Предлагаемая классификация охватывает ошибки и отказы, вызванные электронными узлами системной платы, как наиболее сложной части РС, и может быть распространена на весь клон IBM PC.
С позиции аппаратных и программных средств, используемых в РС, неисправности подразделяются на аппаратные, программные и аппаратно-программные.
Аппаратные неисправности, т. е. неисправности аппаратных средств, в свою очередь, подразделяются на случайные, мягкие и жесткие ошибки.
К случайным ошибкам относят:
1) плавающие ошибки;
2) корректируемые отказы;
3) некорректируемые отказы (технические остановы).
Потенциально, любая неисправность, связанная со случайными ошибками, может привести к жесткой ошибке. Случайная ошибка, приобретшая фактор стабильности и делающая невозможной дальнейшую эксплуатацию системы классифицируется как жесткая, не корректируемая и требует анализа и диагностики неисправности АПС. Нередко, после коррекции условий эксплуатации ВС (температурно-климатические, вибрационные и т. д.), такие ошибки исчезают, но, по истечении некоторого времени, появляются снова. Таким образом, это – не метод устранения ошибок, и задача инженера или техника по ТО – наоборот, ужесточить условия эксплуатации ВС на время диагностики, с целью выявления ошибки и выделения отказавшего узла. Наиболее неприятны отказы, связанные с факторами нестабильности и неопределенности – плавающие ошибки. Их появление часто связано:
1) с наличием мощных источников электромагнитного излучения, таких как:
- сварочное оборудование;
- силовые контакторы;
- щеточные электродвигатели;
- электродуговые приборы;
- СВЧ медицинское оборудование;
- рекламная светотехническая аппаратура и т. п.;
2) с повреждением или ухудшением параметров контуров защитного заземления. "Схемная земля" (или "логическая земля"), объединяет по общему проводу несколько ПЭВМ, и если их нулевые потенциалы сильно отличаются, то это приводит к заметной разности потенциалов между ними и образованию паразитных токов в контуре: схемная земля – защитное заземление;
3) с наличием источников механических колебаний, кинематических перемещений, что, кроме опасных для НЖМД ускорений, может быть причиной нарушений электрических соединений в разъемах питания, слотах расширения, панельках для установки ИМС (Chip Sockets) и т. п.;
4) с запыленностью помещений, наличием агрессивной внешней среды, что вызывает загрязнение и окисление контактов разъемных соединений;
5) с разношенностью или загрязненностью сетевых розеток и вилок подключения СВТ к сети первичного питания;
6) с перепадами температур, которые всегда отрицательно влияют на все компоненты ПЭВМ;
7) появление неисправностей часто возникает после окончания профилактики или модернизациисистемы. Причина подобных неисправностей может заключаться в неправильном, невнимательном или непрофессиональном выполнении этих работ.
К мягким ошибкам (Minor Errors) относятся ошибки, устраняемые аппаратно, аппаратно-программно или программно, самой ВС без вмешательства оператора. Например:
1) ошибки информации в DRAM, корректируемые по коду Хемминга;
2) ошибки чтения секторов диска, исправляемые кодами ECC (Errors Checkingand Correcting Code), исправляющими ошибки, или повторным считыванием сбойного сектора;
3) ошибки передачи данных по каналам связи, исправляемые при повторных сеансах передачи
и т. п.
К жестким ошибкам (MajorErrors) относятся ошибки оборудования, приводящие к устойчивому отказу с потерей всех или некоторых функций ВС, устранение которых является задачей специалистов по ТО и СТО (системотехническому обслуживанию) СВТ.
1. К аппаратным неисправностям, т. е. неисправностям аппаратных средств, относятся, например, следующие:
1) неисправности энергоснабжения в РС;
2) отказы компонент локальной шины;
3) отказы буферов шин каналов адреса и данных;
4) отказы узлов подсистемы DRAM и кэш-памяти;
5) отказы карт расширения подсистем ввода-вывода;
6) отказы компонент узлов обрамления (обвески) CPU;
7) отказы узлов подсистемы ROMBIOS;
8) отказы компонент клавиатуры;
9) отказы узлов и элементов аудиосистемы;
10) отказы узлов расширения подсистем, расположенных на системной плате и т. д.
2. К программным ошибкам относятся:
1) ошибки, связанные с загрузкой операционной системы;
2) ошибки прогона пользовательских программных средств (Soft Ware);
3) ошибки, вызванные вирусными заражениями памяти компьютера.
3. Каппаратно-программным ошибкам относятся:
1) потеря или искажение информации в ROM BIOS, приводящие к нарушениям функций обслуживания средств ввода-вывода;
2) потеря или искажение информации в CMOS-памяти, приводящие к искажениям информации о текущей аппаратной конфигурации ВС;
3) потеря или искажение информации в регистрах портов подсистем ввода-вывода, приводящие к нарушениям интерфейса ввода-вывода;
4) некорректная установка средств конфигурации системы, приводящая к потере обслуживания или опознавания компонент ВС (не тот тип дисковода, монитора, клавиатуры, FPU и т .д.)
Контрольные вопросы.
1. Какие ошибки относятся к аппаратным?
2. Какие ошибки относятся к программным?
3. Какие ошибки относятся к аппаратно-программным?
4. Какие ошибки классифицируются как мягкие?
5. Какие ошибки классифицируются как жесткие?
6. С какими факторами связано возникновение плавающих ошибок?
2.2 Этапы и процесс устранения неисправностей РС
Ремонт ПЭВМ, в общем случае, заключается:
1) в анализе симптомов отказа;
2) в предварительном тестировании;
3) в сокращении аппаратной и программной конфигурации ВС, для выделения отказавшего устройства;
4) в углубленной диагностике неисправного устройства, для локализации места возникновения неисправности, до узла или компоненты схемы;
5) в замене отказавшего узла, компоненты, или восстановлении работоспособности схемы устранением дефекта в монтаже, разъемном соединении и т. д.
Таким образом, ремонт ВС более чем на 9/10 состоит из диагностики АПС и состоит из пяти этапов:
1) анализ ситуации отказа;
2) тестирование;
3) ремонт;
4) тестирование после ремонта;
5) восстановление рабочей конфигурации и проверка функционирования.
При выполнении работы по диагностике неисправностей рекомендуется:
1) подробно документировать работу;
2) предположить одну из похожих по симптомам неисправность (идентифицировать неисправность);
3) выделить неисправное устройство (интерпретировать вид ошибки);
4) воспользоваться,если возможно, эталонной таблицей состояний ВС;
5) выделить неисправную компоненту в устройстве;
6) если симптомов несколько, – классифицировать их на первичные и вторичные (зависимые от первичных).
Процесс поиска неисправностей.
На этапе анализа ситуации следует:
1. проанализировать, в каком режиме работы АПС, при выполнении какой программы и в каком месте программы произошел отказ;
2. зафиксировать симптомы неисправности:
1) состояние индикаторов РС,
2) сообщения программы (диспетчера, ОС, оболочек и т. д.),
3) звуковые сигналы, штатные и нештатные;
3. попытаться перезапустить программу;
4. перезагрузить систему ("теплый" рестарт, или "холодный" старт);
5. внимательно просмотреть, как проходят рестарт, POST-контроль;
6. проверить параметры АПС в CMOS-памяти, с помощью процедур SETUP;
7. выключить ВС, проверить качество соединений кабелей интерфейсов, подключения питания, температурный режим всех ИМС (наощупь), степень загрязненности плат;
8. если POST-программа не выполняется, перейти к локализации компоненты, используя видео- или аудио-коды, сообщаемыми POST-программой;
9. если POST-программа выполняется, – перейти к тестовой диагностике ВС;
Эффективный поиск неисправностей в оборудовании СВТ требует дедуктивного метода рассуждений для выделения главной проблемы.
Проводя анализ ситуации, нужно постараться понять:
1) причину неисправности и ее тип;
2) связать причину неисправности с первичной компонентой ВС, вызывающей подобный тип неисправностей;
3) провести анализ работы выделенного узла, используя его функциональную схему;
4) предположить вероятный источник ошибки;
5) записать расположениекарт контроллеров в слотах, схему подключения кабелей, положение перемычек и переключателей на контроллерах, картах расширения и системной плате;
6) проверить, не возникла ли неисправность после:
- установки другого контроллера в слот расширения (реконфигурация ВС);
- подключения к контроллеру дополнительного периферийного устройства;
- переустановки конфигурации периферийных устройств на контроллерах, периферийных устройствах, системной плате.
Если ошибка возникла вследствие реконфигурации АПС, то следует проверить правомерность проведенных подключений и переустановок, пользуясь руководством пользователя (User Manual) контроллера, периферийного устройства, системной платы.
При возможности, полезно сравнить установки и подключения таких же устройств на другой, аналогичной АПС.
Если все было подключено верно, – вернуть ВС в исходное состояние: выключить только что установленное ПУ и/или контроллер и вновь проверить работоспособность ВС.
Если ошибка осталась, значит, компонента определена неверно, и нужно повторить анализ по пунктам 1) – 4).
Если ошибка устранилась, следует по-очереди заменять элементы узла на заведомо исправные в следующем порядке:
- периферийное оборудование, относящееся к выделенной подсистеме (дисковая, VIDEO, коммуникации, манипуляторы и т. д.), обращая внимание на их конфигурирование;