где
- число обнаруживаемых двойных ошибок по mod 3; - число обнаруживаемых тройных ошибок по mod 3.По методу контрольного суммирования все двойные ошибки, если они находятся в одном слове, обнаруживаются. Следовательно, ошибки, не обнаруженные контролем по mod 3, будут обнаружены методом контрольного суммирования. С другой стороны, если двойные ошибки находятся в разных словах (в разных строках матрицы
) и не могут быть обнаружены методом контрольного суммирования, то они будут обнаружены методом контроля по mod 3.Отсюда был сделан вывод, что применение двух методов контроля приводит к повышению эффективности контроля, обеспечивающего обнаружение также ошибок двойной и тройной кратности.
Обеспечение надежности устройств автоматики и вычислительной техники
В первую очередь надежность устройств достигается за счет использования высоконадежных элементов. Внедрение полупроводниковых приборов вместо электровакуумных позволило повысить надежность устройств более чем на порядок, за счет того, что физические процессы в полупроводниковых приборах обеспечивают их функционирование при меньших питающих напряжениях, рассеиваемой мощности и, следовательно, температурах.
Дальнейшим развитием элементной базы явилось создание интегральных схем (ИС). ИС развиваются бурными темпами и последовательно были созданы ИС малой, средней и большой степени интеграции.
В настоящее время создаются сверхбольшие ИС, содержащие десятки тысяч и даже сотни тысяч элементов. Так как технология ИС непрерывно совершенствовалась, то указанное обстоятельство привело к тому, что, несмотря на резкое увеличение числа элементов на одном кристалле, надежность отдельного кристалла оставалась прежней.
Дальнейшее развитие элементов автоматики и вычислительной техники будет направлено по пути повышения степени интеграции в ИС, использования оптических элементов, а также внедрения новых типов печатных плат, контактных соединений и т. д.
Особое внимание при создании устройств уделяется подбору стандартизованных и унифицированных элементов, использование которых значительно повышает надежность, так как эти элементы отработаны наилучшим образом в схемном, конструктивном и технологическом отношении.
Вторым направлением повышения надежности является обеспечение оптимальных режимов работы элементов. В первую очередь это касается электрических режимов. Опыт эксплуатации элементов показывает, что оптимальные значения коэффициента нагрузки, при которых интенсивность внезапных отказов наименьшая, находятся в пределах 0,2—0,4. Одновременно установлено, что при этих же значениях коэффициента нагрузки параметры элементов медленнее отклоняются от номинальных. Большое значение имеет выбор коэффициента нагрузки по тепловому, механическому и радиационному режиму.
Указанные режимы в большой мере зависят от конструкции устройств, а также от принятых технических решений, и это должно учитываться в процессе проектирования.
Эффективным средством повышения надежности является резервирование. Опыт использования различных методов резервирования в устройствах автоматики и вычислительной техники показывает, что постоянное резервирование может использоваться по отношению к отдельным элементам или схемам. Для сложных конструкций, как правило, применяется резервирование замещением. Оно же используется и для отдельных устройств. Весьма часто в САУ используются мажоритарное резервирование и самокорректирующие коды.
Временное резервирование широко применяется в средствах вычислительной техники. Его конкретная реализация, например, осуществляется способом двойного - тройного счета. Некоторая задача решается дважды, и сравниваются полученные результаты. Если результаты совпадают, то это означает, что отказы и сбои отсутствуют и можно переходить к решению следующей задачи. Если же результаты не совпадают, то в устройстве произошел отказ или сбой во время одного из этапов вычислений.
Временное резервирование используется в устройствах вычислительной техники при тестовом контроле — периодическом решении специальных задач с известными ответами. На основании сравнения полученного результата с известным ответом можно судить о работоспособности устройства. Очевидно, что чем больше времени выделяется на тестовый контроль и чем чаще он проводится, тем с большей достоверностью можно судить о работоспособности контролируемого устройства.
Как показано выше, эффективным методом повышения надежности является восстановление отказавших устройств. Здесь в первую очередь возникают вопросы, связанные с обнаружением факта отказа и с поиском отказавших элементов. Как показывает опыт проектирования и эксплуатации САУ, эффективность диагностирования повышается при использовании автоматизированных систем контроля. В качестве центрального звена в этих системах не пользуются ЭВМ, что обеспечивает проверку большого числа контрольных точек в течение небольшого промежутка времени. Определенные особенности имеет и диагностирование устройств вычислительной техники. В этих устройствах широкое применение находят методы диагностирования, основанные на использовании различных логических соотношений, информационного и алгоритмического резерва. За последнее время в средствах вычислительной техники все шире используется сигнатурный анализ, который на сжатии информации и представлении информационных массивов в виде их специальных образов — сигнатур. Анализ сигнатур при обработке различных массивов информации позволяет сделать выводы о работоспособности устройств.
Время восстановления сокращается за счет обеспечения доступности всех узлов устройства для осмотра, т. е, определяется ремонтопригодностью разрабатываемых конструкции. В настоящее время широко используется модульно - блочный принцип построения устройств, при котором замена отказавших элементов осуществляется путем замены целых блоков. Снятые блоки уже вне изделия подлежат восстановлению па специальных стендах с использованием контрольно-измерительных приборов.
В устройствах вычислительной техники приняты четыре конструктивных уровня:
1) ИС и радиоэлементы;
2) типовые элементы замены (ТЭЗ), представляющие собой печатные платы с размещенным на них ИС;
3) рамы, в которых размещаются ТЭЗ;
4) шкафы, в которых крепятся рамы.
Как показывает опыт конструирования САУ, подобное деление существует и для других видов радиоэлектронной аппаратуры. Замена отказавших элементов осуществляется путем замены ТЭЗ. Отказавшие ТЭЗ затем поступают в ремонт. Большое значение для обеспечения надежности имеет качество изготовления аппаратуры, которое определяется технологической дисциплиной, организацией контроля на всех стадиях производства, проведением испытании и качеством комплектующих и материалов.
Существенное влияние на показатели надежности оказывают качество эксплуатации, принятая система технического обслуживания, обеспечение комплектами ЗИП и его пополнение, подготовленность обслуживающего персонала и ряд других факторов.
Анализ надежности аппаратуры показывает, что примерно 40 - 45% всех отказов возникает из-за ошибок на этапе проектирования, 20% - от ошибок, допущенных при производстве, 30% - от неправильной эксплуатации и 5- 10% - от естественного износа и старения.
Одним из специальных методов повышения надежности САУ является использование самонастраивающихся и самоорганизующихся систем. Особенно важным является принцип самоорганизации. Для реализации его создаются такие САУ, которые способны изменять свою структуру в процессе функционирования. Перестройка структуры осуществляется таким образом, чтобы обеспечить с помощью сохранивших работоспособность звеньев системы требуемое качество регулируемого процесса. Это приводит к необходимости учета при проектировании систем влияния параметров отдельных звеньев на соответствующие показатели исследуемой системы.
Таким образом, можно видеть, что существует достаточно много направлений в повышении надежности САУ и их составляющие показатели исследуемой системы. Из всех перечисленных выше особо можно отметить проблему диагностирования, решение которой в устройствах САУ имеет определенную специфику.
Социально-экономическое обоснование использования аппаратурного контроля
Для уменьшения потерь от сбоев и отказов, порождающих ошибки, необходимо предотвратить распространение ошибки в вычислительном процессе, так как в противном случае существенно усложняются и удлиняются процедуры проверки правильности работы программы, определения и устранения искажений в программе, данных и промежуточных результатах.
Для этого необходимо обнаруживать появление ошибки в выполняемых машиной преобразованиях информации как можно ближе к моменту ее возникновения. С этой целью надо иметь систему автоматического контроля правильности работы ЭВМ, которая при появлении ошибки в работе машины немедленно приостанавливает вычисления и производит диагностирование характера ошибки, с тем, чтобы при сбое автоматически восстанавливались достоверность информации и выполнение программы, и при этом был минимален повторяемый участок программы, а при отказе обслуживающий персонал был извещен о необходимости ремонта машины.