Надежность информационных систем
Предисловие
Проблема надежности является очень важной для современных технических систем. Можно привести примеры многих систем, для которых решение проблемы надежности в самом прямом смысле означает, быть или не быть данной системе. К ним можно отнести и различные информационные системы, включающие в свой состав большое число компьютеров, имеющих сетевую структуру, территориально распределенные информационные системы, информационные системы измерения параметров различных объектов, системы мониторинга и т.п.
Информационные системы могут иметь простую и сложную структуру. Их усложнение идет сегодня в различных направлениях. С одной стороны, в состав систем входит все большее число комплектующих элементов. С другой стороны, усложняется их структура, определяющая соединение отдельных элементов и их взаимодействие в процессе функционирования и поддержания работоспособности. При этом усложнение систем является прямым следствием постоянно возрастающей ответственности выполняемых ими функций, сложности и многообразия этих функций.
При прочих равных условиях система, состоящая из большого числа комплектующих элементов и имеющая более сложную структуру и сложный алгоритм функционирования, является менее надежной по сравнению с более простой системой. Все это требует разработки специальных методов обеспечения надежности таких систем, включая разработку математических методов расчета надежности и экспериментальной оценки.
Прежде чем начать изложение теоретических основ надежности, введем основные термины и определения, принятые в современной инженерной практике.
Под надёжностью технической системы понимают свойство системы сохранять работоспособность в заданных условиях функционирования. Говоря о работоспособности, следует сразу же определить критерий отказа системы. Отказ – это событие, после возникновения которого система утрачивает способность выполнять заданное назначение. Эти два понятия в определенном смысле выражаются одно через другое: отказ – это потеря работоспособности. Однако для той или иной информационной системы конкретное определение отказа зависит от многих факторов: назначения системы, выполняемой задачи, требований к выполнению данной конкретной функции и др.
Надежность – это сложное свойство, включающее в свой состав несколько единичных свойств: безотказность, готовность, сохраняемость, ремонтопригодность, а также безопасность и живучесть.
Под безопасностью понимается способность системы функционировать, не переходя в опасное состояние. Для информационных систем это свойство не является существенным по сравнению, например, с системами атомной энергетики.
Под живучестью технической системы понимают ее способность противостоять внешним воздействиям как естественного характера не предусмотренных условиями нормальной эксплуатации, так и преднамеренным.
Отличительным признаком надежности как свойства технической системы является то, что она характеризуется вероятностными процессами, протекающими во времени.
При изучении теории надёжности широко используются такие понятия как система, объект, элемент. Элемент – это такой объект, отдельные части которого не представляют существенного интереса в пределах проводимого анализа. Под термином «система» будем понимать множество (совокупность) действующих объектов, взаимосвязанных между собой функционально и рассматриваемых как единое структурное целое. Понятия «элемент», «объект» и «система» достаточно относительны. Подразделение системы на элементы зависит от требуемой точности проводимого анализа, от уровня наших представлений о системе и т.п. Более того, объект, считавшийся системой в одном исследовании, может рассматриваться как элемент, если изучается система большего масштаба. Например, в информационной сетевой системе элементом может считаться компьютер, терминал, канал связи и др. В тоже время, рассматривая функционирование компьютера, можно выделить процессор, входные и выходные устройства, различные интерфейсы и т.д.
В теории надежности весьма важную роль играет деление элементов и систем на восстанавливаемые и невосстанавливаемые. Содержательный смысл этих понятий очевиден.
Информационные системы бывают простыми и сложными.
Простыми системами будем считать такие, в которых чётко определён признак отказа, т.е. можно указать элемент, отказ которого приводит к отказу системы.
Основные признаки классификации отказов изделий приведены в таблице 1.
Таблица 1
Признак классификации | Вид отказа |
Характер изменений параметра до момента отказа | внезапныйпостепенный (параметрический)перемежающийся (сбои) |
Степень потери полезных свойств | полныйчастичный |
Восстанавливаемость полезных свойств | необратимыйобратимый |
Связь с другими отказами | независимыйзависимый |
Наличие внешних признаков | явныйнеявный |
Причина возникновения | конструктивныйтехнологическийэксплуатационный |
Период появления | период приработкипри работе нормальная эксплуатацияпериод старенияпри хранениипри испытаниях |
Цена отказа | простой техники (ущерб от ремонта)невыполнение задачи (ущерб от этого)моральный ущерб |
Одной из основных характеристик надежности объекта является время безотказной работы или наработка до отказа. Обозначим эту случайную величину Т. Будем считать, что в момент времени t=0 объект начинает работу, а в момент t=T происходит отказ. Отказ – это случайное событие во времени. Закон распределения случайной величины Tхарактеризуется интегральной функцией распределения
= Вер (Tk< t), где Tk – случайный момент времени, когда произошёл отказ. Тогда, – вероятность отказа на интервале [0, t].Функция Q(t) есть вероятность отказа до момента t. Плотность распределения вероятности отказа
(1)Безотказная работа – противоположное событие по отношению к событию отказа, поэтому вероятность безотказной работы в течении времени t:
(2) Если F (t) – дифференцируемая функция (на практике это почти всегда выполняется), то дифференциальная плотность отказа: (3)Tогда вероятность отказа и вероятность безотказной работы объекта в течение времени tопределяетсячерезплотностьвероятностиотказа:
, (4) .В расчетах чаще всего применяют такую характеристику надежности как интенсивность отказов l(t). Интенсивность отказов можно рассматривать как относительную скорость уменьшения значений функции надежности с увеличением интервала (0, t).
(5)Решение уравнения (5) при начальном условии p(0)=1 дает для функции надежности
формулу
(6)При l=const формула (6) существенно упрощается:
P(t)=exp(-lt). (7)
Интенсивность отказов
– это есть условная плотность вероятности отказов в предположении, что до момента t элемент функционировал безотказно. Таким образом, случайная величина имеет три характеристики – p(t), , .В качестве показателей надежности применяют также числовые характеристики случайной наработки до отказа. Их обычно легче определить по экспериментальным данным, чем зависимости p(t), l(t), f(t). Наиболее часто используют среднюю наработку до отказа (математическое ожидание наработки до отказа или первый начальный момент).
, (8)где F(t) – функция распределения случайной величины T.
Интегрируя (8) по частям, получаем
(9)Таким образом, средняя наработка до отказа численно равна площади под кривой p(t).
При l=const имеем
(10)Очень часто этих двух моментов бывает достаточно для полной характеристики функций распределения наработки до отказа. Например, в практически часто встречающихся случаях, когда
(экспоненциальное распределение), p(t)=exp(-lt) и mt= – несёт исчерпывающую информацию о надежности системы.