Scientific journal
International Journal of Applied and fundamental research
ISSN 1996-3955
ИФ РИНЦ = 0,593

RELIABILITY MODEL OF MAJORITY VOTING SCHEME COMPUTING SYSTEM BASED ON THREE-STATE ELEMENTS

Rahman P.A. 1
1 Ufa State Petroleum Technological University
1686 KB
This paper deals with the majority voting scheme computing system taking into consideration finite time for node activation and different failure rates for active and passive nodes. Obtained by author reliability models and reliability indices calculation formulas for three-state element and system, based on a set of identical and independent three-state elements, with given bottom threshold for number of active elements, at which system is considered as operable, are also observed. At last, application of generalized model and formulas to the major voting scheme computing system with three nodes, and reliability indices calculation example are also provided.
computing system
three-state element
Markov chain
reliability indices

В современном мире информационные технологии являются неотъемлемой частью жизни человека и бизнес-процессов предприятий. Ежедневно огромные объемы информации создаются, передаются, обрабатываются и сохраняются с применением специализированных программно-аппаратных систем. Помимо потребительских технических характеристик систем, таких как: производительность, время задержки, емкость, размер, потребляемая мощность, не менее важными являются характеристики надежности, от которых зависит безопасность функционирования систем, сохранность данных, своевременность передачи и обработки информации, достоверность результатов.

Для оценки показателей надежности восстанавливаемых отказоустойчивых систем, состоящих из множества идентичных и независимых элементов, применяют модели надежности на базе восстанавливаемого элемента с двумя состояниями [1, 2]. Однако, такие модели не учитывают специфику некоторых видов технических элементов, в частности, узлов обработки информации, которые даже будучи в исправном состоянии требуют время для загрузки или реконфигурации программного обеспечения для того, чтобы начать обрабатывать информацию, и до завершения загрузки или реконфигурации пребывают в промежуточном пассивном состоянии. Переход в активное состояние обычно происходит за достаточно короткое, но все же конечное время. Кроме того, в пассивном состоянии элементы также могут отказывать, и интенсивность отказов в пассивном состоянии не равна нулю и не совпадает с интенсивностью отказов в активном состоянии. В такой ситуации возникает необходимость в рассмотрении моделей надежности специального элемента с тремя состояниями (активный, пассивный и неисправный) и систем на базе таких элементов.

В рамках научных исследований автора в области надежности систем хранения, передачи и обработки информации [3–10] возникла научная задача построения модели надежности мажоритарной вычислительной системы с учетом конечного времени активации вычислительных узлов, и различных интенсивностей отказов в активном и пассивном состояниях. Автором была построена модель надежности и выведены расчетные формулы показателей надежности для элемента с тремя состояниями. Далее модель и формулы были обобщены для системы из множества идентичных и независимых элементов с тремя состояниями с заданным нижним порогом для числа активных элементов, при котором система считается работоспособной. Наконец, обобщенная модель и формулы были применены для частного случая мажоритарной вычислительной системы.

Модель надежности элемента с тремя состояниями. Рассмотрим элемент со следующим множеством состояний и условий переходов между ними:

● Состояние P – элемент исправен, но пассивен: не выполняет требуемые функции в силу выполнения инициализации программного обеспечения (активации). Из этого состояния элемент с интенсивностью γN (активация) может перейти в состояние A, либо с интенсивностью λР (отказ в пассивном состоянии) перейти в состояние F.

● Состояние A – элемент исправен и активен (выполняет требуемые функции). Из этого состояния элемент с интенсивностью λA (отказ в активном состоянии) может перейти в состояние F.

● Состояние F – элемент неисправен. Из этого состояния элемент с интенсивностью μN (ремонт) может перейти в состояние P.

Тогда, с учетом вышесказанного имеем следующий граф состояний (рис. 1):

rahman1.wmf

Рис. 1. Марковская модель надежности элемента с тремя состояниями

Математическая модель (система уравнений Колмогорова-Чепмена):

rah01.wmf (1)

где λА – интенсивность отказов элемента в активном состоянии, λР – интенсивность отказов в пассивном состоянии, μN – интенсивность ремонта, и γN – интенсивность активации (перехода из пассивного состояния в активное состояние).

Мы ограничимся выводом аналитического решения для стационарного случая при t → ∞, когда марковский процесс становится установившимся, и производные вероятностей по времени стремятся к нулю. Тогда мы имеем дело с системой алгебраических уравнений, и, решая ее, получаем формулы для стационарных вероятностей всех состояний:

rah02.wmf (2)

Соответственно, стационарный коэффициент готовности элемента, с учетом того, что только в состоянии A элемент активен и выполняет требуемые функции:

rah03.wmf (3)

Примечание. При γN → ∞, коэффициент готовности K → μN/(μN + λА).

Среднее время наработки на отказ нетрудно определить, используя топологический метод для моделей надежности на базе цепей Маркова. Оно определяется как отношение суммы вероятностей работоспособных состояний к взвешенной сумме вероятностей работоспособных состояний, умноженных на соответствующие суммы интенсивностей переходов из работоспособного состояния во все неработоспособные:

rah04.wmf (4)

Наконец, среднее время восстановления, включающего в себя ремонт и активацию, нетрудно определить из взаимосвязи коэффициента готовности со средними временами наработки на отказ и восстановления:

rah05.wmf (5)

Модель надежности системы идентичных и независимых элементов. Рассмотрим систему n независимых и идентичных элементов с тремя состояниями. Каждый элемент может независимо находится в одном из трех состояний.

В силу идентичности элементов пусть каждое состояние системы отражает определенное количество i активных элементов, j неисправных элементов, 0 ≤ i ≤ n, 0 ≤ j ≤ n, i + j ≤ n, и n – i – j пассивных элементов. Общее количество состояний системы (n + 1)(n + 2)/2. Из состояния (i, j) система может перейти:

● С интенсивностью iλА в состоянии rah06.wmf: отказ одного из активных элементов.

● С интенсивностью (n – i – j)γN в состояние rah07.wmf: активация одного из пассивных.

● С интенсивностью (n – i – j)λP в состояние rah08.wmf: отказ одного из пассивных.

● С интенсивностью jμN в состояние rah09.wmf: ремонт одного из неисправных.

Кроме того, пусть система считается работоспособной тогда, когда не менее s элементов активны, 1 ≤ s ≤ n. Соответственно, состояния (i ≥ s, j) системы считаются работоспособными, а состояния (i < s, j) неработоспособными.

Тогда, с учетом всего вышесказанного имеем следующий граф состояний системы независимых и идентичных элементов с тремя состояниями (рис. 2).

Следует отметить, что в силу независимости элементов для определения вероятностей всех состояний системы нет необходимости в трудоемком составлении и решении системы уравнений Колмогорова-Чепмена. Стационарная вероятность каждого состояния (i, j) равна произведению вероятности одновременного нахождения i элементов в активном состоянии rah10.wmf, вероятности одновременного нахождения j элементов в неисправном состоянии rah11.wmf, вероятности одновременного нахождения n – i – j элементов в пассивном состоянии rah12.wmf, умноженного на число всевозможных сочетаний rah13.wmf активных, неисправных и пассивных элементов:

rah14.wmf (6)

Для расчета показателей надежности системы нам также понадобится сумма вероятностей всех состояний системы при заданном количестве i активных элементов:

rah16.wmf (7)

rahman2.wmf

Рис. 2. Модель надежности системы n идентичных и независимых элементов с тремя состояниями и заданным нижним порогом s для числа активных элементов

Тогда при заданном нижнем пороге s для числа активных элементов, при котором система работоспособна, стационарный коэффициент готовности системы определяется как сумма вероятностей всех работоспособных состояний rah17.wmf:

rah18a.wmf

rah18b.wmf (8)

Соответственно, среднее время наработки на отказ системы определяется как отношение суммы вероятностей всех работоспособных состояний rah19.wmfк взвешенной сумме вероятностей граничных работоспособных состояний rah20.wmf, умноженных на соответствующие интенсивности iλА перехода в неработоспособные состояния. Заметим, что для всех граничных работоспособных состояний интенсивность перехода в неработоспособные состояния одинакова и равна sλА:

rah21a.wmf

rah21b.wmf (9)

Наконец, среднее время восстановления, нетрудно определить из взаимосвязи коэффициента готовности со средними временами наработки на отказ и восстановления:

rah22a.wmf

rah22b.wmf (10)

Модель надежности мажоритарной вычислительной системы с тремя узлами. Отказоустойчивая вычислительная система с тремя узлами и мажоритарным выбором результата вычислений может рассматриваться как частный случай вышеописанной системы при n = 3 и s = 2. Вычислительная система дает достоверный результат в случае, если не менее двух из трех узлов исправны и активны (выполняют вычисления). Тогда имеем следующий граф состояний рассматриваемой вычислительной системы (рис. 3).

Формула для расчета коэффициент готовности вычислительной системы выводится путем подстановки n = 3 и s = 2 в формулу 8:

rah23.wmf (11)

Аналогично выводим формулу для расчета среднего времени наработки на отказ:

rah24.wmf (12)

Наконец, формула для расчета среднего времени восстановления:

rah25.wmf (13)

 

rahman3.wmf

Рис. 3. Модель надежности мажоритарной вычислительной системы с тремя узлами

 

Пример расчета показателей надежности. Пусть задана мажоритарная вычислительная система с тремя узлами. Интенсивность отказов узлов в активном состоянии λА = 1/2920 час-1 (в среднем три раза в год), интенсивность отказов в пассивном состоянии λP = 1/8760 час-1 (в среднем раз в год), интенсивность активации γN = 20 час-1 (в среднем три минуты) и интенсивность ремонта μN = 1/24 час-1 (в среднем одни сутки).

Рассчитаем показатели надежности мажоритарной вычислительной системы:

● По формуле 11 получаем коэффициент готовности: KF ≈ 0,999801.

● По формуле 12 получаем среднее время наработки на отказ: TF ≈ 60547 часов.

● По формуле 13 получаем среднее время восстановления: TR ≈ 12,058 часов.

Заключение

Таким образом, в рамках данной статьи автором рассмотрена модель надежности мажоритарной вычислительной системы с учетом конечного времени активации узлов, и различных интенсивностей отказов в активном и пассивном состояниях. Автором разработана модель надежности и выведены расчетные формулы показателей надежности для элемента с тремя состояниями. Далее модель и формулы обобщены для системы из множества идентичных и независимых элементов с тремя состояниями с заданным нижним порогом для числа активных элементов, при котором система считается работоспособной.

Наконец, обобщенная модель и формулы применены для частного случая мажоритарной вычислительной системы с тремя узлами. Также приведен пример расчета стационарного коэффициента готовности, среднего времени наработки на отказ и среднего времени восстановления мажоритарной вычислительной системы.

Полученные теоретические результаты использовались в многолетней практике эксплуатации, развития и проектирования систем хранения и обработки данных НИУ МЭИ (ТУ), Балаковской АЭС, ОАО «Красный Пролетарий» и ряда других предприятий.