Внедрение гибкой системы управления восстановительными процедурами для непрерывных процессов предприятий в комплексе с основными требованиями к организации обеспечения непрерывности технологических процессов и восстановления после сбоев рекомендовано такими стандартами, как стандарт ISO 17799, комплекс стандартов ISO 9000, стандарт Банка России СТО БР ИББС-1.0 и др. позволит значительно снизить влияние последствий чрезвычайных ситуаций, минимизировать финансовые потери и повысить репутацию предприятия [1, 2]. Более того, это поможет расставить правильные акценты жизненно важных показателей непрерывных процессов для предприятия, а затраты на создание и поддержание гибкой системы управления можно рассматривать как одну из необходимых форм гарантий устойчивой работы.
Как показывает практика, при возникновении чрезвычайных ситуаций ущерб от простоя непрерывных процессов, обеспечивающих функционирование и управление развитием предприятия, может в несколько раз превысить стоимость отказа оборудования. Для того чтобы минимизировать время простоев необходимо наличие гибкой системы восстановительных процедур для технологических процессов.
Для повышения экономической эффективности, при создании гибкой системы управления восстановительными процедурами технологических процессов, предварительно необходимо проводить следующее: 1 – идентификацию, 2 – классификацию технологических процессов, 3 – анализ рисков.
Идентификация непрерывных технологических процессов
Технологический процесс (ТП), согласно ГОСТ Р 12.3.047-98, – часть производственного процесса, связанная с действиями, направленными на изменение свойств и (или) состояния обращающихся в процессе веществ и изделий. Например, процесс сборки, разборки (производственный процесс), либо предоставления информационных сервисов (информационный процесс).
В ходе проектирования гибкой системы управления восстановительных процедур для непрерывных процессов необходимо проводить экспертный анализ, для этого разработана анкета и ведомость для фиксирования отказов оборудования, что позволяет их систематизировать и вносить в, разработанную авторами базу данных, для последующего использования в системе.
Анализ рисков
Анализ информационных рисков является всего лишь составной частью при составлении плана аварийного восстановления непрерывных технологических процессов. Выделяют несколько причин отказов технологического процесса: природные, техногенные, природно-техногенные, а также предпринимательские, человеческие. Последним двум типам прерывателей ранее уделялось не так много внимания. А ведь к ним относятся и переезд компании в другой офис, и проблемы, связанные с взаимодействием с государственными структурами, и отсутствие планирования замещения должностей, и трудовые конфликты и другие форс-мажорные ситуации. Таким образом, проблема обеспечения непрерывности процессов затрагивает не только информационные технологии, но и весь технологический процесс в целом
Классификация непрерывных технологических процессов по их критичности
Классификация идентифицированных процессов проводится по двум параметрам: критичности и толерантности к простою. Под критичностью ТП понимается степень значимости ресурса для информационной системы, т.е. как сильно реализация риска непрерывности процессу повлияет на функционирование предприятия.
Предлагается четыре класса непрерывных, на примере, технологических процессов (согласно классификации J.W. Toigo «Disaster Recovery Planning»):
Критические (Critical) – это технологические процессы, функционал которых не может быть выполнен, пока не найдены идентичные ресурсы, которые могут быть использованы взамен утраченных. Критические технологические процессы не могут быть заменены ручными методами, ни при каких условиях. Толерантность к остановке очень низка, а стоимость остановки очень высока. Таким образом, для критических технологических процессов, предприятие должно принять меры, чтобы иметь доступ к ресурсам, сопоставимыми со штатно используемыми.
Жизненно важные(Vital) – технологические процессы, функции которых не могут быть выполнены ручными средствами или могут быть выполнены вручную в течение короткого промежутка времени. У них несколько более высокая толерантность к остановке и несколько более низкая стоимость простоя, при условии, что функции будут восстановлены в пределах определённых временных рамок (обычно четыре или пять дней). В технологических процессах, классифицированных как жизненно важные, может быть допущена краткая приостановка обработки, но для оперативного восстановления функционирования технологического процесса потребуются значительные ресурсы.
Чувствительные (Sensitive) – технологические процессы могут быть обеспечены ручными средствами в течение длительного периода времени, при этом стоимость возрастёт не значительно. Чувствительные технологические процессы, при этом потребуют значительных ресурсов для оперативного восстановления функционирования.
Некритические (Noncritical) – технологические процессы могут быть прерваны в течение длительного периода времени, имеют низкую или нулевую стоимость для компании, и не потребуют значительных ресурсов для оперативного восстановления функционирования
Наглядно зависимость класса технологического процесса от времени и стоимости простоя отображается экономическими показателями и отображается графически. Опираясь на проведённую идентификацию, предельно четко формируются вопросы для анкетирования пользователей. Формулировка вопроса должна быть следующей: «Какие шаги сделал бы пользователь, чтобы выполнить операцию, если бы какие-либо ресурсы технологического процесса были бы недоступны?». Такая формулировка необходима для снижения субъективности при оценке уровня критичности технологического процесса. Субъективность оценки уровня критичности технологического процесса обычно проявляется в том, что рядовой пользователь не видит общей структуры предприятия, кроме того, чаще всего критичность процесса оценивается пользователем исходя из тех сил, которые он затрачивает на поддержание данного технологического процесса, либо исходя из «удобств» для выполнения своих обязанностей.
В связи с расширением или свертыванием производства, при внедрении новых технологий на предприятии могут возникать новые технологические процессы, а существующие изменяют свою структуру, ресурсную базу или ликвидируются. Изменения непрерывных технологических процессов ведёт, в свою очередь, к изменению уровня их критичности и толерантности. Соответственно, при этом необходимо регулярно проводить актуализацию технологических процессов.
После проведения классификации, по каждому конкретному технологическому процессу должны быть проведены следующие работы:
- определение ключевых свойств информации, обрабатываемой в технологическом процессе;
- определение минимального времени простоя технологического процесса;
- определение структуры и ресурсов технологического процесса;
- определение минимального состава ресурсов технологического процесса.
Прежде всего, определяются свойства информации, которую необходимо сохранить, и какими свойствами можно пренебречь при функционировании технологического процесса в аварийном режиме: (доступность, целостность, конфиденциальность) [3].
Стоимость остановки технологического процесса определяется исходя из собственно стоимости простоя, т.е. упущенной выгоды, заработной платы сотрудников на период простоя, оплата сверхурочной работы сотрудников при восстановлении функционирования технологического процесса. Кроме того, необходимо учесть возможную потерю репутации предприятия.
После критичности и толерантности непрерывного процесса необходимо определить структуру технологического процесса – ключевые узлы, направление и интенсивность информационных потоков и т.д. Необходимо так же определить, на какие ресурсы опирается используемое аппаратное обеспечение, поддерживающее узлы технологического процесса, обслуживающий персонал, связи с другими и внешними информационными потоками[4].
Критичность непрерывного процесса распространяется на поддерживающую его инфраструктуру. В большинстве случаев, необходимо определять компоненты инфраструктуры, включая системы электроэнергии, системы кондиционирования воздуха, коммуникации (подключения между помещением компании и месторасположением провайдера передачи данных или центральным офисом), и другие ресурсы, необходимые для функционирования технологического процесса. Без резервных копий или ручных средств управления, потеря одной подсистемы может сделать невозможным дальнейшее восстановление непрерывного процесса.
В дополнение к основной инфраструктурной поддержке, другие инфраструктурные компоненты, включая аппаратные средства, программное обеспечение и сети, наследуют их критичность исходя из поддержки, которую они оказывают определенному критическому технологическому процессу.
Четкое определение связей непрерывного процесса с ресурсами и другими технологическими процессами на предприятии позволяет составить алгоритм их восстановления и управления системой в целом.