Организация бесперебойной работы. План обеспечения бесперебойной деятельности организации в случае нештатных ситуаций

Комплекс Oktell является сложным программным продуктом, обеспечивающим работу в составе сетевой программно-аппаратно инфраструктуры. Бесперебойный характер работы обеспечивается в разных пропорциях всеми частями системы: оборудованием, сетевыми каналами, качеством подключений и т.д. На работу также может оказывать влияние стороннее программное обеспечение: в первую очередь операционная система, ее составляющие части и их состояние, программные продукты, используемые одновременно с комплексом, и т.д.

Очевидно, что программный продукт самостоятельно не в состоянии полностью заботиться о всех составляющих частях системы. Например отключение электричества на длительный период или физический разрыв сетевого канала между сервером телефонии и сервером баз данных - классические примеры внешнего воздействия, в борьбе с которым любое программное обеспечение бессильно. Однако установкой дополнительного оборудования (аккумуляторных батарей или дублирующего сетевого канала соответственно) можно свести вероятность возникновения критического сбоя в контексте описанных примеров к минимуму.

Возможные сбои, возникающие в процессе активной работы сервера уже после ввода его в эксплуатацию по истечении некоторого периода стабильной работы могут иметь различные причины, однако могут быть классифицированы по направлениям. Каждое из направлений необходимо оценить на предмет вероятности возникновения и при необходимости обеспечить профилактику, подготовку персонала и оборудования, а также разработать перечень мероприятий, требующих проведения при возникновении тех или иных критических условий.

Общие проблемы оборудования (плат CTI или составляющих блоков серверной станции)

В зависимости от требований, предъявляемых к системе по обеспечению бесперебойности, могут быть разработаны различные методики борьбы с аппаратными проблемами. В любом случае при необходимости свести к минимуму возможное время простоя требуется дублирование различных узлов системы. Оценка возможных вероятностей и последствий зависит от конкретных условий внедрения. Дублирование может производиться как складированием в запас части подверженных особому риску агрегатов (плат CTI, материнских плат, плат оперативной памяти, телефонных аппаратов и т.д.), так и использованием серверных агрегатов, устойчивых к сбоям и порче составных частей. Например, в отдельных случаях не лишним будет использование в качестве сервера телефонии серверной станции с несколькими блоками питания, серверной материнской платой. Возможно также резервное хранение в запас дублирующего сервера с установленными и настроенными узлами - точными копиями основного. В случае возникновения критических проблем на сервере до момента выяснения и устранения производится полное холодное переключение с одной станции на другую с сохранением всех настроек, имени и IP адреса в сети.

Стоит помнить, что перечисленные варианты - возможное решение лишь аппаратных проблем.

В ряде случаев для удобства настройки и работы распределенной системы рекомендуется выносить БД на отдельный сервер. В этом случае обеспечение быстрого переключения на резервный сервер телефонии в случае аппаратных сбоев на основном производится на порядок проще, так как не требуется перенастройка и восстановление резервных копий БД.

Настоятельно рекомендуется после ввода в эксплуатацию настроенного сервера телефонии производить регулярное резервное копирование необходимых в работе данных: файлов сценариев, баз данных, других (возможно внешних) информационных блоков, участвующих в работе системы.

Также в целях обеспечения защиты от скачков в электросети и отключения электроэнергии рекомендуется снабдить сервер блоком бесперебойного питания. Очевидно, чтобы сервер продолжил обработку вызовов в условиях отсутствия электричества, необходимо, чтобы все узлы, обеспечивающие подключение сервера к внешним провайдерам используемой связи (свитчи, модемы, шлюзы, атс), также функционировали и были обеспечены альтернативными источниками энергии. Также в зависимости от режима работы комплекса может потребоваться настройка сценариев обработки вызовов на альтернативную схему работы при отсутствии операторов и пользователей, а также отсутствии доступа к внешним узлам.

Проблемы связи сервера с провайдерами, с интернет и другими блоками комплекса (АТС, шлюзами, телефонными аппаратами, компьютерами)

Доступ в интернет, обеспечение связи с внешним провайдером SIP и потоков E1 полностью возлагается на системного администратора. В случае нарушений и сбоев в работе каких-либо направлений необходимо иметь альтернативные каналы или условия быстрого устранения возникающих неисправностей. В некоторых случаях провайдеры обеспечивают мгновенное реагирование, и это может не быть критической проблемой, однако в некоторых других случаях по договору или по факту провайдер в состоянии затягивать разрешение возникающих проблем. Необходимо оцениться по ситуации и подготовить план мероприятий, требующих проведения в случае возникновения проблем со связью.

Связь внутриофисных компонентов также должна быть обеспечена системным администратором. Как физически кабелями, так и в плане настроек сетевых подключений.

Дополнительно имеет смысл предусмотреть резервные ветки принимающего звонки сценария, обеспечивающие корректную обработку поступающих вызовов в момент отсутствия связи по используемым рисковым каналам.

Изменения в составе операционной системы (изменение перечня или активности прочего программного обеспечения)

Комплекс работает в операционной системе семейства Windows и использует ее ресурсы. Системные ресурсы сервера разделяются также с другим программным обеспечением, осуществляющим одновременную работу. Возможны случаи, при которых активность сторонних программ может приводить к частичной недееспособности платформы Oktell. В частности, это случаи вредоносной модификации составных частей комплекса, системных файлов платформы FrameWork или ОС, чрезмерной активности, загружающей ресурсы станции: процессорное время, кэш записи/чтения с жесткого диска, сетевые интерфейсы, блокирующие действия на этапе обмена информацией, например файрволлы. Вирусные программы могут оказывать непосредственное влияние на различные уровни системы.

В качестве условий по обеспечению бесперебойности, связанной с вышеописанными проблемами, рекомендуется после настройки сервера не осуществлять установку непроверенного обеспечения, не активизировать ранее неактивные программы, осуществлять контроль за чистотой размещаемых на сервере файлов во избежание попадания вредоносных программ. Не рекомендуется давать прямой и общесетевой доступы к составляющим сервера неквалифицированным и низкоквалифицированным сотрудникам, ограничивать свободный доступ к серверу всех, кроме ответственных администраторов. Крайне осмотрительно производить модификации параметров сетевых интерфейсов, дополнительную настройку брандмауэров, файрволлов и антивирусов. Также настоятельно рекомендуется использовать серверную станцию только по назначению на всем протяжении периода эксплуатации комплекса.

Нехватка дискового пространства

В ходе работы комплекса в зависимости от условий работы осуществляется запись звуковых файлов, разрастание базы данных, также возможны другие причины уменьшения свободного дискового пространства. Система следит за объемом оставшегося места на диске с тем, чтобы предупредить и вовремя прекратить уменьшение места в критической зоне за счет собственных средств, отключая запись коммутаций.

Рекомендуется настраивать запись на дополнительные жесткие диски вместо стандартного системного диска с ОС. Периодически отслеживать изменения и заблаговременно менять или очищать диск от уже неактуальных данных. В систему встроен режим автоматического удаления записанных разговоров (в разделе общих настроек), а также профилактической очистки БД. При необходимости длительного хранения записей используйте внешние носители. Поскольку 1МБ вмещает 10 минут звукозаписи, то современные жесткие диски позволяют достаточно длительный срок вмещать информацию всего офиса. Периодическая смена жестких дисков или архивирование на внешний носитель позволит существенно раздвигать сроки нормальной эксплуатации в этой части.

Переполнение баз данных

В процессе работы (особенно в режиме call-центра) при плотной активной работе базы данных постепенно наполняются большим объемом разнородной статистической информации. Часть ее используется системой при построении стандартных встроенных отчетов, часть может быть использована при создании пользовательских отчетов. Однако в ряде случаев при конкретной настройке комплекса большой объем данных хранится напрасно. Это занимает место на диске, но еще больше мешает серверу баз данных осуществлять быстрый поиск и размещение в оперативной памяти. Разрастание данных в основных таблицах тем пагубнее, что при использовании определенных настроек (таких как, например, поиск наименее занятого оператора) комплекс в реальном времени использует статистическую информацию для маршрутизации. Так, при каждом переключении абонента на задачу неизбежно увеличивается время поиска по статистическим таблицам. Этот процесс плавно ведет к «застреванию» звонков на входе в задачу, и при пересечении допустимой границы ожидания массовым обрывам со стороны абонентов. Рекомендуется полностью формировать проекты перед тем, как осуществлять их настройку и активирование в системе. В ряде случаев информация, собираемая комплексом неинтересна, и можно продлить «легкую» работу, настроив автоматическую очистку таблиц. Также можно пользоваться встроенным режимом удаления данных старее указанной даты из всех оперативных таблиц и автоперестройкой индексов.

Чрезмерная перегрузка одной из составляющих систем выполняемыми одновременно задачами

В случае плотной работы большого числа операторов (или автоматических задач) возможны случаи, когда нагрузка на сервер баз данных возрастает до запредельных значений. В большей степени нагрузка ложится на жесткий диск и его кэш. В этом случае, даже если загрузка процессора в норме, не рекомендуется осуществлять некритичные ко времени процедуры: формировать сложные статистические отчеты, запускать работающие с БД служебные сценарии, проводить другие действия в БД. Совместно с предыдущим пунктом подобные условия могут приводить к неработоспособности или некорректным обработкам.

При формировании проектов рекомендуется предварительно производить анализ и распределение видов работ. В частности, выносить часть данных на другие серверы и строить отчеты на них, использовать внешние БД на других серверах и организовывать распределенную работу в БД модулей и сотрудников, работающих в реальном времени, и тех, кто может отложить до спада активности. В частности, как одна из мер, можно снизить до минимума пребывание в таких модулях call-центра как «Индикаторы», «Ресурсы», «Статистика». При необходимости управления ресурсами возможно отключение использования там наполнения на основе статистических данных.

Однако, стоит иметь в виду, что проблемы с перегрузкой начинаются не сами по себе, а в следствие разрастания оперативных таблиц, что описано в предыдущем пункте. Необходимо рассматривать ситуацию целиком и принимать комплексные решения по оптимизации работы БД. В случае организации сложных и критичных ко времени простоя call-центров, пользуйтесь советами и/или услугами центров внедрения.

В начале этого года на северо-востоке США бушевали невиданной силы грозы. Они нарушили электроснабжение местного call-центра службы спасения 911, и в сервисном отделе фирмы Liebert, входящей в состав компании Emerson Network Power, раздался звонок с просьбой о помощи. Батареи ИБП в ЦОДе вышли из строя, и, учитывая специфику работы call-центра, было необходимо срочно обеспечить его функционирование.

Мы быстро отреагировали, и вскоре call-центр вновь нормально работал. Изучив причины случившегося отказа, представители вендора вместе с руководством call-центра вынуждены были признать, что не была внедрена программа сервисного обслуживания (которая обычно включает профилактическое техобслуживание, регулярные проверки и мониторинг). Если бы в ЦОДе действовала такая программа, то отказа батарей можно было бы избежать.

Подобные случаи постоянно напоминают о том, сколь необходима всеобъемлющая программа профилактического техобслуживания. В сегодняшних быстро меняющихся условиях с неуклонно растущей ролью ЦОДов такая программа совершенно необходима для обеспечения бесперебойной работы.

Перемены повсюду

В условиях постоянно развивающихся ИТ одна из главных трудностей, с которой сталкиваются менеджеры ЦОДов, — это не отстать от перемен. Ушли в прошлое те времена, когда достаточно было иметь небольшую распределенную сеть, охватывающую несколько близлежащих узлов. Сегодня ЦОДов стало меньше, но они теперь гораздо крупнее, более централизованны и берут на себя громадные объемы вычислений.

Также ИТ-инфраструктура многих организаций развилась во взаимозависимую, критически важную сеть, охватывающую данные, приложения, хранение, серверы и собственно сетевое оборудование. Отказ питания в любой точке этой сети может нарушить работу всей организации и негативно сказаться на ее бизнесе.

Ввиду этих перемен очень важно, чтобы организации имели надежные планы профилактического техобслуживания в своих ЦОДах, а также знающих специалистов, что называется, под рукой. Переходя на новое оборудование и осуществляя централизацию своих ЦОДов, организации не должны упускать из вида, что столь же важно иметь надежную инфраструктуру питания и охлаждения, чтобы гарантировать постоянную доступность ИТ.

Слишком часто можно наблюдать такую картину: ИТ-директор решает купить новые серверы для организации, но когда они уже готовятся к установке, менеджер ЦОДа обнаруживает, что не было проведено никакой оценки того, насколько имеющаяся инфраструктура питания и охлаждения соответствует новым требованиям. Профессиональная оценка может определить, например, что на одной из критически важных линий не хватает мощности резервного питания для поддержки новых серверов.

Кроме того, тепловой анализ может показать, что одна из стоек охлаждается недостаточно хорошо. Если бы ИТ-директор и менеджер ЦОДа нашли время встретиться до того, как начинать внедрение, и обратились бы к сервисной организации, чтобы точно определить будущие требования к системам питания и охлаждения, то в смету уже были бы заложены дополнительные капиталовложения и оптимизация этих систем, дабы не создать риска возможных отказов.

Главное — гарантировать безотказность

При наличии хорошо согласованной программы сервисного техобслуживания в рамках всей организации риск нарушения питания, будь то стихийное бедствие или плановый апгрейд оборудования, можно свести к минимуму. ИТ-менеджеры рассчитывают сегодня на 100%-ный уровень готовности. Но как его достичь без всеобъемлющей программы профилактического техобслуживания? Как и ваш автомобиль, ЦОДы также должны быть надежны, им необходим регулярный “техосмотр”, чтобы надежность могла быть гарантирована.

Кроме того, бесперебойность работы зависит от знания менеджерами ЦОДов потенциальных опасностей и их способности разработать план вместе со специалистом по техобслуживанию, чтобы свести к минимуму риск отказа критически важных функций. Хорошо подготовленная организация будет иметь минимум нарушений в работе и будет чувствовать себя уверенно, даже если что-то случится.

Сегодня, как никогда, организации зависят от своей ИТ-инфраструктуры, от ее надежной работы, и не стоит экономить на том, чтобы построить тесные, доверительные отношения с поставщиком сервисных услуг. Опытный специалист поможет разработать и внедрить сильный план обеспечения бесперебойности бизнеса, который гарантирует не только оперативную готовность вашей ИТ-инфраструктуры, но будет охватывать весь жизненный цикл ЦОДа. Но программа, созданная сегодня, может перестать соответствовать требованиям через несколько лет, поэтому необходимо постоянно ее корректировать и развивать. Без такой всеобъемлющей, постоянно развивающейся программы организации подвергают себя риску потерять доходы и вызвать неудовлетворенность заказчиков.

Кроме того, организация может понести незапланированные расходы на ремонт и замену оборудования. Конечно, всё это трудно вписать в ограниченный ИТ-бюджет, но без необходимого техобслуживания затраты могут оказаться еще выше и будут к тому же неожиданными для организации.

Ваши требования к поставщику техобслуживания

Выбирая поставщика услуг техобслуживания, ищите тех, кто инвестирует в лучший инструментарий и знающий персонал. Один из верных способов свести к минимуму риск отказов питания — это внедрить всеобъемлющую программу планово-предупредительного техобслуживания с участием обученных вендором специалистов. Вы можете смело полагаться на поставщиков техобслуживания, если они:

  • могут гарантировать быстрый отклик по вашему вызову;
  • имеют опыт работы с установленным у вас оборудованием (чтобы восстановить его работоспособность с первого раза);
  • гарантируют наличие запчастей;
  • постоянно обучают своих инженеров, повышая их квалификацию, и снабжают их всеми новейшими приборами и средствами, необходимыми для работы;
  • имеют репутацию надежного и соблюдающего нормативные требования партнера;
  • способны дать вам целостную картину состояния вашего ЦОДа благодаря широте своего предложения.

Сегодня многие ведущие поставщики услуг технического обслуживания имеют новейшее тестовое оборудование и прекрасно обученных специалистов, так что проблемы часто можно разрешить, даже не посылая специалиста к заказчику. Имея хорошо спланированную стратегию, менеджеры ЦОДов могут смело рассчитывать на специалистов техобслуживания, которые решат их проблемы без простоев и снижения уровня готовности всех систем.

Заключение

Мы живем в эпоху перемен, в том числе внутри ЦОДов. Перемены неизбежны. ИТ меняются ежечасно, стремясь к совершенству, и это следует принять как данность. Всеобъемлющая программа профилактического техобслуживания, которая включает превентивные меры, регулярные проверки и мониторинг оборудования, просто необходима.

Отказ в call-центре, о котором мы рассказали в начале, был быстро ликвидирован, и его работа почти не пострадала. Но дело могло бы обернуться гораздо хуже, чья-то жизнь могла бы подвергнуться опасности. Сегодня этот call-центр службы спасения уже не берет на себя такого риска. Они внедрили всеобъемлющую программу профилактического техобслуживания, которая гарантирует бесперебойную работу их систем. Такой же выбор следует сделать всем менеджерам ЦОДов в наше время, полное перемен.

2.2.1. Разрабатывать годовые и ежемесячные графики обслуживания и ремонта энергопотребляющего оборудования, утверждать их у главного инженера.

2.2.2. Разрабатывать перечень регламентных и профилактических работ на каждую единицу основного оборудования.

2.2.3. Организовывать межремонтное обслуживание, своевременный и качественный ремонт и модернизацию энергопотребляющего оборудования, работу по повышению его надежности и долговечности, обеспечивать технический надзор за состоянием и его содержанием.

2.2.4. Определять устаревшее энергетического оборудование, требующее капитального ремонта и устанавливать очередность производства ремонтных работ.

2.2.5. Организовывать работу по проведению профилактических ремонтов энергетического оборудования согласно утвержденных графиков.

2.2.6 .Принимать участие в разработке нормативной документации по ремонту энергетического оборудования, расходу материалов на ремонтно-эксплутационные нужды.

2.2.7. Оформлять заявки на приобретение материалов и запасных частей, необходимых для ремонта энергетического оборудования в соответствии с требованиями к проведению закупок

2.2.8. Ежедневно контролировать наличие необходимого количества запасных частей ремонтного фонда (в программе 1С), контролировать их расходование при проведении профилактических и других ремонтов, своевременно составлять заявку на пополнение фонда запасных частей для бюджетирования и закупки. Контролировать поступление запасных частей ремонтного фонда, принимать запчасти по качеству.

2.2.9. Контролировать соблюдение условий хранения электроремонтных материалов и запчастей.

2.2.10. Проводить мероприятия, обеспечивающие безопасные и благоприятные условия труда при эксплуатации и ремонте энергетического оборудования.

2.2.11. Организовывать консультации по решению отдельных профилактических вопросов

2.2.12. Вести анализ простоев энергетического оборудования, принимать меры по предотвращению простоев и аварий оборудования;

2.2.14. Изучать условия работы энергетического оборудования, его отдельных узлов и деталей, разрабатывать и осуществлять мероприятия по предупреждению неплановых остановок энергетического оборудования, продлению сроков службы, межремонтных периодов, улучшению эксплуатации и сохранности, повышения надежности эксплуатации энергетического оборудования;

2.3.15. Подготавливать бюджет СГЭ.

2.3.16. Составлять годовые планы работ, направленные на повышение эффективности обслуживания энергетического оборудования, на улучшение конструкций узлов оборудования, снижение времени простоев.

2.3.17. Принимать участие в разработке и осуществлении мероприятий по повышению эффективности работы СГЭ, снижению затрат на ремонт энергетического оборудования и его содержание.



2.3.18. Организовывать эффективную работу подчиненных работников, контролировать ведение учета выполняемых работ.

2.3.19. Контролировать соблюдение подчиненными работниками:

Правил внутреннего распорядка и режима работы Общества;

Требований личной гигиены в соответствии с санитарными требованиями, предъявляемыми к работе на предприятиях пищевой промышленности, проводить необходимое обучение;

Выполнение ежедневных осмотров энергетического оборудования и ведение обязательных записей;

Внутренних регламентов по энергетического обслуживанию;

Требований охраны Ежедневно контролировать правильность эксплуатации энергетического оборудования, принимать, необходимы меры по целевому и правильному его использованию;

2.2.20. Своевременно рассматривать заявки на обслуживание и ремонт энергетического оборудования, оперативно реагировать на заявки;

2.2.21. Организовывать оперативное устранение неисправностей в работе энергетического оборудования;

2.2.22. Организовывать выход на работу необходимого ремонтного электротехнического персонала, оформлять необходимые документы по приему-сдаче оборудования из ремонта в ремонт

Любой компании, будь то транснациональная корпорация или малое предприятие со штатом в два человека, необходим офис. Ведь офис, это не только то место, где мы проводим переговоры с партнерами и принимаем клиентов, но и место, где ведется повседневная кропотливая работа сотрудниками компании, направленная на развитие и процветание нашего бизнеса.

Задумайтесь, ведь если из нашей жизни вычесть время, отведенное на сон, то окажется, что большую часть своего времени мы проводим в офисе, выполняя нашу повседневную работу. И ведь никто из нас не хочет провести большую часть своей жизни в сыром и темном подвале. Следовательно, задумываясь о том, чтоб снять офис недорого , необходимо помнить что офис, по сути, является вторым домом для его сотрудников, и наличие исправной инженерной инфраструктуры (вентиляции, электроснабжения, отопления, водоснабжения, подключения к Интернету и т.д.) играет не последнюю роль в обеспечении его устойчивого и успешного функционирования.

«Обеспечение функционирования офиса» - эта фраза, зачастую, фигурирует под номером один в должностных обязанностях офис-менеджера. Давайте же разберемся, что скрывается под этой сухой фразой, и что необходимо обеспечить для организации нормального функционирования офиса:

  • обеспечение соблюдения требований противопожарной безопасности;
  • обеспечение безопасности персонала;
  • обеспечение информационной безопасности;
  • обеспечение услуг связи, интернета;
  • обеспечение учета и контроля расходов на телефонные переговоры;
  • организация работы транспорта;
  • обеспечение курьерской связи;
  • организация питания сотрудников;
  • организация рабочих мест, эргономика;
  • обеспечение необходимого уровня освещенности и параметров микроклимата;
  • организация производственного контроля;
  • организация сервисно-профилактических работ;
  • организация проведения профилактического обслуживания и ремонта офисной техники;
  • обеспечение наличия необходимых канцелярских принадлежностей и расходных материалов;
  • организация перемещения мебели;
  • обеспечение вывоза мусора;
  • организация уборки помещений;
  • организация ведения учета посетителей;
  • организация поездок сотрудников (заказ авиа- и железнодорожных билетов для сотрудников офиса), диспетчеризация автотранспорта.

И это далеко не полный список мероприятий, необходимых для успешной работы офиса

Организация и контроль работы офиса – это непрерывный рабочий процесс. Он должен контролироваться на всех этапах, чтобы была уверенность в том, что офис функционирует четко и без сбоев. Но зачастую, далеко не всегда офис-менеджеру под силу обеспечить в полной мере выполнение всех мероприятий, для обеспечения бесперебойной работы офиса. Многие факторы просто неподвластны ему.

Ведь обеспечение бесперебойной работы систем вентиляции, электроснабжения, водоснабжения, отопления и других инженерных систем; обеспечение охраны и пожарной безопасности; содержание в чистоте и исправном состоянии лифтов и мест общего пользования – это те факторы, выполнение которых лежит тяжким грузом на плечах собственника арендуемого офиса. При этом они оказывают немалое влияние на устойчивое функционирование офиса, и как следствие на развитие и процветание бизнеса.

Арендуя офис в офисном центре, обратите особое внимание на то, в каком состоянии содержится здание, и удостоверьтесь в том, что собственник прилагает все усилия для обеспечения комфортной работы Вашего офиса, и только тогда вы сможете быть уверены в плодотворной работе и грядущих успехах Вашего бизнеса.

Для разработки плана существует три основных способа:

Собственными силами.

С помощью коммерческого программного обеспечения, предназначенного для составления планов обеспечения бесперебойной деятельности (демонстрационные версии таких программ можно посмотреть или скачать с веб-сайта независимого американского журнала по вопросам восстановления после бедствия Disaster Recovery Journal.

Привлечение внешнего консультанта для оказания помощи или непосредственной разработки плана.

Способы отличаются по стоимости, но во всех случаях требуется выделение персонала для проведения исследований и реализации плана.

Разработка собственными силами требует наличия квалификации в области составления плана обеспечения бесперебойной деятельности. Эту квалификацию можно приобрести только путем всестороннего обучения и накопления опыта. Большинство организаций не имеют этой возможности.

Разработку плана обеспечения бесперебойной деятельности предприятия необходимо организовать в виде проекта, чтобы управлять задачами, сроками и конечными результатами. Основными этапами типичного проекта являются:

Организация выполнения проекта;

Оценка риска, уменьшение нежелательных последствий от наступления событий, связанных с риском, анализ последствий для бизнеса;

Разработка стратегии восстановления деятельности;

Документирование плана;

Обучение;

Имитация бедствия.

Организация выполнения проекта

Организация выполнения проекта включает в себя административное управление проектом, определение допущений, проведение совещаний и разработку политики .

Оценка риска. При оценке риска выявляются типы бедствий, которые могут произойти в каждом конкретном месте. Обследуется физическая инфраструктура здания и его окружения. Для каждого типа бедствия делается оценка возможной продолжительности и присваивается относительная величина, соответствующая вероятности их появления. Используется шкала, например, от 0 до 3; где 0 означает невероятное событие, а 3 -- весьма вероятное. В результате этого выявляются области, в которых следует провести дальнейшие исследования, чтобы уменьшить последствия событий, приводящих к риску.

Анализ последствий для деятельности организации. После оценки риска проводится анализ последствий бедствия для деятельности организации, в ходе которого определяются потери из-за невозможности продолжать нормальную деятельность. Они могут быть очевидными или носить более абстрактный характер, при котором руководству придется сделать предположительную оценку потерь. В любом случае цель заключается не в том, чтобы получить точный ответ, а в том, чтобы выявить факторы, которые являются критически важными для продолжения деятельности компании. На этом этапе определяется масштаб плана обеспечения бесперебойной деятельности. Чрезмерные меры предосторожности потребуют лишних средств, а недостаточные -- не обеспечат должной безопасности.

Разработка стратегии обеспечения бесперебойной деятельности. После определения требований можно принимать решение о том, как обеспечивать восстановление деятельности. Существует множество вариантов технических решений, в том числе:

Использование "горячего" резервного помещения. Поставщик предоставляет компании подготовленное рабочее помещение с оборудованием, средствами телекоммуникации, персоналом, осуществляющим техническую поддержку, и т.д., обычно по годовому контракту. Заказчики получают доступ к оборудованию по принципу "первый пришел -- первым обслуживается".

Использование "холодного" резервного помещения. Компания организует работу в пустующем или арендуемом помещении, которое подготовлено к использованию. Сразу после бедствия в помещении развертывается оборудование (возможно, закупаемое у поставщиков), программное обеспечение и службы обеспечения.

Использование внутренних резервов. Для предоставления услуг в чрезвычайных обстоятельствах используется оборудование компании, которое расположено в ином месте.

Заключение соглашения о взаимной поддержке. Заключается соглашение с другой компанией о коллективном использовании ресурсов после бедствия. При этом предполагается, что резервное оборудование всегда имеет нужную производительность и вас устраивает степень защиты информации при коллективной работе.

В некоторых случаях можно использовать комбинацию этих вариантов. Крупные многонациональные компании чаще всего используют для локальных вычислительных сетей метод внутреннего резервирования. Поскольку количество имеющихся резервных помещений ограничено, может оказаться, что в случае чрезвычайных обстоятельств не окажется рабочего помещения, которое можно было бы использовать. Бедствие в масштабе региона может привести к тому, что все резервные помещения будут заняты и компании негде будет возобновить работу.

Хорошо подготовленный план обеспечивает компанию пошаговыми инструкциями, соответствующими типу и тяжести бедствия. В нем указываются функциональные группы специалистов компании, подготовленные для реализации плана. Наличие хорошо проработанного плана гарантирует, что в стрессовой ситуации после возникновения чрезвычайных обстоятельств, критически важные факторы не будут упущены.

Документация. План может документироваться различными способами. Большинство компаний все еще применяют традиционные текстовые редакторы, другие используют коммерческое программное обеспечение. Какой бы метод ни был использован, важно обеспечить строгое выполнение процедур управления внесением изменений, чтобы поддерживать план в состоянии, соответствующем реальной текущей ситуации.

Обучение. Обучение "Группы восстановления" направлено на то, чтобы каждый сотрудник знал свои функции и обязанности в случае возникновения нештатных ситуаций.

Имитация бедствия. Большинство компаний проводят испытания плана минимум один раз в полгода. Имитируя бедствия можно проверить план, найти его слабые места и отработать взаимодействие участников. Обнаружение недостатков обычно влечет за собой корректировку плана. План должен регулярно проходить испытания и корректироваться. Лишь немногие планы обеспечения бесперебойной деятельности выполняются так, как это предусматривалось первоначально. Поскольку внесение поправок в план необходимо делать регулярно, должна быть максимально упрощена процедура корректировки плана .

При разработке плана обеспечения бесперебойной деятельности необходимо предусмотреть следующее:

Если в настоящий момент план отсутствует, необходимо уведомить высшее руководство о потенциальных опасностях, которые связаны с отсутствием подготовленного и испытанного плана;

При наличии плана надо обеспечить его регулярное испытание -- провести циклическую замену специалистов, участвующих в испытаниях. Желательно, чтобы в этом процессе приняло участие максимальное количество сотрудников;

Надо добиться того, чтобы руководство сделало планирование обеспечения бесперебойной деятельности одной из своих целей;

При выборе альтернативных рабочих помещений необходимо позаботиться, чтобы ими можно было воспользоваться при первой необходимости;

Не принимайте существующие системы и процедуры резервирования на веру: проведите полную экспертизу резервирования и внесите необходимые изменения. Проведите испытания процедур восстановления;

При определении приоритетов приложений опросите руководителей, чтобы они изложили свою точку зрения;

Учтите в плане все мелочи, которые могли бы помешать процессу восстановления деятельности;

После составления плана разработайте механизм, обеспечивающий его регулярное обновление.

Также план должен содержать процедуры выполнения следующих функций:

Ввод в действие процедур для чрезвычайных ситуаций.

Уведомление сотрудников, поставщиков и заказчиков.

Формирование группы (групп) восстановления.

Оценка последствий бедствия.

Принятие решения о реализации плана восстановления деятельности.

Ввод в действие процедур восстановления деятельности.

Переезд в альтернативное рабочее помещение (помещения).

Восстановление функционирования критически важных приложений.

Восстановление основного рабочего помещения.

Кроме того, план должен содержать документы, которые могут быть использованы персоналом, не знакомым с конкретно восстанавливаемыми функциями. Эти документы должны включать следующие данные:

Схемы коммутации телефонов;

Процедуры для аварийного отключения питания;

Организационная структура Центра восстановления;

Требования к оборудованию и снабжению Центра восстановления;

Конфигурация Центра восстановления;

Список критически важных приложений;

Список восстанавливаемого оборудования;

Сводные данные по оценке рисков.

Проводе комплексный анализ представим описание плана по обеспечению непрерывной деятельности в организации. План включает следующие основные разделы:

а) Основные положения плана.

б) Оценка чрезвычайных ситуаций:

Выявление уязвимых мест компании;

Классификация возможных опасных событий и оценка вероятности их возникновения;

Сценарии чрезвычайных ситуаций;

Потенциальные источники отрицательных последствий каждой чрезвычайной ситуации и оценка величины ущерба;

Набор критериев, на основании которых объявляется чрезвычайная ситуация.

в) Деятельность компании в чрезвычайной ситуации:

Первоначальное реагирование на чрезвычайную ситуацию (оценка опасного события, объявление чрезвычайной ситуации, оповещение необходимого круга лиц, ввод в действие чрезвычайного плана);

Мероприятия, обеспечивающие бесперебойность деятельности компании в чрезвычайной ситуации и восстановление ее нормального функционирования.

г) Поддержание готовности к возникновению чрезвычайной ситуации:

Контроль правильности и корректировка содержания плана;

Составление списка адресов и процедуры рассылки плана;

Разработка программы повышения квалификации и ознакомления персонала с действиями, необходимыми для восстановления деятельности компании после бедствия;

Подготовка к опасным событиям, обеспечение безопасности и предотвращение бедствий;

Регулярное проведение частичных и комплексных проверок (типа пожарных учений) готовности компании к действиям в чрезвычайной ситуации и способности восстановить нормальную деятельность;

Регулярное создание резервных копий данных, документации, бланков входных и выходных документов и основного программного обеспечения, их хранение в безопасном месте.

д) Информационное обеспечение:

Приоритетные функции, выполняемые компанией;

Списки внутренних и внешних ресурсов -- технических средств, программного обеспечения, средств связи, документов, офисного оборудования и персонала;

Учетная информация о техническом, программном и другом обеспечении, необходимом для восстановления деятельности организации в случае чрезвычайной ситуации;

Список лиц, которых необходимо оповестить о чрезвычайной ситуации с указанием адресов и телефонов;

Вспомогательная информация -- планы и схемы, маршруты перевозок, адреса и т.п.;

Описание детальных пошаговых процедур, обеспечивающих четкое выполнение всех предусмотренных мер;

Функции и обязанности сотрудников в случае возникновения непредвиденных обстоятельств;

Сроки восстановления деятельности в зависимости от типа возникшей чрезвычайной ситуации;

Смета расходов, источники финансирования.

е) Техническое обеспечение:

Создание и поддержание базы технических средств, обеспечивающей бесперебойную деятельность компании в чрезвычайной ситуации;

Создание и поддержание в надлежащем состоянии резервного производственного помещения.

ж) Организационное обеспечение, состав и функции следующих групп, обеспечивающих бесперебойную деятельность в случае бедствия:

Группы оценки чрезвычайной ситуации;

Группы управления в кризисной ситуации;

Группы для работ в чрезвычайной ситуации;

Группы восстановления;

Группы обеспечения работы в резервном производственном помещении;

Группы административной поддержки.

Таким образом план обеспечения непрерывной деятельности организации представляет собой детальный перечень мероприятий, которые должны быть выполнены до, во время и после бедствия. Этот план документируется и испытывается, чтобы удостовериться в его работоспособности в изменяющихся условиях.

План служит руководством к действию во время кризиса и гарантирует, что ни один важный аспект не будет упущен. Профессионально составленный план направляет действия даже неопытных сотрудников.

Наличие детального, регулярно испытываемого плана поможет оградить любую организацию от судебных исков по поводу халатности. Само существование плана служит доказательством того, что руководство компании не пренебрегло подготовкой к возможным бедствиям.

Основные выгоды от составления детального плана обеспечения бесперебойной деятельности состоят в следующем:

Минимизация потенциальных финансовых потерь;

Уменьшение юридической ответственности;

Сокращение времени нарушения нормальной работы;

Обеспечение стабильности деятельности организации;

Организованное восстановление деятельности;

Сведение к минимуму суммы страховых взносов;

Уменьшение нагрузки на ведущих сотрудников;

Лучшая сохранность имущества;

Обеспечение безопасности персонала и заказчиков;

Соблюдение требований законов и инструкций.