Правила эксплуатации инженерной инфраструктуры ЦОД

Инженерная инфраструктура дата - центра – система полного жизнеобеспечения всех сегментов и служб ЦОД. В функции инженерных подсистем входит постоянное поддержание в рабочем состоянии  серверных ресурсов и хранилищ  данных вычислительного комплекса.

Сама инженерная инфраструктура ЦОД также нуждается в проведении профилактики и диагностики. Это жизненно необходимо для поддержания в рабочем состоянии собственных подсистем и подразделений дата-центра. Проведение диагностики подразумевают правила эксплуатации инженерных подсистем.

В состав регламентных работ входит частый профилактический осмотр и диагностика основных групп оборудования. Для безопасности дата-центра также должен обязательно проводиться осмотр резервных блоков. По действующим правилам эта процедура может проводиться реже, чем осмотр основного оборудования. Но пренебрегать ей не стоит.

Для проведения профилактических работ  отдельных инженерных подсистем может быть задан свой режим периодичности. Частота диагностики напрямую связана с функциональной важностью и интенсивностью рабочего использования отдельных сегментов.

Так, система кондиционирования и охлаждения  нуждается в регулярной профилактической чистке и осмотре основных рабочих блоков. Помимо визуального осмотра  отдельных сегментов систем охлаждения: внешних и внутренних блоков, линий трассы, ремней приводов вентиляторов проводится контроль уровня давления охлаждающего компонента.

Для охлаждения  используется инертный газ  фреон, помещаемый в специальные контуры. С помощью промышленных пылесосов специалисты проводят детальную чистку фильтров от грязи, осуществляют замену изношенных фильтров внутренних блоков.

Ежегодные процедуры эксплуатации инженерных систем ЦОД

Профилактический осмотр и диагностика инженерных систем проводится по определенному графику, совпадающему с ежегодным расписанием.  В этом документе, утвержденном у руководства ЦОД, выполнение отдельных процедур  расписано по месяцам и продолжительности проведения работ.  

Диагностика проводится на любом объекте, независимо от уровня ЦОД.  Для коммерческих ЦОД старших уровней надежности и крупных дата-центров распределенной инфраструктуры  важным является возможность проведения ремонтных работ и диагностики без останова работающего оборудования. Останов серверов и СХД может привести к сбоям вычислительных операций  и ошибкам при обработке запросов пользователей.

Для такого комплекса даже минутная остановка в работе вычислительных ресурсов может привести к невосполнимым потерям.  Поэтому для ЦОД старших уровней действуют более жесткие нормативы при проведении диагностических плановых работ.Но данные работы проводить необходимо в дата- центре любого уровня. Соблюдение правил эксплуатации продлевает срок рабочей пригодности оборудования и срок службы инженерных подсистем.

Хорошая диагностика исключает провокационные ситуации для возникновения сбоев и аварий в сети, а также временных «зависаний» компьютеров и серверов.

Для ЦОД всех 4-х уровней надежности создается свое уникальное расписание. Данный график совмещается с типовой схемой регламентных профилактических работ. В соответствии с этим документом специалисты проводят диагностику на объекте.

Список регламентных и профилактических работ инженерной инфраструктуры ЦОД

Каждый месяц сервисные инженеры ЦОД проводят следующие регламентные процедуры:

  • визуальный осмотр, очистку механических подсистем от пыли и загрязнений, смазку металлических доводчиков дверей, замков и петель, клапанов и приводов дымоудаления, компонентов СКУД
  • осмотр и очистку от пыли и грязи электронных компонентов, к которым относятся датчики систем охранной и пожарной сигнализации, видеорегистраторы СКУД.
  • тестирование электронных компонентов для проверки их работоспособности
  • проверку розеточных блоков
  • осмотр и сверку штатных манометров баллонов системы газового пожаротушения.
    По правилам пожарной безопасности кроме осмотра и замера показаний манометра необходимо провести обязательную сверку показаний прибора с эталонным значением, указанным в его техническом паспорте.
  • кратковременный пуск дизеля с проверкой на внешнюю тестовую нагрузку.

Раз в два месяца каждый год проводится обязательная процедура осмотра системы защиты от протечек. Выполняется очистка датчиков и проводится тестирование системы путем искусственной имитации ситуации утечки воды.

Раз в 4-е месяца в помещениях дата-центра проводятся следующие виды профилактических работ:

  • визуальный осмотр электрических схем люков забора воздуха и дымоудаления
  • тестирование системы пожарной сигнализации и газового пожаротушения
  • контроль состояния пожарных датчиков
  • осмотр фальшпола и напольных перекрытий по отдельным зонам. Осмотр производится для выявления мест возможной расстыковки плит, расшатанных опор и прочих ненужных отклонений 
  • проверка основной и резервной систем энергоснабжения: поиск возможных механических повреждений электрощитов, осмотр системы вентиляции ИБП и контроллера,  контроль  уровня заряда батарей
  • осмотр компонентов СКУД, чистка  считывающих устройств и экранов камер и  от загрязнений и пыли
  • диагностика рабочей станции оператора 
  • осмотр систем видеонаблюдения
  • архивирование данных системы видеонаблюдения. 

Два раза в году для выявления возможных отклонений в работе инженерных подсистем необходимо проводить следующие процедуры:

  • проверка состояния электрической сети
  • сверка показаний датчиков температуры и влажности систем кондиционирования с базовыми настройками
  • через главную заземляющую шину стоек, шкафов и щитов проводится протяжка болтовых соединений
  •  ведутся замеры величин сопротивления

Ежегодно проводят профилактическое тестирование и проверку выборочных инженерных подсистем.  Среди проверяемых компонентов:

  • аккумуляторные батареи и автономные источники  электропитания. Плановая проверка помогает исключить отключение оборудования по причине разрядки батарей
  • энергосистемы 
  • автоматика ДГУ: основной и резервной установки 
  • cитемы пожарной сигнализации.  Процедура включает замену неисправных  противогазов и других индивидуальных средств защиты с истекшим сроком службы.

Работоспособность и производительность вычислительного комплекса во многом зависит от состояния внутренней ИТ-инфраструктуры и состояния  серверов, хранилищ данных, телекоммуникационных ресурсов и коммуникационных каналов.

Поддержание в хорошем рабочем состоянии основных и резервных вычислительных мощностей ЦОД – задача квалифицированных ИТ-специалистов.  Качественная работа оборудования во многом также  зависит от  качества  подсистем жизнеобеспечения ЦОД.

Определиться с оптимальным  необходимым объемом  профилактических работ в ЦОД Вам помогут инженеры системного интегратора ИЦ Телеком-Сервис.