В процессе цифровой трансформации экономики человечеству приходится строить все больше центров обработки данных. Сами ЦОДы тоже должны трансформироваться: вопросы их отказоустойчивости и энергоэффективности сейчас важны как никогда. Объекты потребляют огромное количество электроэнергии, а отказы размещенной в них критически важной ИТ-инфраструктуры обходятся бизнесу недешево. На помощь инженерам приходят технологии искусственного интеллекта и машинного обучения — в последние годы их все чаще используют для создания более совершенных дата-центров. Такой подход увеличивает уровень готовности объектов, сокращает количество отказов и снижает эксплуатационные расходы.
Как это работает?
Технологии искусственного интеллекта и машинного обучения используют для автоматизации принятия операционных решений на основе собираемых с различных датчиков данных. Как правило подобные средства интегрируются с системами класса DCIM (Data Center Infrastructure Management) и позволяют прогнозировать возникновение внештатных ситуаций, а также оптимизировать работу ИТ-оборудования, инженерной инфраструктуры и даже обслуживающего персонала. Очень часто производители предлагают владельцам ЦОДов облачные сервисы, накапливающие и обрабатывающие данные многих заказчиков. Такие системы обобщают опыт эксплуатации разных дата-центров, поэтому работают лучше локальных продуктов.
Управление ИТ-инфраструктурой
Компания HPE продвигает облачный сервис предиктивного анализа InfoSight для управления ИТ-инфраструктурой, построенной на системах хранения Nimble Storage и HPE 3PAR StoreServ, серверах HPE ProLiant DL/ML/BL, стоечных системах HPE Apollo и платформе HPE Synergy. InfoSight анализирует показания установленных в оборудовании датчиков, обрабатывая более миллиона событий в секунду и постоянно самообучаясь. Сервис не только выявляет неисправности, но и прогнозирует возможные проблемы с ИТ-инфраструктурой (отказы оборудования, исчерпание емкости СХД, снижение производительности виртуальных машин и т.д.) еще до их возникновения. Для предиктивной аналитики в облаке развернуто ПО компании VoltDB, использующее авторегрессионные модели прогнозирования и вероятностные методы. Подобное решение доступно и для гибридных систем хранения данных компании Tegile Systems: облачный сервис IntelliCare Cloud Analytics осуществляет мониторинг состояния, производительности и использования ресурсов устройств. Технологии искусственного интеллекта и машинного обучения использует также Dell EMC в своих решениях для высокопроизводительных вычислений. Подобных примеров множество, по этому пути сейчас идут практически все ведущие производители вычислительного оборудования и систем хранения данных.
Энергоснабжение и охлаждение
Другая сфера применения ИИ в дата-центрах связана с управлением инженерной инфраструктурой и прежде всего с охлаждением, доля которого в общем энергопотреблении объекта может превышать 30 %. Одной из первых об умном охлаждении задумалась корпорация Google: в 2016 году совместно с компанией DeepMind она разработала систему искусственного интеллекта для мониторинга отдельных компонентов ЦОД, позволившую на 40 % сократить энергозатраты на кондиционирование. Первоначально она только давала подсказки персоналу, но впоследствии была доработана и теперь может управлять охлаждением машинных залов самостоятельно. Развернутая в облаке нейросеть обрабатывает данные с тысяч внутренних и наружных датчиков: она принимает решения с учетом нагрузки на серверы, температуры, а также скорости ветра на улице и множества других параметров. Предлагаемые облачной системой инструкции направляются в дата-центр и там еще раз проверяются на безопасность локальными системами, при этом персонал всегда может отключить автоматический режим и начать управлять охлаждением вручную. Nlyte Software совместно с командой IBM Watson создала решение, которое собирает данные о температуре и влажности, энергопотреблении и загруженности ИТ-оборудования. Оно позволяет оптимизировать работу инженерных подсистем и не требует подключения к облачной инфраструктуре производителя — при необходимости решение может быть развернуто непосредственно в дата-центре.
Другие примеры
Инновационных умных решений для центров обработки данных на рынке очень много и постоянно появляются новые. Компания Wave2Wave создала роботизированную систему коммутации волоконно-оптических кабелей для автоматизированной организации перекрестных подключений в узлах обмена трафиком (Meet Me Room) внутри ЦОД. Разработанная ROOT Data Center и LitBit система использует ИИ для мониторинга резервных ДГУ, а в Romonet сделали самообучающееся программное решение для оптимизации инфраструктуры. Созданные компанией Vigilent решения используют машинное обучение для прогнозирования отказов и оптимизации температурного режима в помещениях дата-центра. Внедрение в дата-центрах искусственного интеллекта, машинного обучения и других инновационных технологий для автоматизации процессов началось сравнительно недавно, но сегодня это одно из самых перспективных направлений развития отрасли. Современные ЦОДы стали слишком большими и сложными, чтобы эффективно управлять ими вручную.