В марте этого года компания Cisco представила блейд-сервер Cisco UCS B480 M5. На базе этой системы мы развернули новый пул ресурсов в Санкт-Петербурге и готовим к запуску аналогичный пул в Москве. Но буквально полгода спустя (в сентябре) ИТ-гигант выпустил еще одну новинку — UCS C480 ML M5, «заточенный» для работы с системами искусственного интеллекта. Рассказываем, что внутри, и зачем это все дата-центрам.
/ Wikimedia / Tibigc / CC
Новая разработка компании — модифицированная версия сервера C480 M5. Для ускорения обработки алгоритмов машинного обучения два слота для CPU в том сервере заменили на разъемы для GPU. В эти слоты поместили графические ускорители Tesla V100-32G от NVIDIA.
Общее количество карт достигает восьми штук. Производительность каждого из ускорителей в 47 раз превосходит показатели традиционных процессоров на задачах глубокого обучения. Обмен данными идет через встроенный интерфейс NVLink — это 200 ГБ/с на один GPU.
Также в C480 ML M5 установлены два процессора Intel Xeon, каждый из которых поддерживает до 28 ядер, и 3 ТБ оперативной памяти. При этом к серверу можно подключить до 24 HDD или SSD через интерфейсы SAS или SATA.
По словам представителей Cisco, сервер должен упростить работу с моделями машинного обучения на всех этапах их разработки: от сбора и анализа данных до вывода результатов обработки. При этом он подходит для работы с конвейеризованными приложениями в многооблачных средах. Речь идет о фреймворках Hadoop и Spark, а также TensorFlow и PyTorch. Дополнительно Cisco ведет переговоры о сотрудничестве с платформой Anaconda, а также совместно с Google работает над Kubeflow.
Cisco предполагают, что к 2019 году 70% хакерских атак будут использовать шифрование трафика, поэтому, по их мнению, дополнительные мощности нового сервера также сыграют важную роль в защите ИТ-инфраструктуры дата-центров. Для этих целей у ИТ-гиганта тоже есть свое решение: Encrypted Traffic Analytics. Система выявляет уязвимые места в инфраструктуре и обнаруживает вредоносные паттерны даже в зашифрованном трафике.
/ Wikimedia / Global Access Point / PD
Отметим, что релиз C480 ML M5 повлияет и на работу организаций, которые обрабатывают большие объемы данных, — например медицинских и финансовых. Аналитикам и разработчикам в этих организациях будет проще извлекать полезную информацию из Big Data. Новый сервер Cisco ускорит процесс обработки крупных сводов информации и поиска паттернов (например, при анализе медицинских снимков).
По словам представителей Cisco, 80% мировых бизнесов уже внедрили сервисы на базе технологий искусственного интеллекта или внедрят такие решения к 2020 году. А к 2035 году технологии МО помогут увеличить производительность организаций на 40%.
Директор по исследованиям в Gartner Чираг Декате (Chirag Dekate) считает, что C480 ML M5 будет пользоваться спросом у старых и новых клиентов компании. При этом директор по работе с партнерами Скотт Мор (Scott Mohr) говорит, что Cisco продолжит совершенствовать решения для сервисов на основе нейронных сетей, и важную роль в этом процессе сыграет опыт клиентов. Поэтому сейчас новинка тестируется полусотней партнеров Cisco.
Позже систему сделают доступной для всех сертифицированных партнеров компании. Несмотря на ведущиеся тесты, пока сказать что-либо об эффективности нового сервера не представляется возможным. Специалисты Cisco (в отличие от той же NetApp) решили не предоставлять результаты тестов производительности Resnet или Alexnet, поскольку, по их словам, они не отражают положение вещей при работе на реальных проектах с машинным обучением.
Заказать C480 ML M5 можно будет уже в конце этого года.
/ Wikimedia / Tibigc / CC
Что внутри
Новая разработка компании — модифицированная версия сервера C480 M5. Для ускорения обработки алгоритмов машинного обучения два слота для CPU в том сервере заменили на разъемы для GPU. В эти слоты поместили графические ускорители Tesla V100-32G от NVIDIA.
Общее количество карт достигает восьми штук. Производительность каждого из ускорителей в 47 раз превосходит показатели традиционных процессоров на задачах глубокого обучения. Обмен данными идет через встроенный интерфейс NVLink — это 200 ГБ/с на один GPU.
Также в C480 ML M5 установлены два процессора Intel Xeon, каждый из которых поддерживает до 28 ядер, и 3 ТБ оперативной памяти. При этом к серверу можно подключить до 24 HDD или SSD через интерфейсы SAS или SATA.
Зачем нужен новый сервер
По словам представителей Cisco, сервер должен упростить работу с моделями машинного обучения на всех этапах их разработки: от сбора и анализа данных до вывода результатов обработки. При этом он подходит для работы с конвейеризованными приложениями в многооблачных средах. Речь идет о фреймворках Hadoop и Spark, а также TensorFlow и PyTorch. Дополнительно Cisco ведет переговоры о сотрудничестве с платформой Anaconda, а также совместно с Google работает над Kubeflow.
«Новый ML M5 упростит работу с системами искусственного интеллекта для облачных провайдеров и компаний, владеющих дата-центрами, — комментирует Сергей Белкин, начальник отдела развития 1cloud. — Технологии машинного обучения можно использовать для оценки всех процессов, происходящих в ЦОД. Такие приложения уже есть в экосистеме Cisco. Например, Tetration Analytics собирает данные телеметрии от программных и аппаратных датчиков и обрабатывает их с помощью методов МО».
Cisco предполагают, что к 2019 году 70% хакерских атак будут использовать шифрование трафика, поэтому, по их мнению, дополнительные мощности нового сервера также сыграют важную роль в защите ИТ-инфраструктуры дата-центров. Для этих целей у ИТ-гиганта тоже есть свое решение: Encrypted Traffic Analytics. Система выявляет уязвимые места в инфраструктуре и обнаруживает вредоносные паттерны даже в зашифрованном трафике.
/ Wikimedia / Global Access Point / PD
Отметим, что релиз C480 ML M5 повлияет и на работу организаций, которые обрабатывают большие объемы данных, — например медицинских и финансовых. Аналитикам и разработчикам в этих организациях будет проще извлекать полезную информацию из Big Data. Новый сервер Cisco ускорит процесс обработки крупных сводов информации и поиска паттернов (например, при анализе медицинских снимков).
По словам представителей Cisco, 80% мировых бизнесов уже внедрили сервисы на базе технологий искусственного интеллекта или внедрят такие решения к 2020 году. А к 2035 году технологии МО помогут увеличить производительность организаций на 40%.
Перспективы и планы на будущее
Директор по исследованиям в Gartner Чираг Декате (Chirag Dekate) считает, что C480 ML M5 будет пользоваться спросом у старых и новых клиентов компании. При этом директор по работе с партнерами Скотт Мор (Scott Mohr) говорит, что Cisco продолжит совершенствовать решения для сервисов на основе нейронных сетей, и важную роль в этом процессе сыграет опыт клиентов. Поэтому сейчас новинка тестируется полусотней партнеров Cisco.
Позже систему сделают доступной для всех сертифицированных партнеров компании. Несмотря на ведущиеся тесты, пока сказать что-либо об эффективности нового сервера не представляется возможным. Специалисты Cisco (в отличие от той же NetApp) решили не предоставлять результаты тестов производительности Resnet или Alexnet, поскольку, по их словам, они не отражают положение вещей при работе на реальных проектах с машинным обучением.
Заказать C480 ML M5 можно будет уже в конце этого года.