IBM и Nvidia увеличили скорость глубокого обучения нейронных сетей


    За нейронными сетями — будущее человечества, считают некоторые специалисты. Или, если не всего человечества, то ряда сфер, связанных с информационными технологиями. Компания IBM давно работает над созданием эффективной когнитивной системы, способной решать сложные задачи и помогать человеку в поиске решений ряда проблем. Один из важных вопросов — это глубокое обучение нейронных сетей.

    Этот процесс должен быть достаточно быстрым, но вместе с тем и эффективным. Корпорация IBM заключила договор с Nvidia о совместном сотрудничестве, которое заключается в разработке программного обеспечения IBM Power AI. Это платформа, работающая на специализированном сервере IBM Power System S822LC на процессорах IBM Power 8. Такая программно-аппаратная платформа, по мнению специалистов, и должна обеспечивать быстрое глубокое обучение современных сетей.

    Особенностью сервера Power System S822LC является наличие в нем интерфейса Nvidia NV Link. Этот интерфейс представляет собой средство прямого взаимодействия между CPU и GPU. Из таких серверов участники проекта составили тестовую нейросеть Alex Net, где используется фреймворк Caffe от Berkeley Vision and Learning Center. Кроме Caffe, платформа IBM Power AI включает такие библиотеки, как cuDNN, cuBLAS и NCCL. Caffe — широко используемый фреймворк, который считается одним из наиболее популярных в сфере глубинного обучения нейросистем.

    Разработчики утверждают, что производительность новой системы в несколько раз выше производительности других систем, построенных на обычных серверах. Партнеры говорят, что производительность сервера 822LC равна производительности системы X86 архитектуре с восемью графическими адаптерами Nvidia предыдущего поколения — Tesla M40. В целом, сервер S822LC с NVLink может передавать данные примерно в пять раз быстрее, чем аналогичные x86 системы.

    Собственно, этот сервер — первая система на Power8, которая поставляется с NVLink. До выхода новинки обмен данных между центральным процессором и GPU был узким местом в интерфейсе PCIe x16 Gen3. Сейчас же все данные находятся в общем пространстве системной памяти, что, можно сказать, облегчает программирование.

    Конфигурация Power System S822LC

    — Процессоры IBM POWER8, стандартно работающие на частоте 2,92 или 3,32 ГГц, с 8 или 10 полностью активированными ядрами;
    — До 1024 ГБ оперативной памяти;
    — Пять слотов PCIe Gen3, два из которых поддерживают только GPU;
    — Два жестких диска с интерфейсом SATA на 1 TB, 7200 об/мин, или два SSD SATA накопителя на 480 (или 960) ГБ;
    — Два Compute Intensive Accelerator GPU K80;
    — Один передний порт USB 2.0 и один задний порт USB 3.0;
    — Два источника питания;
    — 19-дюймовое стоечное исполнение высотой 2U;
    — Операционные системы:
    Ubuntu Server 14.04.5 LTS
    Ubuntu Server 16.04.1 LTS
    Red Hat Enterprise Linux (RHEL) 7.2



    В состав Power AI, помимо всего прочего, входят несколько инструментов глубинного обучения, оптимизированных для новой системы. Например, это научная платформа Torch и библиотека Python. В целом, платформа Power AI может работать как на одном сервере, так и на тысячах машин, ее легко можно масштабировать.

    «Power AI упростит глубинное обучение и облегчит работу с другими аналитическими технологиями. Ученые и исследователи получат легко масштабируемую платформу, которую можно развернуть довольно быстро», — заявили разработчики. Они также заявили, что считают новую платформу лучшей в плане создания ИИ-приложений. Она без труда позволяет создавать «интеллектуальных» чат-ботов или же работать с данными статистики для получения обработанных результатов анализа в сжатые сроки.

    Свой интерес в том, чтобы опробовать новую платформу, выразили такие организации и проекты, как Human BrainProject, HPC облачный провайдер Nimbix, и турецкий вычислительный центр суперкомпьютеров SC3 Electronics.
    IBM
    110,29
    Компания
    Поделиться публикацией

    Комментарии 1

      0
      Партнеры говорят, что производительность сервера 822LC равна производительности системы X86 архитектуре с восемью графическими адаптерами Nvidia предыдущего поколения — Tesla M40.

      — Два Compute Intensive Accelerator GPU K80;

      M40 новее K80, а каком предыдущем поколении говорят партнеры?
      говоря про тот же NVLINK есть от этих же партнеров сравнение с P100 в той же SuperMicro, в которую и карт больше можно запихнуть и памяти в 2-3 раза больше можно установить?

      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

      Самое читаемое