NVIDIA показала GPU на Ampere для облачных вычислений и обучения систем на ИИ

    image

    NVIDIA на днях продемонстрировала графические процессоры с архитектурой Ampere. Они предназначены для дата-центров, способны выполнять научные расчеты и обрабатывать большие данные.

    Презентация прошла необычным образом. Директор компании Дженсен Хуанг вынул cистему DGX A100 из духовки у себя на кухне.


    «Это наш самый лучший графический процессор для дата-центров, и он вобрал почти десять лет нашего опыта», — отметил Хуанг позднее уже на пресс-конференции.

    У GА100 свыше 54 млрд транзисторов. GPU GA100 содержит 8192 ядра CUDA и 512 тензорных ядер третьего поколения, а также шесть модулей памяти HBM2 с шиной памяти разрядностью в 6144 бита. Выпускается по 7-нм технологии компанией TSMC.

    A100 GPU при этом — не графический процессор, а графический ускоритель. Он включает пять модулей HBM2 (40 ГБ) с шиной памяти разрядностью в 5120 бит. 3456 ядер CUDA предназначены для вычислений с плавающей запятой двойной точности (FP64), 6912 ядер — для одинарной (FP32). Тензорных ядер третьего поколения с поддержкой вычислений TF32 — 432.

    В новой станции DGX A100 AI восемь таких процессоров объединят в один. Общая производительность системы составит 5 петафлопс. Она будет иметь 320 ГБ видеопамяти с пропускной способностью 12,4 Тбит/с.

    В GPU включили TensorFloat-32 — новый режим для обработки математических матриц, также называемый тензорными операциями, который используется в основе AI и некоторых приложений HPC. Комбинация TF32 со структурированной разреженностью позволяет повысить производительность процессоров по сравнению с GPU Volta в 20 раз.

    image

    Пиковая производительность ускорителя составляет 19,5 TFLOPS (FP32) или 9,7 TFLOPS (FP64).

    GA100 поддерживает интерфейс NVLink третьего поколения. Это дает возможность обмениваться данными с аналогичными GPU со скоростью 600 Гбайт/с. Каждый графический процессор поддерживает 12 каналов NVLink 3.0. С помощью технологии виртуализации MIG можно разделять ресурсы одного графического процессора на семь независимых сегментов.

    image

    Разработка будет выполнять задачи обучения искусственного интеллекта. Как отметили в NVIDIA, сейчас клиенты использует решение стоимостью $11 млн, которое занимает 25 серверных стоек в дата-центре и потребляет 630 киловатт электроэнергии. Однако на базе Ampere для тех же мощностей понадобится в 11 раз меньше оборудования, стоимость которого составит около $1 млн, всего одна серверная стойка и 28 киловатт электроэнергии. В компании подчеркнули, что использование новой системы ускорит процесс обучения ИИ в 20 раз.

    Серийное производство DGX A100 уже стартовало. В числе заказчиков оказалась Аргоннская национальная лаборатория США, которая планирует задействовать систему в исследованиях коронавируса.

    Начальная цена вычислительной станции составляет $199 000.


    Nvidia показала также кластер из 140 DGX A100 под названием DGX SuperPod. Он имеет производительность 700 петафлопс. Благодаря соединению с серверными адаптерами Mellanox HDR 200Gbps InfiniBand interconnects компании удалось получить собственный суперкомпьютер. Его можно задействовать в исследованиях генома и разработке говорящих ИИ.

    При этом никаких официальных данных о сроках доступности игровых видеокарт с архитектурой Ampere нет.
    См. также:

    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама

    Комментарии 11

      +1
      Как я понимаю производительность системы составит 5 петафлопс у DGX A100 AI только в определёны задачах?
      И можно ли эту систему сравнить с суперкомпютерами хотя бы из 2000 годов?
        +2
        Tianhe-1A (2010 год) — 4,7 петафлопс. Так что да.
        Ну и отмечу, что сейчас основной упор не столько на рост просто числа операций, скоролько на рост операций на единицу потребляемой энергии
          0
          Немного дополню. Из Википедии:
          Тяньхэ-1А (天河-1A, Tiānhé-1A) — суперкомпьютер, спроектированный Национальным университетом оборонных технологий Китайской Народной Республики[3]. Скорость вычислений, производимых суперкомпьютером, составляет 2,57 петафлопс

          Тяньхэ-1А использует 7168 графических процессоров Nvidia Tesla M2050 и 14336 серверных процессоров Intel Xeon[2]. Согласно заявлениям компании Nvidia, суперкомпьютер использует электрическую энергию в три раза эффективнее, чем иные электронные вычислительные машины подобного класса. Потребляемая Тяньхэ-1А электрическая мощность составляет 4,04 МВт[1].

          Строительство суперкомпьютера обошлось в 88 млн $
          (При старте производительность Тяньхэ-1А была в два раз ниже DGX A100)

          Т.е. 10 лет назад: 14336 графических процессоров, 176 млн $, и 8,08 МВт
          Сегодня: 8 графических процессоров, 0,2 млн $, и 0,0056 МВт…

          Падение стоимости в 880 раз, потребления энергии в 1442 раз.

          Каждый год стоимость падала в 1.97 раза, потребление энергии в 2,07 раза.
            +1

            Надо ещё сегодняшние 0,2 млн пересчитать в деньги десятилетней давности и цифры ещё более впечатляющие будут)

              0
              Вы правы.
              Если пересчитать, получается падение стоимости в 1047 раз. Или 2.004 раза в год.
                +1
                Вот интерестно, а какие-нибудь задачи то оно позволяет быстрее решать. Что с того что процессор будет быстрее на бумаге, при этом будет использовать более кривой код
        0
        Интересно, как отреагируют на анонс представители Сбера, которые в прошлом году построили кластер на базе NV Tesla V100?
          +10
          Ну надо же когда-то начинать, иначе так всю жизнь можно новых анонсов ждать.
            0
            А есть какие-то варианты? Закупят новую партию и введут в эксплуатацию.
            0
            Вы правы.
            Если пересчитать, получается падение стоимости в 1047 раз. Или 2.004 раза в год.

            Интересная закономерность. Почти закон мура. Надеюсь в следующие 20 лет темп не особо сильно упадет. И в 2040 можно будет такую мощность засунуть в обычный ПК.
              0
              Сейчас оно стоит 200 000$ и потребляет 6 киловат. Если закономерность не изменится, то уже через 10 лет оно будет стоить 200$ и потреблять 6 ватт… А через 20 лет — 0,2$ и 6 милливатт… Где-то в датчиках дыма, если только будут такую ерунду использовать, что не жалко выбросить когда встроенная батарейка сядет :)

            Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

            Самое читаемое