company_banner

Intel PAC c FPGA Stratix 10 SX — ускоритель для больших задач


    FPGA Intel Stratix 10 SX/GX, появившиеся в продаже 2 года назад, стали новым словом в области вентильных матриц. Выполненные по минимальному на тот момент 14-нм техпроцессу, они были в два раза производительнее и на 70% энергоэффективнее предшественников. Однако чтобы реализовать все заложенные в FPGA Intel возможности, нужна такая же продвинутая «обертка». Аппаратно-программный конструктив, выпускаемый Intel для использования Stratix в хост-системах, называется Programmable Acceleration Card (PAC) — его очередная версия анонсирована в сентябре этого года.

    Новый РАС имеет в своей основе FPGA Intel Stratix 10 SX — самую мощную модель из семейства Stratix 10. Напомню вкратце ее основные характеристики:

    • архитектура HyperFlex;
    • технология производства — 14-нм Tri-Gate (FinFET);
    • монолитная фабрика с 5.5 млн логических элементов;
    • до 96 дуплексных трансиверных каналов;
    • пропускная способность трансиверов до 28.3 Гб/с;
    • аппаратная коррекция ошибок в каждом канале трансивера;
    • аппаратные контроллеры памяти, поддерживающие DDR4-2666 память;
    • блоки цифровой обработки сигналов (DSP) суммарной производительностью до 10 TFLOPS, энергоэффективность до 80 GFLOPS/Вт;
    • встроенный 4-ядерный 64-битный процессор ARM Cortex-A53 с частотой до 1.5 ГГц;
    • аппаратное ускорение шифрации/дешифрации AES-256, SHA-256/384 и ECDSA-256/384;
    • аппаратная поддержка многофакторной аутентификации.

    Что же касается самой Programmable Acceleration Card, то ее функциональное устройство выглядит следующим образом.



    То же самое более подробно в виде таблицы.

    Форм-фактор PCIe Gen3 x16
    Full height, 3/4 length, dual slot
    Память 32 Гб DDR4 (4x8 Гб) ЕСС
    Сетевые интерфейсы 2X QSFP+ до 100 Гбит/с
    Служебный интерфейс USB 2.0 для отладки и программирования
    Контроллер управления Intel MAX 10 FPGA Baseboard Management Controller (BMC)
    • Чтение данных температуры и напряжения
    • Platform Level Data Model (PLDM)
    • IPMI 2.0
    Управление питанием Intel Enpirion Power Solutions (телеметрия реального времени и контроль состояния)
    Программное обеспечение • Acceleration Stack для Intel Xeon CPU с FPGA
    • FPGA Interface Manager
    • Intel Quartus Prime Pro Edition
    • Intel FPGA SDK для OpenCL
    Карта будет доступна в составе серверных продуктов ОЕМ-партнеров Intel (в частности, Hewlett Packard Enterprise) в начале следующего года.

    Intel

    202,21

    Компания

    Поделиться публикацией
    Комментарии 35
      +3
      «монолитная фабрика с 5.5 млн логических элементов» — дальше не читал)
        +8
        А можно попросить хотя бы один абзац в начало текста добавить: для таких, как я, в «ускорителях для больших задач» не разбирающихся, дать хотя бы общее представление, о чем идет речь в тексте, и почему оно круто?
        Спасибо!
          +1
          Любые вычисления, нейросети, работа в реал-тайме с большим потоком данных, например, аппаратный файрвол, криптография — шифровать в реал-тайме Ethernet 10G какой нибудь. Ну и многое другое. Задач на деле миллион, просто в СНГ нет компаний, которые занимаются задачами где реально может потребоваться чудовище в виде стратикса, отсюда и вопросы «а нафига оно нужно?»
            0
            А вот интересно, вы пишете «работа в реал-тайме с большим потоком данных»… можно на базе этой штуки быстрый аппаратный L7 DPI соорудить?
            Очень-очень любопытно мне сие.
              0
              В такой постановке вопроса — скорее нет, либо ваш DPI будет медленно развиваться. С точки зрения скорости разработки я бы для этой задачи брал всё же что-то типа DPDK. Вот там, где в latency операций упираться начинаете — есть смысл думать про FPGA, но сил надо затратить очень много. Прямо сейчас Intel предоставляет некоторый acceleration pack для нейросеток, но там не любые архитектуры сетей поддерживаются, да и в целом геморройной будет.
              +1
              Мне тоже — интереса ради… Эта железка может применяться для майнинга криптовалюты?
              Если да, то нецелесообразно из-за высокой стоимости железки, или из-за алгоритмов(мол из пушки по воробью)?
                +2
                Нет смысла — асики более энергоэффективны. Майнинг на FPGA меньше полугода был прибыльным, вроде.
                –1
                >просто в СНГ нет компаний, которые занимаются задачами где реально может потребоваться чудовище в виде стратикса
                Глупости. ПЛИС это вообще нишевый продукт. Для маркетного использования они не годятся, они используются только для прототипирования, либо для задач, в которых реально может потребовать постоянно изменять прошивку.
                А вы говорите о третьем применении, куда более редком — когда производство очень мелкосерийно (выпекать ASIC экономически невыгодно), а весь интерконнект при этом между блоками обработки/интерфейсами должен быть на чипе. Такого не то, что в СНГ, такого по миру почти не делают. Ибо это какая-то очень странная бизнес-модель получается.
                edit: Да, HFT. И кроме него, честно говоря, мне сложно представить себе задачу, которая бы обоснованно лучше имплементировалась именно на ПЛИС
                  +2
                  Задач для ПЛИС море! Для любой мелкосерийки ASIC делать не выгодно. Скорость разработки на ПЛИС в разы выше. Готовый софт и инфраструктура для разработки. Ну и множество других ништяков. Средне — крупносерийное выгоднее уже на ASIC.
                    –4
                    Для большинства мелкосериек не нужно взаимодействие между IP-блоками на кристалле. Дешевле и проще купить готовые чипы/контроллеры, распаять их на плате вместе с управляющей логикой на МК/процессоре. Стоимость и время разработки на ПЛИС будут намного, намного больше. Как и стоимость самой железки как продукта.
                    Готовый софт для разработки? Насколько я помню, весь нормально работающий софт сурово проприетарен, а пользоваться им удобно… не очень. Плюс, в нем достаточно часто встречаются баги, которые раздражают и сильно тормозят разработку — и их ведь не найти в силу закрытости софта. В ту же копилку и проприетарные вендорные IP-блоки. А сколько стоят IP-шки от внешних вендоров? Там с ума сойти какие ценники (даже для бизнеса) на не самые сложные контроллеры не самых актуальных интерфейсов.

                    Я мог отстать от жизни, уже давненько ушел из отрасли. Если так, то назовите, пожалуйста, еще три обоснованных с точки зрения бизнеса применения ПЛИС, помимо инфраструктуры для бирж/трейдинга.
                      +3
                      Радиолокация и связь, на военку.
                        +1
                        Именно по этой причине стратиксы и попали под группу «двойное назначение».
                        0
                        Авиация, военные, космос… В любом самолете ПЛИС очень большое количество… Если хотите что-то более приземленное, то даже на хабре писали о использовании подобных плат в анализе сетевого трафика, если не ошибаюсь статья была о диагностике работоспособности тысяч видео потоков на одном сервере…
                0
                Интересно, а подобную мощь вообще можно ввозить в Россию?
                  0
                  это думается мне можно без проблем ввести в Россию, т.к. оно не Military и не Space…
                    +1
                    Но с PACом на базе Arria 10 у них это не получилось, оно оказалось под Экспортным контролем.
                  0
                  Интересно куда 125Вт рассеивается в такой конструкции (где радиатор на fpga?)
                  И сколько сия железяка стоит?
                    0
                    Судя по брифу там все 225Вт.
                    А вот фоток с радиатором не нашел — везде только с посадочным местом…
                      0
                      ИМХО, там будет турбинка в пределах прямоугольника (по картинке в начале топика, справа). Корпус по брифу это и подразумевает.
                    +1
                    Как с ввозом в Россию дела обстоят в свете «аппаратное ускорение шифрации/дешифрации AES-256, SHA-256/384 и ECDSA-256/384» и заботы о нас родного ФСБ?
                      0
                      Пишите письмо-гарантию на таможню, что это не устройство шифрования… и вроде проблем быть не должно
                        0
                        Я к чему спросил — у дистрибьютеров Xilinx есть явные проблемы с поставкой аналогичной продукции. Вплоть до выпуска специальных версий чипов с деактивированным шифровальным блоком
                          0
                          Ну с Xilinx проблем в 2016 году не было купили несколько ML605.
                            +1
                            AES-256 есть даже в DSP и микроконтроллерах и никаких проблем. Все эти ограничения распространяются если устройство предназначается для шифрования, а отладочный комплект законченным устройством в принципе не является и функционалом не обладает. Сопроводительное письмо на таможню или брокеру DHL-я и вопрос закрыт.
                        0
                        Предполагаю, что стоимость этого устройства будет от 10k $ в низшей конфигурации.
                          0
                          5,5 млн LE'шек за $10k? Не очень верится в такой аттракцион невиданной щедрости как-то, учитывая, что Stratix 10 вдвое меньшей площади (2,5–2,8 млн LE) стоит от 15–20 тысяч.
                            0
                            Политика Intel сейчас похоже такова, что специализированные (жестко зашитые) карты на Arria 10 будут стоить меньше, чем сам чип в розничной продаже.
                              0
                              У Altera всегда такая политика и была… Все карты terasic дешевле, чем чипы в розницу. В принципе подход правильный средства разработки должны быть доступными.
                                0
                                То были отладочные карты, и цель такой политики вполне ясна была — первая доза бесплатно. А тут будет следующее — вот вам сетевая карта с ускорением, фаерволом и вызовом блекджека за 500уе, вот вам карточка, которая определяет породу собак по фотографии за 500уе, вот вам карточка, чтоб на бирже играть за 500уе. Ах, вам нужна отладочная карта, куда вы своё творение зальёте — 4000уе пжалста. Поиграли с отладкой, хотите чипов, их есть у нас, пжалста 1000уе за чип.
                          0
                          По моему, нужны новые реализации подключения периферии. Уже сейчас есть видеокарты весом почти в полтора кг которые вынуждают «армировать» слоты pci.
                            +1
                            Когда Intel наконец родит полноценный SoC в виде Xeon + Stratix (Aria) необходимость в этих монстрах исчезнет.
                                0
                                Если использовать AVX512 на 20ядрах то процессор не справляется с отводом тепла и понижает частоты ядер с 3.7ГГц до 1.9ГГц. Интересно а если использовать fpga то он будет понижать еще ниже?
                                  0
                                  TDP с FPGA увеличен до 195Вт против 125Вт, FPGA отдельный кристалл рядом с процессором, если система охлаждения справится с 195Вт то не должно влиять
                                  0
                                  Спасибо я как-то упустил эти новости из вида…

                            Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                            Самое читаемое