Технология из 80-х: кто возрождает waferscale-процессоры

    Идея waferscale-процессоров наделала много шума в 80-х годах прошлого века, но оказалась забытой на десятилетия из-за сложности производства. Сегодня технологию вновь пытаются развивать. Рассказываем, кто работает в этой области.


    / фото timo vn CC BY

    Что такое waferscale


    При производстве современных процессоров кремниевая подложка распиливается на индивидуальные кристаллы, из которых потом собирается чип. Технология waferscale (WSI) подразумевает создание процессоров (как CPU, так и GPU) на единой полупроводниковой пластине — она становится одним большим «чипом». Такой подход увеличивает производительность системы: компоненты размещаются ближе, поэтому данные передаются быстрее.

    В 1970-х и 1980-х годах технологию WSI предлагали использовать для создания чипов для суперкомпьютеров. Однако от этой идеи было решено отказаться — при производстве в чипах возникало слишком много дефектов.

    Например, в этой сфере работал стартап Trilogy Systems, который тогда стал самым финансируемым в Кремниевой долине — он получил $230 млн инвестиций. Но компании так и не удалось сформировать надежный техпроцесс. В 1985 году Trilogy прекратила исследования в области WSI и обанкротилась, что отрицательно сказалось на репутации waferscale-процессоров в целом.

    Только недавно о WSI снова заговорили как о перспективном направлении. К примеру, ожидается, что такие устройства помогут повысить производительность ИТ-инфраструктуры в дата-центрах. Интерфейсы для передачи данных между компонентами сервера часто оказываются «бутылочным горлышком». Waferscale-системы, за счет размещения части компонентов на одной подложке, могут помочь решить проблему пропускной способности.

    Кто развивает технологию


    Организациями, развивающими waterscale-процессоры сегодня, являются Калифорнийский университет в Лос-Анджелесе и Иллинойсский университет в Урбане-Шампейне. В начале февраля этого года сотрудники вузов предложили создать систему, которая объединит на одной кремниевой десятки графических процессоров. Проект получил название Silicon Interconnect Fabric, или Si-IF.

    Инженерам удалось создать два прототипа на 24 и на 40 GPU. Разработчики провели сравнительные тесты с классическими устройствами (с аналогичным числом вычислительных модулей) — производительность Si-IF-устройств оказалась выше в 2,5–5 раз. Потенциально технология может ускорить работу серверов на базе графических процессоров в дата-центрах.

    Waferscale-процессорами с 2012 года занимается и тайваньский производитель TSMC. Их технология называется CoWoS — «чип на пластине на подложке». На кремниевом мосту (interposer) размещаются GPU и память, FPGA и память или сетевые контроллеры. Затем мост устанавливается на монтажную плату и «упаковывается» как обычный процессор. Решение уже используется в реальных устройствах, например графических чипах Nvidia серии Volta.

    Также разработкой технологии занимаются инженеры в рамках проекта WIPE, который входит в европейскую инициативу по созданию инновационных решений Horizon 2020. В составе WIPE семь участников, среди которых — IBM, бельгийский центр микроэлектроники iMinds и ряд исследовательских институтов.


    / фото Enrique Jiménez CC BY-SA

    Организация предлагает создать процессор для работы с оптоволоконными сетями. В нем модуль для преобразования оптического сигнала в электрический будет расположен над кремниевой пластиной с чипами и связан с ней напрямую через металлические контакты. Исследователи ожидают, что такая архитектура будет потреблять меньше энергии и работать быстрее, чем традиционные системы с раздельными трансиверами и процессорами.

    Каковы перспективы


    Эксперты ожидают, что развитие WSI-процессоров поможет дата-центрам увеличить мощность серверов для ресурсоемких задач, например обучения нейросетей. По некоторым данным, над waferscale-процессором для машинного обучения уже работает стартап Cerebras — хотя сама компания скрывает подробности разработки.

    Ещё одно преимущество WSI — простота управления. Для операционных систем и других программ waferscale-устройства выглядят не как несколько отдельных процессоров, а, например, как один большой GPU. Это упрощает работу программистов и системных администраторов, которым не нужно по отдельности настраивать каждый модуль waferscale-системы.

    Но у waferscale-процессоров есть и ограничение, которое делает сложным масштабирование ИТ-инфраструктуры. Системы питания в WSI-чипах требуют установки регуляторов напряжения. Эти блоки занимают место, на котором можно было бы разместить дополнительные вычислительные модули. Ещё одно ограничение для waferscale-процессоров связано с охлаждением устройств. Высокая плотность модулей на чипе усложняет отведение тепла.

    Но по мнению специалистов, эти проблемы преодолимы и сейчас для возрождения WSI настало подходящее время. С 1980-х технологии производства процессоров стали более совершенными, количество дефектов сократилось. Поэтому можно ожидать, что в ближайшее время будет появляться все больше проектов, посвященных разработке waferscale-устройств.



    О чем мы пишем в корпоративном блоге:


    И в Telegram-канале:

    ИТ-ГРАД
    279,00
    vmware iaas provider
    Поделиться публикацией

    Комментарии 28

      +8
      При производстве современных процессоров кремниевая подложка распиливается на элементарные кристаллы, из которых потом собирается чип. Технология waferscale (WSI) подразумевает создание процессоров (как CPU, так и GPU) на единой полупроводниковой пластине
      Для тех, кто прочитал, и тоже ничего не понял: предлагается делать процессор размером с целую 200мм пластину (или сколько там они сейчас).
        +1
        Спасибо. Я тот самый тоже.
          +2
          Насколько я понял, от технологии «прибор размером с пластину» давно отказались. То, что делает TSMC — это отдельные чипы, которые производятся по классической технологии (разрезая пластину на чипы), которые сажаются на интерпозер, который тоже не с пластину размером, потом все это корпусируется. Смысл не в том, чтобы сделать процессор размером с пластину, а в том, чтобы уменшить расстояние с десятков миллиметров между микросхемами на обычной печатной плате до десятков микрон на интерпозере, что уменьшит время распространения сигнала, уменьшит потери и т.д.
          Как это выглядит

        0
        Скорее всего, будут делать однородную сеть, а дефектные чипы можно будет отключать после тестирования. А как тепло отводить?
          0

          ну отвести жар на огромный радиатор можно и водой, если не гнать ядра выше 3ГГц, то сильно греться-то не будет. Больше интересно как эту вундервафлю питать ))

          0
          А если запитывать «вычислительный модуль» посредством электромагнитной индукции? Вытравить прямо на кристалле для каждого процессора свою катушку, и наводить ЭДС внешним переменным магнитным полем на всех процессорах сразу?
            0
            И подводить к каждому модулю по ядерному реактору.
              +1
              Что бы запитать такую штуку, надо Ампер 500-1000. Если не гнаться за попугаями.
              И первые десятки килоАмпер, в случае супер-пупер.
              Я слабо представляю агрегат. По крайней мере, компактностью оно отличаться не будет.
                –1

                Тогда — разрабатывать топологию так, чтобы питание на кристаллы подавалось сверху и снизу пластины, и накрывать её двумя "блинами", припаивая их на сплав Розе — заодно решится и проблема теплоотвода. Правда, в случае пробоя — знатно жахнет.

                  +1

                  Современные чипы держат температуру до 105 градусов. Пластина будет плавать в Розе.

                0
                Как быть с наводками на вычислительные цепи?
                  –1
                  Выполнить шины данных по технологии диффиренциальных пар. Заодно, можно реализовать состояния на шине -1, 0, +1, ну и логику сделать троичной, выиграв примерно 1/3 в производительности и плотности памяти по сравнению с двоичной.
                  +1
                  А смысл? Индуктивная связь имеет ограничения по напряжённости поля и его убыванию. Запитать вроде не так сложно, если достаточное число ножек вывести и пару слоёв чисто под это выделить. На мой взгляд, с охлаждением будет сложнее
                    0
                    Да, и греть кристаллы вихревыми токами.
                    +4
                    Будет прикольно, если окажется что, единственным способом сделать сильные ИИ окажется нейроморфная пластина такого размера. И у каждой пластины будет свой уникальный рисунок дефектов. Который запретит копировать ИИ.
                      +1
                      И интеллектуальные способности и склонности ИИ будут зависеть от количества и типа дефектов. Чихнул кто-то в стерильной комнате, и вышла пластина не математик, а художник.
                        +5

                        Главное что бы не рэпер.

                          +1
                          Это если роняли)
                        +1
                        Какие-то несколько процентов дефектных нейронов никак не мешают копированию ИИ. В современных сетях специально используют dropout-слои так, что на отдельной итерации может не работать более половины нейросети, и сети не просто справляются с этими дефектами, а получаются более устойчивыми и меньше сваливаются в переобучение.
                        0
                        Может быть не «кремниевая подложка распиливается на элементарные кристаллы», а кристалл распиливается?
                        Как думаете?
                          +1
                          35 лет назад обанкротились, что помешает обанкротиться сейчас?
                            0
                            Некоторый прогресс в отрасли полупроводниковых производств, нет?
                              0
                              Но электроны не стали двигаться быстрее, поэтому построить устойчивую систему будет не проще.
                              «Кластер» — штука не новая.
                                0
                                Зато дефектов на пластинах стало меньше, потому и количество брака тоже должно уменьшиться.
                                  0
                                  Так и техпроцессы стали тоньше, и оттого чувствительнее к дефектам.
                              0
                              Сейчас можно больше времени тратить на R&D, прогресс сильно замедлился.
                                0
                                Но и денег это стоит значительно больших, а продажи не очень-то растут, т.к. процессоры сильно дешевеют, обороты — падают.
                              0
                              Вот интересно, а как выглядит надежность? Как бы пластина большая, повредить ее не сложно. Да и хрупкое все это будет.

                              Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                              Самое читаемое