Зачем нужна система мониторинга на кристалле

    Британский стартап UltraSoC представил on-chip-технологию для отслеживания характеристик микросхем без ущерба для производительности. Рассказываем, как устроено решение.


    / фото 83DegreesMedia CC BY

    Зачем внедрять системы мониторинга в чип


    Гетерогенные устройства строятся из нескольких блоков. Ими могут выступать процессоры, сопроцессоры или интегральные схемы ASIC. Специализация вычислительных модулей повышает производительность всей системы, но «многокомпонентный состав» приводит к сложностям с оптимизацией — каждому аппаратному блоку требуется настройка.

    Проблема усугубляется, если чипы используются крупным дата-центром. Мониторинг обширной инфраструктуры — задача не из легких. Специализированные программные решения зачастую наносят ущерб эффективности работы вычислительных систем. К примеру, утилита для измерения пропускной способности канала iPerf снижает производительность сети на 10–15%.

    Для решения этой проблемы UltraSoC внедрили инструменты для мониторинга прямо на чип. Компания разработала ряд логических полупроводниковых модулей, каждый из которых отвечает за одну из задач — мониторинг, отладку, обеспечение безопасности. Производители чипов могут использовать эти модули и вытраливать их на одной схеме с процессорами, GPU, сетевыми интерфейсами. Это позволяет собирать данные со всех компонентов микросхемы «на месте» без инвазивных программных решений. Эта технология уже адаптирована для работы со стандартными архитектурами: от ARM и RISC-V до MIPS и Xtensa.

    Устройство системы


    В UltraSoC предлагают порядка тридцати модулей, которые можно компоновать в зависимости от особенностей конкретной системы на кристалле (SoC). Модули делятся на три класса:

    1. Блоки аналитики — контролируют и мониторят компоненты микросхемы;
    2. Блоки обмена сообщениями — связывают модули UltraSoC между собой;
    3. Коммуникаторы — интерфейсы для связи с внешними системами и внутренними компонентами.

    К примеру, для микропроцессоров на базе архитектуры RISC-V вся система может выглядеть следующим образом:



    Полученные данные о состоянии компонентов чипа можно выводить через различные интерфейсы: USB, Ethernet, PCI-Express и даже Wi-Fi. После эту информацию можно загрузить в любую аналитическую систему для поиска аномалий в работе компонентов.

    Потенциал и недостатки решения


    Разработчики из UltraSoC говорят, что их система найдет применение в дата-центрах и поможет облачным провайдерам мониторить масштабную облачную инфраструктуру. Так как параметры системы на кристалле отслеживаются с помощью аппаратных средств, которые (в отличие от программных) не оказывают влияние на производительность, операторы ЦОД смогут получать актуальные данные о состоянии серверов в реальном времени.

    Из-за того что технология оценивает работу низкоуровневых компонентов напрямую, она поможет быстрее определять причину так называемых гейзенбагов — «плавающих ошибок», которые сложно отловить из-за того, что они регулярно меняют свойства.

    Но прежде чем технология найдет широкое применение, команде UltraSoC придется убедить производителей внедрить решение в свои чипы. Его реализация усложнит бизнес-процессы, приведет к удорожанию производства и увеличению цены микросхем. Поэтому многие компании могут отказаться, сославшись на то, что клиентам будет дешевле самостоятельно воспользоваться сторонним ПО для мониторинга.

    Но ряд производителей все же хочет опробовать продукт. Например, в компании Esperanto собираются внедрить технологию UltraSoC в тысячу процессоров на базе RISC-V и ускорители AI/ML, чтобы отслеживать их производительность.

    Альтернативные разработки


    Другие организации тоже разрабатывают on-chip системы. В частности, специальные сенсоры для отслеживания напряжения и температуры (PVT — Process, Voltage, Temperature). Они заточены под работу в системах на кристалле и ASIC. В начале прошлого года Moortec заручились поддержкой производителя чипов TSMC и реализовали свою технологию в 12-нм микросхемах. В компании уверены, что процессоры с системами мониторинга «на борту» найдут применение в ЦОД, мобильных устройствах, системах ИИ, IoT и проч.

    Еще один проект — «умные» PVT-сенсоры — стал результатом совместной работы компаний. Комбинация цифровых систем мониторинга и анализа UltraSoC и физических сенсоров Moortec позволяет комплексно отслеживать состояние SoC и оптимизировать нагрузку в режиме реального времени.

    Что ждет технологию в будущем


    Разработчики из UltraSoC считают, что рост популярности высокотехнологичных решений (AI, ML, IoT), а также переход на гетерогенные системы сделают встроенные инструменты мониторинга незаменимыми.

    В компании планируют сделать архитектуру решения более гибкой и настраиваемой. Для этого в UltraSoC начали разрабатывать UltraDevelop 2. Это — интегрированная среда разработки (IDE), с помощью которой можно конфигурировать, отлаживать и оптимизировать параметры компонентов чипа. Её релиз намечен на второй квартал 2019 года.



    О чем мы пишем в корпоративном блоге:


    Несколько постов из нашего Telegram-канала:

    • +16
    • 3,3k
    • 6
    ИТ-ГРАД
    306,00
    vmware iaas provider
    Поделиться публикацией

    Комментарии 6

      +1
      Интересная разработка, правда сразу встает вопрос о безопасности таких решений, какое то левое устройство вмонтированное сразу в чип
        0
        На сайте производителя пишут
        The system architect and design team have complete freedom to choose which blocks to monitor and to what level of detail.
        . Т.е. вроде как монтировать и выбирать, что и как мониторить, будут клиенты. По-моему, по уровню доверия/безопасности и модели использования это похоже на обычное IP-ядро.
          +1
          Это и есть обычное IP-ядро, полностью (наверное) понятное разработчику чипа и одобренное им. По сути — очень навороченный JTAG, который можно запускать, не отключая основную функциональность чипа. Собственно, вопрос безопасности использования — это вопрос к разработчику чипа. Так-то и трехногий линейный регулятор можно сделать так, что он опасен будет, дело не в использованных IP.
        +1
        Современные игры стали настолько реалистичны, что я в замешательстве.
        Подскажите — это реальная фотография или рендер из игры?
          0

          У заклепок видна перспектива, значит реальное фото. В играх и даже рендерах такие мелкие детали почти никогда не детализируют в 3d, и оставляют в текстуре.

            +1
            Но согласитесь, с первого взгляда сложно дать однозначный ответ.
            Вот оно будущее, уже здесь и сейчас.

        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

        Самое читаемое