Здесь на Хабре есть статья от @SmartEngines "Низкоуровневая оптимизация кода на платформе Эльбрус". Эльбрус-8СВ и 16С поддерживают уже векторные операции с регистром 128 бит. Также для процессоров Эльбрус имеется высокопроизводительная библиотека EML, функции из которой можно использовать для оптимизации.
Попробуйте выше в комментариях обратиться к @shigorin Михаилу Шигорину, у него имеется рабочая станция с инженерным образцом Эльбрус-16С и достаточным объёмом оперативной памяти, работающей в 8-канальном режиме.
А вообще, для задач хранения, обработки и дообучения нейросетей, недавно были представлены ПАК "Капля" и "Капель", на базе 4-процессорного сервера с Эльбрус-8СВ (2 южных моста КПИ-2) и сопроцессорами 1879ВМ8Я от НТЦ "Модуль".
Причина в отдельной микросхеме контроллера периферийных интерфейсов КПИ-2 (южный мост), пропускной способности которой хватает для двух процессоров Эльбрус, а в случае четырёх уже становится узким местом.
Это ограничение в полной мере проявило себя на СХД, поэтому в ИНЭУМ разработали материнскую плату сразу с двумя микросхемами южного моста КПИ-2, по одной на два процессора. Например, 4Э8СВ-MSWTX на базе Эльбрус-8СВ. Это решило вопрос с пропускной способностью, который и возник в данном случае.
В случае Эльбрус-16С, "южный мост" внесён в процессор и проблем с пропускной способностью в многопроцессорных серверах уже не должно быть.
Здесь
https://dev.mcst.ru/access/
И здесь
https://t.me/imaxairu/12023
Запись пресс-конференции
Портал для разработчиков ПО на платформе "Эльбрус"
https://dev.mcst.ru/
Исходники
https://dev.mcst.ru/download/
Удалённый доступ к "Эльбрусу"
https://dev.mcst.ru/access/
Репозиторий Openelbrus
https://git.openelbrus.ru/
ОС Эльбрус от АО "МЦСТ"
https://git.openelbrus.ru/mcst/osl
ОС ALTLinux от "Базальт СПО"
http://elbrus.ivk.ru/pub/ALTLinux/Sisyphus/files/SRPMS/
Обычно, кто с чем сталкивается, у того такие и ассоциации. За товарищем с личинкой стоит приглядеть.
У кого-то он даже уже на руках, в прямом и переносном смысле.
Появились сборки SOM (System on module) с микроконтроллером MIK32 АМУР
https://elron.tech/elsom/
Параметры и состав сборки:
Микроконтроллер MIK32 АМУР
Память NOR FLASH 8 Мб (может быть изменена)
EEPROM содержит загрузчик по UART
Кварцевый генератор часовой 32 кГц
Кварцевый генератор высокочастотный 32 МГц
Отлаженные обвязки по питанию, обвязки кварцев, цепь сброса, подтягивающие резисторы
Размер: 25,4*25,4 мм, толщина текстолита 0,71 мм
Производство: Россия, Новосибирск
SOM не содержит опознавательных идентифицирующих знаков (позволяет использовать данные сборки в качестве OEM узлов в устройстве)
Микроконтроллеры MIK32 АМУР с отладочной платой от непосредственно АО "Микрон" уже попадают в цепкие руки разработчиков.
Cреда разработки MikronIDE и gerber файл отладочной платы для микроконтроллера "Амур" в свободном доступе
https://mikron.ru/products/iot/mk32-amur/#!/tab/672102497-4
Готовые платы с микроконтроллером "Амур" и программатор
https://arduino54.ru/category/rus-product/
https://elron.tech/russian-arduino-compatible-board/
Непосредственно сам микроконтроллер "Амур"
https://www.chipdip.ru/product0/9001456984 (физлица)
https://tellur-el.ru/catalog/integralnye_mikroskhemy_1/mikrokontrollery_i_protsessory_1/mikrokontrollery_1/323268/ (юрлица)
От оптимизации ускорилось в два с лишним раза.
https://habr.com/ru/articles/732508/
http://old.mcst.ru/files/61c195/f2dece/61d641/e4549f/sber_kommentariy_mtsst.pdf
До 16 ТБ на 4-процессорный сервер, соответственно до 4 ТБ на процессор.
Здесь на Хабре есть статья от @SmartEngines "Низкоуровневая оптимизация кода на платформе Эльбрус". Эльбрус-8СВ и 16С поддерживают уже векторные операции с регистром 128 бит. Также для процессоров Эльбрус имеется высокопроизводительная библиотека EML, функции из которой можно использовать для оптимизации.
Попробуйте выше в комментариях обратиться к @shigorin Михаилу Шигорину, у него имеется рабочая станция с инженерным образцом Эльбрус-16С и достаточным объёмом оперативной памяти, работающей в 8-канальном режиме.
А вообще, для задач хранения, обработки и дообучения нейросетей, недавно были представлены ПАК "Капля" и "Капель", на базе 4-процессорного сервера с Эльбрус-8СВ (2 южных моста КПИ-2) и сопроцессорами 1879ВМ8Я от НТЦ "Модуль".
Причина в отдельной микросхеме контроллера периферийных интерфейсов КПИ-2 (южный мост), пропускной способности которой хватает для двух процессоров Эльбрус, а в случае четырёх уже становится узким местом.
Это ограничение в полной мере проявило себя на СХД, поэтому в ИНЭУМ разработали материнскую плату сразу с двумя микросхемами южного моста КПИ-2, по одной на два процессора. Например, 4Э8СВ-MSWTX на базе Эльбрус-8СВ. Это решило вопрос с пропускной способностью, который и возник в данном случае.
В случае Эльбрус-16С, "южный мост" внесён в процессор и проблем с пропускной способностью в многопроцессорных серверах уже не должно быть.