All streams
Search
Write a publication
Pull to refresh
4
0
Александр Труш @troosh

User

Send message

Почему нет? Набиваем старую материнку сетевыми картами на 10 Мбит/с, в идеале под коаксиал с BNC разъёмами...

Новость хорошая. Но выглялит так, что у T-Head TH1520 с развитием софта как-то не очень в сравнении с StarFive JH7110. Так у них обоих похожие 3D GPU и, увы, драйвера закрытые в виде блобов. Однако у TH1520 драйвера более старые, выпускали их реже. Тоже самое с видеокодеками и прочей периферией.

Попытался оптимизировать работу в формате Q4_0 для e2k процессоров с 5-й и выше версией системы команд (для тех которые с 128-ми битными регистрами), выкладываю сюда: https://github.com/E2Kports/llama.cpp

Именно в этом формате проверят умножение матриц бенчмарк. А вот используемая в статье модель сконвертирована под Q4_1, на ней ускорения ждать не стоит. Нужно брать модели в Q4_0, либо подождать пока доработаю и этот формат.

А вообще, проект llama.cpp ну очень уж быстро меняется - пришлось пару раз под новые правки подстраиваться...

Сам себя поправлю: ла, программе непосредственно работа с диском нет требуется. Но машине с 16ГБ памяти вполне можно запустить в работу 40ГБ-ную модель. Файл с моделью отобразится на виртуальную память и будет постоянный процесс считывания с диска фрагментов модели, с замедление на порядок и более....

Так что, корректно сравнивать на такой машине, где достаточно физической памяти для удержания модели в ОЗУ (и нет других задач, запущенных в ОС, также жаждущих памяти). Чтоб наверняка не вытеснялась память следует указывать опцию "— mlock".

Скорость работы в один поток на e8c2, на e2c3, и на e16c практический одинаковая (с поправкой на частоту). На их 128-ми битных регистрах могут выполняться до двух, иногда до трёх AVX2 интринсиков.

А вот у e8c SIMD регистры 64-х битные, один 256 битный AVX2 интринсик разбивается на четыре отдельные операции и, в лучшем случае, занимает одну ШК, на таких машинах скорость работы будет раза в два ниже.

В той ревизии процессора, которую только отдали на производство (после чего тайваньские господа решили простить свои долги всем русским), должно было поддерживаться 4 ТБ, а вот в предыдущей ревизии - максимум 1 ТБ.

В этой задаче не требуется работа с диском, вся модель должна рано или поздно оказаться в памяти (или в дисковом кеше ОС), после чего как там работает КПИ уже не важно.

Ну и в межпроцессорных обменах КПИ никак не участвует, - для это используются разные линки.

Рисунок 3 про управление памятью это наверняка шок для несведущих (плюс там какие-то «теневые порты», а-а-а!..). Тем кто прошел этот уровень, контрольный выстрел: обработчик прерываний с модификацией кода (это ещё хорошо пока нет кешей).

А так статья годная, спасибо! Может быть вступление про историю клонов вообще стоило бы выделить в отдельную статью.
Железо эмулируют, чтобы разрабатывать под него софт пока это железо не готово или недоступно массам. В браузере это частый случай.

Linux уже портирован на более чем два десятка архитектур (это про активыне сейчас), лучше взять одну из них готовых, чем добавлять ещё одну псевдо-архитектуру.

Больше будет пользователей OpenRISC, даже в эмуляторе, — больше шансов что в ядре не выпилят поддержку этой архитектуры (такое такое случается с архитектурами про которые народ начинает забывать).
Ох как же там много ламповости:
— Системный таймер (по которому процессором огибающие обновляются), зависит не от кварцевого генератора, а реализованы на микросхеме К555АГ3 (DD5 в «узле процессора»). А значит параметры звука будут определятся точностью RC цепочек и температурой. В первом приближении там около 220 Гц, и скважность 1:20. Интересно какая же там на самом деле частота и форма сигнала…
— Та же история с частотой дискретизации, — она ко всему там ещё и оператором может подстраиваиться в каких-то пределах. Та же К555АГ3, но ещё больше аналоговой обвязки.
— В узле «хора», ещё больше наворотов: две линии задержки с отдельными генераторами на КР1006ВИ1 (непонятно какая частота и в каких пределах можно её «расстраивать»). После линий задержки фильтры высокого порядках, АЧХ также будет зависеть он номиналов резисторов и конденсаторов.

Всё это будет делать каждый экземпляр инструмента уникальным, с неповторимым звуком. Может так и нужно, так и задумывалось?..
Это при том, что 32 Кбайта адресного пространства процессора вообще не используется…

Ан нет, используются полностью. По дизассемблеру прошивки сразу не видно было, только когда схемы стал изучать. Xотя используется совершено бездарно: под каждый голос выделяется 4 Кбайта, позиция записи в таком окошке и сохраняется как код частоты в регистрах DD1-DD3 (К561ИР4) узла процессора. То есть выполняя запись байта по некоторому смещению, сохраняется не этот байт а это смещение (12 бит, реально используется только 11-ть). Разработчики наверняка гордились таким оригинальным инженерным решением, как же одной записью прописываем сразу полтора байта. И в итоге для хранения 16 байт отъели половину адресного пространства… Возможно так добились атомарности записи слова в 8-ми битном процессоре, но можно же было оставить одно окошко в 4 Кбайт, а в записываемом значении указывать для какого это голоса (слота).
Весьма интересный девайс, спасибо! Интересно куда пошло развитие в загадочном инструменте Форманта П465?..

Есть в П432 некоторые особенности, которые удивили:
— Размер ОЗУ 1 Кбайт, но аппаратно ограничено 256 байтами. Причём в прошивке стек так и оставили указывающим на верхушку этого килобайта (работает благодаря повторам этих 256 байт во всём окне выделяемом под ОЗУ.
— Там нет отдельного ПЗУ именно для MIDI, но то второе ПЗУ на отдельной плате аппаратно используется только на 7/8 объёма, — 256 байт вырезается под регистры контроллера прерываний, последовательного порта и прочих регистров на той плате. Это при том, что 32 Кбайта адресного пространства процессора вообще не используется…
— Непонятно зачем ПЗУ «преобразования частота-приращение» разместили в блоке генераторов, а не в пространстве процессора. Потеряли гибкость и точность задания частоты, ради экономии одного корпуса 561ИР11?.. И да, какие-то странные числа там в области самых низких частот скорее всего для тестирования при производстве: четырьмя тумблерами проще перебрать весь диапазон частот, плюс похоже коэффициенты там будто специально подобраны так, чтобы проверить КЗ соседних бит аккумулятора фазы.
Разработчики алгоритма позаботились о возможности создания эффективной аппаратной реализации (но возможно забыли об этом выпустить публичные разъяснения). За одно позаботились и о программной реализации, устойчивой к атакам по времени исполнения.
А тут, вот, панику подняли: странности!.. совпадения?!.. бэкдоры!.. нас всех обманули!..

Подобным в AES уже десять лет как пользуются:
www.shiftleft.org/papers/vector_aes
crypto.stanford.edu/vpaes
Да ладно, был портирован gcc-2.95.3 и заброшен уже лет десять назад. Качество кода было не очень,… но свою роль он сыграл. Сейчас какой-то из новых gcc пилят, но весьма неспешно силами одного человека.
Бррр… «bundle», у нас же импортозамещение, — используем термин «широкая команда» или просто «ШК». ;)

А ещё в системе команд E2Kv3 и выше для маловероятных выходов есть интересная возможность: можно в одной ШК поставить условный непосредственный переход который будет срабатывать от одной или двух операций целочисленного сравнения в тоже самой ШК. Полезно для разных проверок на редкие ситуации с указателями null и кодами ошибок:

{
cmpedb,0 %r1, 0, %pred0
cmpedb,1 %r2, 4, %pred1
rbranch Fail? %cmp0 || ~%cmp1

}

Но похоже ни в реализации Java, и в реализациях JS этим так и не пользуются…
Есть около 2-3 десятков проектов в белом списке, со своими отдельными сайтами. С этих сайтов забирается статистика и на ёё основании сетью решается какие выплаты положены каждому участнику. Т.е. это уже конкретные владельцы проектов могу заниматься мошенничеством, но это им не выгодно т.к. в случае бана уйдут вычислительные мощность с их проектов. Проекты регулярно добавляются/удаляются в данный список голосованием.
Министерство обороны России приняло на вооружение новую систему радиоподавления «Поле-21», которая позволит глушить сигналы спутниковой навигации всех существующих сегодня систем — GPS, ГЛОНАССб Galileo и Beidou. Как пишет газета «Известия», система состоит из станции радиопомех Р-340РП, подключенной к передающим антеннам сотовой связи на вышках.

С технической точки зрения глушение спутниковых сигналов является относительно простым, поскольку сами по себе эти сигналы уже являются достаточно слабыми. В результате, излучатель мощностью 20 ватт, работающий в узком диапазоне частот, способен существенно нарушить или вовсе сделать невозможным прием сигналов GPS в радиусе 80 километров.
https://nplus1.ru/news/2016/08/25/cell
Это не принципиально в плане задачи подавления работы этих систем на конкретной местности: спутники на высоте 19000000-20000000 метров, а wifi точки совсем рядом на расстоянии 20 метров (это отношение расстояний нужно ещё в куб возвести), полосы частот выделенных под GPS/Глонасс на порядок уже выделенных под каналы wifi.
Wi-Fi модуль может работать только на приём для целей геопозицирования (т.е. в то время, как он якобы отключен), причем эта настройка довольно глубоко спрятана.

image

(скриншот взят из этой статьи.)
В виде статьи уже наверное поздно… Зато есть очень давно написанный мной Exel файл с тех. подробностями: http://altmer.arts-union.ru/3DO/docs/3DOessence.zip Хорошо дополняет другие доки/патенты собранные тут: http://www.arts-union.ru/node/36
1

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity