Pull to refresh

Comments 80

Голосом дяди Фёдора: Чтобы продать акции Nvidia, надо сначала купить акции Nvidia, а у нас денег нет.

"А у нас теперь и СПБ Биржи нет".

Сча Нвидия выкатит какую-нибудь GDDR N+1, в которой по команде с GPU происходят операции с половинной точностью прямо в RAS/CAS… Прочитали такие всю строку, рефрешнули обратно, а потом, вместо того, чтобы выдирать оттуда крошечный участок данных и передавать процу — прочитали вторую строку прямо на второй вход сумматора (или умножителя). А рефрешнули уже результатом операции, распараллеленным до длины строки, делённой на длину числа с половинной точностью.

А строки там ооооой какие длинные… и банков памяти тоже больше одного… и чипов на плате куча… да никакие burst mode даже рядом не стояли со скоростью потенциально возможных операций внутри DRAM. Бах-бах, две текстуры сложили, бах-бах, на освещённость умножили, ну или бах-бах, слой нейронов умножили на матрицу весов…

Такое уже делают только внутри флэш и аналоговым способом, я ниже сылку постил

Adobe Flash? Ну наконец-то, не будет тормозить!

Системная энергоэффективность выражается в способности производить до 74,8 квадриллиона операций в секунду при затрате 1 Вт мощности. Скорость вычислений — 4,6 пета-операций в секунду

О каких операциях идёт речь, если он полностью аналоговый? Если вы меряете напряжение аналоговым вольтметром, то он вам постоянно показывает текущее напряжение, нет никаких операций.

У меня была другая мысль. Они говорят, что сравнивали с NVidia, но тот час вопрос: эквивалетно ли это или нет. И что если понадобится изменение, программу в GPU можно изменить легко (зависит от сложности конечно), а вот эту аналоговую систему можно ли перепрограммировать? Или это прототип с "зашитым" алгоритмом.

Т.е. вопрос, отличается ли эта оптическая система от специализированного чипа? Или оно может быть перепрограммировано? Или перепрограммирование - следующий этап?

Не эквивалентное сравнение изначально. Аналоговые вычислители - не новость, хотя современные коммерческие - редкий зверь. По сути эта штука непрерывно в реальном времени выполняет какую-то функцию «аналогово», а электроника оцифровывает результаты с какой-то частотой. Хорошо если «функцию» ещё можно перестраивать на лету (думаю в определенных пределах - должно быть), но даже так - оно остается довольно узкоспециализированной штукой. Nvidia же - возьмет математикой

Мы такой вычислитель полинома на лабе делали в 97ом.

А мы на лабе в '77 настраивали симулятор акционного потенциала, нейронов или мышечных волокон...

Нейронные вычисления это и есть специализированная штука. На лету вы меняете веса, а структура сети в процессе обучения не меняется. "электроника оцифровывает результаты с какой-то частотой" :-))) Эхх, порождение цифрового века :-) Даже не представляют, что аналоговый результат сам по себе результат, и без оцифровки :-)))

Увы, мы действительно слишком погрязли в цифре, «аналоговый» результат - может оказаться достаточным, но даже его нужно как-то преобразовать и отобразить (применить). Аналоговые вычислители не дают пока такой же гибкости (или правильнее сказать простоты построения систем?) как цифра, в итоге имеем - вот такое вот, но в любом случае сабж - это стык двух миров

P.S. Если аналоговую функцию можно перестраивать на лету - то там ведь гарантировано этим занимается цифровая обвязка

отнюдь. Персептрон Розенблата весил 10 тонн. Это был набор из переменных резисторов совмещенных с электродвигателями. То есть первое самообучение работало без цифры.

В конце 80 читал в журнале техника молодёжи про устройство типа электронная пушка светит на экран- приёмник, у него было необычное свойство к распознаванию за счёт неопределённости волновых функций электронов. Кто знает как оно называлось?

 «аналоговый» результат - может оказаться достаточным, но даже его нужно как-то преобразовать и отобразить (применить).

Например китайский бражирующий боеприпас в процессе погони за вами может аналогово шевелить элеронами, тратить минимум энергии на суперзрение и стоить сто юаней.

Перспективно ;-)

Если аналоговую функцию можно перестраивать на лету - то там ведь гарантировано этим занимается цифровая обвязка

да нет же! Занимается этим "программист" ручками. Перетыкает проводки и подкручивает потенциометры.

Очень эффективно, да, на прям на лету. Тогда может цифра все же будет быстрее? Чем пока программист физически все перенастроит коммутацию связей?

Такие микросхемы - это стык, программа для цифры занимается перенастройкой аналоговой функции изменяя связи, я уже приводил ниже пример Enlight256

а в цифре программа прямо из мозга программиста берётся? Или он ручками кнопки давит? И ещё мышь катает?

На лету вы меняете веса, а структура сети в процессе обучения не меняется.

Могу ошибаться, но вроде бы структура нейросети как раз и определяется весами. Потенциально все узлы связаны со всеми, а отсутствие связи -- это просто связь с весом 0.

Вот. А если результат на выходе сэмплировать с большой частотой, а цифровую систему заставить обсчитывать столько же раз, то можно уверенно получать результаты "в 10 000 раз быстрее Nvidia".

Ещё 60 (+/- сколько то) лет назад назад применялись функциональные лампы, вычисляющие некоторую функцию, просто за счет ослабления электронного пучка на матрице (пластине) определённой формы.

Мне немного довелось помоделировать на АВМ (аналоговая вычислительная машина) - не знаю насколько этот чип на неё похож. "программируется" - это идеология именно ЦВМ, АВМ вместо программирования использует соединение звеньев с элементарными функциями в цепочки, чем достигается моделирование поведения любой системы. Например, управляемой ракеты. Вместо программирования вы меняете параметры и соединения входов с выходами звеньев. То есть гибкость та же, но принцип иной. И круг решаемых задач сильно уже. Например, на АВМ невозможно обрабатывать текст. А вот моделировать переходные процессы в сложных системах - пожалуйста!

Мне немного довелось помоделировать на АВМ

Были такие. На лампах. Лабы какие-то на них были.

Ну я застал не на лампах, а на операционных усилителях

Вот именно операционные усилители там были на лампах )

нет, в моём случае ОУ были микрухи - круглые такие корпуса с 9-ю ножками, типа к544уд или подобные

Например, на АВМ невозможно обрабатывать текст.

Вы удивитесь, но ЦВМ тоже не могут обрабатывать текст. Они думают, что это числа и обрабатывают их. На АВМ так тоже можно, но никому не захотелось.

хотел бы я посмотреть на такой текстовый редактор на АВМ

Ну, если АВМ остались в мейнстриме, то обязательно был бы. Конечно их архитектура была бы очень не похожая на то что мы сейчас называем АВМ.

Например, потоковый редактор типа юниксового sed как раз вполне реализуем.

реализуем-то реализуем, только вот в процессе его работы не факт что текст не исказится... это все равно что QLC флэш использовать без алгоритмов коррекции ошибок...

не факт что текст не исказится...

Не забывайте, что буквы конечное множество а у аналогового сигнала бесконечное количество значений. Избыточность кодировки запредельная. Надо просто шумы держать в нужных границах. ;)

оно-то так в теории, на практике - аналоговые вычислители вымерли примерно в 60-х годах прошлого века. по причичне низкой точности. аналоговая флэш-память (была такая, да) ушла туда же в 90х - по той же причине.

и да, шумы держать в нужных границах - обычно можно только в теории...

Так, флэш памети и до сих пор аналоговыми и являются. А то что аналоговые компьютеры вымерли, это совсем не из за низкой точности. У них другие, фундаментальные проблемы, которые нелегко решить. А цифровые компьютеры простые и предсказуемые. Поэтому и развивались.

нет, флэши вполне дискретные с малым количеством уровней. я же говорил об аналоговых ISD17xx...

Исползуя эту особенность флэш-памяти, как раз, и делают сейчас аналоговые чипы для нейронок

С помощью АЦП идёт вывод числа! 0 вольт - 0, 0.1 вольт - единица, 0.25 - 2.5, 10 вольт - число 10. Это сильно утрирую. Аналоговые вычислители ещё в СССР были и по ним СССР сильно двигался вперёд. До сих пор много техники на этих принципах летает, радары бдят и т.д. По сути вся музыка это аналоговые вычисления, смешанные с цифровым в последнее время.

Вообще аналоговые нейроны должны быть более эффективны, чем цифровые, ибо это всего лишь веса и некие простые функции их преобразования. Аналоговые нейроны действительно вычисляют свои функции быстрее и эгнергоэффективнее, видимо эта технология и победит

Ток ошибка аналоговая накапливается

в случае нейронных технологий это минусом не является, ибо сам процесс обучения - это некий подбор весов по принципу "похожести" на нужный результат. Собственно, цифровые нейроны лишь имитируют аналоговое поведение. То есть им изначально присуща эта аналоговая "ошибка"

Это не проблема, хотя бы в свете того, что например, если взять время осознанной реакции человека в 300-500 мс, то учитывая характерную задержку срабатывания нейрова, что осознанная реакция происходит не более чем за 100 шагов "программы" нашей нервной системы. Это не очень-то и много. Тем более, что я читал, что человеческие нейроны, вообще обладают двухбитной точностью: 0, 1, 2 и 3 спайк-импульсов, которые примерно соответствуют таким шаблонам распознавания: 0 - это точно не то, 1- может быть это то, 2 - это то, 3 - это, без сомнений, точно то самое!

В нейронах человеческого мозга тоже ошибка на ошибке, и ошибкой погоняет. Тем не менее, мы как-то справляемся.

использование новой технологии для решения различных задач, отвечающих «важнейшим потребностям общества»

Быстродействие и энергоэффективность - то чего не хватает видеопроцессорам чтобы быть установленными на военных дронах и сделать их автономными, без толстого видеоканала к оператору. Такие видеопроцессоры, если они появятся, обеспечат создание нового поколения дронов, которые смогут автономно искать цель. Не уверен, является ли это важнейшей потребностью общества, но ситуацию на поле боя это изменит радикально.

Я думаю что Китай будет это использовать для своей системы слежения за собственными гражданами. У них на каждом столбе стоит десяток камер направленных во все возможные стороны. Видимо уже не хватает мощностей чтобы всё это обрабатывать. А про "потребности общества" - это типичная подмена понятий, потому что потребности общества определяет партия.

Разумеется... Отсталые китайцы не будут искать полезные ископаемые на спутниковых снимках, не будут строить беспилотные автомобили, не будут анализировать рентгеновские и УЗИ-снимки. Они будут шпионить за своими гражданами. Они и чип придумали, потому что отсталые и не хватает мощностей. Вот и тех. процесс чипа отсталый.

Беспилотные автомобили у них активно развиваются, так что могут и использовать со временем. Но для обработки видео со всех их камер используют в первую очередь.

UFO just landed and posted this here

За прогрессивным западом Европы, видать, гонятся

Разве распберри-пиай не достаточно, чтобы отличить танк от котика?

Проблема, на самом деле, не в инференсе, а в обучении. Научить нейросеть отличать огневую точку, замаскированную на границе леса по спутниковому снимку пока трудно. Отличают, но точность далека от идеальной.

А вот это, я думаю, вопрос практики. Если кто-то озаботился тем, чтобы по крайней мере часть тех дроны, которые вернулись на базу после выполнения боевой задачи в некоторых текущих конфликтах, сливали отснятые в процессе видео в какую-то базу, то уже очень скоро накопится приличная выборка. Останется посадить миллион китайцев её размечать, у военных бюджеты немеряные, и следующее поколение Дронов будет на голову круче.

Видео и так полно даже с невернувшихся дронов. И размечать китайцами ничего не надо, всё делается иначе. Синтезируется картинка, типа компьютерной игры, где по полю/лесу/городу в разное время суток и в разных погодных условиях бегают, катаются, ползают пехотинцы, танки, пушки и пр. Всё уже размечено на момент генерации сцены. Это подаётся на вход обучения.

Что-то в этом роде было в 70-х. Использовали вычисления на магнитооптических пленках, если не ошибаюсь. Они были перестраиваемые. Получали двумерную фильтрацию и как раз распознавание. Мелькало в литературе. Сейчас на новом витке вернулись. Наверное.

Нет. То, что я читал, было не настолько популярным.

Было и посвежее, вот, например Enlight256, коммерческий продукт

Очень похоже на классическое изнасилование журналистов учеными (начиная с англоязычных популярных заметок).

Если примитивно: этот чип реализует нейронку для классификации изображений, причем:

  1. N первых слоев нейронки (задача классификации) выполняются когда свет проходит через несколько слоев со специальным образом сформированной дифракционной картиной - это называется ОАС. ( Тут не происходит пета операций над числами (Но чтобы смоделировать этот процесс в реальном времени на классическом cpu, понадобилось бы производительность им эквивалентная))

  2. Электронная часть чипа обрабатывает выход ОАС уже в пространстве признаков (матрица всего 32х32) и т.к. матрица небольшая делает это очень быстро выдавая результат классификатора

  3. Судя по статье системе не требуется специальной подсветки объекта - и это действительно удивительно - можно использовать с обычными объективами.

Итого:

Это ни разу не аналог nVidia A100. Это чип который может решать задачу классификации (и возможно близкие задачи) изображения и делает это очень хорошо, с минимальным энергопореблением и задержкой.

За правильной и подробной информацией нужно обращаться к первоисточнику.

чуть получше, это ускорение операций над матрицами, это не только задачи классификации, и кстати большая часть вычислений, задействованных в нейронных сетях могут быть таким образом оптимизированы (правда операции нужно будет в железе реализовать)

Это ни разу не аналог nVidia A100. Это чип который может решать задачу классификации (и возможно близкие задачи) изображения и делает это очень хорошо, с минимальным энергопореблением и задержкой.

Вот именно этого и хотелось бы видеть в статье, причём выделенным жирным. Потому что при прочтении возникает вопрос, может ли чип помимо классификаций изображений этого заниматься чем-либо ещё.

осталось найти первоисточник. И желательно не на китайском.

там написано то же, что и тут (или тут то же, что и там) - та же ахинея про какие-то операции

Пространственный модулятор света похоже на MEMS сделан. https://www.nature.com/articles/s41378-023-00498-z - Integrated silicon photonic MEMS. По крайней мере в оригинальной статье он упоминается без самой технологии. Сама идея многократно публиковалась.

М-м-м, теплые аналоговые вычисления. Все равно что сказать что примочка дисторшн по мощности равна процессору компа, который обсчитывает аналогичное искажение сигнала в эмуляторе.

Ооо, аналоговые компьютеры (тогда называли вроде вычислители) показывали нам в лётном училище в 90-х на курсе бортового оборудования. Толком особо не помню уже, да и кто там будет будущим лётчикам технические подробности излагать - нечего им голову ерундой забивать ))

Если правильно запомнил - то сей девайс позволял решать узкий спектр задач, но зато очень быстро, считай что "мгновенно" - аналог жеж. На вход подавались начальные данные в виде разных уровней напряжения, а вычислитель "преобразовывал" (а не "вычислял", по этому и быстро) их в результат.

Сейчас видимо с развитием микроэлектроники китайцы наследие "большого брата" не забыли, и впихнули в микросхему, приспособив для решения актульных задач.

В целом выглядит логично и перспективно, выстрелит или нет - тут кто знает. Но такие вещи обычно под конкретную задачу делают, это не универсальный процессор. Видимо задача для этого у них есть.

А унутри него была неонка?

Число операций в секунду в аналоговом оптическом преобразователе? Ну-ну.

Там стык с цифрой, и именно скорость оцифровки результата аналоговой части (или предел скорости управления аналоговой функцией) ограничивает производительность

Ох уж эти заголовки и китайцы с их манией все гиперболизировать (3000(!) раз).

Вспомнилось видео, где один китаец другому говорит:

– помнишь своего кузена Тимми? у него уже 15 лет рабочего опыта! и ему 9 лет!

– как это возможно!?!?

– он работает одновременно в 5 местах!

...

– ты слушаешь lo-fi, а что делать Тимии, если он хочет слушать музыку?! – он сам должен ее играть!

...

– он капитан футбульной команды, должен бегать в 150 градусную жару! босиком! по снегу!

?

и вообще вспоминаются мемы с "high expectations chinese dad":

тебе 5 лет? в твоем возрасте мне уже было 6
тебе 5 лет? в твоем возрасте мне уже было 6

Ладно, если серьезно. то мне кажется тут больше про цифровое зрение и фотоматрицы, нежели остальное.

UPD. нашел видео про кузена Тимми:

У аналоговых вычислений есть одна проблема - воспроизводимость.

И она может проявляться в двух аспектах: воспроизводимость результата (когда при одинаковых входных данных НС должна выдавать один и тот же правильный ответ), и воспроизводимость ошибки (если в каких-то случаях НС отвечает неправильно, то ошибка должна быть повторяема и локализуема).

При переносе аналоговых данных на другое устройство часть информации теряется, и нейронная сеть начинает работать немного иначе. Но если первую проблему можно частично решить, увеличивая число нейронов и улучшая качество обучения, то с отладкой могут возникнуть серьёзные проблемы. Так как если даже обычная цифровая НС с алгоритмической точки зрения представляет собой чёрный ящик, то аналоговая НС - это просто чёрная бездна, в которой баги могут возникать из ниоткуда.

Нейронные сети, идеальное место для использования ненадежных вычислителей, они очень устойчивы к ошибкам такого рода за счет кошмарной избыточности.

Отличный пример - понижение битности и квантизация, это выглядит абсурдом, что начиная с 32 и 16 бит на числа с плавающей точкой доводят его до 8бит (буквально) и качество ответом языковой модели падает на сотые доли процента (есть метрики которые это оценивают, perplexity, по ней можно точно изучать, иначе количество тестов абсурдно высокое должно быть, напоминаю что gpt активно использует случайность для выбора токенов) но затем идут дальше и понижают среднее количество бит на веса в 4 бита, 3 бита и видел 2 бита (правда качество результата падает но все еще работает в каких то условиях)

Например llama2 с квантизацией 5 бит вполне юзабельна и даже не заметно что что то не так.

Нервосеть новость писала... У меня возник только один вопрос к нервосети-ньюсмейкеру: как может быть примерно равным количество операций в секунду для аналогового и цифрового ЦП, если принцип аналогового представления информации требует на порядки большего количества входящих данных?

Как же сложно читать английские статьи для домохозяек, обильно политые водой. По несколько раз повторяют одно и то же. PFLOPS сначала обозвали пета-операциями (чего??), затем ещё раз повторили эту цифру 4.6.
То в одном тесте разница в энергопотреблении всего 18.5/4.38=~4 раза, то потом "в 4 миллиона раз меньше энергии".

Sign up to leave a comment.