Pull to refresh

Comments 44

"сжатие видео в GIF убило детализацию"
Да, но как? GIF в пределах индексированной палитры оттенков жмёт без потерь..

Ну точно используется индексированная палитра? GIF умеет в любую фиксированную палитру, не только индексированную по цветам исходного изображения. А уменьшенное число цветов в палитре это прямая потеря информации.

Потеря, но предполагаемая заранее. Современные утилиты палитру подбирают неплохо, а если лень проверить палитру - нужно было паковать бегущий текст в apng, на не в gif.
На гифке восьми оттенков хватит с головой, скорее четырёх.

Да, но как?

Можно, например, назвать гифкой WebM, а потом ещё раз на самом деле перекодировать в гифку.

Да, вполне возможно.

Думаю, что на сайте Medium имеется ограничение на размер файла изображения, из-за которого автор уменьшил ширину и высоту GIF. Хотя можно было бы уменьшить количество кадров в секунду.

Палитра из такого GIF наверняка была бы, с формальной точки зрения, стопроцентно с потерями (так как в исходнике присутствуют не только оттенки серого цвета, то есть цветов наверняка > 256), вопрос лишь в том, было бы это заметно или нет. Допустим, если убрать каждый второй цвет, то палитра уменьшится, условно говорят, с 500 до 250 цветов, а на глаз различий не будет, если применен подходящий дизеринг.

В общем, под “сжатием с потерей детализации” он имел в виду просто уменьшение картинки по ширине и высоте. Также в оригинале “the video-to-gif compression leads to mediocre resolution” – слово “resolution” (хотя и там формулировка расходится с фактами – конвертирование видео в GIF не требует уменьшения количества пикселей).

Везде речь идёт о пропускной способности памяти, но по сути горлышко тут - шина, по которой данные идут между вычислителями и памятью. Так? Или не так? Если так, тогда почему это горлышко везде ассоциируется с самой памятью?

Ну и конечно, не раскрыта тема "Дома 2". В том смысле, что если даже часто простаивающие вычислители нагревается до ста градусов, то насколько же они будут нагреваться, не простаивая, и как там бороться с теплом? Хотя если они сильно проще, то и нагреваются меньше? Но в масштабе всей пластины должна быть куча тепла (в 15-20 раз больше, чем в GPU).

Везде речь идёт о пропускной способности памяти, но по сути горлышко тут - шина, по которой данные идут между вычислителями и памятью.

Нет, у DRAM пропускная способность ограничена ещё и самим её внутренним устройством: информация хранится в конденсаторах. Эти конденсаторы надо адресовать, получить их заряд, усилить его, записать в латч, а потом обновить в конденсаторах.

А у SRAM информация хранится в транзисторах, скорость доступа к ней гораздо (в десятки раз) выше.

В результате SRAM память будет быстрее. Однако ячейки SRAM больше по площади и дороже, в результате объём памяти на той же площади гораздо меньше и дороже, чем в DRAM. Отсюда начинаются всякие компромиссы: выстраивания иерархий памяти, манипуляции с шинами данных, способами обращения и прочим.

Это понятно, что у любой памяти пропускная способность ограничена. Но понял про SRAM.

Да не, в соседней ветке уже написали, что не сгенерировано.

Гигантский поток генеренки. Кто то реально читает это вот все?

Мозг научился игнорировать воду, которая несёт ноль байт

Так то оно так, но жалко своего времени и внимания на эти бесконечные простыни текста. Смысла - пара абзацев, а на чтение 10-20 минут. И таких текстов сейчас подавляющее большинство

Скормить статью ИИ и получить короткую информационную выжимку 😀

Я спрашивал у бесплатной нейросети по поводу аналогичных вопросов, отвечает очень интересно) видимо, всё-таки у нейросеток эксперты внутри сильно разные.

Я прочитал. И непохоже на генеренку, как минимум ручная редактура была.

Живой переводчик, старательно перетаскивающий фаренгейты в русский перевод... Ну, такое.

Справедливости ради, оригинал тоже мог быть сгенерирован ИИ.

Переизобретение FPGA/ASIC

ЕМНИП FPGA stateless, то есть не хранят в своих ячейках сколько-нибудь данных. Здесь фактически чип с кучей L1 кэша, но уменьшенным набором команд, ну и огромный до кучи.

Не, нет никакого препятствия собрать из ячеек FPGA память, но часто там есть ещё и специальные блоки для этого (BRAM).

Слежу за ними некоторое время. У них лучшие результаты по качеству предоставляемых открытых моделей, но цена сильно выше средней. Еще помню что их CTO читала у нас базы данных в универе.

Как бы, ничего принципиально нового они не придумали и столкнуться ровно с теми же проблемами, что и остальные. А это и деффекты и теплоотвод.

По сути их пластина это кластер, который не собран, а сразу расчерчен.
И надо сказать, учитывая то, что даже по сравнению их пластина выглядит как примерно 80 чипов nvidia (на глаз), а производительность, в лучшем случае, в 15 раз выше, достижение у них сомнительное.

Т.е. Хуанг может подобное начертить за вечер (это гипербола), получится кластер на пластине, со встроенной памятью.

Но он, по какой-то причине, продолжает делать отдельные кристалы. Возможно потому, что если один такой сдохнет, его можно будет заменить, либо заменить на более мощный, а вот у WSE3 ни то, ни другое не получится

Там в статье написано, что отказы/брак отдельных чипов в пластине не приводит к отказу всей пластины, а лишь снижает ее производительность.

Тут вопрос именно в возможностях:

Каким бы классным не был двигатель с винтом - он никогда не полетит быстрее скорость звука.

Каким бы классным и экономичным не был турбовентиляторный двигатель - он никогда не полетит на 1.5 mah

Каким бы классным не был турбореактивным двигатель, позволяя летать на 2-3mah - он потребляет слишком много горючего

Какими бы не были предыдущие двигатели, но пролететь полмира за пару часов можно только на прямоточном двигателе

Для Хуана исторически более перспективно gpu based архитектура, и у него есть больше преимуществ чем недостатков. А wse просто выбирает свою нишу, где Хуан не справляется.

UFO landed and left these words here

Не забудьте сразу пять агентов, один пишет тесты, второй доку, третий модули поддержки, четвертый доку переписывает, пятый чинит баг пытаясь дебажить

«...правда, такая фигня получается...» ©

Ну вообще "thinking process" это больше к человеку - чтобы он перечитал и передумал что попросил сделать...

UFO landed and left these words here

Для такого, у меня системный промт разработческих задач написан так, что он заставляет модель самостоятельно искать где логика может "пойти не туда", останавливаться и предлагать мне варианты, запрашивать у меня явное подтверждение выбора.
Да и самих правил разработки не менее чем на десятки тысяч токенов,
где уже рассмотрены стратегии принятия решений на проекте, всевозможные правила и предпочтения, с примерами как хорошо и как плохо..

Можно попробовать доработать под свои задачи эту версию правил.
Она более общая, без узкой специализации под мои проекты.
llm_dev_directive.txt
Модели по-разному ведут себя с правилами, возможно, придется уточнять правила под конкретную модель.
Reasoning версии лучше следуют правилам, соответствуют требуемому стилю кода, планированию работ и подготовке отчета о результатах.
Составлял список правил совместно с Grok, для того, чтобы разработка шла в нужном мне стиле, с акцентами на те моменты, которые мне были важны.

Пример
Следуя правилам разработки DFD создай скрипт установки gitlab на ubuntu server

Не увидел в статье дисклеймер что модель пришлось ощутимо порезать, сами openai ее оценивают чуть выше gpt-5.1-mini, а я бы сравнил с haiku который у антропиков или гугла в vertex ai отвечает уже вполне сопоставимо по скорости. (в целом и sonnet с opus'ом у гугла или антропиков в fast режиме тоже довольно быстры)

По интро не очень очевидно было что цель статьи - разбор Cerebras.

Интересно как бы себя показал GPU если ему напихать столько же SRAMа?

Для сравнения: диффузионные LLM (dLLM) работают иначе – они не авторегрессионны, там все токены генерируются одновременно, а не по одному.

Кто может пояснить что здесь написано?
Какой пример диффузионной модели на huggingface для txt2txt?

UPD - нашел по "dLLM", но там не более 8b, чьи-то эксперименты.

"нагреваться так, что любая серия “Дома-2” покажется прохладным вечерком"
AI юмор чувствуется))

До сих пор даже на Реддите не увидел зачем вообще нужна эта модель? В Api ее нет, значит она для личного пользования. Ну и как, есть смысл на ней что-то кодить, создавать? Даже от самой Open Ai - никаких примеров, как и для чего использовать?

Была новость пару дней назад, что модель на 8 B параметров запекли прямо в чип, и он 16 тысяч токенов выдает. Так что есть куда стремиться.

Sign up to leave a comment.

Information

Website
bothub.chat
Registered
Founded
Employees
2–10 employees