Статьи / Профиль morginalium8 / Хабр

Александр Колесников@morginalium8

Изучаю ML

Рейтинг

Подписчики

ПрофильСтатьи2ПостыНовостиКомментарии28

morginalium8 28 июн в 04:45

Как я свертки ускорял

Средний

9 мин

11K

C++ *

Кейс

После написания статьи про NormIs-1 я решил углубиться в тему оптимизации модели. Архитектура была неплохой и показала адекватные результаты на метриках интеллекта, но скорость сильно проседала. Проблема была в Depthwise Conv, а именно - множестве обращений к памяти. Между блоком внимания и FFN стоял небольшой блок сверток и тормозил все вычисления. Именно его я и решил ускорить.

Делать целую языковую модель с полноценным вниманием возможности нет. Проблемы нестабильного обучения, взрывающийся лосс или сломавшийся DataLoader - это все не сегодня.

Нет, все будет 'проще' - мелкая CNN + кастомное MLX-ядро для инференса + бенчмарки скорости

morginalium8 1 мая в 15:15

Архитектура важнее размера: внедряем каузальные свертки в трансформер и получаем связный сторителлинг

Средний

4 мин

10K

Машинное обучение *

Кейс

Из песочницы

Дело было вечером, делать было нечего. Я сидел за ноутом и разбирал новую идею Deepseek Engram: Лян Ванфень собрал вместе хеш‑таблицы и почти‑линейный трансформер — получилось дешево и сердито.

Однако есть в Engram один недостаток — он требует много RAM (каламбурчик, хаха). А хотелось архитектуру, на инференс которой не придется скидываться всем поселком.

Как я свертки ускорял

Архитектура важнее размера: внедряем каузальные свертки в трансформер и получаем связный сторителлинг

Информация

Специализация