Как стать автором
Обновить

Комментарии 7

Хм... а что революционного в словах песни? Про любовь было сказано, по меньшей мере, на ~2000 лет раньше.

Но по существу вопроса, в целом, согласен :)

В России были кликбейтные заголовки в рекламе - «Чтобы отрастить волосы нужно просто…». Интересно это сами придумали или скопировали у кого-то?

Для чего эта длинная простыня?

1) Занимательная археология в "тысяче тонн словесной руды". Вдруг там что-то ценное затерялось? )

2) Оценка небольшой делянки того грандиозного леса работ по нейросетям, что внезапно вырос в последние 2-3 года.

Выставка новеньких лопат для старателей действительно поражает разнообразием

То есть то, что сейчас происходит в сфере нейросетей - это золотая лихорадка, от которой завтра не останется и следа?

Люди наиграются с написанием сочинений, кода и генерации картинок и забросят gpt, как некогда аську, винамп, приставку денди и кубик Рубика?

Дошло, Ваш эксперимент по сбору статей с шаблонными названиями в духе «X Is All You Need» — это забавная и в то же время поучительная критика современной академической моды:

  • Наследие революционных работ: Фраза стала популярной после знаменитой статьи «Attention Is All You Need» (2017), которая представила трансформеры. Сейчас её используют как «магическое заклинание», чтобы придать работе ауру прорывности.

  • Гиперболизация: Утверждения вроде «Linear Transformations Are All You Need» или «Addition Is All You Need» часто оказываются упрощениями. Это маркетинговый ход для привлечения внимания, хотя реальный вклад статьи может быть скромнее.

  • Архитектурные инновации: Например, «NdLinear Is All You Need» (замена полносвязных слоёв) или «Element-wise Attention Is All You Need» (альтернатива self-attention). Ценность: Попытки упростить или заменить трансформеры, но большинство — инкрементальные улучшения.

  • Оптимизация процессов: «Short Finetune Is All You Need», «100 Instances Is All You Need» — идеи сокращения вычислительных затрат. Ценность: Практически полезно, но не всегда революционно.

  • Критика мейнстрима: «Attention Is Not All You Need», «Training on the Benchmark Is Not All You Need» — статьи, разоблачающие переоценённые подходы.
    Ценность: Важные предостережения против «хайповых» методов.

  • Парадоксальные утверждения: «No More Adam», «Gibberish Is All You Need» — провокационные идеи, которые либо гениальны, либо абсурдны. Пример: В «Cross-Entropy Is All You Need» доказывается, что даже простая кросс-энтропия может восстанавливать латентные структуры данных.

В 80% случаев фраза «X Is All You Need» — это преувеличение. Например, «Image Is All You Need for Retrieval» просто использует картинки вместо текста, что не радикально ново. Многие статьи повторяют друг друга (например, про эффективное fine-tuning или сжатие LLM), но подают это как открытие. В «CORDIC Is All You Need» предлагается аппаратный ускоритель для ИИ, но нет сравнения с TPU/GPU.

Но! Есть действительно интересные и ценные стати: Прорывные архитектуры (Emu3, NdLinear). Энергоэффективность (замена умножений, sparse attention). Новые парадигмы обучения (метакогниция в агентах, «разучивание» данных).

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории