Комментарии 6
Статья про историю LLM заканчивается рекламой современного ИИ-сервиса. Символично )
И всетаки немного скачками.... неплохо бы не просто упомянуть рекурентные сети а сказать на чьих работах выросла эта модель, а там и до идей, которые продинули обучение многослойных нейронок, без которого вообще все стояло на месте пару десятков лет.
Автор пропустил SemaWeb имени сэра Тим Беренс Ли.
Текущие модели не понимают семантику.
Они вообще не понимают.
В статье искажены факты. Внимание появилось не в Attention is all you need. Там появились только трансформеры. А сам механизм внимания появился в статье Dzmitry Bahdanau et. al, 2015, "Neural machine translation by jointly learning to align and translate"
Я попробую рассказать эту историю без лишнего академизма - просто, но честно.
:)))

Рождение LLM: история, которую мало кто знает