Как стать автором
Поиск
Написать публикацию
Обновить

Разработчик представил проект Killed by LLM, где опубликованы бенчмарки, которые были побеждены прогрессом ИИ

Время на прочтение1 мин
Количество просмотров6K
Всего голосов 7: ↑7 и ↓0+7
Комментарии3

Комментарии 3

Драматично, killed... Эти бенчмарки для того и создавались, чтобы автоматические решения по ним проверять. Ну и разрабатывать, разумеется.

Раньше был MNIST handwritten number recognition dataset. Кто-нибудь его помнит? Теперь это "hello world" для алгоритмов компьютерного зрения.

Ну вот в том и дело, что бенчмарки, на которых не так давно SOTA-системы показывали по 5-10%, сейчас стремительно теряют свою актуальность. Потому что средние системы 2024 года на них уже заламывают 80+%.

Ещё один "вы находитесь здесь" - список.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости