Как стать автором
Обновить

Как мы учили Алису видеть мир с помощью мультимодальной нейросети Яндекса

Время на прочтение11 мин
Количество просмотров5.1K
Всего голосов 26: ↑26 и ↓0+31
Комментарии10

Комментарии 10

Что надо настроить в Алисе, чтобы она на команду "выключить свет в коридоре и туалете" не отвечала "не нашла такую комнату"?

Ну, или когда ... :)

Этот запрос не совсем в команду компьютерного зрения, поэтому я передам коллегам. Спасибо.

Ещё вопрос не по адресу. Когда в сценариях Алисы появится элементарная логика И Или и ТД.

Когда уже будет как J.A.R.V.I.S?

Спасибо, что вы оставили сравнение с Qwen2.5 на синтетике, где видно, что модель проигрывает. Все чаще, сейчас, такое предпочитают скрывать или умалчивать.

Снимаю шляпу 🎩

Пока что не даем, но думаем об этом

Большинство общеизвестных бенчей: docvqa, infographicsvqa, MMBench, MMMU, pope итд (всего чуть больше 30 штук)

Здравствуйте, @isachenkoroma. Подскажите, какое приложение "Алиса", вы имеете ввиду в начале статьи? Хотел потестировать, но не нашел.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий