Комментарии 5
Было б чуть удобнее давать линк не pdf с arxiv, а на страницу статьи:
https://arxiv.org/abs/2409.11402
и на страницу проекта будет не лишним:
А, ну то есть уже совсем скоро оно научится отличать пожарные гидранты от велосипедов, ЕВПОЧЯ?
Убежден, сейчас только 6.5 + 5.0 = 11.5 ярдов зелени добудут, и гидранты наконец будут повержены
Любопытно будет пощупать, когда сделают кванты. Открытых средних моделей и так не то чтобы много, а уж мультимодалок и подавно. Судя по бенчмаркам, модель 34В должна обгонять Gemma 2 27B, а на деле... посмотрим насколько это "Лев Толстой". В последнее время что ни модель, так по тестам GPT-4 и Cloude Opus почти уделывает, а потом оказывается что только по тестам и то только по тестам разработчиков.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Nvidia выпустила NVLM 1.0 – собственную мультимодальную LLM, которая на некоторых тестах опережает GPT-4o