Pull to refresh

Comments 1

Для меня, как для computer vision инженера, в секции «вопрос-ответ» прозвучало важное наблюдение: индустрия постепенно уходит от чисто свёрточных архитектур в сторону гибридных решений и трансформеров, которые сегодня становятся новым стандартом для мультимодальных моделей.

Мне кажется, это стало очевидным ещё несколько лет назад, когда мультимодальные модели начали побеждать во всех бенчмарках, включая тот же ImageNet

Sign up to leave a comment.

Articles