Comments 1
Для меня, как для computer vision инженера, в секции «вопрос-ответ» прозвучало важное наблюдение: индустрия постепенно уходит от чисто свёрточных архитектур в сторону гибридных решений и трансформеров, которые сегодня становятся новым стандартом для мультимодальных моделей.
Мне кажется, это стало очевидным ещё несколько лет назад, когда мультимодальные модели начали побеждать во всех бенчмарках, включая тот же ImageNet
Sign up to leave a comment.
Что я вынес из Oxford Machine Learning Summer School 2025