Статьи / Профиль nagadit / Хабр

Aleksandr Nagaev @nagadit

RnD ML CV

Профиль Публикации 2Комментарии 7Закладки 2

nagadit 7 сен 2023 в 12:04

«SAM и тут и сям»: Segment Anything Model в задачах компьютерного зрения (часть 2)

Средний

6 мин

3.3K

Блог компании SberDevicesData Mining*Обработка изображений*Машинное обучение*Искусственный интеллект

В предыдущей части мы разобрали, как можно улучшить качество предсказаний SAM и ускорить её работу. Мы уже упоминали, что SAM — это фундаментальная модель, а значит, она может использоваться не только для сегментации, но и легко адаптироваться для решения других задач компьютерного зрения. Сегодня мы рассмотрим, как SAM может применяться для решения таких задач, как Image Inpainting, Object Tracking, 3D-сегментация и 3D-генерация, а также увидим, как SAM работает на датасетах из медицинской сферы и сравним дообученную модель с базовыми весами. А еще мы поделимся своим опытом и расскажем, как SAM облегчила нам разметку данных при сборе датасета бьютификации изображений.

SAM и тут и сям...

+12

nagadit 16 сен 2021 в 13:15

Involution: Attention is not what you need, или Как скрестить Self-Attention из NLP и Convolution в задачах CV

5 мин

6.9K

Python*Алгоритмы*Машинное обучение*

Из песочницы

Если говорить про Self-Attention в картиночных моделях, то тут есть 2 варианта. Олдскульный “давайте просто перевзвесим фичи” в разных вариантах: поканально, пространственно, в некоторой проекции. И новомодный "давайте обучим трансформер" с представлением патчей как визуальных слов. Первый подход рабочий, но не дает значительного улучшения в плане метрик. Второй подход слишком вычислительно сложный и часто заточен на размер картинок.

Подход коллег из ByteDance AI Lab и университета Пекина сильно отличается от этих крайностей и является переосмыслением Attention-механизма трансформеров в работе свёрток.

Читать подробнее об Involution

+13