Comments / Profile of befozg / Habr

Карен Ефремян@befozg

DL/CV R&D Engineer

Subscribers

ProfileArticles1PostsNewsComments7

Матирование изображений, или как получить фотореалистичный передний план

befozg Aug 29 2023 at 12:20

Этим немного другая команда занимается, а какой вопрос?

Матирование изображений, или как получить фотореалистичный передний план

befozg Jun 21 2023 at 09:37

А какой датасет? И железо?

Матирование изображений, или как получить фотореалистичный передний план

befozg Jun 20 2023 at 13:07

На самом деле для удаления фона недостаточно хорошей маски, поэтому я б посмотрел в сторону background removal алгоритмов. А приложенная маска похожа на результат слабо обученного автоэнкодера :) попробуйте учить дольше и с меньшим шагом. Ну и блюр тоже уйдет, но границы станут грубее.

Матирование изображений, или как получить фотореалистичный передний план

befozg Jun 20 2023 at 12:12

Насчет датасета - конечно же хочется, и, возможно, в будущем сделаем. Но у нас есть описание способа генерации новых изображений, что частично покрывает этот вопрос.

А про upsampling и архитектуру - тут уже субъективно, что применять и чего добиться, для трансфера стилей и деталей guided filter и его модификации вполне до сих пор используются в разных решениях (не только матирование).

Возможно вам хочется увидеть более фундаментальное и прорывное решение. Мы будем стараться улучшать качество и обобщающую способность нашей модели.

Матирование изображений, или как получить фотореалистичный передний план

befozg Jun 20 2023 at 09:48

да, это не панацея. Классические способы увеличения размерности картинки не требуют дополнительных входных данных (как в случае с guided filter, которому в нашем случае для увеличения размерности маски требуется исходное изображение в высоком разрешении, а такого дополнительного знания не во всех задачах можно подыскать). Помимо этого, классический upsampling может работать с произвольным тензором, независимо от числа каналов и информации, которая в них содержится. Поэтому guided filter не будет решением получше, например, в промежуточных слоях UNet-подобных автоэнкодеров.

Матирование изображений, или как получить фотореалистичный передний план

befozg Jun 20 2023 at 09:43

действительно, transformer-based сетка не для real-time, но можно его использовать в редакторах, или как учителя для сегментационных сеток, которые работают быстро в режиме inference.

Матирование изображений, или как получить фотореалистичный передний план

befozg Jun 20 2023 at 09:41

датасетов практически по любому запросу можно найти очень-очень много, но качество разметки, чаще всего, оставляет желать лучшего :)