Как стать автором
Обновить

Учёные AIRI и «Сколтеха» разработали оптимальный метод переноса данных из одного домена в другой с помощью нейросетей

Время на прочтение3 мин
Количество просмотров842

Исследователи из Института ИИ AIRI и «Сколтеха» создали новый алгоритм для преобразования данных из одного домена в другой оптимальным способом с помощью нейросетей, рассказали Хабру в пресс-службе AIRI. В отличие от большинства существующих аналогов, новый метод не требует парных обучающих выборок и может обучаться на независимых выборках данных из входного и выходного доменов. При этом результат работы алгоритма обладает большей интерпретируемостью, чем существующие подходы, и имеет строгое теоретическое обоснование.

Современные модели машинного обучения, созданные для решения прикладных задач, (распознавание лиц, анализ медицинских снимков или распознавание речи) требуют большого набора обучающих данных. При этом качественных данных зачастую не хватает для создания достаточного обучающего набора, в связи с чем появляется потребность в синтезе искусственных данных, похожих на уже имеющиеся в доступе реальные. Решить проблемы такого рода помогают генеративные модели, в последние годы достигшие колоссального прогресса в качестве создания изображений и текстов.

Генеративные модели позволяют синтезировать одни данные из других, то есть осуществлять «перенос одного домена в другой». Например, человек нарисовал скетч, а нейросеть на его основе создала цифровую картинку, или спутник сделал снимок, а нейросеть улучшила его детализацию. Обычно для решения таких задач нужны парные обучающие выборки, наборы изображений вход-выход, знания о которых нейросеть учится обобщать и распространять на новые поступающие изображения. Как правило, парные данные очень сложно или дорого собирать, и учёным приходится обходиться непарными наборами, что создаёт трудности в достижении действительно хороших результатов.

«Стандартные подходы к построению генеративных моделей для решения задач переноса одного домена в другой в значительной степени эвристические, они зависят от большого числа влияющих на результаты обучения гиперпараметров, подбор которых затруднен. Для таких подходов нет строгой математической постановки. В результате процесс обучения моделей нестабилен и приходится настраивать его вручную», – отмечает Евгений Бурнаев, руководитель исследовательской группы AIRI и руководитель Центра Прикладного ИИ, профессор «Сколтеха».

Команда исследователей из AIRI и «Сколтеха» обратилась к работам советского математика и экономиста Леонида Канторовича. Основываясь на его идеях об оптимальной перевозке грузов (теория оптимальной транспортировки), учёные разработали новый алгоритм для расчёта планов оптимальной транспортировки данных между доменами. Алгоритм получил название Neural Optimal Transport. Он создан на базе глубинных нейронных сетей и использовании независимых друг от друга наборов данных.

На изображении слева можно увидеть результаты оптимального и неоптимального переноса домена, а на изображении справа – пример переноса домена с помощью нового алгоритма
На изображении слева можно увидеть результаты оптимального и неоптимального переноса домена, а на изображении справа – пример переноса домена с помощью нового алгоритма

По результатам проверки качества работы Neural Optimal Transport на задачах непарного переноса домена учёные выяснили, что алгоритм превосходит существующие методы в ряде экспериментов, в том числе и в задаче стилизации изображений. При этом он имеет гораздо меньше сложно настраиваемых гиперпараметров, чем другие существующие методы, а результат его работы хорошо интерпретируем. Кроме того, алгоритм имеет строгое математическое обоснование.

«Численные методы оптимальной транспортировки уже несколько лет активно используются для построения генеративных нейросетей. Наши предварительные исследования показали, что ошибка вычисления оптимальной транспортировки в таких моделях очень высока. Нам удалось не только обнаружить причины этой ошибки, но и на основе проведенного анализа разработать принципиально новые эффективные способы построения генеративных моделей для непарного переноса домена на основе теории оптимальной транспортировки», – отмечает Александр Коротин, научный сотрудник AIRI и руководитель исследовательской группы «Сколтеха».

Сейчас ознакомиться с публикацией можно с помощью препринта, а в мае алгоритм будет представлен на международной конференции ICLR 2023 (A*).

Теги:
Хабы:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Другие новости

Истории

Ближайшие события

Конференция HR API 2024
Дата14 – 15 июня
Время10:00 – 18:00
Место
Санкт-ПетербургОнлайн
Конференция «IT IS CONF 2024»
Дата20 июня
Время09:00 – 19:00
Место
Екатеринбург
Summer Merge
Дата28 – 30 июня
Время11:00
Место
Ульяновская область