Для большого профессионального коллектива это — спотык. Для меня — стоп машина, что я и отметил в статье. Без наличия на руках подходящих метрик (не мой случай, увы) — это трата времени и дискредитация подхода (потенциально хороший результат превратится в тыкву).

Celsius 31 янв 2023 в 08:58

Нейросети так не работают. Рекомендую ознакомиться с теорией информации и использованием нейросетевых методов сжатия.

Собственно, нейросеть может создать приближение функции кодирующей изображения из определенного домена, но при добавлении другого домена возникнут искажения. Это можно компенсировать добавлением числа параметров, но после некоторого предела использовать такую функцию становится бессмысленно.
Самый наглядный пример - StableDiffusion. Набор из 75 токенов и сид исходного шума кодирует любое из триллионов изображений, но закодировать любое произвольное изображение невозможно так как функции генерации используют некоторый набор абстракций, полученных из обучающего датасета. И статистическое смещение/искажение этих абстракций не позволяют кодировать произвольное изображение без дообучения.
Самая главная проблема в нейросетевом кодировании - фазовые пространства не гомеоморфны, там есть гомеоморфные кластера для некоторых доменов, но эти кластера разрежены. Чем больше размерность пространства, тем больше кластеров и больше разряжение.

NickDoom 29 мар 2023 в 11:11

То есть мы каждый раз должны обучать сеть сжимать одно изображение?

ОК, сойдёт :) На выходе всё равно детерминированный формат, который читается без нейросетей. Хотя на данном уровне развития техники это, конечно, умозрительная возможность.

Biga 31 янв 2023 в 15:44

Существуют архиваторы, которые работают на нейросетях (или на алгоримах, похожих на нейросети), но немного по другому принципу. Там нейросеть быстро обучают под сжимаемый набор данных. Но их скорость работы слишком низкая, а профит слишком небольшой по сравнению с более традиционными методами сжатия.

Некоторые предсказательные алгоритмы (вроде https://ru.wikipedia.org/wiki/Context_tree_weighting, https://ru.wikipedia.org/wiki/DMC_(алгоритм_сжатия)) хоть и не являются нейросетями, но имеют некоторые схожие особенности.

НЛО прилетело и опубликовало эту надпись здесь

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Теоретические соображения о сжатии изображений при помощи нейросетей

Комментарии 8

Публикации

Истории