man_of_letters Sep 29 2021 at 16:00

Апскейл, который смог

15 min

74K

RUVDS.com corporate blogMachine learning*Image processing*

Technotext 2021

+160

Comments 79

Galperin_Mark Sep 29 2021 at 16:59

Статья, развивающая поднятую тему.
А также анимация от Google Brain Team:

Aquahawk Sep 29 2021 at 17:01

В sample 03 совсем другая эмоция на губах. Какой-то Сильвестр Сталоне проявился. А вообще шикарная статья на тему достоверности восстановления https://habr.com/ru/post/490620/

man_of_letters Sep 29 2021 at 17:20

Вы шутите так, верно? То, что такое сильное увеличение похоже на оригинал уже чудо.

Moldovich Sep 29 2021 at 17:04

| На результате от RealESRGAN листья деревьев выглядят не только реалистично, но и более чётко чем в оригинале, что-то необычное.

эмм, чётче, или вы про резкость всё же ?

man_of_letters Sep 29 2021 at 17:14

Оригинал — это оригинальное изображение, т.е. чётче исходного изображения.

Moldovich Sep 29 2021 at 17:20

Да да, позже дошло, даже отредактировать успел до вашего ответа )

ALF_Zetas Sep 29 2021 at 19:49

банальный эффект шарпнесс

dlinyj Sep 29 2021 at 17:04

Потрясающее исследование, просто поражает воображение! Хабр торт.
Хочется снять монокль и немного пошутить.

Когда немного перебрал :).

А, вот если серьёзно, то всякие истории фильмов, когда в отражении номера видят что-то уже не кажется такой уж глупостью.

Одной из мыслей у меня было, что можно даже из штучных пикселей получить достаточно большое количество информации, а с ИИ можно пойти даже дальше.

lxsmkv Sep 29 2021 at 18:50

Не хотел бы я, чтобы по искуственно увеличеной фотографии меня в ментовку замели, из-за того, что фантазии искуственного интеллекта случайно немного похожи на мою рожу.

И вообще вопрос, насколько изображения полученые искуственным путем могут применяться для сличения. Боюсь тут очень долго не будет нормального законодательства. Или до громких прецедентов.

Thero Sep 30 2021 at 09:40

в целом с плохим законодательством фантазии сотрудника полиции для вас страшнее фантазий нейросети.

DWZ Sep 30 2021 at 23:17

из-за того, что фантазии искуственного интеллекта случайно немного похожи на мою рожу.

Самое интересное, что большинство людей поверит компьютеру и *в принципе* не поймёт, где здесь "ха-ха"

xenon Oct 5 2021 at 12:22

Причем, в принципе, в основном будут склонны верить всякие.... кхм... гуманитарии. От судьи и прокурора до постовых полицейских.

Thero Sep 29 2021 at 20:51

увы эта информация будет недостоверной. номерок телефона с салфетки отражённой в пуговице вы так не восстановите.

lxsmkv Sep 29 2021 at 22:18

нельзя тут не вспомнить фильм «Бегущий по лезвию» (1982).

Tarakanator Sep 30 2021 at 09:10

но вы можете восстановить информацию какого номера там точно нет. И этим очень сильно сузить список возможных вариантов номеров. И если у вас есть ещё какие-то данные про этот номер, то в итоге вполне возможно что и восстановите.

Thero Sep 30 2021 at 09:39

некоторые варианты с некоторой степенью достоверности.. но только если от этого номера вообще хоть что-то осталось, я скорее про случай где номер превращается в пару пикселей неотличимых от артефактов сжатия.

Tarakanator Sep 30 2021 at 09:50

Да, но не забывайте, что чтобы получить номер, нам не нужно восстанавливть изображение цифры. Нам достаточно восстановить саму цифру.
Если упрощая не нужно восстанавливать шрифт, которым написана эта цифра. Т.е. количество информации необходимое для восстановления номера сильно ниже, чем кажется на первый взгляд. из пары пикселей конечно не восстановить... но вот 4 пикселя на цифру может уже и достаточно.

Johnneek Sep 30 2021 at 12:29

номерок телефона с салфетки отражённой в пуговице вы так не восстановите.

Зависит от качества исходного изображения.

Thero Sep 30 2021 at 13:19

ну если номерок в пуговице на исходном фото кое как видно без апскейла то да поможет угадывать что там написано.

xenon Oct 5 2021 at 12:25

Если нейросеть обучать по голливудским фильмам, то первые три цифры (555) она будет восстанавливать достаточно хорошо.

А еще, она всегда будет знать, что на салфетке либо написан номер телефона, либо просьба о помощи, либо секретные данные, которые шпион вынужден передавать связному таким образом, но никак не каляка-маляка и не подсчет стоимости ужина в ресторане.

Tarakanator Sep 30 2021 at 09:09

Так тут была статья с чудесными результатами восстановления строк символов низкого качества.

UFO just landed and posted this here

czz Sep 30 2021 at 14:34

Да, на примере фотографии стены каменного дома очень хорошо видно, что алгоритм придумал текстуру.

dcoder_mm Sep 29 2021 at 17:08

Плюс за использование HTML таблиц с маленькими жипегами, вместо неприлично больших png картинок

man_of_letters Sep 29 2021 at 17:23

Благодарю-с, загрузить 840 картинок — это было весело

dcoder_mm Sep 29 2021 at 17:41

Понимаю вашу боль. У меня в посте про вертолет была всего сотня картинок, но они все были относительно крупные, и к середине поста habrastorage через раз отказывался загружать картинку из редактора (а через свой веб интерфейс отказывался с самого начала).

man_of_letters Sep 29 2021 at 17:50

Статья была сверстана с локальными картинками.
Потом картинки из каждой папки загружались в сторадж, ссылки сохранялись для каждой папки.
Потом скрипт по ссылке картинки определял нужный комплект и по индексу подменял на ссылку в сторадже.
Боль была в создании мотивации так заморочиться. Подействовал аргумент «иначе, всё поперепутаешь и будешь переделывать минимум дважды и перепроверять 10 раз»

dcoder_mm Sep 29 2021 at 18:00

картинки из каждой папки загружались в сторадж

Вот на этом этапе меня ждала самая большая боль, потому что пачка в N картинок обычно переставала загружаться на 2-3.

А вы не думали опубликовать этот скрипт?

man_of_letters Sep 29 2021 at 18:05

И статья и скрипт живут внутри эзотерического редактора Leo Editor, код привязан к дереву статьи внутри редактора, так что никому это не пригодится)

p.s. Очень много и подробно писал про редактор тут

mSnus Sep 29 2021 at 17:52

но иногда интересно косячит! из ваших же примеров, посмотрите на лица:

странно как-то

man_of_letters Sep 29 2021 at 17:56

Господа! Те маленькие картинки в каждом примере это исходник с которого я увеличивал. Это невероятно малый размер. Лицо — это 12 на 12 точек. Потерпите еще два года, тогда будет уже чёткое лицо.

lamerAlex Sep 29 2021 at 20:26

тогда будет уже чёткое лицо

Один вопрос - чьё?

vvzvlad Sep 30 2021 at 00:06

А какая разница? Из 150 пикселей-то?

UFO just landed and posted this here

vvzvlad Sep 30 2021 at 00:42

А он точно нашел человека, а не оригинал картинки?

UFO just landed and posted this here

Thero Sep 30 2021 at 09:29

такой сервис натренирован сильно в пользу лучше найти лицо там где его нет, чем пропустить там где оно есть, у апскейл сетки такой приоритет считается ошибочным, но да потенциал в улучшении определения лиц есть.

UFO just landed and posted this here

man_of_letters Sep 29 2021 at 18:19

1. Он закрыт
2. Люди пилят и выкладывают свои версии, но без обучения на промышленных мощностях, это не имеет ценности для использования

TheRaven Sep 29 2021 at 18:05

С аниме, имхо, вайфу справилась лучше. RealESRGAN даёт слишком жесткие линии, что особенно заметно на лице Мотоко.

vicsoftware Sep 29 2021 at 18:38

Я бы ещё сказал, что RealESRGAN старается везде подрисовать черные границы, даже там, где их нет.

man_of_letters Sep 29 2021 at 18:55

Ценителям конечно виднее.

А если не ультрамаленький размер в нормальный, а нормальный в 4K?

RarogCmex Sep 30 2021 at 08:22

Комикс в 1 Мб весом и кодировкой jpeg превращается в 80+ мегабайт png. Чуда не происходит, но качество значительно возрастает в основном за счёт удаления jpeg-шумов. Я ожидал, что будет значительно больше артефактов.

UFO just landed and posted this here

man_of_letters Sep 30 2021 at 20:28

Несколько моделей
Исходник -> upsc -> downsize (кроме модели x2)

Cпойлер

UFO just landed and posted this here

SADKO Sep 30 2021 at 10:41

Овершарп и в кадрах кино видно, а тут ИМХО самое показательное это машинки на трассе, чётко видна потеря детализации, и это плохо...

drWhy Sep 29 2021 at 18:45

Женщину в красном можно было просто скачать из Матрицы в виде детализированной модели.
Остальное впечатляет — результаты, объём проведённых исследований, настойчивость и методичность при публикации.

Повышение качества изображения ведь кроме улучшения восприятия даёт возможность улучшать степень сжатия, устраняя шумы, занимающие в сжатом изображении большую долю. Особенно велик выигрыш будет для рисованных фильмов.

А если в видео восстановить модель заднего фона по всей сцене (газоны, дороги, стены и прочее преобразовать в «текстуры» и «градиенты»), то можно несущественный для восприятия сцены фон сжать значительно сильнее, чем с помощью традиционных алгоритмов, без существенного ухудшения качества результата.

Контрастные же объекты на переднем фоне после восстановления формы так и просятся быть векторизованными (сразу в 3D?), тогда последующий апскейл будет неактуален.

MaM Sep 29 2021 at 18:56

Super resolution algorithm

man_of_letters Sep 29 2021 at 19:39

О, классно! Ссылка на тысячи статей про «Super resolution». Спасибо!

debagger Sep 29 2021 at 18:57

Интересно, как оно отработает на восстановлении видеофрагментов.

Thero Sep 30 2021 at 09:32

также как и все апскейлеры не учитывающие предыдущие и последующие кадры.

lxsmkv Sep 29 2021 at 18:58

Хотелось бы больше примеров с темнокожими, мне показалось, что он слабо справляется с темной кожей. А у африканских лиц и биометрия другая. Вообще интересно насколько маленьким должна быть фотография чтобы ИскИн начал менять биометрию африканского лица на биометрию европеоида.

man_of_letters Sep 29 2021 at 19:34

Примеры

lxsmkv Sep 29 2021 at 21:17

Спасибо. Мне кажется, или у лица появляются монголоидные черты?

man_of_letters Sep 30 2021 at 11:08

Так и есть. При сильном недостатке информации алгоритм часто уходит в Азию. Разработка китайская, можно поспекулировать, что у них перекос в наборе обучения, но это мои домыслы, может это на самом деле приближение с наименьшей ошибкой.

Loki3000 Sep 30 2021 at 12:27

Есть такое. А у Морфеуса — волосы на макушке:)

Enginfury Sep 29 2021 at 19:09

Все эти алгоритмы - хорошая вещь, но далеко не все справляются хорошо. Тот же Topaz Gigapixel меня не удивил, хотя я перебрал много алгоритмов. Но прогресс есть и это не может не радовать. Спасибо за статью.

Shaginov Sep 29 2021 at 19:16

Самая мощная модель, аналогичная той, что использовалась в данном сравнении, лежит почему-то в другом месте:
models-DF2K — это «official ESRGAN_x4»

Что-то у меня с этой моделью каша получается из картинки. Где бы взять модель которую Вы использовали?

мой результат

man_of_letters Sep 29 2021 at 19:36

Ваша картинка сжата больше некоторого порога, который недоступен для программы, видно сетку сжатия, она начинает воспринимать её как информацию. Попробуйте models-DF2K_JPEG, но чуда не будет.

Shaginov Sep 29 2021 at 21:14

Эта картинка из архива realesrgan-ncnn-vulkan-20210901-windows.zip, на который ведёт ссылка из статьи. Конечно я пробовал и другие фото с этим модулем, результат один — такое вот крошево из кубиков. Если я использую другие модели, то всё получается хорошо (с разной степенью качества). Но мне хочется попробовать модель, которую вы использовали. Об этом и вопрос :)

man_of_letters Sep 30 2021 at 11:49

Понятия не имею что было в голове у тех кто паковал этот exe. Но это возмутительно! Нашел исходник этой картинки, уменьшил до такого же размера. Вот.

Спойлер

kr12 Sep 29 2021 at 19:54

Как можно заметить, текстуры в тему получаются только для кожи и волос. Остальное или замазывает градиентом или крупнозернистым шумом, который на вид хуже, чем если вообще не применять. Итого: лучше, чем Topaz Gigapixel, но смысла для чего-то, кроме lineart, не вижу. Думаю даже лучше было бы, если алгоритм сложные места не трогал, а работал только по четким участкам без текстур

eugeneb0 Sep 29 2021 at 23:19

У меня есть старая фотография куска газеты. Плёночная ещё. С очень нечётким текстом. Возьмётесь улучшить? Хочется прочесть если не текст, то хотя бы дату выпуска и заголовок.

TheRaven Sep 29 2021 at 23:28

Алгоритмы из статьи превратят всё в нечитаемую кашу, вам нужно смотреть в сторону deblur

eugeneb0 Sep 30 2021 at 00:12

Собственно, примерно этого я и ожидал. Но хотелось услышать подтверждение.

man_of_letters Sep 30 2021 at 11:22

Подтверждаю, точное восстановление информации делается другими алгоритмами.

Попробуйте программу хабраавтора отсюда habr.com/ru/post/180393
smartdeblur.net

Arxitektor Sep 30 2021 at 09:42

Будет ли работать RealESRGAN с изображениями большого разрешения ?

Например сделать из картинка 1920*1080 изображение 3840*2160 ?

man_of_letters Sep 30 2021 at 11:14

Собственно в этом весь смысл. Если алгоритм справляется с низким разрешением, то с высоким подавно справится. На высоких разрешениях обычно возникает загвоздка с требованиями к видеопамяти, но в
алгоритм встроена хитрость: он может разбивать картинки на кусочки и обрабатывать их раздельно. Поэтому ничего не мешает сделать 4K.

olegbask Oct 23 2021 at 19:29

А алгоритм запустится на процессорах M1 Max или требует отдельного GPU? У м1 как раз 64 гига видеопамяти.

PzVI Sep 30 2021 at 11:09

Алгоритмы может и хороши, но перешарп итогового результата дикий. Вопрос только один. Авторы кода подслеповаты?!

FedorovDimulya Sep 30 2021 at 15:33

Надеюсь, сегодня усну ночью после этого

PsyHaSTe Sep 30 2021 at 23:25

Ну не знаю. Когда я слышу слова «нейросеть восстановила», я лезу проверять бэкапы

krote Oct 1 2021 at 12:41

Я все жду когда уровень сжатия видео дойдет до того что фильм скажем будет сжиматься в некий скрипт, где будет тайминг, описание движения объектов, их класс, движение камеры, описание эффектов и прочее. Чтобы приложив к такому фильму свой любимый набор актеров ,предметов, текстур подстроить его под себя. Хотят чернокожие фильм "властелин колец" с черными актерами - пожалуйста, а я например только с белыми, и сам выберу какой актер будет эльфом и т.п.

Да и в принципе книгу тоже ИИ сможет когда то превращать в фильм.

Это еще далекое будущее, но не нереальное.

drWhy Oct 1 2021 at 13:14

Хм. А что, технология виртуальной камеры на Аватаре и Гравитации отработана, пора в «матрёшку» добавлять потоки геометрии сцены, перемещения камер и света, физики и т.д.

yupych Oct 25 2021 at 18:49

Как обошлась статья про работу с изображениями без нестареющей классики?

lagudal Oct 29 2021 at 11:00

Кто то сам пробовал уже, действительно ли реально получить такое качество на выходе при увеличении? Сейчас очень надо как раз…

man_of_letters Oct 29 2021 at 19:02

В статье только мои личные эксперименты.

ipastuhov May 24 at 15:39

Вообще RealESRGAN наиболее нереалистично выглядищие картинки рисует. Добавляет детали, которых нет, морщины лишние, глаза навыкат и т.д.
И вроде бы чётче, но глазу неприятно становится. Картинка в заглавии вообще лощёная какая-то, неживая.