Pull to refresh

Comments 29

Стоит ли поменять модель waifu2x на другую? CUnet?

Я пользую только CUnet. Гораздо лучше чем другие методы в waifu: выше чёткость, больше деталей, лучше удаление артефактов. Плюс включена опция TTA, хоть и жутко медленно, но чуть качественней.
Опция удаления артефактов даже на первом уровне настройки — очень сильная, годится лишь для аниме/комиксов, для нормальных фоток не применимо т.к. удаляет слишком много деталей, только для пережатых в хлам.
Ну и размытость, если она присутствует на исходнике, waifu не устраняет. И текстуры не дорисовывает. По моему так и должно быть. Вообще, это инструмент не для фоток и видосов, а для анимешных картинок.

Пару месяцев назад я тестировал оба, и решил, что UpResNet10 выглядит лучше. Надо будет перепроверить, спасибо за отзыв.
Плюс включена опция TTA, хоть и жутко медленно, но чуть качественней.
Да, эта опция на самом деле не стоит того времени, что добавляет к времени обработки.

Опция удаления артефактов даже на первом уровне настройки — очень сильная, годится лишь для аниме/комиксов, для нормальных фоток не применимо т.к. удаляет слишком много деталей, только для пережатых в хлам.
Если я правильно помню, то этот шумодав рассчитан на удаление шумов сжатия JPEG, поэтому может странно работать с кадрами, где их нет в принципе, например — кадрами из видео. Кроме того, не совсем понятно, что делает «Авто-убрать шум», и как работает с видео. Изучу этот вопрос перед следующей статьей.

Ну и размытость, если она присутствует на исходнике, waifu не устраняет. И текстуры не дорисовывает. По моему так и должно быть.
Я тоже так думал до Topaz, теперь уже и не знаю…

Я не понимаю вот чего, если каждый кадр обрабатывается независимо, то возможна их нестыковка во времени, например, на кадрах 1 2 3 6 7 нейросеть решает дорисовать тень, а на 4 5 — нет.

Теоретически — да, на практике я такого пока не встречал. Есть некоторые артефакты, которые ИИ может усилить. Например, в видео YOUTUBE в файле Topaz на с 18 секунды на волосах женщины: простой шум превратился в переливающиеся цвета. Я не стал записывать это в минусы, потому что шум там есть и в оригинале, но нестабильность обработки этого шума хорошо заметна. В остальных сравнениях я такого не наблюдал.

Есть еще одно замечание. 1080->4к похоже на сравнение MP3 256 и 320, которые большинство людей на слух не чувствуют. Вот у меня и мониторы full hd. Вот 360->full hd было бы интереснее

Вот у меня и мониторы full hd. Вот 360->full hd было бы интереснее
Сдается мне, что здесь Topaz будет вне конкуренции, потому что он единственный, кто «додумывает» картинку и убирает блочность. Photoshop тоже пытается, но расплачивается резкостью изображения.
На мониторах FullHD тоже можно увидеть разницу, по крайней мере у Topaz и Instant 4K, да и есть люди, которые качают 4К ради повышенной четкости изображения на тех же 1080P мониторах\телевизорах.
Но я не сомневаюсь, что «не вижу разницы» это вполне легитимная реакция после изучения всех материалов. Часть с гайдами все равно прекрасно распространяется на любые разрешения.
Согласен, для реставрации видео было бы интересно
В следующий раз буду апскейлить из чего-нибудь поменьше, и до 1080Р. Беда низких разрешений не в том, что там мало пикселей, их проблема в том, что сжимали их как правило сурово и без оглядки на качество. Разгребать ошмётки макроблоков и шумы — не совсем задача апскейлера, скорее денойзера и чего-то еще. В любом случае, для этих целей, из выбранных для сравнения программ может сгодиться только Topaz, и то с натяжкой: до первого артефакта, который он примет за «фичу»

В вашем случае – да. Хотя можно немного комфортней смотреть 1920x960 -> 4k -> "Fill Screen" (1920x1080)

Что-то более популярное, вроде nnedi3, пробовали?
Нет, не пробовал, посмотрю. Он ведь через Avisynth?
Да, Avisynth и Vapoursynth. Его поддержка есть также в рендерере madVR.
На это, конечно, интересно будет посмотреть. Но nnedi3 проиграет другим по резкости. В его основе подход к изображению не как к фракталу, а как к непрерывной функции как у старых методов, вроде бикубика или ланцоша. Проще говоря, если тот же CUnet способен сколько угодно увеличивать изображение, сохраняя чёткими границы (с оговоркой на простые случаи), то у nnedi3 с каждым шагом ресайза будет всё больше блюра.
Хорошо когда видео можно разложиь на удобные четкие кадры.
Но бывает же и такое, когда в некоторых кадрах присутсвуют поля из соседних, актуально для старых вещей
на рутрекере встречал в примерах
не фиксится. в одном кадре каждое из полей содержит смешанные поля из соседних кадров. Восстановить оригинальный кадр существующими методами (да и в перспективе) невозможно. Можно только минимизировать количество таких кадров применением существующих деблендеров на участках с реальными 12 кадрами в секунду.
Из этих троих кадров
Скрытый текст
image
image
image


получить нормальный кадр невозможно, только что-то такое, после топорного наложения
Заголовок спойлера
image

Скрины с предыдущего рипа за неимением таких двд, но концепцию иллюстрируют.


Да, это частая проблема старых видео, на ТВ ее зовут «полуполем». Как правило, вырезается вручную, без попыток исправить. Но это в «боевой ситуации», когда нет времени как-то по-другому исправлять. Не знаю, попадут ли в мою следующую статью подобные видео, будем посмотреть!
Я этим не занимаюсь, просто вспомнился пример из коментариев. А данный исходник в целом очень проблемный, над ним уже много кто бился. Сейчас более менее неплохого результата все же добились.

Ловите задачу, из видео 4:3 дорисовкой полей получить 16:9. Очень актуально для старых фильмов

Уже отвечал тут.
Если при апскейле ИИ работает с тем, что в кадре есть, то догадаться, что будет там, где есть лишь черное поле — на данный момент невозможно. Нужно как минимум понимать, что ты дорисовываешь — толпу, стены, деревья…
Полностью автоматически нет (за исклюбчением случаев с zoom/понорамированием итд, когда видно, что было рядом). Но в полуавтоматическом режиме с помошью человека — уверен, можно, и уверен, какие нибудь стартапы уже над этим работают
Ха.

Есть пример обученной сетки, расширяющей (тривиально, но весьма неплохо) изображения.
kingdomakrillic.tumblr.com/post/178254875891/i-figured-out-how-to-get-esrgan-and-sftgan

Хотя на видео будет а) очень долго (как раньше качали с торрентов — так сейчас придётся ставить на ночь дорисовывать) и б) нестабильно работать на соседних кадрах
Не нашел там расширения кадров, только апскейл, можно пример(ы)?

Вообще-то можно и даже без машинного обучения. Для статичных изображений называется Seam Carving (liquid rescaling). Для видео тоже есть, но в качестве "швов" там выступают целые двухмерные поверхности, а не одномерные линии. Смотри также: Improved Seam Carving for Video Retargeting.

Топаз весьма хорош, имхо. Интересно было бы взглянуть на кадры не из мультика, а из фильма с живыми людьми.
В файле SCENE 1 вполне себе живые люди! Хоть и не долго…
Хорошо получилось, имхо
Спасибо за столь подробную статью! Вышел Topaz Video Enhance AI, было бы чудесно добавить и ее в статью.
Добавлять в эту не буду, только если в следующую. А по поводу самой программы — особых отличий от Gigapixel не заметил, чуть-чуть проще из-за возможности сразу экспортировать в видео, но там мало настроек экспорта, из кадров ffmpeg-ом можно лучше собрать.
Извиняюсь, что не совсем в тему, но, может гуру подскажут, на какие инструменты сейчас можно посмотреть для автоматического ретуширования старого кино (типа оцифрованных домашних 8мм)?
Only those users with full accounts are able to leave comments. Log in, please.