Как стать автором
Обновить

Нейросетевой апскейлинг дома: вторая молодость для классических мультфильмов

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров7.3K
Всего голосов 43: ↑42 и ↓1+59
Комментарии47

Комментарии 47

Тут ситуация - "Choose your poison". Или смотреть на артефакты от древних аналоговых форматов записей + артефакты от цифровой компресии, или на артефакты апскелера и шумодавов. Кому что. Но верно сказано, надо сначала искать максимально качественный вариант, так как если наличиствует ХД с нормальным качеством, пытаться апскейлить двд исходник бессмысленно. Насчет же Лазер диска вы не правы, так как VHS < LD < DVD. Некоторое время существует технология прямой записи сигнала с диска, а уже потом раскодирования в видео чисто в цифре - Domesday Duplicator. Качество таких релизов приближается к качеству двд.

Согласен, но просто у меня по опыту с ld очень сложно иметь дело, бывает буквально день уходит чтобы по итогу ничего не вышло после перебора всех возможных инструментов, в том числе и ручных. Апскейлеры даже обученные именно на разнице ld и web изданий (Pooh V4 например, и он потому и медленнее остальных, что анализа сетке нужно делать очень много), не спасают никак, спотыкаясь об очень простые артефакты. И такие случаи очень сбивают настрой пытаться что-либо делать с ld.

НЛО прилетело и опубликовало эту надпись здесь

Чип и дейл есть в ХД, кроме пары серий (исходные пленки от них видимо были утеряны) И эта серия есть в хд.

НЛО прилетело и опубликовало эту надпись здесь

Вопрос на какую пленку снимали изначально. Если 16мм - то выше 1080 не имеет смысла, там зерно четче только станет. Для 35мм - 4к обычно предел. Но трансфер могут внутренний делать и в 8к, чтобы запас под стабилизацию картинки был.

НЛО прилетело и опубликовало эту надпись здесь

Вы видимо имели дело со старыми захватами с ЛД, когда захватывался и оцифровывался аналоговый видеосигнал с плеера, со всем букетом соответствующих проблем. Ну сам мастер для изготовления ЛД тоже аналоговый, что качества не добавляет. Достоинство ЛД в том что он не деградирует от проигрывания, в отличии от VHS и там записан полный спектр ТВ сигнала, в то время как на VHS он порезан по частотам.

Кстати проблема с блендингом изображений из разных кадров в одном обычно связана оборудованием для телекино того времени. Так как захват пленки в ТВ формат проходил через ваккумные трубки с люминофором, так этот люминофор не успевал "сбросится" за 1 кадр и продолжал хранить след от картинки. Такое не всегда случалось, видимо зависело от качества оборудования, его ушатанности и настроек.

Мне всегда было непонятно - откуда берется интерлейс на мультфильмах? Их же изначально просто рисуют в виде картинок, в которых никакой чересстрочности нет.

Даже если надо из 24 кадров/сек получить NTSC, не проще дублировать каждый 6-й кадр, но оставлять его прогрессивным, чем извращаться с переводом этого в интерлейс?

Да, это перевод в 60 полей 24 кадров. Дублируются поля, а не кадры, потому что меньше эффект статтера картинок. Но самая жесть происходит когда из таких 60 NTSC делают 50 PAL смешивая разные поля кадров в одно.

Вот-вот, там много всякой жести в результате приходится делать.

Правда, сейчас уже вряд ли надо это смотреть на телевизоре в PAL, так что достаточно просто деинтерлейс сделать.

С PAL вообще, за исключением случаев нативных трансферов с пленки в этот формат, лучше не связываться.

Так ведь на пленке 24 fps, а их надо перевести в 25 fps. Тоже приходится извращаться с ускорением звуковой дорожки, например.

Меньшее из зол. Зато вертикальное разрешение у PAL больше.

Это да, но хорошо, если оно изначально с пленки туда попало, а не было получено из NTSC.

!за исключением случаев нативных трансферов с пленки в этот формат !

НЛО прилетело и опубликовало эту надпись здесь

Добавлю ещё 5 копеек. Про дублирование полей для 24->NTSC уже сказали, это называется телекино. Есть неплохая статья в английской википедии - https://en.wikipedia.org/wiki/Telecine

Вообще, для DVD в стандарте есть механизм для так называемого софтового телекино - вы записываете обычный прогрессивный поток, но для некоторых кадров ставите флаги типа "вот тут нижнее/верхнее поле повтори 2 раза", и при воспроизведении проигрыватель сам превращает 24fps в 30. При этом, соответственно, пропустив этот шаг с дублированием можно вытащить хорошее прогрессивное видео.

Дальше могу только про аниме сказать, поскольку западные мультфильмы никогда не трогал. Так вот, в аниме софтовое телекино используется крайне редко, потому что как правило перевод в NTSC не является последним этапом производства - как правило отдельные сцены переводят в 30fps с помощью телекино, и уже потом происходит монтаж и иногда накладывание каких-то дополнительных эффектов (типа титров). Это приводит к куче проблем, начиная от того что в разных сценах разные паттерны телекино (поскольку сцены далеко не всегда кратны 5 кадрам), и у вас сцена может начинаться или заканчиваться в середине последовательности. Fade-in/fade-out (затемнение сцены до черного/белого) часто делаются чисто интерлейсно, это не так страшно, но можно увидеть что при этом полосы на картинке. Самое худшее - это вертикально ползущие по экрану титры, которые в 95% случаев накладываются в 60i (чисто интерлейсно), и там сочетание интерлейсности, артефактов кодирования и низкого разрешения двд превращает их в нечитаемую кашу. Особенно если они на фоне двигающейся картинки в телекино, тогда вообще вы остаётесь либо со статтером в титрах (если переводите в 24fps), либо в картинке за ними (если оставляете 30fps).

Но даже все эти проблемы меркнут перед тем, что было в более старых DVD (первая половина 90ых и раньше) - тогда как правило телекино делалось с плёнки аналогово с помощью специальных устройств при сканировании, что приносило пачку плохо решаемых проблем - тут и гостинг, который описан в статье, и цветные линии (но это вообще от аналогового тракта, помехи люмы (яркостной компоненты сигнала) на хрому (цветносную компоненту)), и dot crawl (тоже аналоговый тракт). Это всё очень сложно для исправления, и по этим причинам если потеряны плёнки для аниме этого времени (и в оставшихся исходниках либо бетакам с двд-материалом, либо вообще только двд/лд), то в хорошем качестве нам эти видео уже никогда не увидеть.

Спасибо, Вы мне многое напомнили из того, что я лет 20 назад читал в форуме "Цифровое видео" на ixbt, а кое-каких подробностей я не знал, либо уже не помню.

Для противопоставления Топаза и Чейннера надо еще сказать, который из них требует б-гомерзкий AVX2, который теперь стали пихать повсюду, из-за чего нейросетевые приложения, которые по своей идее завязаны на видеокарту, могут стать недоступными вам из-за процессора, как у меня и случилось с очередным обновлением топаза и Backyard.AI.

Очень неприятная штука, надеюсь в чейнере её нет.

А кто мешает для подобных применений выбирать процессоры с AVX2? Эти инструкции по слухам, очень хорошо работают с нейросетевыми штуками, я подробностей не помню, то ли перемножение матриц, то ли работа с памятью...

Ну да, раньше все работало и без них. Однако сильно медленнее.

Автор, безусловно, молодец, но как мне кажется, есть два момента:

  • Зачем вообще править эти артефакты? Их наличие придает видеоряду, наоборот, свой шарм. И смотреть на них имхо приятнее, чем на мыльные артефакты сеток;

  • Это не панацея, но можно предложить такой лайфхак. Это сугубо субъективно, но например на FHD проекторе артефакты анимации выглядят сильно лучше, чем на качественной OLED или IPS матрице (на монике или телеке). То есть проектор как бы "размазывает" немного и норм. На HD проекторе просто сама картинка плохая, видно "пиксели". А на 4K проектор я не раскошеливался, уж очень дорого (и бессмысленно, имхо);

Заставим физику работать на нас =)

Вопрос технический - чем лучше захватывать "аналоговые видеозаписи" с видеомагнитофона ? Например Pinnacle плата PCI, или mini-Dv-видеокамера со сквозным входом (тогда только PAL-видеозаписи) ? Важно ли формат "сжатия" исходника или без "сжатия" лучше ? Вы что используете, чем оцифровываете, если можно поинтересоваться ?

Лучше 9 или 10-бит ТВ тюнер. PCI или USB. Например недавно видел на авито продавали 10-битный USB ТВ тюнер GOTV без пульта за 1000 руб. Идеал 20-летней давности. Найдете 9-битные PCI SAA7134 GOTV или Behold - тоже очень хорошо.

Можно немножко подушнить? По моему не совсем правильно говорить что "топаз не умеет". Если написать "я не придумал как это сделать в топазе", то так будет намного честнее :) На самом деле топаз замечательно справляется и с ореолами и со всем остальным, но это сделать чуть сложнее чем просто перетащить видео в окно топаза - исходник нужно предварительно как минимум ресайзить с уменьшением и очень кропотливо подбирать степень уменьшения, а по хорошему прогонять через avisynth QTGMC с не менее тщательным подбором параметров. Если вам было лень заниматься этими плясками и тратить тонну времени на подбор параметров, то так и скажите.

Вопрос к автору стать и к любому посвященному =)

Какой наилучший сейчас апскейлер, для 3d фильмов? (читай стереопар)

Существуют ли которые сразу умеют напряммую работать скодеком MVC? Умеют ли на выходе давать 4к и менять выходной формат стерепары? (например в черезстрочный или свеху снизу)

Upd. дополню и сразу вопрос пока вспомнил!

Совместить стерео фильм с 4к фильмом?

вопрос скорее опятьже к тому умеют ли сетки брать готовый 4k фильм и уже на основе него работать?

Честно говоря, я подобными проектами не занимался, хотя в одной из статей у меня человек о чем-то подобном писал @ED-209

Из реайлтайм апскейлеров для 3D фильмов (да и не только, повсеместно) использую известный видеорендер MadVR. Вплоть до разгона Full SBS 1080p видео почти до 8К (в режиме супер-семплинга, до 7680x2160). На лету умеет переворачивать Blu-Ray 3D iso в Side-by-Side или Top-Bottom. И куча еще полезных настроек: chroma upscale (выправляет цветопередачу), убирает шумы в видео, сглаживает градиенты, NGU Sharp и прочее.

Также и на видеокартах серии RTX есть встроенный апскейлер RTX Video Super Resolution в настройках панели Nvidia, пункт видеоизображение.

Плоские обычные фильмы 2D можно нейронками конвертировать в 3D (в т.ч. разные форматы) через:

а) Owl3D - френдли юзер интерфейс, но платная.

б) IW3 - бесплатная, но немного замороченная в настройках.

https://github.com/nagadomi/nunif/blob/master/iw3/README.md

https://forum.ixbt.com/topic.cgi?id=25:23747:2582#2582

Плюсанул конечно!

Но вопрос. madVR же это просто рендер. Он не апскейлит нейронками (а в этом ведь главная суть вопроса). Его плюс только в быстроте. Или я что-то не так понял?

RTX к сожалению на моей 1080 не доступен. И в очередной раз лучи ненависти в сторону зеленых карт. в то время как AMD сделала целочисленное масштабирование для своих карт включая старые, "куртка" опять все зажал. И переименовал для появления новых "фич". Батхерт.

В MadVR также используются умные AI апскейлеры видео, разработанные непосредственно автором видеорендера (madshi). Внутри видеорендера в меню еще куча галочек и выбора настроек. В принципе, сам MadVR изначально заточен под оптимизацию качества просмотра видеоконтента комплексно. Помимо апскейла еще много чего полезного применяется к улучшению качества видео.

https://habr.com/ru/articles/709110/

Нейронками апскейлить в real-time жестко. Оно все жрёт CUDA, тензорные ядра. Для сравнения, у меня на RTX 4060 просто конвертация фильма 2д в 3д занимает порядка 15-20 часов. Оффлайн конвертация. В это время загрузка CUDA составляет 90%.

Пример вот, ниже. Реалтайм апскейлер аниме на базе нейронок. Минимум RTX 3060, а хорошо бы RTX 4090. Мультфильмы смотреть :)

https://github.com/the-database/mpv-upscale-2x_animejanai

MadVR и вашей GTX 1080 тоже даст жару, не думайте)) Аналогично, весь банкет за счет GPU.

Фундаментальная разница между шейдерами, фильтрами, видео AI апскейлерами - грубо говоря, пусть количество пикселей в изображении станет в два раза больше. Что при этом за контент внутри видео - не имеет значения.

А апскейл через нейронки имеет значение только и только контент внутри видео - прокручивается многомиллионный датасет подобных схожих изображений (нейронка обучилась на них и запомнила) и на основе их сравнивается, достраивается, каждый кадр искусственно генерируется и рисуется изображение. Чем больше был изначальный датасет, тем умнее, тем точнее результат.

Нейронакми апскейлить в real-time жестко.

Поэтому изначально и был вопрос про оффлайн конечно. хоть 3 дня. а там првоерить и сравнить. Особенно было бы интересно именно скормить 4к фильм и уже на его основе выдать 4к стеропару. А уж после сравнения понять стоит ли овфичнка выделки. или достаточно реалтайм рендера.

Так я же писал выше, есть бесплатный AI Converter 2D to 3D на базе нейронок (Depth Anything). Как раз им и конвертирую 4К UHD в Full SBS. На выходе получается стереопара 7680x2160. Сконвертировал так Чужой: Ромул (4К UHD 8bit SDR) в 3D, посмотрел, очень и очень круто.

https://forum.ixbt.com/topic.cgi?id=25:23747:2535#2535 - тут предыстория, первые пробники правда кривые немного получились. Пока вникнешь, пока разберешься. Потом уже докрутил, подобрал конфигурацию до отличной хорошей конвертации. Там ниже все подробно писал.

В том числе немного расписал настройки программы

https://forum.ixbt.com/topic.cgi?id=25:23747:2582#2582

тут все понятно(вроде) кроме пункта 2в в 3д. - а зачем собственно конвертировать 2в в 3д кодга уже готовые стереопары существуют и их нужно просто увеличить? суть именно в том чтобе конвертеру скормить 1. исходную стерепару. 2. 4к версию фильма. и пусть она за счет нее обучится и увеличит то что нужно. Имхо беспроигрышный вариант. =)

з.ы. а чем вы в итоге 8к видео воспроизводили? телек вроде не сумеет такое потянуть. почитаю тему. =) но если вдруг что-то подобное появится дайте знать плз.

А где вы видели готовые стереопары новинки фильмов? Вот, например, хочу буквально недавно вышедшний "Тогда. Сейчас. Потом" (2024) с Томом Хэнксом в 3D (Full SBS) на русском дубляже.

Фильмы смотрю на FHD шлемах либо Goovis Pro, либо Luci Immers. В разрешении дисплеев SBS 3840x1080 (1920x1080 + 1920x1080, два микро-олед дисплея стоят). Это специальные 3д очки для просмотра видео, не VR. Как второй монитор работают на уровне hardware. Можно также поставить физическое аппаратное разрешение 7580x2060@24Гц (почти 7680x2160). На самом деле это не совсем 8К разрешение, честное 8К UHD было бы при 7680x4320. Но в контексте Full SBS 4K 3D 7680x2160 получается ровные 4К на глаз. 3840x2160 L + 3840x2160 R

Из-за того, что в очках очень большой зум микро-олед дисплеев (FOV от 52 до 70), визуальный экран размером варьируется от субъективного размера кинотеатра до полноценных масштабов IMAX.

Несмотря на то, что сами очки Full HD 1920x1080 (умеют аппаратно в Full SBS 3840x1080, становятся ultra-wide), обычное 1080p видео или Full SBS 3D 1080p смотрится так себе, видно все артефакты пережатых BDRip. Переходы градиенты, шумы, color banding. Либо докручивать картинку с помощью MadVR, либо не заморачиваться и смотреть 4К UHD. Образно говоря, если на обычном Full HD мониторе разницу между 1080p и 2160p не видно, то при таком же экране визуально размером уже с трехэтажный дом - очень даже все видно, разницу в качестве.

Поэтому, по возможности, стараюсь смотреть 4К UHD. Также и сконвертированные в Full SBS получаются без какой-либ потери качества. 7680x2160 = 3840x2160 + 3840x2160 на каждый глаз. Что обычное плоское 4К UHD, что сконвертированное в 7680x2160 - тоже самое сохраняется четкое крутое изображение, только уже все в 3D.

Воспроизвожу с ноутбука, RTX 4060. Очки подключены либо через HDMI, либо через USB Type-C (Thunderbolt 3).

То что мертво - умереть не может =) Если фильма в 3д не выходило то и разговра нет. Другое дело что есть фильмы и 3д и в 4к. но отдельно. И вот бы это объединить. - скормить нейронке (пусть даже "пустой" чтобы для ее обучения использовался как раз контент этого самого фильма в 4к =)

Я кстати вижу что вы реально этим все пользуетесь и увлекаетесь. тему бегло почитал на хоботе.

Скажите вы пробовали сранивать такие варианты.

  1. BD3d (ну или читай полноценную стерепару)

  2. Конвертированное 2д в 3д - FULLHD

  3. Конвертированное 2д в 3д -4к

  4. Ну и ради интереса.... настоящее bd3d (полную стереопару) в 4k

В каком случае на ваш взгляд результат лучше? Тут конечно больше любопытно лучше ли результат нейронки по сравнению с авторским мастерингом.

Опятьже пробовали ли вы смотреть только в очках или и на других устройствах тоже? (тв\проекторы) на них тоже улучшения заметны?

В двух словах тут и не расскажешь, придется подробно. Если лень читать, промотайте вниз, жирным выделил Сравнение 3D.

Рассматривая исключительно с точки зрения аутентичного просмотра, то эталонное воспроизведение 3D это:

Воспроизведение Blu-Ray 3D в режиме Frame Packed на соответствующем блю-рей проигрывателе и дисплее, который поддерживает частоту обновления экрана 23.987Гц. В таком случае получаете каноничный эталонный просмотр в режиме 3D 1080p. Называется 24p True Cinema. Частота экрана 23.987Гц полностью совпадает с количеством кадров в видео 23.987 кд/с. Эдакий аппаратный v-sync, ни разрывов изображения, ни задержек, ничего нет. Стык в стык. Вот как было задумано изначально 3D технологией самой, именно оно.

Но. Всю малину подпортили, почему 3D и умерло в массы толком не пошло, несовершенство технологий комплектные 3д-очки. Активные 3D очки (120Гц ТВ, по 60Гц затворные жк-очки) многие чувствовали и ощущали присущее мерцание и начинала болеть голова, дискомфорт. А пассивные же 3д-очки на Full HD панелях (а других тогда особо и не было) резали разрешение вдвое, вместо 3D 1080p получался Half-SBS.

В итоге, что так, что эдак - так себе развлечение, больше разочарование.

У меня самого 3D телевизора не было, так получилось, что сразу подсел на серию шлемов Sony HMZ (о чем будет ниже), но неожиданно пришлось столкнуться, собирал Triple 40" 3D панели для гоночных автосимуляторов. Это когда кресло с рулем и впереди три здоровых 3D-телека в метре буквально. Один посередине и два по бокам. NVidia Surround, ультра-вайд разрешение 5760x1080. Вот это запускал в 3D, катался в Asseta Corsa и NFS (с патчами на стереоскопик). Конечно круто, впереди 3д и голову влево-вправо поворачиваешь на другие телеки, 3д также продолжается. Виртуальный трехмерный кокпит автомобиля, трасса и все такое.

Тем не менее, подобные 3д игровые сетапы настолько узкая, специфическая и, в том числе, очень дорогая штука, что для типичного обывателя подобные "ваще бомба все выглядит, действительно обалдеть" практически были не достижимы в повседневной жизни. Обычно был куплен какой-то там 3D TV, первоначальный вау-фактор очень быстро проходит и потом 3D TV используется как.. да просто как ТВ и всё.

Ситуацию кардинально поправил выпущенный в 2011 году 3D-шлем от Sony, серия HMZ. Он был на 2xMicroOled в разрешении 720p. Каждый дисплей по 1280x720, две штуки. Шлем на полном фарше, поддерживал все возможные режимы, тот же Frame Packed, Full SBS и Full Top-Bottom. Помимо, аппаратный декодер звука DTS / Dolby Digital 5.1. Позже даже было беспроводное решение на Wirelles HD, Sony HMZ-T3W. Работал с чем угодно и на чем угодно, вплоть до просмотра Blu-Ray 3D с PlayStation 3 и также и игры: Killzone 3 в 3D, Анчартеды 3D, Моторшторм Апокалипсис в 3D и прочее. Вещь исключительно самобытная и для 2011 года явно опередившая своё время. И вот в нём, несмотря на 720p разрешение, было офигеть как круто смотреть Blu-Ray 3D. Никаких косяков присущим 3д-очкам. Два микро-олед, синхронизированы, частота обновления также поддерживало 24p (23.987Гц), великолепная контрастность, яркость и, естественно, черный цвет полноценно истинно глубокий черный, т.к. OLED.

Опять же, снова но. Во-первых, сей гэджет был прям на языке очень что-то дорого-богато, цены на него были катастрофически-астрономические. Премиум девайс. И второе, так как фактически первенец, дубовая ужасная эргономика. По сути, пластиковая кастрюля на голове. Тут сильно давит, здесь ужасно сжимает. И плюс пластиковые ремешки-затяжки, просто так сходу на голову не наденешь. Нужно долго и упорно подстраивать под себя, подтягивать, подкручивать, примерять. А было как: человек приходит в магазин, в торговый зал, видит демо-юнит Sony HMZ, надевает, смотрит, картинку видит великолепную, а на голове не держалось. Ахал, охал, вздыхал, по итогу смотрел на ценник и шел дальше.

Альтернатива 3D TV была. Корявая, неудобная на голове, но была. С той же точки зрения просмотра 3D и великолепного качества картинки вообще без нареканий, все идеально абсолютно супер.

Вот тут прошу прощения за долгое вступительное интро, дальше ближе к делу. 3D-телеки/проекторы с 3д-очками, как по мне лично, по дефолту отметаются. Даже тогда, в тех годах, было гораздо интереснее, привлекательнее решение для просмотра 3D. Про 3D TV в современных реалиях можно забыть, уже есть решения гораздо интереснее.

В 2016-ом году компания Sony Semiconductor выпустила дисплеи микро-олед Full HD, 1920x1080. Китайцы оперативно подсуетились и на базе этих micro-oled FHD быстро выпустили шлем QMER1. Поправили эргономику, легкий удобный, всего 200 грамм. Потом подтянулись аналогичные Royal Moon тоже на Full HD микро-олед и затем в данную область зашли компания Goovis. В промежутке, кстати, было интересное довольно решение - 3д очки Avegant Glyph. На 720p микро-дисплеях, но из необычных особенностей, лазерная проекция била сразу в глаз отражаясь от зеркала. Прям пучок видео сразу в сетчатку отражался зеркалировался, лазерный микро проектор. Погуглите, интересно, жаль что не стали развивать дальше.

А не стали развивать дальше по очень простой причине. В 2016 годах резко выстрелило VR. Oculus Rift CV1, HTC Vive, народ зашептался, зароптал, буквально год-два и всех ждет Матрица, наконец-то future свершилось наступило (спойлер: как видите, не наступило).

В это же время шла параллельная ветка с великолепными эргономичными Full HD cinema-шлемами с полной поддержкой 3D. Просто о них никто толком не знал, тем более в рунете, т.к. VR целиком и полностью забило весь эфир.

И возвращаясь теперь к сравнению, что где лучше 3D, картина следующая. От меньшего к большему.

Сравнение 3D

1) Blu-Ray 3D 1080p.

С эстетической и аутентичной точки зрения просмотр BD3D идеален, если:

а) Железка (BD плеер или PS3, например) поддерживает аппаратное воспроизведение режима Frame Packed.

б) Дисплей/экран/3DTV поддерживает частоту обновления 23.987Гц

В таком случае частота кадров видео полностью синхронизирована с частотой развертки экрана. Никаких разрывов изображения, задержек, полный абсолютный мэтч, совпадение. Данный режим называется 24p True Cinema. Можно сказать эталон просмотра, воспроизведение Blu-Ray 3D как изначально было задумано данными технологиями, подразумевалось.

2) Next Level 3D 1080p. Тоже самое, только с просмотром с ПК. Можно дополнительно накрутить насыщенность цвета (saturation), подкрутить яркость/контраст, немного чуть облагородить, софтово немного оптимизировать.

3) Advanced next level 3D 1080p. Тоже самое, просмотр с ПК, но используя видеорендер MadVR. Позволяет качественно существенно улучшить 3D изображение, повышает цветопередачу, убирает шумы, улучшает и повышает резкость и четкость изображения. Последнее кардинально влияет на восприятие 3D. Чем меньше "мыла", тем лучше, тем качественнее 3D и восприятие стереоскопического объема, глубины. Плюс, можно сделать более мягкое, плавное изображение используя опцию Smooth Image (вставляет промежуточные кадры, микро-уплавнялка).

4) Expert next level 3D 1080p -> 3D 1440p -> 3D 2160p.

Тоже самое как и выше, но допом MadVR еще и апскейлит. Например, включаете в настройках видеокарты режим super-sampling, внутреннее разрешение повышается до 4К (3840x2160). В таком случае MadVR апскейлит изображение до разрешения экрана, до 4К (3840x2160). И ощутимо лучше выглядит, чем просто просмотр 3D 1080p. Аналогия тут примерно следующая: вот есть у вас условно монитор 1440p и размером диагональ 32" дюйма. В 2560x1440 игры все выглядит великолепно. Но при таком большом размере дисплея, если сделаете еще внутри супер-семплинг до 4К (3840x2160), будет выглядеть еще четче и лучше. Тоже самое и с видео, чем больше размер экрана, тем больше видишь разницу в изображении. Ну как в интернете пишут, чтобы 8К полностью понять увидеть, нужна TV панель от 100" дюймов. А на обычных типовых 40" что 4К, что 8К разница абсолютно не заметна.

5) Ultra Next level 4K UHD 3D. Вот тут как раз в дело вступают нейронки. В идеальном конверте 4К 2D в 4K 3D все выглядит гораздо поразительнее и сильно эффектнее, чем обычный просмотр 3D 1080p. Но косяк в иногда артефактах, бьются плоскости, расслоение, изредка возникает ореол вокруг объектов. Если отбросить редкие артефакты изображения, то выглядит фантастически. Глубина и четкость изображения неимоверные, аж не верится, будто в натуральный портал какой-то смотришь вживую. Это в сценах где нет никаких коллизий и артефактов. Опять же, текущая нейронка конвертирует с точностью примерно 75% от настоящего. снятого вживую на стерео-камеры Blu-Ray 3D. В ближайшее время должна выйти новая, более продвинутая нейронка с точностью стерео-изображения 97.5%, тут уже вопросов никаких не будет.

Итого, коротко:

Скажите вы пробовали сранивать такие варианты.

  1. BD3d (ну или читай полноценную стерепару)

  2. Конвертированное 2д в 3д - FULLHD

  3. Конвертированное 2д в 3д -4к

  4. Ну и ради интереса.... настоящее bd3d (полную стереопару) в 4k

  1. Хорошо отлично, здорово.

  2. При условии, если MadVR дополнительно апскейлит - сильно гораздо лучше первого голого варианта как есть, разница весьма ощутима. В ином случае, если лоб в лоб 2D 1080p convert to 3D 1080p, по качеству сравнимо с BD3D но еще добавляются глюканы/артефакты видео при конвертации.

  3. Конвертированное 4К в 4К 3D - суммарно еще кардинально круче чем варианты выше, но если закрыть глаза на периодически иногда встречающиеся артефакты изображения.

  4. Если апскейлить BD3D или FHD стереопару в режиме 3D до 4К/8K через MadVR, то качество не сильно хуже конвертов 4К -> 4K 3D. Такая же резкая отличная эффектная стерео-картинка с потрясающей глубиной. С обычным просмотром 3D 1080p вообще не сравнимо, результат с апскейлом 3D до более высоких разрешений на голову выше.

Это все хорошо, когда есть исходник 3D. Стереопара или Blu-Ray 3D, можно накрутить quality апскейлами и доп. опциями до фантастического эффекта.

Но если фильм изначально выходил только в 2D (неважно, Netflix 1080p или просто 4K UHD), то кроме как конвертировать его через нейронки, других вариантов нет. А конвертируется в 3D вполне себе годно, смотрибельно и хорошо.

Ну чтоже. плюсик за ответ. И поставил бы плюсик в карму за такой развернутый ответ. но у вас и так максимум и уже не ставится =)

Обязательно продублируйте свой коммент на IXBT.

Однако позволю себе пару дополнений. Просто чтобы развеять некоторые заблуждения которые ходят годами и повторяются из уст в уста...

FramePacket - режим это зло, еще и недоделанное. Он ничем не лучше простой ПОЛНОЦЕННОЙ стереопары.

24 кадра в FP это не тру. это просто издержки низкой полосы пропускания и тем что помещается в HDMI 1.4. Для фильмов подходит а вот для игр...так и не доделали с приходом HDMI 2 и не сделали поддержки 60 кадров.. Тут либо 720 при 60 кадрах либо 24 при Full HD. и выводит он как раз разрешение 2200 на что-то там. только телек обрабатывает его и рисует уже чересттрочно или покадрово.

BD3d - это тоже полноценная стереопара. Но только на этапе кодека. Закодирована проприетарным кодеком MVC (подвид AVC) за счет чего опятьже требуется меньше места для хранения.

В раскодированном виде BD3d будет полноценной стереопарой. например 1920x2160 или 3840x1080 что как раз равно двум фулл ХД мониторм стоящим горизонтально или вертикально. И вот минус этого режима только в том что не каждый телевизор способен такое воспроизвести. для HMZ-T как раз не проблема (тогда еще в довоенные времена смотрел и слюни пускал на этот шлем,. не купил. имхо дорого и тогда и сейчас подобное. Аппл вижн даже вообще вспоминать не буду.)

Для 4к устройство такое разрешение не является проблемой. Ролики можно смотреть даже с флешки. Для устройств не 4к тоже есть чит код - Также стереопара но только с чередующимися кадрами т.е. в 48 кадров. (опятьже все зависит от того может обработать выводящее устройство или нет. )

поддержка 24 желательна но не обязательна.. Ибо если смотреть с компа можно видео и разогнать до 48-72 кадров, просто повторив каждый 3 раза. не обязательно дорисовывать кадры если не нравится режим мыльной оперы.

Простите увлекся. просто хотел сказать что BD3d и Fp - НЕ равно лучший вариант качества 3д!!!! Оно просто иногда удобнее. (оно и понятно...индустрия и затачивала на БД плеер,диски,тв...) но саму суть многие не понимают. А для игр поодходит только в 720p что иногда уже плохо смотрится в не родном разрешении.

Я даже когда то начал писать статью про форматы на хоботе. бросил...уже даже тогда было не актуально ввиду умирания....)

Абсолютно правы целиком и полностью. Я даже на ixbt в той самой ветке увещеваю единомышленников перебираться с Frame Packed на стереопары Full SBS (3840x1080). Даже при просмотре BD3D через MadVR, он на лету разворачивает BD3D в Full SBS, активируются супер-плюшки и доп. бонусы значительно влияющие на качество видео, 3D.

C играми предстоит отдельно разбираться, все руки никак не дойдут. Есть 3D Fix Manager, который позволяет фиксами на стереоскопик запускать игры в Full SBS. Но тут нужен полноценный 3840x1080@60Гц и HDMI 2.0 как минимум, без оного с обеих сторон (дисплей + video output) нечего даже соваться..

Оригинальное разрешение полного кадра Blu-Ray 3D, чуть-чуть вас немного скорректирую дополню, составляет 1920x2205. Полные кадры самого видео изображения 1920x2160, но еще существует врезанная между ними техническая черная полоска высотой в 45px (2160 + 45 = 2205). По этой технической полоске BD проигрыватели определяют, что используется режим Frame Packed, #flag.

Касательно скормить некую стереопару нейронкам, натравить на аналогичный 4К и получить "умный" конверт 2D в 3D - все уже придумано ранее, готово и настроено. Остается просто нажать кнопочку Convert и ждать результата.

Нужные нам модели нейросетей, которые конвертируют 2D в 3D, они уже ранее обучены, смоделированы. Не на фильмах, а в целом как из моно-изображения (monocular) получить глубину. Там основной принцип построен на яркости объекта, чем он светлее, считается дальше, чем темнее, считается ближе.

https://depth-anything-v2.github.io/ - картиночки, как работает.

Это универсальная нейронка по построению глубины стереоизображения.

Также есть нейронки, которые обучены чисто на внешнем мире (природа, поля, луга, небо и деревья) и есть нейронки, которые обучены на внутреннем интерьере (помещения, комнаты, залы, мебель, лампы и люстры). И есть нейронки, которые обучены чисто на людях, а другие только на автомобилях или самолетах.

В том и суть, что для нейросетей важен именно контент с чем работать. На что обучены и натравлены. И каждое изображение, каждый кадр, искусственно генерируется на основе своих каких-то данных. С одной стороны вроде как fake 3D, а с другой стороны взять подсунуть плоское фото танка Т-34, а в нейросеть загружено миллион изображений танков Т-34 под абсолютно разными ракурсами абсолютно полностью со всех сторон - ну в итоге нейросеть и скажет: ваша трехмерная модель танка Т-34 будет выглядеть примерно вот так, крути верти в 3д как хочешь. Хотя изначально вводные данные, всего лишь плоская обычная картинка. А взяла и построила 3д модель.

С генерацией 2D to 3D примерно также. Fake 3D, но ввиду огромного скормленного датасета (распознавание глубины в плоском изображении) вроде как геометрически правильное, выверенное, все точно верное.

Ну и есть также проджект, который прям ориентирован на стереоскопик. Нейронка обучалась именно на 3D изображениях.

https://stereocrafter.github.io/

Интересная штука конечно. Лет 10 назад мне кто скажи, что из плоского фильма можно реконструировать полностью в 3D, я бы сказал так не бывает, это физически невозможно.

по поводу 3в fix. Если будуете вникать обращайтесь. во первых должна быть именно нвидиа. во вторых не выше 20 серии. В третьих. SBS возможен только ан DX11 играх. враппер для dx9\10 прикрутили но не знаю стабилен ли для 3д. Опятьже проблемы с масштабированием...как я писал выше Хуанг не сделал челочисленного масштабирования для многих ккарт а это важно порой для апскейла(особенно для пассивного 3d), а библиотеки не всегда справляются. Впрочем если у вас 20 серия то это пока лучший вариант. Да и 3д фикс это просто сборка разных библиотек и патчей. в общем совсем не панацея а скорее костыли =(

Просто хотел уточнить - Вы берете где-то уже готовые записи ? А как быть если нужно перевести VHS в компьютер ?

Либо разбираться и делать самому. Либо найти того кто умеет захватывать видео с VHS, учитывая все нюансы, и у кого еще остался качественный видеомагнитофон (учитывая возраст кассет это самое важное). Как пример - https://forum.ixbt.com/topic.cgi?id=29:37186-20

А, если не секрет, сколько времени занимает у вас обработка мультика минут на 6-7? У меня чейннер сразу выкатывает оценку в 19 часов, потом сокращает часов до 13-15 (это просто вход, один питорчевый обработчик и выход, источник 1920х1080). Это реальные цифры или я не докрутил что-то с аппаратным ускорением?

Всё зависит от ваших аппаратных мощностей, входного разрешения + фпс и того сколько всего вы на обработку накрутили) Цифры в 13-19 часов - вполне реальны в случае с фулхд 60 фпс, но конечно, всё зависит и от всех раннее перечисленных факторов.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий