S3D: No pain IS gain
Сегодня речь пойдет о проблеме, которая почему-то очень редко упоминается, но при этом регулярно встречается в фильмах — примерно в 10 раз чаще перепутанных ракурсов — сдвиге во времени между ракурсами. Искать эту проблему — весьма нетривиальная задача с точки зрения компьютерного зрения. Однако в итоге нами был создан алгоритм, который позволяет обнаружить сдвиг с точностью до 0,1 кадра. В результате было найдено более 500 проблемных сцен в 27 фильмах из 105 проанализированных. Самые большие сдвиги — на 1–2 кадра, наименьшие — на 0,1 кадра. Интересно, что сдвиг во времени — один из самых болезненных артефактов после перепутанных ракурсов. Почему такое происходит, как выглядит, сильно ли заметно и можно ли исправить, будет рассказано дальше.
Откуда в стерео берется сдвиг во времени
В свое время, когда стереограферы жаловались вашему покорному слуге на сдвиг во времени и предлагали заняться разработкой методов автоматического обнаружения проблемы, делать это очень не хотелось. Казалось — ну пройдет год-другой, будут решены детские проблемы синхронизации и о “рассинхроне” можно будет забыть как о страшном сне. Тем более, что алгоритмически его обнаружение — очень нетривиальная задача. Однако годы шли, а проблема оставалась.
Причем рассинхронизация ракурсов встречается у документалистов, очень часто снимающих на дешевые стереориги, что в общем-то ожидаемо. Интерфейсы синхронизации технических параметров съемки в стерео имеют только достаточно дорогие камеры. Но когда на CG-Event рассказывали, что при съемке “Сталинграда” на дорогие арендованные у крупной голливудской студии профессиональные стереориги данные о времени в метаданных кадров различались на 4 кадра, и выравнивание делали вручную по “хлопушке”… и на западе это довольно частая ситуация, о чём регулярно упоминают профессионалы. В общем, стало понятно, что проблемой надо заниматься. Если в студиях все еще выравнивают вручную, это значит, что неизбежны ошибки людей, а значит сдвиг во времени между ракурсами будет попадать в фильмы на экраны кинотеатров.
Наверняка кто-то сейчас воскликнет: “Да что они — одновременно запустить камеры не могут? Там же пару проводков спаять!”. Не думайте, что все так просто. Спаять проводки действительно несложно, но вот дальше выясняется, что камера начинает снимать не сразу после того, как ей сигнал подали. Причем эта задержка может меняться по времени. И в 95–99% случаев все происходит одновременно, но иногда одна из камер “задумывается” чуть дольше (плата за “умность” камеры), и ракурсы расходятся по времени.
Документалисты рассказывают про совсем уж феерические ситуации, когда они одновременно покупают две камеры с одинаковыми аккумуляторами, снимают по горам и лесам и в процессе отсмотров снятого материала уже дома обнаруживают, что камеры иногда (видимо, когда один из аккумуляторов садился сильнее) начинают расходиться по частоте кадров (!). То есть прямо во время дубля одна камера убегает вперед по сравнению со второй. В таких случаях в воздухе густо повисает смог из трехбуквенной английской аббревиатуры (“WTF?!?!”), что приблизительно и с потерей смысла переводится: “Как они это сделали?”
Итак! У нас на руках
Раньше для синхронизации звука и видео, а заодно, чтобы подписать дубль, использовали простую хлопушку
Сегодня на съемочной площадке начали использовать хлопушки с электронным таймером:
Изначально хлопушка позволяла синхронизировать звук и видео, также на ней указывается время и прочая информация для идентификации дублей. Современные хлопушки с показом времени позволяют также синхронизировать ракурсы стерео. Слева вообще-то сувенирные часы :), но на них понятно подписано время
Однако внимательный читатель, думаю, уже готовит вопрос: “А что если расхождение не в целый кадр, а в полкадра? Такое возможно?”. Ответ вас не обрадует — такое не только возможно, но и довольно часто встречается.
Пример сдвига во времени стереопары на хлопушке (для удобства хлопушка сдвинута к уровню экрана). Обратите внимание, что фильм — 48 FPS, то есть 48 кадров в секунду, поэтому временной сдвиг в худшем случае при исправлении будет в два раза меньше. Тем не менее, на руке хорошо видно расхождение в движении по вертикали
Ответ на вопрос: полкадра — это много или мало? Хорошо видно, что “старая” хлопушка на 24 кадра не успевает сменить номер кадра за два кадра 48 fps на одном из ракурсов (в нем номер меняется каждые два кадра)… Мда, для 48 fps пора выпускать новые хлопушки!
Собственно, расхождение ровно в кадр или два кадра хорошо тем, что оно очень просто исправляется. Для непрофессионалов это может прозвучать странно, но разница в одну десятую кадра также исправляется относительно легко. И как раз разница в полкадра исправляется сложнее всего. Впрочем, про исправление — позднее. Запомним только, что если проблему вовремя поймали, оно возможно.
Естественно возникает вопрос: а насколько вообще заметно расхождение во времени? Интуитивно понятно, что при расхождении во времени на любом вертикальном движении мы будем видеть “невозможную” картинку. Но насколько это дискомфортно? Может быть мозг, как любят говорить некоторые практики, “легко это компенсирует”? Ровно в эти недели, когда пишется эта серия статей, нами готовится один из весьма интересных экспериментов — сравнение уровня дискомфорта от отдельных измеряемых нами артефактов стерео:
Один из тестовых прогонов. Человек готовится к тому, чтобы в течение часа смотреть специальный фильм, в котором собраны сцены с разным уровнем разных артефактов. На голове у него — электроэнцефалограф, на заднем плане
Важный момент для понимания важности временных сдвигов: после первого прогона эксперимента нам пришлось переделывать тестовые последовательности, так как временные сдвиги, выбранные на уровне худших примеров из реальных фильмов, оказались намного дискомфортнее для зрителя, чем другие артефакты (!). Отдельно следует в очередной раз отметить мужество, с которым студенты МГУ идут на просмотр. Вот описание эксперимента от человека с фотографии выше, на следующий день: “Ощущения в ходе эксперимента были ожидаемы: сухость в глазах, частое моргание, кратковременная головная боль в лобной части головы, сильная усталость (которая осталась на весь день). Но я знал на что шел :)”
Эти эксперименты будут аккуратным и четким ответом людям, которые тренируют свое бинокулярное зрение на собственном плохом стерео, а потом действуют по принципу из второго моего любимого комментария: “если Вы сами пробовали снимать и монтировать стерео кино или хотя бы стерео картинки, то легко заметили бы, что небольшие огрехи вроде разных углов поворота в районе 2–3 градусов, смещения центра или размытость одного из изображений легко компенсируется нашим мозгом”. Проводя эксперименты мы видим, что если человек не привык смотреть плохое стерео, то огрехи в часовом фильме приводят к кратковременной головной боли в лобной части головы, а если их много — сильной усталости на весь день. Собственно это ровно то, что можно часто наблюдать в отзывах людей, разочаровавшихся в 3D. С той разницей, что у нас все отзывы четко зафиксированны, более того — проведен мониторинг всего показа с каждым морганием (регистрируемыми айтрекером и ЭЭГ), измерением усталости с помощью ЭЭГ и регулярными опросами испытуемых.
Итак! По данным опросов, которые мы получили из нашего часового фильма еще до экспериментов на большом количестве людей — сдвиг по времени лидирует по дискомфорту среди всех видов артефактов. При этом, он практически не распознается “на глаз” (дискомфорт есть, но непонятно, из-за чего он), и о нем почти никогда не упоминают в статьях про дискомфорт в стерео.
В общем, мы работаем над тем, чтобы наши респонденты страдали не зря и общее количество дискомфорта от 3D фильмов уменьшалось. Эти работы публикуются на английском и, как минимум, западные стереограферы с большим интересом и весьма положительно реагируют на наши новые результаты.
Говоря про сдвиг во времени, отдельно стоит сказать про активные очки. В первой части уже упоминалось замечательное исследование японцев, измеривших усталость при использовании активных очков на 500 добровольцах (T. Morita and H. Ando, “Effects of Viewing Conditions on Fatigue Caused by Watching 3DTV”, Proc. SMPTE 2012 Annual Technical Conference & Exhibition, October 1 2012, vol. 2012, no. 10 1-9, doi: 10.5594/M001472.). Их вердикт звучит практически как приговор: усталость от использования активных очков крайне велика и превышает усталость от артефактов стерео. Одна из проблем обычных активных очков (на 60 Гц) заключается в том, что вы по определению получаете сдвиг на полкадра во времени, который практически не виден на глаз, но дискомфортен. При этом большим плюсом активных очков называют полное разрешение, поскольку пассивные очки часто показывают половину строк в одном ракурсе, а половину — в другом. И это действительно так для многих 3D-телевизоров.
Но, во-первых, для кино это неверно, во-вторых, это неверно для новых 4K-телевизоров. То есть с их распространением, которое сейчас идет весьма активно, проблема будет решена. Поскольку фактически на новых телевизорах проблемы пассивных очков решены, производители активных очков также пытаются уменьшить проблемы своей технологии. В частности, повышается частота экрана вплоть до 200 Гц, в итоге для фильма на 25 FPS один кадр показывается в течении 4-х попеременных открываний очков. Этот прием позволяет практически полностью убрать сдвиг во времени, но если не применяется технология увеличения частоты кадров, то возникает заметная неравномерность движения. Особенно она заметна при панорамировании, когда изображение на всем кадре плавно сдвигается в сторону. Скачки при движении также вызывают дискомфорт, хотя и меньший, чем сдвиг во времени.
Тем не менее, активные очки еще долго будут рекламировать, как, например, в статье про новый “элитный” кинозал, открывшийся в декабре 2014 года в гостинице “Москва”. Не очень понятно, из каких соображений они выбрали активную систему от Xpand, но рекламируют ее так: “Следующая «фишка» — активные 3D-очки. Опять же, в современных кинотеатрах в большинстве своем используют пассивные 3D-системы, но теряют в качестве. А на студиях по всему миру применяют только активные очки, так как это лучшая технология для просмотра 3D. Да, при большом обороте зрителей это неудобно, но здесь к зрителю отношение индивидуальное.” Утверждение “в большинстве своем используют пассивные 3D-системы, но теряют в качестве” голословно. Вам предлагается просто поверить, что в чем-то по качеству идет потеря. И в IMAX, например, проектируя дорогие залы с максимальным качеством (и ценой билетов) на основе пассивных очков просто что-то не понимают в этой жизни. А утверждение “А на студиях по всему миру применяют только активные очки” просто неверно.
Автор общался с большим количеством профессионалов по миру и знает, как они в 2010, когда в основном продавались активные системы (просто потому, что их быстрый выпуск наладить было технологически проще всего), наоборот разыскивали и ставили пассивные системы. Чтобы можно было спокойно смотреть 3D часами. А когда автор в 2011 году смотрел стерео в студии таки с активными очками, то там долго извинялись и предупреждали, что поскольку у них активные очки, то они не рекомендуют в течении 40 минут после просмотра садиться за руль. В такие моменты жалеешь, что у нас не США и иски за разбитые машины не мотивируют владельцев залов вникать в технологические тонкости устанавливаемого оборудования, что оборачивается головной болью для зрителей.
Выводы:
- Из-за отсутствия интерфейсов синхронизации недорогие камеры при съемке нередко дают заметное расхождение во времени между ракурсами.
- Расхождение более, чем на кадр, может быть поправлено вручную в любом редакторе и быть сведено к расхождению менее чем на кадр. Но для этого нужен контроль за расхождением во времени.
- Расхождения менее чем на кадр также можно исправлять, и делать это тем легче, чем ближе кадры друг к другу.
- Нами сейчас ведется работа по сравнению и нормировке “болезненности” разных видов артефактов. По предварительным замерам оказалось, что сдвиг во времени оказался лидером по дискомфорту. При этом в статьях про дискомфорт стерео сдвиг во времени практически никогда даже не упоминается.
- Весьма неприятный сдвиг во времени на полкадра появляется при использовании большинства активных очков (на 60 Гц и менее). Ниже можно будет оценить более подробно, много это или мало — полкадра.
Сдвиг во времени при вертикальном движении
Если в сцене было вертикальное движение, то при сдвиге во времени мы получаем “невозможное” изображение, весьма дискомфортное для нашего мозга:
На этой сцене зритель будет четко видеть “невозможное” изображение. Интересно, что хотя фильм 1954 года, проблему можно было легко исправить, так как 0,042s — это как раз сдвиг на 1/24 секунды, то есть на один кадр
Пример заметности сдвига на 0,2 кадра при быстром вертикальном движении, специально для тех, кто считает, что и полкадра — это незаметно )
Лицо является так называемым “регионом интереса”, все будут смотреть на него, поэтому данный сдвиг скорее всего будет заметен, причем понять, почему сцена дискомфортна, весьма сложно
Пример, который будет смотреться несколько сюрреалистично из-за сдвига капель на полкадра во времени
Изредка не минует сия участь и достаточно высокобюджетные фильмы, правда сдвиг в таких фильмах обычно минимален — в данном случае порядка 0,1 кадра, что практически незаметно
Сдвиг на горизонтальном движении
При горизонтальном движении сдвиг во времени будет проявляться в первую очередь как странное “проваливание” или “выпячивание” объекта по глубине. Причем от нас или к нам он будет смещаться в зависимости от того, в какую сторону идет сдвиг во времени. К сожалению, хорошо продемонстрировать этот эффект даже с использованием анимации довольно сложно. Тем не менее, приведем такой пример:
Сдвиг на 0,2 кадра, при котором дельфин на переднем плане заметно визуально сдвинется в направлении к зрителю. Сдвиг можно оценить по пузырькам воздуха, которые остаются сравнительно неподвижны относительно воды. Если в сцене есть вращение или неподвижные объекты, то возможна неприятная ситуация, когда из-за сдвига во времени объект, находящийся за чем-то, будет по стерео выглядеть как находящийся ближе — очередная “невозможная” ситуация для бинокулярного зрения человека.
Сдвиг на вращении
Вращение — это движение, которое не так просто аккуратно исправить. Ниже примеры сдвига во времени на вращении объектов:
Довольно интересный пример, когда очень небольшой сдвиг на 0,1 кадра становится заметным благодаря быстрому движению автомобиля
Заметный сдвиг на полкадра при вращении героя на переднем плане
Пример вращения глаз главного героя известного фильма при небольшом сдвиге во времени )
Сдвиг на тенях и другом движении
Интересный пример, когда сдвиг прежде всего хорошо заметен на довольно контрастной тени, то есть мы увидим невозможную картинку, когда в одном глазу тень будет набегать на человека раньше, чем в другом. Исправлять такие сцены весьма нетривиально из-за полупрозрачности тени
Пример, когда сдвиг на 0,2 кадра будет хорошо виден из-за движения рук и шнурка на шее
Пример сдвига примерно на полкадра, который будет достаточно дискомфортен из-за быстрого движения человека
В этом примере вертикальный сдвиг (также доставляющий дискомфорт) несколько маскирует сдвиг во времени на полкадра, однако если присмотреться к движению лица актера в очках на заднем плане, становится очевидно, что сдвиг во времени есть и довольно заметный (полкадра)
Сдвиг по времени на спецэффектах
Неодинаково наложенные титры — однозначно очень дискомфортный кадр. Несмотря на то, что проблема длится недолго, часть зрителей, наиболее чувствительных к проблемам 3D, в этот момент испытает значительный моментальный дискомфорт
Еще один достаточно болезненный пример, когда на анимации был допущен сдвиг в 2 кадра. Очевидно, что компьютерная графика выровнена по времени идеально, но из-за ошибки монтажа получилась довольно болезненная для восприятия сцена
Показана малая часть найденных сцен. В основном те, что проще всего воспринимаются в анимации и наиболее наглядны. В сценах с медленным движением сдвиг во времени менее заметен, однако именно там нередко возникает ситуация, когда стерео выглядит как-то странно, но даже при покадровом анализе не сразу понятно, что в сцене есть сдвиг. Именно такие сцены могут “странно смотреться”, когда чувствительные люди будут ощущать дискомфорт, но не смогут понять его причину.
Выводы:
- Из найденных 27 фильмов 8 фильмов: “Dark Country”, “The Hole 3D”, “Silent Hill 2”, “Shark Night”, “Bait”, “Piranha 3DD”, “Child’s Eye”, “Piranha” относятся к жанру фильмов ужасов. Их низкое качество во многом связано с тем, что у них, как правило, довольно низкий бюджет. В целом фильмы ужасов в ключе низкого технического качества, как вы заметили, упоминаются достаточно регулярно.
- При быстром вертикальном движении или вращении сдвиг во времени воспринимается как “невозможная” сцена. При горизонтальном движении и сдвиге во времени отдельные объекты сдвигаются вперед или назад в зависимости от направления сдвига и направления движения, что также может вызывать дискомфорт и приводить к “невозможным” сценам.
Статистика по фильмам
Всего при проверке 105 фильмов было найдено 27 фильмов с 515 сценами, содержащими сдвиг во времени (Temporal Shift или TS). В таблице ниже приведена полная статистика по ним:
Movie title | Release date | Budget $M | Duration | Scenes with TS | Max shift | Average shift | Total TS duration | % of movie | Total score |
Creature from the Black Lagoon | 3/5/1954 | $0.00 | 4745 | 218 | 0.042 | 0.008 | 2,056.77 | 43.35% | 17.04 |
The Child's Eye | 10/14/2010 | $4.50 | 5822 | 78 | 0.061 | 0.009 | 510.55 | 8.77% | 3.52 |
3-D Sex and Zen: Extreme Ecstasy | 4/14/2011 | $2.58 | 6775 | 37 | 0.022 | 0.010 | 240.24 | 3.55% | 2.40 |
Dolphins and Whales 3D: Tribes of the Ocean | 6/10/2009 | $6.00 | 2546 | 9 | 0.023 | 0.012 | 153.45 | 6.03% | 1.93 |
Dark Country | 10/9/2009 | $4.00 | 5287 | 12 | 0.086 | 0.037 | 56.89 | 1.08% | 1.62 |
Dial M for Murder | 5/29/1954 | $1.40 | 6315 | 40 | 0.042 | 0.004 | 444.40 | 7.04% | 1.30 |
Spy Kids 3-D: Game Over | 7/25/2003 | $39.00 | 5063 | 4 | 0.083 | 0.034 | 19.23 | 0.38% | 0.61 |
Shark Night 3D | 9/2/2011 | $25.00 | 5419 | 12 | 0.010 | 0.006 | 96.39 | 1.78% | 0.50 |
My Bloody Valentine | 1/16/2009 | $15.00 | 6061 | 16 | 0.008 | 0.005 | 85.79 | 1.42% | 0.47 |
Drive Angry | 2/25/2011 | $50.00 | 6271 | 30 | 0.011 | 0.004 | 99.60 | 1.59% | 0.36 |
Dredd | 9/21/2012 | $50.00 | 5751 | 1 | 0.042 | 0.042 | 8.55 | 0.15% | 0.36 |
Silent Hill: Revelation 3D | 10/26/2012 | $20.00 | 5670 | 4 | 0.014 | 0.006 | 32.74 | 0.58% | 0.35 |
The Hole | 6/11/2010 | $12.00 | 5558 | 7 | 0.007 | 0.004 | 54.47 | 0.98% | 0.21 |
Bait | 9/20/2012 | $28.00 | 5587 | 18 | 0.010 | 0.004 | 53.47 | 0.96% | 0.20 |
The Ultimate Wave Tahiti | 7/5/2010 | $3.00 | 2753 | 1 | 0.042 | 0.042 | 4.50 | 0.16% | 0.19 |
Resident Evil: Afterlife | 9/2/2010 | $60.00 | 5812 | 5 | 0.019 | 0.007 | 12.89 | 0.22% | 0.17 |
Pina | 2/13/2011 | $4.20 | 6236 | 1 | 0.038 | 0.038 | 4.25 | 0.07% | 0.16 |
Journey 2: The Mysterious Island | 2/10/2012 | $79.00 | 5650 | 2 | 0.042 | 0.023 | 12.05 | 0.21% | 0.13 |
Piranha 3D | 8/20/2010 | $24.00 | 5301 | 1 | 0.042 | 0.042 | 2.29 | 0.04% | 0.10 |
Piranha 3DD | 5/11/2012 | $5.00 | 4961 | 6 | 0.013 | 0.009 | 9.63 | 0.19% | 0.09 |
The Legend of Hercules | 1/10/2014 | $70.00 | 5918 | 2 | 0.018 | 0.015 | 5.67 | 0.10% | 0.08 |
Step Up 3D | 8/4/2010 | $30.00 | 6431 | 2 | 0.039 | 0.029 | 2.59 | 0.04% | 0.07 |
Step Up Revolution | 7/26/2012 | $33.00 | 5919 | 2 | 0.023 | 0.014 | 5.09 | 0.09% | 0.05 |
Flying Swords of Dragon Gate | 12/15/2011 | $35.00 | 7339 | 2 | 0.005 | 0.004 | 11.18 | 0.15% | 0.05 |
Pirates of the Caribbean: On Stranger Tides | 5/20/2011 | $250.00 | 8183 | 2 | 0.003 | 0.003 | 16.43 | 0.20% | 0.05 |
Hugo | 11/23/2011 | $170.00 | 7581 | 2 | 0.005 | 0.004 | 8.17 | 0.11% | 0.03 |
A Very Harold & Kumar 3D Christmas | 11/4/2011 | $19.00 | 5379 | 1 | 0.005 | 0.005 | 1.58 | 0.03% | 0.01 |
Таблица отсортирована по сводной величине, пропорциональной размеру сдвига во времени и длительности содержащей его сцены.
Какие можно сделать выводы по таблице:
- Лидирует фильм “Creature from the Black Lagoon” 1954 года, содержащий 218 сцен со сдвигом во времени. Суммарно сцены с заметным сдвигом во времени составляют 43% от длительности этого фильма, что для того времени относительно простительно.
- На втором месте весьма неаккуратный азиатский фильм ужасов “The Child's Eye” с 78 сценами, который, если помните, занимает первое место по длительности сцен с перепутанными ракурсами. В Азии в принципе принят более короткий, чем в Европе цикл подготовки фильмов. По результатам анализа данного фильма создается ощущение, что даже авторы его толком не успели посмотреть.
- На третьем месте азиатский же “3-D Sex and Zen” который, если помните, был на третьем месте в рейтинге фильмов по перепутанным ракурсам.
- Из высокобюджетных фильмов в список попали только “Pirates of the Caribbean...” и “Hugo”, но находятся они в самом конце списка с очень короткими сценами.
- Из 27 фильмов у 10 максимальный сдвиг более, чем на один кадр, что означает, что они содержат сцены, которые можно было легко поправить в любом редакторе, вопрос был только в том, чтобы этот сдвиг заметить, то есть в наличии соответствующего инструментального контроля.
Интересно посмотреть статистику распределения числа сцен с разным сдвигом по времени (в кадрах):
Хорошо видно, что довольно много сцен имеют весьма небольшой сдвиг порядка 0,2 кадра, однако есть пик в районе 1 кадра и в районе 2 кадров. Причем если вычесть 218 сцен фильма “Creature from the Black Lagoon” (на который приходится почти половина сцен), получается такая картина:
Как видно, кардинального изменения характера сдвигов в остальных 26 фильмах не происходит, то есть после 1954 года больших изменений в характере сдвигов не произошло
Также напомню, что самый “неприятный” в плане исправления сдвиг — это сдвиг на полкадра. По гистограмме видно, что таких сдвигов относительно немного. Соответственно, имея средства проверки, относительно легко можно улучшить ситуацию для довольно большого количества сцен.
Тенденции для сдвига во времени
Традиционно посмотрим, как изменяется ситуация по годам:
Источник: этот и следующий графики из отчета по анализу 105 стереоскопических фильмов
Хорошо видно, что если в 50-х года прошлого века, когда все снималось на механические камеры, точно попасть по времени было проблемой и оба проанализированных фильма не очень хороши. Правда если один (“Creature from the Black Lagoon”) ставит абсолютный антирекорд, то второй (“Dial M for Murder”) выглядит весьма неплохо и даже лучше некоторых фильмов 2010–2011 годов. Правда известно, что “Dial M for Murder” исправляли перед записью на Blu-ray. Похоже, что они вручную нашли и поправили почти все сдвиги на кадр и больше. Если так — то хорошая работа!
По бюджету ситуация также весьма ожидаема:
Львиная доля проблем приходится на фильмы с бюджетом менее $500 за минуту фильма. У высокобюджетных фильмов, использующих дорогие качественные камеры, проблем рассинхронизации фактически нет.
Обычно ранее всегда все показывалось относительно “Аватара”. На графиках выше видно, что в данном случае “Аватар” относится к высокобюджетным фильмам, у которых по данному параметру все или идеально или практически идеально.
Исправление сдвига во времени
Уже традиционно приведем примеры исправления проблемы. Про исправление рассинхронизации можно написать отдельную серию статей. В основе исправления — алгоритм сдвига кадра во времени, при этом возникает масса проблем, особенно с полупрозрачными областями. Впрочем, начнем с простых случаев:
Крайне дискомфортная сцена с рендерингом из фильма “Дети Шпионов 3D” — сдвиг на 2 кадра
Как видно, из него довольно легко можно получить совершенно комфортное стерео
Пример явно дискомфортного сдвига на один кадр из азиатского фильма
Исправляется также легко и почти идеально. Видно, что легкий поворот остается из-за нескомпенсированного небольшого сдвига. Также в этом примере поправлены цвета (хорошо видно по дальней руке и полу над столом) и небольшой вертикальный сдвиг (виден по локтю в углу). К сожалению полностью исправить блики в этом случае довольно сложно (почему они появляются и про их исправление см. шестую часть цикла)
Более сложный пример, при котором использовалась компенсация сдвига во времени, то есть сдвиг временного ряда кадров
Исправленный кадр — практически идеален по времени, также исправлен вертикальный сдвиг и заметная разница по цвету
Пример, который будет заведомо дискомфортен, из-за того, что собака поворачивается
В данном примере исправлены сдвиг по времени, геометрические искажения (поворот кадра) и искажения цвета. Для удобства оценки кадр смещен к уровню экрана. Интересно, что после исправления кадр стал практически плоским и только блики выдают съемку в стерео. То есть, используя конвертацию, они могли получить результат намного лучше. В фильмах с большим бюджетом для таких сцен используют бим-сплиттер (см. пятую часть) или конвертацию (будет в девятой части :) Тем не менее дискомфорт серьезно снижен.
Сдвиг на полтора кадра. Также имеет место быть заметная разница по цветам между ракурсами
Специально для тех, кому интересно “заглянуть под капот” — исправление просто сдвигом на один кадр, с правкой цвета и геометрии. Т.е. остался сдвиг на полкадра. Стало существенно лучше (футболка и крыша машины не так сильно меняются по цветам), но еще не идеально (видно вращение сцены, оставшееся от движения камеры). В частности даже на уменьшенном кадре хорошо видно, как меняется по масштабу молодой человек справа. На большом экране кинотеатра это “небольшое изменение” будет “бить по глазам”.
И, наконец, на последнем примере исправлен и сдвиг во времени на полкадра. Хорошо видно, что теперь все трое молодых людей находятся на положенной глубине без искажений из-за движения камеры — молодой человек и девушка — ближе всех, человек справа — подальше. Блики частично остались и мешают, но это уже вопрос к оператору. Сравните этот кадр с оригинальным и почувствуйте разницу.
Понятно, что всегда будут люди, в том числе профессионально выпускающие фильмы, которые сравнят последние примеры и вынесут безапелляционный вердикт — разница слишком мала, чтобы тратить на нее драгоценное время. Причем также понятно, что большинство продюсеров (в том числе русских, к сожалению), имеют очень общее представление о проблемах стерео и, бывает, не только не требуют исправления таких проблем, но еще и выражают конкретное недовольство, когда студии post-production тратят на такое исправление время (увы, мне про такое рассказывали не раз). И также понятно, что если студия никогда не делала таких исправлений — она будет делать их долго и не очень хорошо. Если студия уже делала и какие-то процессы на коленке создали — они сделают все в разы быстрее. И, наконец, если у студии куплен софт и есть люди, которые являются специалистами в этом, они сделают все очень быстро и весьма качественно.
По опыту общения со студиями время на исправление проблем у тех, кто этим раньше не занимался и тех, у кого это налажено, может отличаться на два порядка(!). Как следствие исправление у тех, у кого оно, например, в 200 раз дороже, получается на самом деле драгоценным. То есть они говорят правду, когда высоко оценивают свое время. Именно так на экраны кинотеатров попадают заведомо болезненные сцены, после просмотра которых возникают “сухость в глазах, частое моргание, кратковременная головная боль в лобной части головы, сильная усталость” (см. описание экспериментов выше). К счастью число подготовленных студий растет, качество софта и техпроцессов исправления — также улучшается, улучшается и контроль за исходным и финальным материалов. Именно поэтому качество стерео будет расти. Хотя, надо полагать, не у всех.
В качестве бонуса для дочитавших до этого места. Ниже пара загадок для тех, кто верит написанному на ценниках.
Внимательный читатель наверняка детально изучает технические характеристики разных устройств. В том числе видел ценники, типа этого (фото не новое):
Слева, как можно видеть, черным по белому написано: “Частота обновления: Чем больше Гц (Герц), тем больше кадров в секунду будет отображаться”, а справа красуются гордые “3000 Гц”
Возникает вопрос: в чем проблема подвинуть во времени поток, если даже телевизоры уже умеют показывать 3000 кадров в секунду. Берем такой телевизор и его преобразование 30 кадров в 3000, выбираем нужные кадры и вуаля — получаем сдвиг с точностью до 1/100 кадра! А теперь, внимание, первая загадка: что же на самом деле отображает этот телевизор 3000 раз в секунду? На ценнике указано, что кадры и подразумевается, что чем их больше, тем телевизор явно лучше. Ведь так?
Опять же — даже не самые продвинутые телевизоры сегодня дают 100 Гц, то есть сдвигают на упоминавшийся самый сложный сдвиг — на полкадра. Сдвигают ли они самом деле? Ответы пишите в комментарии!
В качестве подсказки и второй загадки: парой строчек ниже написано, что этот телевизор также умеет автоматически конвертировать 2D в 3D. То есть Джеймс Кэмерон, который заплатил 18 миллионов долларов за конвертацию “Титаника” в 3D мог, как вы уже догадались, просто купить такой телевизор и прогнать фильм через него? Или не мог? Может, модель вышла слишком поздно? Ваши версии в комментариях помогут нам понять ситуацию. Что же на самом деле покупают те, кто верит указанному на ценниках?
Выводы:
- Исправление сдвига во времени еще долго будет весьма нетривиальной задачей из-за сложностей с полупрозрачными областями, заполнением областей открытия и, наконец, с построением аккуратного поля векторов движения. Однако уже сегодняшние результаты позволяют поправить часть сцен весьма неплохо.
- Пожалуй главный результат — создание весьма точной и практичной по скорости метрики измерения сдвига по времени между ракурсами нашей группой, что дает возможность в перспективе полностью исправить даже снятый ранее материал. Мы декларируем, что достигли практического результата первыми. Если найдете что-то подобное точно рабочее — дайте знать.
- Если для фильмов 50-х сдвиг во времени был нормой, для 90-х, 2000-х — регулярно встречался, то в последние пару лет он становится редкостью. При этом все шансы полностью исправить и старые релизы. И это не может не радовать.
Продолжение следует. Stay tuned!
Всем поменьше головной боли вообще и от 3D в частности!
Благодарности
Хотелось бы сердечно поблагодарить:
- моих коллег Владимира Янушковского, проделавшего львиную долю работы, представленной выше, Юрия Гитмана, весьма способствовавшего появлению удачных решений, Сергея Гришина, чей метод интерполяции видео во времени использован для компенсации временного сдвига, а также других членов видеогруппы, благодаря которым представленные выше алгоритмы были созданы, а результаты посчитаны,
- вице-президента по технологиям и Senior Scientist компании RealD Джона Карафина за веру в наши силы и воодушевляющую поддержку,
- компании Intel, Cisco, Verizon и YUVsoft за серьезную поддержку проекта и то, что им не безразлично качество стереофильмов,
- Лабораторию Компьютерной Графики ВМК МГУ им М.В.Ломоносова за вычислительные мощности и не только,
- также автор выражает горячую признательность британскому стереограферу Россу Коплэнду (Ross Copeland) и независимому американскому специалисту Борису Старосте (Boris Starosta) за мотивацию заняться тестированием сдвигов во времени и предоставленные в свое время примеры,
- отдельная благодарность Айдару Хатиулину, который изображен на фото выше с электроэнцефалографом на голове, и который уже трижды принимал участие
в жестоких пытках плохим стереов тестовых прогонах,
- и, наконец, очень благодарим Артема Казакова, Анастасию Анциферову, Владимира Янушковского, Алексея Шалпегина, Виталия Людвиченко, Александра Жиркова, Александра Воронова и Алексея Федорова за большое количество дельных замечаний и правок, сделавших этот текст намного лучше!
Смотрите также:
- Почему от 3D болит голова / Часть 1: Недостатки оборудования
- Почему от 3D болит голова / Часть 2: Дискомфорт из-за качества видео
- Почему от 3D болит голова / Часть 3: Перепутанные ракурсы
- Почему от 3D болит голова / Часть 4: Параллакс
- Почему от 3D болит голова / Часть 5: Геометрические искажения в стерео
- Почему от 3D болит голова / Часть 6: Искажения цвета
- Почему от 3D болит голова / Часть 8: Расфокус и будущее 3D
- Будущее VR видео — VR180 от Google