Search
Write a publication
Pull to refresh
2
0
Андрей Дугин @adugin

Руководитель группы видеоаналитики в MTS AI

Send message

Вопросы, которые Вы написали, в основном имеют отношение к бизнесу и продукту KION, поэтому с моей стороны, пожалуй, будет некорректно давать ответы за моих коллег. Буду рад ответить на технические вопросы по сути первой части статьи.

Добрый день!

Буду отвечать прежде всего как представитель технической команды, а не бизнеса.

Не дешевле ли посадить низкоквалифицированного специалиста

Нет, по многим причинам. Сервис для удалёнщиков сложен в реализации уже потому, что придётся как-то передавать им исходники фильмов (юридический вопрос), либо писать/адаптировать веб-инструмент (систему разметки видео), что тоже затратно и будет работать довольно медленно (хотя бы из-за размера файла - десятки гигабайт). Кроме того, низкоквалифицированный специалист должен хорошо разбираться в критериях качества изображений и иметь инструменты их численного измерения - например, резкости, композиции, фотографического качества и т.п. Наши алгоритмы использует эти метрики и, разумеется, работают гораздо быстрее человека.

Мне кажется у вас в сутки добавляется меньше сериалов чем способен один человек разобрать за рабочий день

Наш пайплайн обрабатывает не только вновь добавляемые сериалы, но и те, что уже есть в базе, и есть очерёдность по приоритетам. Самые актуальные и просматриваемые сериалы обрабатываются первыми. Так что объёмы весьма велики.

Лично для меня использование разных постеров, не таких как у всех - только раздражающий фактор

Баннерная слепота - это доказанный в индустрии эффект, и борьба с ним достоверно повышает метрики просмотров. Да, всё верно - люди могут "не видеть" фильмы. Они смотрят другие фильмы, листают ленты на витрине и привыкают к одним и тем же постерам. Часть постеров могут сначала не вызывать интерес, но привлечь внимание после их смены. Отдельных пользователей, возможно, это может раздражать, но большинство вполне лояльны.

Что касается истории просмотров, этот функционал есть в каждом онлайн-кинотеатре, можно поискать просмотренные фильмы в соответствующем разделе.

А в таком контексте вообще непонятно причем тут баннерная слепота?

Во второй части статьи станет понятнее, объясню немного забегая наперёд.

Есть постеры сериалов - это картинки, иллюстрирующие серии. Именно про них основная статья. Здесь мы используем двухступенчатый пайплайн. Первая ступень алгоритма (KION Tools) формирует короткий lossless-видеоролик из 150 кадров-кандидатов, а вторая ступень (legacy-код) выбирает единственный лучший кадр.

Ещё есть постеры (обложки, афиши) фильмов (их вы видите на витрине) - именно к ним применим эффект баннерной слепоты. Поэтому дизайнеры KION могут вручную нарисовать дополнительные альтернативные постеры. Здесь используется одноступенчатый пайплайн (только KION Tools), а на выходе 150 лучших кадров упаковываются в ZIP-архив и отправляются к дизайнерам в качестве исходных материалов.

то есть вы еще и спойлеры генерируете

В редчайших случаях действительно может получиться спойлер, но вряд ли это является существенной проблемой. Один кадр из порядка 150 тысяч вряд ли станет таковым. Постеры серий небольшие - их обычно сильно не разглядывают. Пользователи смотрят сериалы по несколько серий подряд (используя автоматический пропуск заставок и титров). Приложение кинотеатра позволяет продолжить просмотр сериала с места остановки. Ну и, наконец, перед публикацией сериала всё просматривает выпускающий модератор/редактор и может по своему усмотрению заменить какие-то изображения.

Безусловно, проблематика спойлеров в наших внутренних обсуждениях поднималась. У нас пока нет соответствующих инструментов, но есть некоторые идеи - например, распознавать и анализировать речь (это мы хорошо умеем), тем самым описывая происходящее текстом и затем определять наиболее важные и драматичные эпизоды с помощью GPT-подобных LLM. Можно анализировать кадры-кандидаты с помощью мультимодальных LLM-моделей и описывать происходящее на них, затем фильтруя по каким-то критериям и отбрасывая слишком драматичные кадры.

Но как я уже сказал, вероятность возникновения спойлера стремится к нулю, и с точки зрения бизнеса пока нет смысла тратить на это усилия команды. Есть масса более важных задач.

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity