tyomitch Nov 30 2020 at 23:21

Загадочные субтитры на CNN

3 min

51K

Accessibility * Natural Language Processing * History of ITTypography *

Technotext 2021

+151

102

Comments 102

DrPass Dec 1 2020 at 00:19

Познавательно, но у меня возникает вопрос другого плана: одно дело, если там уличный корреспондент или интервью какое-то. Но диктор же не сочиняет отсебятину, перед ним там экран с видеосуфлёром, по которому он читает. Т.е. все его тексты и так уже оцифрованы и написаны. Зачем в этой схеме нужен стенографист?
И ещё момент вспомнил: я подобный бред в субтитрах видел ещё пару раз, причём оба раза — в сабах к музыкальным клипам на Ютубе. Поэтому подозреваю, что тот «стенографист» — не сотрудник CNN, а какой-то ютубовский робот, который преобразовывает речь в текст.

alchemist666 Dec 1 2020 at 01:33

Думаю такие люди не только для ютуба работают, но и для внутренней кухни, собственные архивы и прыгание между филиалами или ещё как-то так. Особенно если дикторский текст ещё может заранее записан и можно его вставлять, то текст корреспондента в полях явно не пишется, так что поэтому есть такая профессия, которая пока логирует лучше, чем распознающие боты. Даже старые программы аля 70-х годов, сидит человек и расшифровывает интервью, кто чего сказал и на какой секунде. Нужно для будущих поколений и дальнейшего автоматического поиска по тексту.

drWhy Dec 1 2020 at 08:15

И если корреспондент всё-таки готовится к речи, то он периодически берёт интервью у случайных прохожих, которые говорят случайный текст (ведь правда?).

izogfif Dec 1 2020 at 15:22

Вы про прямое включение? Потому что большинство роликов, показываемых в новостях, довольно явно смонтированы (т.е. присутствуют монтажные склейки, в том числе с корреспондентом, читающим текст на камеру) и попадают на студию явно до начала выпуска новостей.

mitasamodel Dec 1 2020 at 11:21

Потому что репутация.
Выпуск новостей — это прямой эфир. Текст должен соответствовать тому, что говорит диктор. Если во время выпуска или прямо перед ним случается «breaking news», то текст всё равно должен соответствовать. А не продолжать транслировать фейковую телеметрию, когда ракетоноситель уже потерян.

Iv38 Dec 1 2020 at 11:37

Да и без брейкинг ньюсов ведущие могут оговориться и исправиться или несколько от текста отойти. Ну и всякие диалоги с кореспондентами живьём могут быть непредсказуемы.

tyomitch Dec 1 2020 at 16:26

Не дальше чем на прошлый День независимости было, что Трамп с телесуфлёра вместо «Our army rammed the ramparts» прочитал «Our army manned the airports», после чего добавил из головы: «it rammed the ramparts, it took over the airports, it did everything it had to do». Тут сразу и очитка, и исправление, и абсурдная отсебятина экспромтом.

mgremlin Dec 1 2020 at 14:22

Потерять ракетоноситель — это сильно.
Про такое не скажешь не только «с… дили», но даже и «про… бал».
Не подскажете, кто это так отличился и когда?

Naves Dec 1 2020 at 15:01

Аварийный пуск «Союз МС-10»
habr.com/en/post/426039

mgremlin Dec 1 2020 at 16:32

Случается такое с ракетами.
Но вот чтоб ракетоноситель потерять — не слыхал такого.

Naves Dec 1 2020 at 16:36

С протоном вроде такая же ситуация была в 2013, когда еще «датчик вверх-ногами заколотили».

TheShock Dec 1 2020 at 17:01

mgremlin говорит, что вы путаете ракету-носитель (Протон и Союз) и ракетоноситель (штука, переносит эту ракету)

muxa_ru Dec 1 2020 at 20:50

Увы, но эта битва проигран и давно.
Не просто давно, а с самого начала она проиграна.

Обзывание ракет-носителей словом "ракетоноситель" началось сразу при появлении слова ракета-носитель. Это зафиксировано в лингвистической литературе советских времён.

Есть примеры использования слова "ракетоноситель" в смысле "ракетоносец", но они погоды не делают :(

anmilez Oct 14 2021 at 17:33

При этом в школах уделяют этому внимание. Я помню как нам вколачивали разницу между ракетой-носителем и ракетоносителем, у меня сразу срабатывает это воспоминание, когда я слышу одно из этих слов. Видимо, впоследствии забывают.

Tomasina Dec 2 2020 at 06:34

продолжать транслировать фейковую телеметрию

Это реально такое было?

tyomitch Dec 2 2020 at 06:49

habr.com/ru/post/426039/#comment_19221105

tyomitch Dec 1 2020 at 16:41

Но диктор же не сочиняет отсебятину, перед ним там экран с видеосуфлёром, по которому он читает. Т.е. все его тексты и так уже оцифрованы и написаны. Зачем в этой схеме нужен стенографист?

Любому СМИ нужны штатные стенографисты для пресс-конференций.
Раз они уже есть, почему ими не воспользоваться и для субтитров?

И ещё момент вспомнил: я подобный бред в субтитрах видел ещё пару раз, причём оба раза — в сабах к музыкальным клипам на Ютубе. Поэтому подозреваю, что тот «стенографист» — не сотрудник CNN, а какой-то ютубовский робот, который преобразовывает речь в текст.

Ютубовский робот, который преобразовывает речь в текст, генерирует что-то такое:

Видите разницу между этим и «STILLEVELOP PLANANDEMIC, ILNG T»?

Murimonai Dec 1 2020 at 05:25

Всегда думал, что ютубовские сабы генерит нейронка. Навеяло некоторой необъяснимой лажей, когда слова произносятся предельно отчетливо, но в сабах совершенно иное, причем не связанное даже с контекстом.

Metotron0 Dec 1 2020 at 08:57

Вроде, тут про видео на ютубе, а в видео нарисованы субтитры, как на картинке.

DrPass Dec 1 2020 at 09:03

Я заходил на видео по ссылке в статье. Эти сабы включаются/выключаются кнопкой «субтитры» в ютубовском плейере. Это не нарисованные субтитры, а наложенные плейером поверх видео.

fireSparrow Dec 1 2020 at 09:05

Не, там в гифке вначале статьи явно видно, как человек через настройки ютуба включает эти сабы.
Но вроде бы на ютубе субтитры могут быть не только сгенерированы самим сервисом, но и загружены руками.

alexxz Dec 1 2020 at 09:24

Так и есть. cloud.google.com/speech-to-text. Её же можно пощупать в действии на видео вызове в Google Meet. Хорошо справляется с английской речью на лету.

Iv38 Dec 1 2020 at 10:37

Автоматические субтитры на Ютубе генерируются распознаванием голоса, да, но автор ведь может загрузить свои сабы. В этом видео нет автоматических сабов, есть две разные версии английских субтитров, обе бракованные.

papazogl0 Dec 1 2020 at 15:26

Субтитры на youtube, насколько мне известно, могут быть как добавлены владельцем видео, так и созданы автоматически — для этого владельцу видео необходимо согласиться на создание авто-субтитров при помощи распознания речи в видео.

mrEDitor Dec 1 2020 at 15:58

Вроде можно прикрепить написанные человеком вручную.

tyomitch Dec 1 2020 at 16:15

Всегда думал, что ютубовские сабы генерит нейронка.

В данном случае — так и было; только нейронка не ютубовская, а CNN-овская, и принимала на входе не звукозапись, а стенограмму.

Навеяло некоторой необъяснимой лажей, когда слова произносятся предельно отчетливо, но в сабах совершенно иное, причем не связанное даже с контекстом.

Сбои ютубовской распознавалки выглядят совсем иначе — например, в результате всегда получаются реально существующие слова, а не «FODOWINGPRESID».

zv347 Dec 1 2020 at 05:28

Я один, читая статью, не понимал, почему нельзя использовать диктофон? Наверняка ведь и в те годы можно было сделать компактный потребительский микрофон, сравнимый по чувствительности с человеческим ухом.

rg_software Dec 1 2020 at 05:35

Расшифровка дольше происходит. Превратить страничку каши в нормальный текст гораздо быстрее, чем час разговоров с паузами, эканьем, всяким шумом и т.п.

ZekaVasch Dec 1 2020 at 05:42

Попробуйте включить на ютубе любое часовое интервью и попробовать сделать его в текст. Вопрос отпадет сам. Я пробовал разок. 3 часа видео в кабаке с беседой под звон пива. Около 10 часов трудозатрат.

zv347 Dec 1 2020 at 06:51

Пробовал, делал. Не интервью в кабаке, конечно, но аудиозапись защиты, в большой аудитории, со множеством говорящих и иногда одновременно. Не понимаю, в чем сложность. Нажал паузу, альт-таб, записал. Если разговор с паузами, можно и параллельно успевать записывать. И не нужно никаких «SHRAOUT HRAOE» и десяти вариантов кодирования.

Bringoff Dec 1 2020 at 09:47

Не понимаю, в чем сложность

Не сложность, а времязатраты.

Нажал паузу, альт-таб, записал

Вы сами подтвердили, что общее время работы будет в несколько раз длиннее видео.

SquareRootOfZero Dec 1 2020 at 07:15

Я пробовал, часовое интервью не делал, но цитаты на несколько минут приходилось выписывать — действительно, занимает неожиданно много времени, но, мне кажется, исключительно из-за несоответствия интерфейса поставленной задаче: не успел за оратором — бросаешь клавиатуру — тянешься за мышкой — наводишь на видео — пару секунд дрочишь указатель мыши, пока всплывёт панель с кнопкой паузы — нажимаешь паузу — начинаешь мучительно отматывать назад, ища момент, с которого ты не успел, на длинных видео это может стать весьма долгим и увлекательным квестом. Была бы какая-то глобальная педаль, чтобы можно было ей ставить на- и снимать с паузы — и, думаю, можно было бы перепечатывать неспешную беседу в плюс-минус реальном времени, спикеров, шпарящих как по-писанному — медленнее раза в полтора-два, а беседы с паузами, эканьем-меканьем и звоном пива кабы не быстрее (если к педали прикрутить ещё ускоренную перемотку туда-сюда, или просто ускорить аудио раза в два).

gudvinr Dec 1 2020 at 07:42

Была бы какая-то глобальная педаль, чтобы можно было ей ставить на- и снимать с паузы

На многих клавиатурах есть кнопка play/pause. Иногда в явном виде, иногда через Fn. В некоторых ОС можно глобальный шорткат вместо неё назначить

AndreyDmitriev Dec 1 2020 at 08:13

Я пробовал педаль от электропианино как клавишу контрол использовать — опыт интересный и любопытный, но возникает определённый «диссонанс», в общем у меня не прижилось.

UFO landed and left these words here

Admaer Dec 1 2020 at 15:57

В продаже есть «USB Foot Pedal» — это, фактически, программируемая клавиатура с одной кнопкой. Через ПО задаёшь что оно будет посылать при нажатии (какую кнопку/сочетание кнопок) и можно работать. Я уже несколько лет использую её для голосовых чятеков как выделенную кнопку для push to talk. Дело привычки — я уже не представляю как без неё можно голосовым чатом пользоваться.

SquareRootOfZero Dec 1 2020 at 08:25

По моему опыту, ничто так не убивает скорость печати, как необходимость тянуться пальцами куда-то в необычные места. Кнопка pause на клавиатуре, наверное, будет, всё же, получше мыши в этом отношении, но тоже не ахти, особенно если она «в неявном виде глобальный шорткат через Fn».

vmkazakoff Dec 1 2020 at 07:55

Я себе в свое время написал на HTML и JS плеер для видео, который хоткеи ловил. Оч удобно было (правда писать пришлось там же на странице в браузере, но это меня не парило) но особо скорости такое решение не добавило. Просто меньше нервов ушло на упражнения с мышкой.

dbalabanov Dec 1 2020 at 08:23

а чем пробел не подходит? для пауз и запуска.
возможно я что-то не поныл

UFO landed and left these words here

piton-vas Dec 2 2020 at 11:59

Педалью!

UFO landed and left these words here

SantrY Dec 1 2020 at 10:46

Все правильно пишите, правильный инструмент тут очень помогает, хотя все равно получается долго. Знаю не по наслышке, по долгу службы часто работаю с интервью. Пока самое удобное, что нашел, — вот эта страничка: otranscribe.com
Горячая клавиша для паузы, ускорение, замедление записи, перемотка и временные метки, на которые можно быстро вернуться.

Mem0 Dec 3 2020 at 04:02

Аль-таб, пробел. влево, пробел, альт-таб.
такая вот комбинация чтобы с текста перейти на соседнюю вкладку, отмотать 10-15 секунд (больше обычно не надо), запустить всё и вернуться к потерянному.

SquareRootOfZero Dec 3 2020 at 12:36

Тут уже в пальцах запутаешься. К тому же, оно толком не работает — то получается запустить/остановить ютубовское видео нажатием пробела, то вдруг перестаёт получаться (и всегда так было, насколько я помню, хз чо ему надо, может, проблема во мне).

UFO landed and left these words here

Metotron0 Dec 3 2020 at 16:45

k — play/pause, даже если фокус находится не на видео
j и l — перемотка влево-вправо на 10 секунд
? — показать список хоткеев

UFO landed and left these words here

SquareRootOfZero Dec 4 2020 at 12:42

Обалдеть.

UFO landed and left these words here

Newbilius Dec 1 2020 at 15:18

… что тоже занимает времени не меньше, чем просмотр видео, и тоже требует много правок. Пробовал.

UFO landed and left these words here

tyomitch Dec 1 2020 at 15:56

Неплохой способ, но для телеэфира не годится.

ZekaVasch Dec 1 2020 at 21:31

ну вот же написал, в кабаке под звон бокалов и пьяная речь… Я же знаю о чем базар.

Androniy Dec 1 2020 at 05:46

Во-первых, стенограмма часто была важным документом. Документ — это текст на бумаге, аудиозапись документом не является (на неё не поставить подпись, печать, не провести почерковедческую экспертизу). Во-вторых, стенограммы хранятся в течении длительного срока. Срок хранения магнитной аудио записи не идет ни в какое сравнение со сроком хранения бумажной записи. Цена листа бумаги на порядки ниже цены аудиокассеты, а объем хранимой информации там довольно большой.
Сейчас многое изменилось технологически, но на момент создания этого порядка технической возможности вести аудиозапись — не было. Теперь так уж исторически сложилось и закреплено законодательно (в нормативных документах).

Newbilius Dec 1 2020 at 15:20

"почерковедческую экспертизу" документа с печатной машинки — это сильно :)

Naves Dec 1 2020 at 15:33

Для печатной машинки проводят не столько «почерковедческую» сколько «технико-криминалистическую» экспертизу.
Ну и строго говоря, пока машинки были чисто ручными без электричества, почерк тоже был.

tyomitch Dec 1 2020 at 15:51

Почерковедческую экспертизу подписи на машинописном документе.

Голос на аудиозаписи хоть и можно идентифицировать, но гораздо сложнее доказать, что сама запись не смонтирована. С бумажным документом, подписанным ручкой, такой проблемы нет.

ChinaraGuliyeva Dec 1 2020 at 16:43

Видимо, как тут пишут, из-за законов. Я некоторое время юзала Express Scribe, там можно замедлять, ускорять, останавливать, отматывать назад-вперед, кажется даже частично шумы убирает. Если все через горячие клавиши делать, норм. С непривычки долго, с опытом входишь во вкус.

UFO landed and left these words here

zv347 Dec 2 2020 at 04:10

А сейчас адвокаты работают с нерасшифрованными стенограммами?

9660 Dec 3 2020 at 08:39

Сейчас огромная масса народа вместо смс на 10 символов шлет друг другу 2 минутные послания голоом. И считает это нормальным.

SquareRootOfZero Dec 3 2020 at 16:25

Занятно, что данная проблема поднималась ещё в романе «Дракула» (19 век!): один из главных героев, врач психушки, ведёт записи на фонографе вместо бумаги. Потом вдруг сталкивается с необходимостью поиска по этим данным, и, такой: «Ой, как-то я не подумал...»

AndreyDmitriev Dec 1 2020 at 05:55

Круто, про устройства я не знал — думал стенографисты запысывают всё на бумаге спецсимволами, а потом каракули расшифровывают.
А ведь это набор текста сочетаниями «горячих клавиш» 80-го уровня.
Я пытаюсь прикинуть — будет ли так же удобно программировать? В любом языке программирования куча ключевых слов, которые «аккордами» набирать можно.

vesper-bot Dec 1 2020 at 06:21

Скорость кодирования обычно не требуется разгонять до реалтайма. И поздравляю, вы изобрели vi/emacs.

jaiprakash Dec 1 2020 at 06:35

Аккорды давно применяются в Delphi для ускорения многобуквенного синтаксиса паскаля.

usbstor Dec 1 2020 at 06:59

В спектруме (ZX80) так было — одна клавиша одно выражение.

Shaman_RSHU Dec 1 2020 at 08:50

Вспомните клавиатуру ZX Spectrum. Там во встроенном BASIC ключевые слова набирались одной или сочетанием нескольких клавиш.

Darkhon Dec 1 2020 at 14:27

Помню микрокомпьютер «Электроника МК-90», тоже Бейсик и вставка по сочетанию двух клавиш.

tyomitch Dec 1 2020 at 15:46

Рукописными каракулями по-прежнему пользуются: стенотайпу нужно электричество и две свободные руки, в карман его не положишь, на ходу не попечатаешь, и т.д.

Так же, как вычисления «в столбик» не ушли в прошлое с появлением счётных машин.

vadimk91 Dec 1 2020 at 17:28

Кстати, была (наверное «была») советская система стенографии, году в 1985-86 я даже дистанционно ей учился, что-то запомнил, но до конца курс не прошел — поступил в институт. Там иногда в лекциях некоторые слова записывал спецсимволами, чем немало удивлял тех, кто брал переписать мои лекции :) похожи они чем-то были на арабскую вязь, только слева-направо; сейчас конечно всё уже забыл.

tyomitch Dec 1 2020 at 18:59

Да, была и такая — гуглится по названию «ГЕСС»

vadim_bv Dec 2 2020 at 11:07

В свое время в Науке и жизни был цикл статей «Скоростное конспектирование», где стенография как раз не очень приветствовалась. Потому что в ней (я тоже видел эту книжку, которую упоминал tyomitch) многое зависит от контекста. Типа «Л» — это Ленин.
Суть системы была в том, что мы вводили буквально несколько десятков символов типа кванторов, писали корни слов, а наиболее распространенные окончания и приставки можно было отмечать символами наподобие стенографических.
У меня были символы для концовок типа «ение», «ность», глаголов, в т.ч. возвратных, причастий действительных и страдательных. До сих пор могу прочитать, а писать можно было со скоростью лектора.

LeToan Dec 1 2020 at 20:13

В любой американской судебной драме недалеко от судьи сидит стенографистка и чего-то печатает. Иногда по требованию судьи зачитывает с этой ленты.

andersong Dec 2 2020 at 07:01

Радисты, вон, точками и тире шпарят, а программистам 80-го уровня нужно писать сразу единицами и нулями)))

tyomitch Dec 2 2020 at 07:15

xkcd.com/378

9660 Dec 3 2020 at 08:48

Как-то раз встретил напросторах сайт. Спарва подумал что у меня с глазами что-то, потом что с головой, а потом дошло что это сайт энтузиастов морзянщиков.
У них весь сайт на морзянке был.
Годы прошли а забыть не могу того удивления.

drWhy Dec 1 2020 at 08:18

«стенографист со стенотайпом может печатать до 300 слов в минуту»

Т.е. Эминем, начитавший в треке Godzilla 229 слов за 30 секунд, перечеботарил стенографиста? Любопытная уязвимость.

AxisPod Dec 1 2020 at 08:39

Что-мне кажется, что сглюкануло распознавание речи, а субтитры создаются автоматом.

Metotron0 Dec 1 2020 at 09:02

Прошу прощенья, но 12/11/2020 — это 11 декабря 2020. Оно ещё не наступило. По-нашему это будет 11.12.2020. У них другая система записи, формат ММ/ДД/ГГГГ. Отличать можно по слешам. Если дата через слеши, то сперва идёт месяц. Когда начинают через слеши писать в российском формате, наступает путаница.

UFO landed and left these words here

iDm1 Dec 1 2020 at 13:14

В ISO 8601 хоть обычно двусмысленности не возникает (2020-11-12T13:00:00Z), но порядок ГГГГ-ММ-ДД не используется в документах, с которыми мы сталкиваемся постоянно. Придется во всех сферах жизни на него переходить, чтоб мозг не ломался от ситуации к ситуации.

UFO landed and left these words here

Iv38 Dec 1 2020 at 14:00

Некоторые страны даже на метрическую систему в быту никак не перейдут. Хотя тут проще. Дни, месяцы и годы не меняют своих значений, только меняется порядок. И меняется на вполне логичный. Причём отличить старый формат от нового можно по разделителям.

mayorovp Dec 1 2020 at 09:50

Если дата через слеши, то сперва идёт месяц.

Французы, итальянцы и англичане с вами не согласны, если верить https://en.wikipedia.org/wiki/Date_format_by_country (там много примеров, но я отобрал самые значимые).

zetroot Dec 1 2020 at 10:40

Надо рядом с датой указывать культуру! «11/12/2020 en_US» или как то так…

mayorovp Dec 1 2020 at 11:34

Проще ISO 8601 использовать. Проблема с теми, кто этого не делает.

Iv38 Dec 1 2020 at 11:47

В быту этого никто не делает или почти никто, судя по табличке из комментария выше.

mayorovp Dec 1 2020 at 11:52

Ну так и культуру никто в быту дописывать к дате не будет, в том-то и проблема.

zetroot Dec 1 2020 at 11:54

Картинка про 14 конкурирующих стандартов.

TheShock Dec 1 2020 at 09:58

Американские стенографисты уже больше сотни лет как используют специальные устройства с минимальной 22-клавишной клавиатурой — по две клавиши под каждый палец

22 / 2 = 11. Мы что-то не знаем о американских стенографистах?

Squoworode Dec 1 2020 at 11:16

Мужская профессия

zetroot Dec 1 2020 at 11:54

Это ладно, а ещё 1?

Metotron0 Dec 1 2020 at 12:27

Редкая мутация.
Или две педали забыли упомянуть.

General_Failure Dec 2 2020 at 11:33

Так под каждый палец по две клавиши
20 клавиш на 10 пальцев на руках, и ещё две — на тот… кхм… палец

UFO landed and left these words here

AC130 Dec 1 2020 at 12:43

Судя по картинке из поста, на указательные пальцы приходится 4 клавиши, а на большие по 1.

tyomitch Dec 1 2020 at 15:31

Всё несколько сложнее:

Zverik Dec 1 2020 at 17:19

Видел таких стенографистов на американской конференции State of the Map. Сидели на втором-третьем ряду и невозмутимо писали, смотря вперёд перед собой. На сайте конференции в этот момент в прямом эфире шёл текст из речи докладчика. Ощущалось… как будущее.

eimrine Dec 2 2020 at 13:37

Меня удивило что в раскладке для стенографистов, от которой требуется только максимальная скорость, клавиши AOEU находятся в отдельном ряду максимально удобно для нажатия. Лишний довод в сторону моей любимой раскладки Dvorak и против раскладки QWERTY которая была составлена для причин все-таки отличных от быстрого печатания.

Merzavets Dec 3 2020 at 22:40

Я долгих четыре с половиной десятка лет задумывался, как работают эти штуковины. Правда, задумывался как-то не очень глубоко, ибо ответ на свой насущный вопрос прочитал только что.
Но теперь уже не забуду никогда! Спасибо автору.

gordt Dec 4 2020 at 09:37

не знаю почему, но мне это напомнило https://habr.com/ru/post/87736/