Комментарии 102
И ещё момент вспомнил: я подобный бред в субтитрах видел ещё пару раз, причём оба раза — в сабах к музыкальным клипам на Ютубе. Поэтому подозреваю, что тот «стенографист» — не сотрудник CNN, а какой-то ютубовский робот, который преобразовывает речь в текст.
Выпуск новостей — это прямой эфир. Текст должен соответствовать тому, что говорит диктор. Если во время выпуска или прямо перед ним случается «breaking news», то текст всё равно должен соответствовать. А не продолжать транслировать фейковую телеметрию, когда ракетоноситель уже потерян.
Про такое не скажешь не только «с… дили», но даже и «про… бал».
Не подскажете, кто это так отличился и когда?
Но вот чтоб ракетоноситель потерять — не слыхал такого.
Увы, но эта битва проигран и давно.
Не просто давно, а с самого начала она проиграна.
Обзывание ракет-носителей словом "ракетоноситель" началось сразу при появлении слова ракета-носитель. Это зафиксировано в лингвистической литературе советских времён.
Есть примеры использования слова "ракетоноситель" в смысле "ракетоносец", но они погоды не делают :(
продолжать транслировать фейковую телеметрию
Это реально такое было?
Но диктор же не сочиняет отсебятину, перед ним там экран с видеосуфлёром, по которому он читает. Т.е. все его тексты и так уже оцифрованы и написаны. Зачем в этой схеме нужен стенографист?
Любому СМИ нужны штатные стенографисты для пресс-конференций.
Раз они уже есть, почему ими не воспользоваться и для субтитров?
И ещё момент вспомнил: я подобный бред в субтитрах видел ещё пару раз, причём оба раза — в сабах к музыкальным клипам на Ютубе. Поэтому подозреваю, что тот «стенографист» — не сотрудник CNN, а какой-то ютубовский робот, который преобразовывает речь в текст.
Ютубовский робот, который преобразовывает речь в текст, генерирует что-то такое:

Видите разницу между этим и «STILLEVELOP PLANANDEMIC, ILNG T»?
Вроде, тут про видео на ютубе, а в видео нарисованы субтитры, как на картинке.
Но вроде бы на ютубе субтитры могут быть не только сгенерированы самим сервисом, но и загружены руками.
Вроде можно прикрепить написанные человеком вручную.
Всегда думал, что ютубовские сабы генерит нейронка.
В данном случае — так и было; только нейронка не ютубовская, а CNN-овская, и принимала на входе не звукозапись, а стенограмму.
Навеяло некоторой необъяснимой лажей, когда слова произносятся предельно отчетливо, но в сабах совершенно иное, причем не связанное даже с контекстом.
Сбои ютубовской распознавалки выглядят совсем иначе — например, в результате всегда получаются реально существующие слова, а не «FODOWINGPRESID».
Расшифровка дольше происходит. Превратить страничку каши в нормальный текст гораздо быстрее, чем час разговоров с паузами, эканьем, всяким шумом и т.п.
Попробуйте включить на ютубе любое часовое интервью и попробовать сделать его в текст. Вопрос отпадет сам. Я пробовал разок. 3 часа видео в кабаке с беседой под звон пива. Около 10 часов трудозатрат.
Была бы какая-то глобальная педаль, чтобы можно было ей ставить на- и снимать с паузы
На многих клавиатурах есть кнопка play/pause. Иногда в явном виде, иногда через Fn. В некоторых ОС можно глобальный шорткат вместо неё назначить
Я себе в свое время написал на HTML и JS плеер для видео, который хоткеи ловил. Оч удобно было (правда писать пришлось там же на странице в браузере, но это меня не парило) но особо скорости такое решение не добавило. Просто меньше нервов ушло на упражнения с мышкой.
возможно я что-то не поныл
Горячая клавиша для паузы, ускорение, замедление записи, перемотка и временные метки, на которые можно быстро вернуться.
такая вот комбинация чтобы с текста перейти на соседнюю вкладку, отмотать 10-15 секунд (больше обычно не надо), запустить всё и вернуться к потерянному.
Сейчас многое изменилось технологически, но на момент создания этого порядка технической возможности вести аудиозапись — не было. Теперь так уж исторически сложилось и закреплено законодательно (в нормативных документах).
"почерковедческую экспертизу" документа с печатной машинки — это сильно :)
Ну и строго говоря, пока машинки были чисто ручными без электричества, почерк тоже был.
Голос на аудиозаписи хоть и можно идентифицировать, но гораздо сложнее доказать, что сама запись не смонтирована. С бумажным документом, подписанным ручкой, такой проблемы нет.
А ведь это набор текста сочетаниями «горячих клавиш» 80-го уровня.
Я пытаюсь прикинуть — будет ли так же удобно программировать? В любом языке программирования куча ключевых слов, которые «аккордами» набирать можно.
Скорость кодирования обычно не требуется разгонять до реалтайма. И поздравляю, вы изобрели vi/emacs.
Аккорды давно применяются в Delphi для ускорения многобуквенного синтаксиса паскаля.
В спектруме (ZX80) так было — одна клавиша одно выражение.
Так же, как вычисления «в столбик» не ушли в прошлое с появлением счётных машин.

Суть системы была в том, что мы вводили буквально несколько десятков символов типа кванторов, писали корни слов, а наиболее распространенные окончания и приставки можно было отмечать символами наподобие стенографических.
У меня были символы для концовок типа «ение», «ность», глаголов, в т.ч. возвратных, причастий действительных и страдательных. До сих пор могу прочитать, а писать можно было со скоростью лектора.
Т.е. Эминем, начитавший в треке Godzilla 229 слов за 30 секунд, перечеботарил стенографиста? Любопытная уязвимость.
Прошу прощенья, но 12/11/2020 — это 11 декабря 2020. Оно ещё не наступило. По-нашему это будет 11.12.2020. У них другая система записи, формат ММ/ДД/ГГГГ. Отличать можно по слешам. Если дата через слеши, то сперва идёт месяц. Когда начинают через слеши писать в российском формате, наступает путаница.
Если дата через слеши, то сперва идёт месяц.
Французы, итальянцы и англичане с вами не согласны, если верить https://en.wikipedia.org/wiki/Date_format_by_country (там много примеров, но я отобрал самые значимые).
Американские стенографисты уже больше сотни лет как используют специальные устройства с минимальной 22-клавишной клавиатурой — по две клавиши под каждый палец
22 / 2 = 11
. Мы что-то не знаем о американских стенографистах?
Мужская профессия
Видел таких стенографистов на американской конференции State of the Map. Сидели на втором-третьем ряду и невозмутимо писали, смотря вперёд перед собой. На сайте конференции в этот момент в прямом эфире шёл текст из речи докладчика. Ощущалось… как будущее.
Я долгих четыре с половиной десятка лет задумывался, как работают эти штуковины. Правда, задумывался как-то не очень глубоко, ибо ответ на свой насущный вопрос прочитал только что.
Но теперь уже не забуду никогда! Спасибо автору.
не знаю почему, но мне это напомнило https://habr.com/ru/post/87736/
Загадочные субтитры на CNN