Comments 20
Ну хоть чуть-чуть про железо расскажите. Про используемое звуковое оборудование...
Классная идея, а ты представляешь объем решений, который это за собой тянет? (если касаться новостей)
Во первых, текст не всегда соответствует оригиналу. Во вторых - любое лишнее действие пользователь будет пропускать. Решение задачи в "изолированном" виде не имеет смысла. Вот когда начитка привязана к материалу в рамках единой системы, появляется целое море неожиданных возможностей для автоматизации. Ну и доступных готовых решений "из коробки" для разметки медиа по тексту я ещё не видел (хотя, у меня есть)
Мы уже задумывались, как сделать помощника в преобразовании голоса в текст. Потому что расшифровка синхронов занимает не маленькую часть времени. И возможно ваша идея поможет сделать первый шаг.
20 лет назад работал я на ТВ. На случай отсутствия звукорежиссёра просто обучили всех журналистов (их был человек 6-7), что нажать и куда сохранять. Все обучились без проблем и очень быстро. Журналист подходит к компу, который за пределами будки звукозаписи, жмёт в аудиоредакторе кнопку создания нового файла, жмёт кнопку записи, заходит в будку, сквозь стекло видит монитор, на котором идёт процесс записи... По окончании записи, жмёт на компе стоп и "сохранить", пишет название сюжета в качестве имени файла, жмёт кнопку закрытия файла. Внутри будки есть микшер с предусилителем для контроля громкости.
Всего шесть пунктов, включая процесс начитывания.
Ну Семен Семенович! Сайт вроде про IT, а где обработка звука? А процесс звукоизоляции? А то, что шурик как микрофон совсем не идет некоторым басовитым мужикам? Где обзор нашей любимой Audacity какой-нибудь очень затертой версии? Если это - вещательная студия то аппаратура должна соответствовать российскому вещательному ГОСТу, а это - микшер, поп-фильтры, пантографы, противовибрационные подвесы, мебель, специальное освещение беззвучное. Хочется больше подробностей, а не просто уровень одного XLR соединения с джеком на 3.5.)
Благодарю за конструктивную критику! Только начинаю пробовать себя в роли автора)
Если только пробуете,то тогда объяснимо. Прочитал все ваши статьи, хочется указать общие проблемные места. Опять же, не претендую на менторство.
Постановка задачи и заголовок должны соответствовать друг другу.
В статьях видно, как вы занимаетесь малой автоматизацией. Хорошо так занимаетесь, но в таких статьях есть проблема: как это лучше описать?
В каждой статье есть ряд незаконченных мыслей/притянутых не к месту фраз.
Статьи с отрицательным голосованием требуют большей глубины проработки фактов.
Очень рад, что вы растете как автор.
Теперь вернемся к текущей статье (сравнение с моей статьей про яндексовскую Алису ниже).
Постановка: Есть ряд профессий, где важно сделать качественную звукозапись.
Развитие: Убираем профессию звукача (ну, это вы зря, у человека воздушная и костяная проводимость звука даже говорить качественно не дает).
Решение: Программно-аппаратный комплекс. Три прихлопа, два притопа. Два коннекта, простая схема. Но работает же как-то после долгой настройки.
Финал статьи: Я придумал автоматическую будку гласности из недешевых недомашних устройств. В принципе, ничего полезного, кроме марок процессоров. Плюсик за это.
Сравним с моей статьей.
Постановка: Есть хорошая штука - Алиса. В документации есть баг, так как прошивка позволяет давать наружу два звука. Как это можно использовать?
Развитие: Как я это обнаружил, почему об этом нигде не написано. Делаю умный дом с радиусом действия в километр и даже больше.
Продолжение: АЧХ Алисиных микрофонов. Работа с разными ОС.
Решение: В мирных целях Алиса - само то, но есть проблемы и возможности, которые хотелось донести до читателя. Апдейт: Как командовать женским голосом, если ИИ изначально к этому был не готов. 20К просмотров и 0 рейтинга ))).
Решение с распознаванием любой звукозаписи в текст на бесплатных компонентах в моем блоге тоже есть )).
Смутило это
Файл записывался с одним каналом звука. На звуковую карту приходили два канала, а ffmpeg записывал один.
То есть, на выходе получается стерео-файл? Зачем? Дикторские начитки на студийный микрофон — это моно-запись с одного источника.
Если у вас возникла проблема с тем, что изначально ффмпег создавал стерео-файл, оставляя запись в одном канале («в одном ухе»), то правильнее не продублировать этот канал во второй, а просто преобразовать файл в моно, выбросив пустой канал.
Желаемый результат был достигнут, Добавив параметр смешивания каналов в строку запуска. В этом помогла вот эта страничка.
Возможно тут имелось в виду смешивание стерео в моно.
/facepalm А решалось то все удлинителем УСБ, второй клавиатурой, мышкой и монитором протянутым через стенку и поставленных в дикторской.
Какой-то оверинжениринг, сомнительного какчества записи через виндючный микшер в ffmpeg ;-)
Да на двери в скворечник, повесить дешевый x86 планшет с тачьскрином, вот и весь сервер.
Причём если использовать линукс, то звуковую систему можно настроить так, что писать будет не хуже чем мак или винда через асио. Ну и запуск привычных журналистам программ, где они могут не только говорить\слушать но и резать и дописывать...
...а если журналист\диктор в 22 году ничего такого не умеет, то точно ли он проф пригоден?
а в чём понт веб-приложения?
Надо записать звук.
ООкей. комп с той же Audacity и привет, записал, обрезал, захотел - фильтранул чуток.
Вариант - записал на смартфон, скинул (любым способом) в нужную шару, там это забрали, обработали.
Звукозапись без звукорежиссера