Распознавание подкастов

    Недавно я начал запись подкастов и столкнулся вот с какой проблемой: поисковики не умеют индексировать голос и видео изображения, поэтому каждый подкаст необходимо снабжать текстовыми комментариями и описанием, которые проиндексируют поисковики. Очень хорошо для индексации было бы весь подкаст изложить в текстовом варианте.

    Времени на такую работу обычно не бывает, а работа очень важная. Можно было бы сделать такой проект, в котором подкастеры будут заказывать «конвертацию» подкастов в текст, за что будут платить трансляторам денежки. В результате всем хорошо: подкастеры получаю нормальное индексирование, «трансляторы» (те кто слушают подкасты и набивают тексты) получают заработок.

    UPD. Вопрос к комментаторам: как по вашему мнению, хватит ли денег, которые заплатят авторы подкастов за распознавание чтобы привлечь распознователей? а организаторам проекта что-нибудь останется?
    Поделиться публикацией
    Ой, у вас баннер убежал!

    Ну. И что?
    Реклама
    Комментарии 19
    • 0
      хе, думаю ребята из e-генератора уже взяли эту статью на заметку.
      • 0
        подкаст всегда читается с чегото :)
        • 0
          не совсем понял, что Вы имели в виду.
          • 0
            шоуноты готовятся перед подкастом, а не после. если это конечно это не безудержный гон "за жисть".
            • 0
              а если безудержный гон за жисть, то полный текст окажется весьма кстати, не так ли?
              • +1
                Чо, правда? Ой.
                • 0
                  ну, я оставляю шансы варианту, при котором подкастеры тщательно скрывают факт неподготовки к подкасту. ;-)
                  • 0
                    готовится к подкасту можно по разному... вот "Янки после пъянки" записывается при стимуляции алкоголя
                  • 0
                    bobuk, а ты свои подкасты сочиняешь на ходу, если конечно умпутуна рядом нет?
                    • 0
                      У меня уже года 2 как нет своих подкастов. Некогда.
                • 0
                  Ну текст читается не из головы а с бумажки/монитора, так что он уже есть на момент записи
                  • 0
                    уверен, что не все так делают. я, например, составляю план, а говорю сходу. Иногда план меняется прямо на ходу.

                    Все же мне кажется, что индексация и поиск подкаста будут более успешными, если он будет снабжен полным текстом: в процессе записи я рассматриваю множество утилит и разных опций и параметров, о которых нет упоминания в шоунотах.
                    • 0
                      ok.
                      просто ни один подкаст который я слушаю не читается автором, кроме всяческих интервью :)
                • +1
                  к счастью, ты не прав.
                  это было бы унылое зрелище, если бы все подкасты читались с бумажки
                • 0
                  поправьте, пожалуйста, заголовок поста: "распознАвание".
                  • 0
                    и еще в тексте зароботок->зарАботок
                  • 0
                    хороший вопрос в том, кто кому должен платить за это деньги;)
                    Авторы подкастов и так являются производителями контента.
                    Зная, как низок процент людей согласных платить за размещение блога или подкаста, можно предположить, что людей, платящих за индексацию своих подкастов будет еще меньше)
                    Главный интерес здесь поискового ресурса.
                    Я думаю, максимум на что пойдут подкастеры в массе - это покупка программы, которая распознает аудиодорожку и переносит распознанный текст в теги внутри файла, которые в свою очередь будут распознаваться поисковой системой
                    • 0
                      еще многое зависит от цены. распозновать подкасты - это совершенно неквалифицированная работа, которая оплачивается по минимуму (берем роту солдат, сажаем за компы и вперед...).
                      Насколько я знаю, нормальных алгоритмов распознования голоса пока не существует.
                      • 0
                        у меня дома имеется купленный диск с программой Диктограф. Только нужно обучать его.
                        Я так понимаю, что алгоритмы уже есть, но без обучения пока не получается

                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                    Самое читаемое