Как стать автором
Обновить

Комментарии 7

Без примеров статья ни о чём.
Будьте любезны, приложите, мы послушаем.
Вскоре последует апдейт, полная версия статьи и необходимые ссылки с примерами. Немного терпения, это не более чем превью.
Так может стоило проявить немного терпения и выложить полною версию? А то конфетку показали, а внутри пусто.
Вы знаете, корпоративная по своей природе суть нашего блога изредка требует компромиссной линии, то есть смещения от исследовательских материалов к сугубо информационным, рассказывающим о нашей работе. Что полезно, например, для установления и развития связей с коллегами из разных компаний и лабораторий (в т.ч. занимающихся звуком и речью), реализации совместных идей, конкурсов, проектов. Разумеется, вскоре последуют открытая статья и линки на сопроводительные аудио-материалы, которые мы отдельно направим всем откликнувшимся. Спасибо за интерес и понимание.
Здесь это никому нахрен не нужно.

Продукт абсолютно необходим для заслушивания решения суда российскими судьям.
Они шепчут свой текст, так тихо, что расслышать невозможно.
Запись и усиление звука приводят к подъёму уровня естественного шума, в разы превышающего русскосудейский шепот.
Ручной анализ звукозаписи судебного заседания я делал примерно по тому же алгоритму, что и прописан.


  1. Детектируешь, кто говорит каждую фразу.
  2. Устанавливаешь для каждого говорящего свой "уровень громкости"
  3. Привязываешь фразы к таймеру.
    Зачастую только из записи узнаешь, что эксперт нашептал судье ( подойдя к судейскому столу, под видом разъяснения рисунков, ) ложные сведения, которые можно было опровергнуть в ходе заседания, если бы разобрал речь.

Для облегчения работы авторов хочу предложить им использование аудиосигнала, сразу от нескольких микрофонов.
Это позволяет по запаздыванию звука определить координаты каждого источника звука.
Кроме того, предлагаю отдельным алгоритмом изучить эхо в данном помещении, привязать его АЧХ к каждому источнику звука.


Карту аудиолокации помещения удобно выводить на экран смартфона. Предлагаю организовать интерфейс, позволяющий подать команду на усиление речей заинтересовавшего пользователя участника или блокирование шумов ремонта или автодвижения за окном.


У фирмы Евромани Трайдинг посещал недельный курс английского языка для работы на бирже (6000 фт. ст.)
Профессора мотивировали изучать английский язык брокеров с целью получения своей зарплаты.
"Не расслышал сообщение заинтересовавшего тебя клиента — упустил свой шанс!"
Для работы на биржевых площадках, там где не боты шуруют, Ваш алгоритм и приложение будут востребованы.


Успехов в работе. Жду с нетерпением продажи приложений.

интересно будет все же взглянуть именно на продукт, какие будут действительно его возможности, будет ли он готовым к использованию или сырым<a href=".">.… как будут выбираться стандартизированные параметры, можно ли дальше развивать эту же продукцию но более углубленно, какие у нее пределы… интересно это все, жду прототипа :)
Зарегистрируйтесь на Хабре, чтобы оставить комментарий