Maslukhin Dec 5 2014 at 12:30

Немцы создали библиотеку пьяных аудиозаписей

1 min

21K

Эпиграф:
— Пил?
— Не пил!
— Скажи Гибралтар.
— Пил.

Тема немного курьезная, но мне кажется, что именно таких в последнее время не хватает на Хабре. Особенно в пятницу.

Итак, немецкие ученые из двух университетов Мюнхена создали базу аудизаписей, где записана речь 162-х людей в состояние алкогольного опьянения. Данные собирались с 2007 года по 2009 и теперь на основании базы данных создается языковой корпус (статья о корпусах на Вики) Alcohol Language Corpus (ALC).

Корпус предполагается использовать для машинного обучения, чтобы автоматизационные системы (к примеру, в автомобиле) автоматически распознавали состояние хозяина и блокировали управление. Таким образом предполагается бороться с бессовестным человеческим фактором.

До этого несколько автомобильных концернов работали над детектированием пьяного поведения. Но тогда речь шла либо о датчиках, улавливающих пары алкоголя (и иногда ложно срабатывающих при присутствии пьяного пассажира), анализа пота на рукоятке переключения скоростей, или камер, пристально вглядывающихся в лицо водителя. Но, судя по всему, до анализа речи никто пока не додумался.

Стоимость набора записей — порядка $1200 (внушительная сумма за 162 структурированные речи немецких алкоголиков :)
Кстати, вот пример из базы.

Новость закончена, можете ставить минус за краткость.

Hubs:

If this publication inspired you and you want to support the author, do not hesitate to click on the button