Pull to refresh

Немцы создали библиотеку пьяных аудиозаписей

Data Mining *Big Data *
Эпиграф:
— Пил?
— Не пил!
— Скажи Гибралтар.
— Пил.


Тема немного курьезная, но мне кажется, что именно таких в последнее время не хватает на Хабре. Особенно в пятницу.



Итак, немецкие ученые из двух университетов Мюнхена создали базу аудизаписей, где записана речь 162-х людей в состояние алкогольного опьянения. Данные собирались с 2007 года по 2009 и теперь на основании базы данных создается языковой корпус (статья о корпусах на Вики) Alcohol Language Corpus (ALC).

Корпус предполагается использовать для машинного обучения, чтобы автоматизационные системы (к примеру, в автомобиле) автоматически распознавали состояние хозяина и блокировали управление. Таким образом предполагается бороться с бессовестным человеческим фактором.

До этого несколько автомобильных концернов работали над детектированием пьяного поведения. Но тогда речь шла либо о датчиках, улавливающих пары алкоголя (и иногда ложно срабатывающих при присутствии пьяного пассажира), анализа пота на рукоятке переключения скоростей, или камер, пристально вглядывающихся в лицо водителя. Но, судя по всему, до анализа речи никто пока не додумался.

Стоимость набора записей — порядка $1200 (внушительная сумма за 162 структурированные речи немецких алкоголиков :)
Кстати, вот пример из базы.

Новость закончена, можете ставить минус за краткость.
Tags: машинное обучениепьянству бойавтомобилилингвистический анализ
Hubs: Data Mining Big Data
Total votes 65: ↑46 and ↓19 +27
Comments 33
Comments Comments 33

Popular right now