alizar Aug 10 2010 at 10:56

ФСБ учится распознавать кавказцев по голосу

1 min

2.2K

ФСБ России объявило тендер на «Создание автоматизированного атласа национальных языков РФ» (НИР «Д-2010-08-4.3») с начальной ценой контракта 24 млн руб. и сроком 29 месяцев (тактико-техническое задание в PDF). Заказ размещён от имени части 68240, принадлежность которой к ФСБ известна по анализу информации из открытых источников.

В рамках тендера требуется разработать справочник, который может стать основой для автоматической системы, способной по речи надёжно распознавать язык говорящего. Например, с помощью такой системы можно оперативно выявлять разговоры на кавказских языках среди всех сотовых переговоров в Москве (при условии их одновременной прослушки через коммутаторы операторов сотовой связи).

Первыми языками, для которых должно быть «проведено исследование особенностей устной речи информантов-носителей», в ТТХ называются шесть языков: аварский, ингушский, кабардино-черкесский, карачаевский, балкарский, даргинский. Для каждого языка должно быть минимум 20 информантов с разными каналами фиксации речи: микрофон, телефон и т.д., минимум по 10 сеансов записи для каждого канала более 40 секунд. Затем нужно провести анализ звукозаписей, после чего составить лингвистические паспорта языков.

Hubs:

Information Security