Всем привет! Я руковожу «Наносемантикой», сегодня хотел бы поделиться с вами результатами нашего сравнения сервисов распознавания речи (ASR). Мы собрали и разметили тестовый датасет на русском языке, прогнали через сервисы ASR, проанализировали результаты работы разных вендоров, собрали основные выводы.
Всем привет! Мы — команда компании «Наносемантика», и недавно мы запустили проект SOVA, где занимаемся сбором датасета для использования его в обучении нейронных сетей и создания виртуальных ассистентов на базе искусственного интеллекта.
Мы подготовили большой датасет для обучения движков распознавания речи и хотим поделиться им, чтобы компании могли внедрять его у себя для решения разного рода бизнес-задач. Данные – это новая нефть, а одна из важнейших причин прогресса в системах распознавания на базе машинного обучения – наличие размеченных датасетов. Если вы интересуетесь исследованиями и разработками в области речевой аналитики – заходите под кат.
Мы в Наносемантике занимаемся виртуальными ассистентами (чат-ботами и голосовыми помощниками) для компаний с большими колл-центрами. Раньше мы использовали распознавание и синтез речи других компаний, а 1.5 года назад решили, что хотим быть самодостаточным вендором.
Если интересно, зачем нам это, что у нас получилось, а также для чего нам выкладывать ASR & TTS в Open Source – добро пожаловать под кат.
Когда возникает необходимость превратить звуковой файл с речью в текст, первыми на ум приходят решения Гугла и Яндекса. Но, кроме Яндекса, есть ещё одна отечественная компания — «Стэл» (http://speech.stel.ru/), API которой поддерживает «over 9000» и даже «очень очень много» запросов в день, а пробные ключи Stel раздает бесплатно.
Добрый день, Харбчане!
vk.com/rtrg?r=MyfvmSagVGcKoVRPBQ92U5CfxIhCPah9BpgCNi*VQ5Z*GZClBfq8O6Xqoc4FgyLmY/t2xfXW*b/pLNakil70J2BgItRALRcbqLdyvvbQaL48Y3InrmCX91lp3jlslzoTrQWAQ2odZccwu06QSKcDISHi4yplYcjlvQQqCvYweCs-&pixel_id=1000020818
В предыдущем посте мы (команда проекта Лекси) объявили о том, что хотим найти желающих взять у нас платы, которые за полтора года жизни стартапа стали ненужными. Вот их список:
Olimex A13 — 2 штуки
Olimex A20 Micro
Raspberry pi 2
Wandboard Freescale i.MX6
Под катом — результаты и запуск глобальной акции по дарению плат на Хабре.
vk.com/rtrg?r=MyfvmSagVGcKoVRPBQ92U5CfxIhCPah9BpgCNi*VQ5Z*GZClBfq8O6Xqoc4FgyLmY/t2xfXW*b/pLNakil70J2BgItRALRcbqLdyvvbQaL48Y3InrmCX91lp3jlslzoTrQWAQ2odZccwu06QSKcDISHi4yplYcjlvQQqCvYweCs-&pixel_id=1000020818
Как видно из нашего профиля — наша компания занимается разработкой и производством интеллектуального домашнего помощника Лекси.
За полтора года работы у нас накопилось немного лишнего железа, которое мы уже не используем и оно нам не нужно. Мы хотим отдать его для опытов в хорошие руки.
Продолжаем рассказ о Лекси. Проект Лекси — участник кластера информационных технологий Фонда «Сколково». Статья понравится всем, кто интересуется разработкой хардварных проектов, кому интересны голосовые интерфейсы и будущее «умного дома». В статье проводим краткий обзор электроники, которая используется внутри нашего устройства.
vk.com/rtrg?r=MyfvmSagVGcKoVRPBQ92U5CfxIhCPah9BpgCNi*VQ5Z*GZClBfq8O6Xqoc4FgyLmY/t2xfXW*b/pLNakil70J2BgItRALRcbqLdyvvbQaL48Y3InrmCX91lp3jlslzoTrQWAQ2odZccwu06QSKcDISHi4yplYcjlvQQqCvYweCs-&pixel_id=1000020818
Сперва кратко анонсируем июньский Тест Тьюринга, а потом расскажем о технологии инфов и нашей команде на этом конкурсе.
Давно не было каких-либо упоминаний и активностей с тегом #turingtest. Сегодня мы разбавим это молчание своим постом.
Что происходит. О конкурсе
Сразу скажем, что регистрация на конкурс — до вечера 30 апреля (т.е., сегодня). Если думаете поучаствовать — не тяните с регистрацией, а то пролетите.
Зарегистрироваться можно тут: turingtest.inf.net
Imagine Cup (vk, fb) – крупнейший в мире ежегодный технологический конкурс, проводимый при поддержке Microsoft с 2003 года. Бессменным организатором конкурса является компания Microsoft. Победители международного финала в каждой категории получают за первое место 50 тысяч долларов, за второе — 10 тысяч долларов, за третье — 5 тысяч долларов на развитие. Однако сражение идет не за деньги, а за престиж — победившие команды моментально становятся известными по всему миру, и могут использовать этот шанс для настоящего взлета. vk.com/rtrg?r=MyfvmSagVGcKoVRPBQ92U5CfxIhCPah9BpgCNi*VQ5Z*GZClBfq8O6Xqoc4FgyLmY/t2xfXW*b/pLNakil70J2BgItRALRcbqLdyvvbQaL48Y3InrmCX91lp3jlslzoTrQWAQ2odZccwu06QSKcDISHi4yplYcjlvQQqCvYweCs-&pixel_id=1000020818
Как написано на сайте, в конкурсе могут участвовать аспиранты и студенты из разных стран мира, в команде либо в одиночку. Участникам необходимо придумать яркую идею и воплотить в жизнь её прототип с помощью современных информационных технологий.
Этим постом, который является переработанной отекстовкой выступления Игоря Ашманова в рамках конференции Skolkovo Robotics Conference 2015 в Гиперкубе «Сколково» 21 марта, проект Лекси (ВК, FB) открывает серию постов о проекте, используемых технологиях, собственных разработках и пережитом опыте команды. Данный пост является своего рода вступлением, кратким обзором отрасли и озвучивает читателю ряд актуальных вопросов.