Pull to refresh
  • by relevance
  • by date
  • by rating

В браузере Firefox появилось голосовое управление

Firefox Browser extensions Browsers Voice user interfaces


Компания Mozilla добавила в браузер Firefox бета-версию голосового управления Firefox Voice. Функция позволяет искать информацию в интернете, переводить содержимое страниц, отправлять документы на печать. Если пользователь находится на странице, где есть видео или аудиотрек, он сможет использовать такие команды, как «Воспроизвести», «Пауза» или «Выключить звук». Также новая функция позволяет устанавливать таймеры и открывать карты. Помимо этого, с её помощью можно находить определенные вкладки, открывать новые и закрывать существующие. Кроме того, она позволяет выбирать, копировать и вставлять содержимое из буфера обмена. Пока что голосовое управление работает только на английском языке.
Читать дальше →
Total votes 11: ↑10 and ↓1 +9
Views 7.5K
Comments 10

Новое приложение — Friday — еще один шаг на пути к Siri

Development for Android *
Добрый вечер.
Еще совсем недавно отгремели интересные (а лично для меня — захватывающие) анонсы новой технологии 4s афона — Siri.
Спустя некоторое время один из андроид-программистов попробовал клонировать ее в Андроид, о чем можно почитать, например, здесь. При попытке связаться с разработчиком в ответ приходила ссылка на довольно интересное приложение — Friday, в которое планируют интегрировать Iris. О нем пару слов, с Вашего позволения.

Читать дальше →
Total votes 44: ↑34 and ↓10 +24
Views 768
Comments 51

«Ассистент Speaktoit» понимает и говорит по-русски

Smartphones IT-companies
Кажется, дождались. Персональный мобильный Ассистент Speaktoit научился русскому языку.

Ассистент имеет визуальное представление в виде персонажа (его можно менять) и отвечает на вопросы, заданные ему на естественном языке (текстом или голосом). Ассистент ищет информацию, выполняет задания, а также напоминает о событиях, используя доступную информацию о пользователе. При поиске информации по запросам пользователя и для выполнения задач ассистент взаимодействует с внешними сервисами.

В Google Play он бесплатный.
В AppStore за него хотят $0.99.
Ссылки на приложения в магазинах лежат на сайте производителя.
Обратите внимание, что и в Google Play, и в AppStore есть по два отдельных приложения — на русском и на английском.

Вот ссылки на русские версии:
Google Play AppStore
Читать дальше →
Total votes 27: ↑22 and ↓5 +17
Views 25K
Comments 45

Pocketsphinx. Распознавание речи и голосовое управление в Linux

Configuring Linux *
Tutorial
— Всё в порядке, Лёня?
Динамики отрегулированы на максимум, я морщусь, отвечаю:
— Да. Тише звук.
— Звук — тише, — соглашается «Виндоус-Хоум», — тише, тише…
— Хватит, Вика
С.Лукьяненко, «Лабиринт отражений»

Введение


В 1997-ом году Лукьяненко пророчил для десктопа сочетание CLI и голосового управления. Однако сейчас голосовое управление — достаточно узкая ниша.
Голосовое управление — взаимодействие с устройством при помощи звуковых команд. Не путайте это понятие с распознаванием речи. Для голосового управления достаточно, чтобы устройство реагировало на единственную нужную команду (ведь ваша собака не может работать машинисткой?). Распознавание речи — гораздо более глобальная проблема: в этом случае устройство должно преобразовывать в текстовый формат все слова, произнесенные вами. Как легко догадаться, распознавание речи на данный момент реализовано поверхностно относительно человеческих возможностей.
Функционал, рассмотренный в статье, может быть применен, к примеру, для организации модного сейчас «умного дома» или просто управления компьютером. Честно говоря, для описания управления компьютером хватило бы пары абзацев, но я попытаюсь показать вам основы работы с CMU Sphinx.
Кстати, процентов 70 описанного здесь подойдет и пользователям Windows.
Научим Linux слушаться?
Total votes 72: ↑63 and ↓9 +54
Views 116K
Comments 37

PixelTone: прототип графического редактора с голосовым управлением

Interfaces *
В Мичиганском университете совместно с Adobe Research создали прототип графического редактора, управляемого голосом и жестами. Прототип, названный PixelTone, пока умеет делать лишь самые простые операции и жесты. Он понимает простые команды и ориентируется в описательных терминах вроде «верх», «низ», «ярче», «темнее». Кроме того, он может запоминать названия объектов и имена людей на фотографиях, что позволяет использовать команды вроде «Сделай Васю чуть контрастнее».


Читать дальше →
Total votes 6: ↑6 and ↓0 +6
Views 3.1K
Comments 4

Идея. Конструктор сайтов в режиме диалога

Interfaces *

Описывая свою идею, всегда есть опасения, что она совсем не нова или ее реализация вообще невозможна по каким-то скрытым от тебя причинам. Тем не менее хочу предложить сообществу идею нового подхода в веб-разработке простых сайтов.

Сразу предупрежу, в посте речь пройдет про разработку «типовых сайтов». Понятно, чтобы разработать серьезный сайт или сервис необходимы глубокие знания и опыт. Но с разработкой блогов, сайтов-визиток, портфолио, каталогов, небольших магазинов и т.п., вполне мог бы справится среднестатистический пользователь интернета. Если бы знал «Как?»…

Идея


Суть в том чтобы разрабатывать сайт отдавая короткие команды на «почти естественном» языке. То есть на языке максимально близком к естественному (насколько позволит ИИ).

Вместо того чтобы изучать какой-то конструктор, учить терминологию, осваивать основы html/css/php/js/верстки/… и т.п. можно просто открыть понравившийся шаблон и начать его изменять простыми командами.

Читать дальше →
Total votes 20: ↑9 and ↓11 -2
Views 8.6K
Comments 25

Зачем роботу уши? (опрос: нужен ли OpenTod)

TOD corporate blog

Второй из законов робототехники, сформулированных небезызвестным американским писателем-фантастом Айзеком Азимовым, гласит, что робот должен повиноваться приказам, которые дает человек. Какими способами можно отдавать приказы роботу? Если верить большинству фантастических фильмов, то наиболее комфортным способом общения с роботом является естественная человеческая речь. Именно поэтому мы предоставили роботу Tod, как настоящему слуге человека, долгожданную возможность понимания голосовых команд управления и синтеза речи на русском языке. Теперь достаточно, например, отдать приказ «Робот, езжай на кухню», чтобы робот выполнил необходимую задачу. Под катом мы расскажем подробнее об используемом на роботе ПО для распознания и синтеза речи, а в видеороликах покажем примеры использования голосовых команд.
Вектор развития нашего проекта зависит от мнения хабрасообщества. Заинтересованы ли вы в использовании робота Tod как open source платформы для разработчиков? Пожалуйста, проголосуйте в нашем опросе.
Читать дальше →
Total votes 12: ↑11 and ↓1 +10
Views 9.1K
Comments 21

Оказалось, что Xbox One включается, когда слышит свою рекламу по телевизору

Information Security *
Понедельник, он же почти как пятница, поэтому он тоже достоин веселых новостей. Итак, игровая приставка Xbox One умеет распознавать голосовые команды (причем настолько хорошо, что в некоторых играх игрока могут оштрафовать за мат, но это другая история). Так вот, если рядом с приставкой произнести «Xbox On», она включится. Очень, надо сказать, удобно.



Теперь представьте развитие ситуации: вы смотрите телевизор. Во время рекламной паузы на экране появляется Аарон Пол (актер, игравший в «Во все тяжкие»). И, рекламируя приставку, Аарон показывает, как она включается по команде. Угадайте, что произойдет с вашей домашней консолью, которая в это время спит в пол уха? Правильно, она тут же влючится. И будет периодически пытаться это сделать, когда соответствующая реклама будет звучать по телевизору.
Читать дальше →
Total votes 82: ↑68 and ↓14 +54
Views 56K
Comments 61

Сверхбыстрое распознавание речи без серверов на реальном примере

Development for Android *
Tutorial

В этой статье я подробно расскажу и покажу, как правильно и быстро прикрутить распознавание русской речи на движке Pocketsphinx (для iOS порт OpenEars) на реальном Hello World примере управления домашней техникой.
Почему именно домашней техникой? Да потому что благодаря такому примеру можно оценить ту скорость и точность, которой можно добиться при использовании полностью локального распознавания речи без серверов типа Google ASR или Яндекс SpeechKit.
К статье я также прилагаю все исходники программы и саму сборку под Android.

Прикручиваем Pocketsphinx к своему Андроиду
Total votes 185: ↑182 and ↓3 +179
Views 316K
Comments 87

Ubi: избушка, повернись к лесу!

Geek To The Future corporate blog Programming *


Бытовыми устройствами, подключенными к интернету и связанными между собой, уже никого не удивишь: даже в России можно при желании прикупить термостаты-не-будем-говорить-какой-фирмы, управляемые по воздуху осветительные приборы или установить жалюзи, закрывающиеся тапом по смартфону. На очереди — управление домашним хозяйством с помощью голоса.

В последние годы Apple, Google и Microsoft щедро вкладываются в технологии распознавания речи, поощряя пользователей на все более частое и осмысленное голосовое общение с мобильными девайсами и игровыми консолями. Ubi, устройство, появившееся в продаже в Соединенных Штатах несколько дней назад, придает этой идее новое направление развития — пора попробовать отдавать команды бытовым приборам и системам умного дома (Ubi — от англ. ubiquitous computer, «вездесущий компьютер»).
Читать дальше →
Total votes 6: ↑4 and ↓2 +2
Views 6.8K
Comments 2

Немецкие ученые: программируем… без языков программирования

Geek To The Future corporate blog Programming *


Компьютеры «говорят» на собственном языке. И они могут быть запрограммированы только теми, кто знает этот язык-код. Специалисты в области вычислительных систем из Технологического института Карлсруэ (KIT) в настоящее время работают над программным обеспечением, которое сможет напрямую переводить естественный язык (как средство человеческого общения) в машинно-считываемый исходный текст.

Если исследователям удастся решить все стоящие перед ними проблемы, пользователи смогут создавать собственные компьютерные приложения, использовав набор фраз. Основная проблема, с которой предстоит справиться — люди не всегда описывают процессы в строго хронологическом порядке. Новый аналитический инструмент, разрабатываемый исследователями из KIT, служит для автоматического упорядочивания команд, после чего они могут быть выполнены компьютером.
Читать дальше →
Total votes 9: ↑4 and ↓5 -1
Views 10K
Comments 6

Распознавание речи в ROS при помощи Pocketsphinx и Kinect

Interfaces *
Sandbox
Распознавание речи является одной из самых важных способностей для робота поскольку позволяет управлять роботом посредством голоса. Можно дать роботу простую команду “Принеси пиво из холодильника” и при достаточных навыках робот может выполнить все необходимые операции, связанные с извлечением пива из холодильника и доставки его в нужное место.

В этой статье я хочу рассказать об установке и настройке всех необходимых драйверов и библиотек для распознавания голоса с использованием Pocketsphinx и сенсора Kinect Xbox 360 в качестве микрофона. Я выбрал пакет Pocketsphinx поскольку он является одним из самых популярных, имеет официальный пакет для ROS и имеет хорошие рекомендации.
Читать дальше →
Total votes 1: ↑1 and ↓0 +1
Views 5.5K
Comments 6

Голосовое управление компьютером и Python

Python *
Sandbox
Начитавшись разных постов о Google Voice и его использовании, решил написать что-то свое. А именно — голосовое управление компьютером. Сразу оговорюсь, что ОС — Windows.

Нам понадобится:

— Python 2.7
— библиотеки:
pyaudio
pycurl
pywin32
+ набор стандартных библиотек
— какой-либо аудиоконвертер поддерживающий flac и wav, а также работу из командной строки, я использовал этот.
Читать дальше →
Total votes 15: ↑11 and ↓4 +7
Views 39K
Comments 9

Windows 10 по 10. Выпуск #3. Использование Кортаны для взаимодействия с пользователями

Microsoft corporate blog Development for Windows Phone *Development for Windows *
В этом выпуске нашей серии статей Windows 10 по 10 мы расскажем, о том, как расширить опыт взаимодействия с вашим приложением в Windows 10 на те моменты, когда приложение даже не запущено. Тема прошлой статьи, — живые плитки и уведомления, — раскрывала один из возможных путей, сегодня мы посмотрим, как для этой задачи использовать Кортану, персональную помощницу в Windows 10. В качестве основы для приводимых фрагментов кода мы будем использовать пример AdventureWorks, доступный на GitHub.



В данной статье, мы постараемся разобраться, что же собой представляет Кортана, как сделать так, чтобы она поддержала осмысленное взаимодействие с вашими пользователями, что необходимо сделать для интеграции Кортаны в приложение, и далее рассмотрим два способа (из многих), как ваше приложение может взаимодействовать с пользователями в зависимости от сценария.

Читать дальше →
Total votes 22: ↑19 and ↓3 +16
Views 29K
Comments 12

Голосовое управление мультимедиа центром

PHP *Google Chrome Google API *
Sandbox
В этой статье хотелось бы описать свой опыт по применению web speech api в браузере Google Chrome для реализации голосового поиска и автоматического воспроизведения видеороликов с канала Youtube. Для демонстрации данного функционала нам понадобиться сделать следующие шаги:

  1. Установить набор: Apache2, PHP5(пакет curl обязательно).
  2. Иметь в наличии мультимедиа центр Dune HD или установить XBMC и настроить его для работы в сети INTERNET.
  3. Получить Youtube API Key для выполнения поисковых запросов.

Как сделать все вышеперечисленное, здесь описывать не буду, так как на эти темы полно статей. Принцип реализации такой:

  1. Распознаем фразу с помощью скрипта, написанного на JavaScript — работать будет только в Google Chrome.
  2. Ищем ролики, соответствующие поисковому запросу.
  3. Получаем прямые ссылки на ролики.
  4. Создаем плейлист из ссылок и названий роликов.
  5. Отправляем плейлист для воспроизведения на устройство.
Читать дальше →
Total votes 8: ↑8 and ↓0 +8
Views 11K
Comments 5

Голосовое управление умным домом на Z-wave через Siri

Development for IOT *
Идея поуправлять умным домом с помощью голосовых команд родилась уже давно. И в каких-то системах так или иначе это реализовано. Siri – хороший и удобный голосовой помощник для владельцев айфонов. Понимает человеческую речь, удобен. Но по причине закрытого протокола, не используется для голосового управления «умных» устройств. Хорошо, что у Apple есть HomeKit – некий «туннель» для приема команд умными устройствами от Siri.

image

В этой статье я опишу процесс установки и настройки шлюза для взаимодействия Siri с устройствами домашней автоматизации и расскажу про некоторые особенности разных версий.
Читать дальше →
Total votes 7: ↑7 and ↓0 +7
Views 19K
Comments 26

Битва титанов голосовой коммерции

PayOnline corporate blog Research and forecasts in IT Finance in IT
Translation
imageВ этой статье, переведенной командой процессинговой компании PayOnline, подробно описаны примеры интеграции инструментов голосового управления онлайн-покупками крупнейшими технологическими корпорациями США.

Google, Apple и Amazon сделали крупную ставку на голосовое управление как на движущую силу электронной коммерции будущего. Каждая из этих компаний уже выложила немало денег и приготовила крутые новые технологии для этого направления. Но эксперт Карен Уэбстер считает, что в назревающем коммерческом сражении победит не тот, кто больше всего раскошелится или предложит самые крутые девайсы. Победителем из этой схватки, вероятно, выйдет тот, кому удастся понять, как потребители на самом деле ищут нужные товары. По ее словам, все чаще это происходит не с помощью приложений из App Store или Google Play и даже не через строку поиска.

Читать дальше →
Total votes 18: ↑18 and ↓0 +18
Views 3.1K
Comments 5

Siri + Zway + Homebridge = Запуск двигателя

Development for IOT *
Добрый день, уважаемое сообщество! Идея поуправлять автозапуском родилась довольно спонтанно, все началось с того, как пару лет назад я приобрел себе автомобиль и встал вопрос об установке системы автозапуска. На протяжении прошедших двух зим (а зимы у нас холодные, т.к я живу в условиях приравненных к крайнему северу) я просыпался по утрам, выходил, заводил машину, шел домой, пил кофе, и ехал на работу. Этой зимой лень взяла свое, и я приобрел комплект автозапуска Starline sm32 с gsm и gps модулем. Автозапуск установлен, приложение скачано, все работает отлично! И тут я подумал: «Почему бы не подключить автозапуск к своей системе умного дома?».
Total votes 19: ↑19 and ↓0 +19
Views 12K
Comments 13

Amazon анонсировала новые проекты для разработчиков и «простых смертных»

Product Management *
image

30 ноября Amazon анонсировал новый ИИ-сервис. Это произошло на конференции AWS re:Invent в Лас-Вегасе. Компания потратила несколько лет на разработку инструментов машинного обучения для сторонних разработчиков. Пока доступно только три из них, но в дальнейшем их будет больше.

«Мы много занимаемся искусственным интеллектом в нашей компании. В этом направлении у нас работают тысячи сотрудников», – рассказал генеральный директор подразделения Amazon Web Services Энди Джэсси.
Читать дальше →
Total votes 24: ↑22 and ↓2 +20
Views 11K
Comments 8