Pull to refresh
  • by relevance
  • by date
  • by rating

Google опубликовал пособие по Voice Playbook для разработчиков conversational AI

Neuro.net corporate blog Artificial Intelligence Voice user interfaces

Корпорация Google недавно выпустила интерактивную публикацию, которая демонстрирует процесс работы обычных пользователей с голосовыми технологиями. Это своеобразное пособие по голосовому UI еще и подсказывает различные идеи представителям отрасли. В основе материала от Google - идея разработки оптимальной голосовой технологии, которая позволит привлечь гораздо больше людей в онлайн в рамках стратегии Google Next Billion Users. Подробности о пособии по голосовым технологиям от Google — под катом.

Читать далее
Total votes 9: ↑9 and ↓0 +9
Views 709
Comments 0

Epic выпустила голосовой чат Voice и сделала бесплатным античит Easy

Software Games and game consoles

Компания Epic Games выпустила два бесплатных инструмента для разработчиков видеоигр — античит Easy и голосовой чат Voice. Они стали частью набора Epic Online Services — инструменты из этого набора можно использовать со всеми игровыми движками на всех актуальных платформах — Windows, Mac, Linux, PlayStation, Xbox, Nintendo Switch, iOS и Android.

Читать далее
Total votes 13: ↑13 and ↓0 +13
Views 933
Comments 0

Всё ли сделал? А молоко — купил?

Self Promo
Почему такой странный заголовок? При чём тут молоко? Дело в том, что в сервисе голосового доступа Вселисделал появилась поддержка веб-приложения Remember the Milk. Фанатов сервиса я прошу подождать следующего поста, там мы расскажем подробно обо всех возможностях добавления записей голосом в РТМ. Этот пост посвящается тем, кто ещё не очень хорошо знает, что такое Remember the Milk.


Читать дальше →
Total votes 34: ↑26 and ↓8 +18
Views 720
Comments 16

Pliq.me крошка…поговори со мной!

Self Promo
image

Лучший способ набрать текст на телефоне – это сказать его.


С прошлой недели доступен в закрытом тестировании новый проект Pliq.me, позволяющий с помощью небольшого приложения и большой серверной части создавать голосом короткие текстовые сообщения на вашем телефоне для SMS, E-mail, напоминаний, записей в Twitter, Evernote или просто быстрых заметок.
Читать дальше →
Total votes 41: ↑37 and ↓4 +33
Views 529
Comments 93

Инвайты на Google Voice уже доступны студентам

IT-companies
Translation
Вы учитесь в одном из американских учебных заведений? Или имеете друзей «там»?
Google раздаёт приглашения в Google Voice всем студентам, кто имеет почту в домене .edu
Подробности
под катом
Total votes 72: ↑52 and ↓20 +32
Views 413
Comments 48

Google Voice в Gmail

IT-companies
Google добавил службу звонков на стационарные и мобильные телефоны в Gmail

image

Цены на звонки по России сравнимы со Skype

image

Ищите в своем Gmail.

Остальные цены

UPD: как сообщают ниже, сервис может не работать в Русской версии Gmail.
Total votes 72: ↑39 and ↓33 +6
Views 1.9K
Comments 56

Ближайшее будущее Wi-Fi: сертификация Voice Enterprise

Network technologies *Wireless technologies *
В прошлой статье мини-цикла мы говорили о 802.11ac, в этой — поговорим о сертификации Voice Enterprise: что это такое, и зачем она нужна.

Голос в беспроводных сетях прошел примерно через тот же тернистый путь, что и в сетях проводных: изначально никто и не собиралсяпередавать по этому что-то вроде голоса и видео; потом была поставлена задача, пришлось изобретать новые протоколы и прикручивать дополнительные расширения к существующим; в итоге всё заработало.
Технологии более-менее качественной передачи голоса по Wi-Fi существуют достаточно давно, но построение качественной сети для VoWLAN до сих пор является весьма тяжелой задачей. И даже не из-за тонкостей радиопланирования и тюнинга QoS – банально, проблемой является подбор железа!
Читать дальше →
Total votes 6: ↑6 and ↓0 +6
Views 11K
Comments 2

Клиническая обработка сигналов речи и машинное обучение. Часть 1

Algorithms *
Sandbox

Из выступления Max Little (основателя PVI) на конференции TED в 2012 году.

Здравствуй, Хабрахабр. Данный цикл статей будет посвящен рассмотрению возможности и построению Open Source универсального анализатора нарушений речи.

В данной статье будет рассказано о проекте Parkinson Voice Initiative, посвященному ранней диагностике Болезни Паркинсона по голосу (успешность распознавания составляет 98,6± 2.1% за 30 секунд по телефонному разговору).

Будет произведено сравнение точности используемых в нем алгоритмов выбора особенностей (ВО) – Feature Selection Algorithm – LASSO, mRMR, RELIEF, LLBFS.

Битва между Random Forest (RF) и Supported Vector Machine (SVM) за звание лучшего анализатора в данного рода приложениях.

Начало


Читая статьи по синтезу и распознаванию речи, нашел упоминание о том, что при болезни изменяется голос. Проверив очевидность факта, что я не первый догадался использовать распознавание речи для диагностики болезней (первые клиницисты определили некоторые features — особенности еще в 40-х годах прошлого века, записывая на магнитофонную ленту, а потом вручную анализируя), пошел по ссылкам Гугла. Одна из первых указывала на проект PVI.


Читать дальше →
Total votes 25: ↑22 and ↓3 +19
Views 7K
Comments 2

Аутентификация и идентификация по голосу с помощью когнитивных сервисов Microsoft

Development of mobile applications *Development for Windows Phone *Microsoft Azure Development for Windows *
Tutorial

Когнитивные сервисы представляют доступ к различным облачным сервисам, которые позволяют работать с визуальной, голосовой и текстовой информацией. Кроме того, доступны различные поисковые функции Bing.

Для того, чтобы попробовать когнитивные сервисы в действии даже не обязательно иметь аккаунт Microsoft. Получить пробный ключ можно и с помощью аккаунта GitHub или LinkedIn. Пробная подписка не ограничена по времени, но ограничена по количеству используемых ресурсов за период. Ознакомиться с онлайн демонстрацией можно по адресу: Speaker Recognition API

Далее идет описание того как опробовать в действии аутентификацию пользователя с помощью голоса. Хоть сервис еще и в состоянии preview, но, несмотря на это, уже довольно интересен.
Сервис может быть использован из различных платформ, но я буду рассматривать создание C#/XAML приложения UWP.
Читать дальше →
Total votes 17: ↑17 and ↓0 +17
Views 7.5K
Comments 3

Краудфандинг технологии звукового зрения vOICe — для слепых и не только

Crowdsourcing Wearable electronics DIY Medical gadgets The future is here
Ушами можно любить, на них можно вешать лапшу. А ещё ушами можно… видеть.

Много лет назад голландец Питер Мейер, сотрудник научно-исследовательского отдела компании Philips, начал работу над проектом Seeing With Sound, призванным заменить зрение незрячим людям. Идея была весьма необычной и на первый взгляд довольно спорной. Человеческий мозг довольно пластичен. И если превратить изображение с камеры в звуковую последовательность — возможно, после тренировок мозг пользователя сможет научиться воспринимать скрежещаще-свистящую трель не как звук, а как монохромную картинку и различать тёмные и светлые участки этого «аудио-изображения». На первый взгляд, идея неочевидная. Но её авторы сумели найти единомышленников и рискнули собственным временем и потраченными на оборудование деньгами. Так родилась система «звукового» зрения vOICe – (аббревиатура из трех заглавных букв звучит как «Oh I See»).

image

По отзывам экспериментаторов, после долгих и регулярных тренировок незрячие люди, пользующиеся vOICe'ом, могли передвигаться в помещениях, не натыкаясь на предметы, и даже читать крупный текст, например надписи на вывесках.

Такой проект не мог не привлечь внимание трансгуманистического сообщества РТД еще в 00-х, но только к середине 10-х прогресс железа и интернет-ресурсов позволил дать разработке vOICe новый импульс и организовать кампанию на Boomstarter, которая сегодня успешно завершается более чем на 100%. Базовый проект предусматривает создание 5 пилотных экземпляров системы для слепых пользователей плюс их обучение, но если кто-нибудь желает помочь еще одному человеку с ограниченными возможностями стать немножко Бэтменом, а заодно получить софт и обучающие материалы для экспериментов и сувенир на память, то это можно успеть сделать до 20:34 MSK 4 августа. Более подробно о проекте можно почитать на странице кампании, а сейчас несколько слов об истории его разработки от Яны Артищевой ака telegamochka:
Читать дальше →
Total votes 10: ↑8 and ↓2 +6
Views 3.9K
Comments 14

Звуковое зрение vOICe – в шаге от прорыва

iCover.ru corporate blog Gadgets Biotechnologies AR and VR Medical gadgets
"Все предметы обладают своим уникальным звуком, и как только вы поймете принцип действия системы, вы сможете "видеть", что вас окружает". До относительно недавнего времени это удивительное свойство окружающего нас мира существовало в отрыве от практического применения. Благодаря Питеру Мейеру, работающему в отделе исследований и разработок голландской компании Philips был составлен уникальный алгоритм, позволяющий буквально превратить звук в картинку. После нескольких десятков лет поиска возможности воплотить идею Мейера “на аппаратном” уровне было создано устройство, позволяющее наделить слепого человека т. н. ”суррогатным” зрением. Об успехах, проблемах и перспективах проекта, реализуемого сегодня командой российских ученых – энтузиастов, мы остановимся в нашей статье.

vOICe
Читать дальше →
Total votes 22: ↑20 and ↓2 +18
Views 10K
Comments 31

Что нужно незрячему? Обзор слепоглухого эксперта Сергея Флейтина

Реабилитационная индустрия России corporate blog Gadgets Biotechnologies Wearable electronics Medical gadgets
Качество продукции в конечном итоге определяет пользователь. Реабилитационная индустрия при всех её особенностях – не исключение. Об этом свидетельствует опыт множества проектов, как успешных, так и оставшихся в истории.



Наш сегодняшний гость уже много лет изучает отрасль и её продукцию. Интерес Сергея Флейтина к техническим средствам реабилитации незрячих людей носит не только личный характер, но и профессиональный. В прошлом тотально слепой Сергей работал экспертом по ТСР Европейского союза слепоглухих и был генеральным секретарём этой организации, а сегодня занимает должность вице-председателя благотворительного фонда «Творческое Объединение «Круг».

Сергей Флейтин один из немногих незрячих россиян, который на себе опробовал большинство существующих средств реабилитации и ассистивных устройств. Некоторые разработки стали верными спутниками Сергея, каждый день помогая ему в быту, а другие пылятся в дальнем углу после первого же использования.
Читать дальше →
Total votes 23: ↑20 and ↓3 +17
Views 5.4K
Comments 11

VoiceOver на iOS: каждый контрол ведёт себя по-разному

Dodo Engineering corporate blog Development for iOS *Development of mobile applications *Accessibility *
Привет, Хабр! Недавно я говорил про адаптацию приложений для незрячих и неподвижных людей. И не договорил!

Сегодня расскажу, как изменить поведение контролов с помощью accessibilityTraits и сделать жизнь незрячих чуть удобней. Знать работу этих трейтов (traits) важно, чтобы не писать свои костыли.


Total votes 16: ↑16 and ↓0 +16
Views 2.6K
Comments 7

VoiceOver на iOS: решение типовых проблем

Dodo Engineering corporate blog Development for iOS *Development of mobile applications *Accessibility *Mobile applications design *
Когда берёшься адаптировать приложение для незрячих, часто что-то идёт не так: то порядок собьётся, то фокус не туда встанет. С другой стороны, есть UX, который легко пропустить, потому что не знаешь про возможные проблемы. В этой статье будем разбираться с типовыми проблемами и их решением.


Читать дальше →
Total votes 10: ↑10 and ↓0 +10
Views 1.9K
Comments 0

Как встроить голосового помощника в любое мобильное приложение. Разбираем на примере Habitica

Just AI corporate blog Development of mobile applications *Development for Android *Kotlin *Voice user interfaces
Tutorial
Вам не кажется, что многие мобильные приложения стали бы куда удобнее, будь в них голосовое управление? Нет, речь не о том, чтобы вести беседы с банковским ассистентом в чате техподдержки. В основном было бы достаточно голосовой навигации по приложению или form-filling в режиме диалога.

На примере Habitica (опенсорсный app для закрепления привычек и достижения целей, написан на Kotlin) Виталя Горбачёв, архитектор решений в Just AI, показывает, как быстро и бесшовно встроить голосовой интерфейс в функционал любого приложения.


Читать дальше →
Total votes 2: ↑2 and ↓0 +2
Views 3.4K
Comments 7

NetBox как Voice и UC Source of Truth

Abnormal programming *System administration *Network technologies *

Привет Хабр! Доводилось ли вам испытывать трудности с документацией на корпоративные Voice и Unified Communications инфраструктуры?


  • Что это за номер? Откуда он приходит?
  • Этот SIP-транк еще актуален?
  • В каком из этих Excel-файлов нужная мне информация?
  • Есть у нас свободный городской номер для новой услуги?
  • Телефонные_номера_новый_072019(3).xlsx?!

Звучит до боли знакомо? Есть вариант, который может с этим помочь.
Всем заинтересовавшимся добро пожаловать под кат!

Читать дальше →
Total votes 5: ↑5 and ↓0 +5
Views 1.2K
Comments 6

Разрабатываем своего первого голосового ассистента на iOS

VS Robotics corporate blog Development for iOS *Voice user interfaces
Tutorial

За последнее время значимость голосовых функций и звука значительно выросла. Примером тому может служить уже громкая история запуска приложения Clubhouse, голосовых ассистентов Сбера и общего оживления интереса со стороны пользователей, компаний и инвесторов к звуку на мобильных устройствах.

На мой взгляд, звук как интерфейс между пользователем и приложениями, изначально был недооценен, однако с появлением технологий искусственного интеллекта, высокой информационной нагрузки и нехватки времени, польза аудио становится очевиднее.

В этой статье я бы хотел рассмотреть пример разработки голосового помощника на платформе iOS, используя язык Swift.

Читать далее
Total votes 5: ↑5 and ↓0 +5
Views 1.3K
Comments 2

И чат, и бот, и логопед. Как разработать сервис на основе ML для диагностики дефектов речи у детей

Machine learning *Artificial Intelligence

«Шла Саша по шоссе», «Скажи: рррррыба», «Кукушка кукушонку...» – знаете, да, эти фразы, травмировавшие нас всех в детстве? Это был какой-то бесконечный эксперимент родителей с неоформленным желаемым результатом и главное – страхами, что их ребенок растет с дефектом речи. 

Привет! Меня зовут Дима Пухов, я технический директор в Cleverbots. Хочу рассказать, как мы учили чат-бот распознавать дефекты речи и добились 80% точности в диагнозах ИИ-логопеда.

Читать далее
Total votes 4: ↑4 and ↓0 +4
Views 1.4K
Comments 7