Как стать автором
Обновить

Комментарии 67

Надеюсь, что пропустят. Та программа, просто использует тот же движок, что и Siri. Да и американцы не сильны в русском.
Ну да, может дело и в вольфраме. Желаю удачи!
Вы упустили видео-демонстрацию.
Сейчас попробую на айпаде запустить, а на айфон заснять. Если получится, выложу ссылку на youtube.
Добавил видео, глядите.
Это видео c ограниченным доступом.
Как его расшарить, подскажите?
ХЗ честно говоря. Сам не сталкивался ни разу.
Все, уже исправил. Смотрите.
Добавил еще одно видео
А как же чисто отечественное «Вы что, не видите, я занята!» и «Для обработки этого запроса возьмите талон в соседнем окне в пятницу утром после полнолуния»? По-моему, весьма оригинальные сообщения об ошибках выйдут
Тогда уж «у меня голова болит»
image
Идея красивая. Когда ждать версию для дроида?
Вначале надо, чтоб эту apple пропустил. А там посмотрим.
Да даже если apple и не пропустит. Точнее — как раз если не пропустит, то будет особенно уместно выпустить для андроида. Дескать, не хотите конкуренции — так получите ;-).
Выпущу. Просто буду решать проблемы по мере их возникновения. Сначала завершу эпопею с Apple, потом займусь андроидом. А там, глядишь, и да windows phone дело дойдет.
Могу помочь в портировании на Android )
Не хочу загадывать наперед. Не уверен, что сервер выдержит реализацию под iPhone. Если не упадет, то буду думать про андроид.
Мм, на андроид маркет легче пролезть)
Под андроид могу порекомендовать play.google.com/store/apps/details?id=com.luitech.remindit&feature=search_result#?t=W251bGwsMSwxLDEsImNvbS5sdWl0ZWNoLnJlbWluZGl0Il0.

Записывает todo голосом и напоминает в нужное время. Супер программа. Вечером еду в авто — надиктовываю голосом задачи на следующий день. Она распознает и напоминает в нужное время.
спасибо, завтра попробую!
Спасибо большое, офигеный софт :)
Да, отличная вещь. Особенно если докупить функцию синхронизации с гугл-календарем.
под Андроид есть Кири (Kiri)
Под Android есть практически все, но это не значит, что разрабатывать для него не стоит.
Вероятно, надо добавить «в том или ином виде». Много сталкивался, что программа «почти хороша», но — все же без блеска. В т.ч. и потому, что разработчик подчас — не многомиллиардная корпорация, а отдельный человек/группа, и у них нет дизайнера, нет (как в случае с голосовым движком) отряда лингвистов. С другой стороны, сравниваешь продукты одиночки и мегакорпорации, и порой обидно за корпорацию — «с такими-то ресурсами, и всего настолько лучше получилось?»
Ох, классная реализация! Я полгода назад мучался со Sphinx4 (и его упрощённой версией), в итоге забил.
Попробую ispeech
Чат-бота прикрутите, чтобы можно было «просто поболтать» :)
Прикручу, конечно. Вот как раз с просто поболтать нет проблем, а вот чтоб полезную информацию выдавала- это труднее.
Ага, едешь в машине, в пробке скучаешь — есть с кем поговорить.

А еще можно ГИБДДнику в окно выставить, если что — пусть друг друга лечат.
О большое спасибо!!! Прочту обязательно.
А чем вы записываете звук?
Стандартно с микрофона обычный recorder.
Может быть можно настроить формат звука при записи? Вроде как AVAudioRecorder это может. У него есть settings-словарь.
Там вроде формат записи или WAVE или CAF
А во сколько обошлась лицензия на технологии ispeech.org?
Для iphone бесплатно (хотя наверняка есть какие ограничения), но при использовании их SDK.
Как раз сегодня по теме видел
Youtube
На 99% уверен, что фейк.

А вот Ваша работа впечетляет. Отлично! Продолжайте развиваться :)

Может и не фейк, но путь ему в App Store закрыт. Они просто ломанули сири.
Слишком много думает)
Да, есть такое. В процессе формирования ответа задействованы 3 сервера. Из за этого и «тормоза».
Почему бы не попробывать ответы бота, отправлять cылку на translate.google.com, там можно вытянуть файлик с произношением.
Тобишь посылаем ответ на клиент текстом, а клиент уже формирует ссылку и забирает файлик с гугла. Конечно рано или поздно прикроют, но разгрузить свой сервер на время можно и повысить скорость ответа можно.
Можно попробовать. Но (1) Там ограничение 100 символов. (2) Остается вопрос о лицензионной чистоте такой операции. Да и скорости такое решение не прибавит.
Нужно читать пользовательское соглашение с гуглом.
Но если уж развивать по серьзному то нужен свой выделенный сервер и покупка речевого движка под него. Тогда скорость существенно возрастет. Но это не малые затраты.
«И если подключить к Siri все гаджеты Apple, сервера просто рухнут.»
— смеялся с этого до слез. Чего чего, а уж серверов думаю Эпл не жалко :)
Гуглу — может быть, у них отлаженная инфраструктура
А вот у Яббла специализация чуточку другая. Они вроде пока только собирались строить вычислительный центр к 2013 году. Да и вообще, пожизненное право пользование Siri при единовременной оплате — это весьма существенная уступка
А не подскажете, где словари для программ-болталок брали?
Вообще, в iOS 5.1 уже вроде встроили API speech-to-text, может так проще будет. Не уверен насчёт русского.
Помоему, только на iPhone 4S эта фича будет работать (незнаю насчет The new iPad). В доке про это сказано.
Может стоило к ней еще wikipedia прикрутить?
Попробуйте для синтезации голоса VitalVoice, у него более вменяемое произношение, а то у Кати оно немного походит на дислексичку.
Спасибо, отправил им запрос. А какие у них расценки?
Расценки у нас простые: 1 доллар = 1 минута речи.
Этот тариф подходит для наших основных клиентов — call-центров.
Но поскольку к нам сейчас обращается множество стартапов, объем трафика которых не всегда предсказуем, — общаемся в индивидуальном порядке, что конечно не есть хорошо…

Типичный пример коммуникации выглядит следующим образом:
— Дайте ключ API!
— Для каких целей?
— Хочу озвучивать свое шоу/видео/аналог siri/переводчик и т.п. Я даже готов платить. Сколько стоит?
— Есть стандартный тариф — доллар минута. Но в зависимости от ваших нагрузок, мы можем сделать для вас индивидуальный тариф.
— Вы офигели?! Для меня это дорого.
— Спрогнозируйте ваши приблизительные месячные нагрузки.
— …

обычно на этом этапе коммуникация обрывается.

Мы, понятно, не Google, и о нагрузках на сервер беспокоимся в первую очередь. Понятно, что о наших затратах на сервера молодой и активный стартапщик, готовый прям сейчас захватить мир, и которому мешают всякие поставщики технологий, которые зажимают товар, — не думает по определению.

Стараемся разрулить…
Спасибо большое сейчас протестирую.
Надо просто скорость речи увеличить немного.
Знаете, я попал впросак. Около трёх месяцев назад там была тестовая страничка, где можно было набрать текст не более 250 символов длиной. Думаю, вам бы сгодилось, дал ссылку, а там, оказывается, уже API для разработчиков без теста.
Ничего, я им запрос отправил.
Спасибо. И им отпишусь
Произвольный текст можно ввести на сервисе открыток. Используется обязательная музыкальная подложка и ограничение по количеству символов… уж извините.
>> Я прекрасно понимаю, что для создания действительно чего то похожего на Siri, нужны гигантские ресурсы и много средств.

Ресурсы на что? Вообще, что у сири уникального, своего? Распознавание — ньюанс. Парсинг — вольфрам. Поиск — гугл, бинг и еще кто-то там. Не знаю, правда, на счет генерации, но не удивлюсь если тоже не их. Так что в них такого инновационного? :)
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории