Search
Write a publication
Pull to refresh

Comments 67

Надеюсь, что пропустят. Та программа, просто использует тот же движок, что и Siri. Да и американцы не сильны в русском.
Ну да, может дело и в вольфраме. Желаю удачи!
Сейчас попробую на айпаде запустить, а на айфон заснять. Если получится, выложу ссылку на youtube.
Это видео c ограниченным доступом.
Как его расшарить, подскажите?
ХЗ честно говоря. Сам не сталкивался ни разу.
Все, уже исправил. Смотрите.
А как же чисто отечественное «Вы что, не видите, я занята!» и «Для обработки этого запроса возьмите талон в соседнем окне в пятницу утром после полнолуния»? По-моему, весьма оригинальные сообщения об ошибках выйдут
Тогда уж «у меня голова болит»
Идея красивая. Когда ждать версию для дроида?
Вначале надо, чтоб эту apple пропустил. А там посмотрим.
Да даже если apple и не пропустит. Точнее — как раз если не пропустит, то будет особенно уместно выпустить для андроида. Дескать, не хотите конкуренции — так получите ;-).
Выпущу. Просто буду решать проблемы по мере их возникновения. Сначала завершу эпопею с Apple, потом займусь андроидом. А там, глядишь, и да windows phone дело дойдет.
Могу помочь в портировании на Android )
Не хочу загадывать наперед. Не уверен, что сервер выдержит реализацию под iPhone. Если не упадет, то буду думать про андроид.
Мм, на андроид маркет легче пролезть)
Под андроид могу порекомендовать play.google.com/store/apps/details?id=com.luitech.remindit&feature=search_result#?t=W251bGwsMSwxLDEsImNvbS5sdWl0ZWNoLnJlbWluZGl0Il0.

Записывает todo голосом и напоминает в нужное время. Супер программа. Вечером еду в авто — надиктовываю голосом задачи на следующий день. Она распознает и напоминает в нужное время.
Спасибо большое, офигеный софт :)
Да, отличная вещь. Особенно если докупить функцию синхронизации с гугл-календарем.
Под Android есть практически все, но это не значит, что разрабатывать для него не стоит.
Вероятно, надо добавить «в том или ином виде». Много сталкивался, что программа «почти хороша», но — все же без блеска. В т.ч. и потому, что разработчик подчас — не многомиллиардная корпорация, а отдельный человек/группа, и у них нет дизайнера, нет (как в случае с голосовым движком) отряда лингвистов. С другой стороны, сравниваешь продукты одиночки и мегакорпорации, и порой обидно за корпорацию — «с такими-то ресурсами, и всего настолько лучше получилось?»
Ох, классная реализация! Я полгода назад мучался со Sphinx4 (и его упрощённой версией), в итоге забил.
Попробую ispeech
Чат-бота прикрутите, чтобы можно было «просто поболтать» :)
Прикручу, конечно. Вот как раз с просто поболтать нет проблем, а вот чтоб полезную информацию выдавала- это труднее.
Ага, едешь в машине, в пробке скучаешь — есть с кем поговорить.

А еще можно ГИБДДнику в окно выставить, если что — пусть друг друга лечат.
О большое спасибо!!! Прочту обязательно.
А чем вы записываете звук?
Стандартно с микрофона обычный recorder.
Может быть можно настроить формат звука при записи? Вроде как AVAudioRecorder это может. У него есть settings-словарь.
Там вроде формат записи или WAVE или CAF
А во сколько обошлась лицензия на технологии ispeech.org?
Для iphone бесплатно (хотя наверняка есть какие ограничения), но при использовании их SDK.
Как раз сегодня по теме видел
Youtube
На 99% уверен, что фейк.

А вот Ваша работа впечетляет. Отлично! Продолжайте развиваться :)

Может и не фейк, но путь ему в App Store закрыт. Они просто ломанули сири.
Да, есть такое. В процессе формирования ответа задействованы 3 сервера. Из за этого и «тормоза».
Почему бы не попробывать ответы бота, отправлять cылку на translate.google.com, там можно вытянуть файлик с произношением.
Тобишь посылаем ответ на клиент текстом, а клиент уже формирует ссылку и забирает файлик с гугла. Конечно рано или поздно прикроют, но разгрузить свой сервер на время можно и повысить скорость ответа можно.
Можно попробовать. Но (1) Там ограничение 100 символов. (2) Остается вопрос о лицензионной чистоте такой операции. Да и скорости такое решение не прибавит.
Нужно читать пользовательское соглашение с гуглом.
Но если уж развивать по серьзному то нужен свой выделенный сервер и покупка речевого движка под него. Тогда скорость существенно возрастет. Но это не малые затраты.
«И если подключить к Siri все гаджеты Apple, сервера просто рухнут.»
— смеялся с этого до слез. Чего чего, а уж серверов думаю Эпл не жалко :)
Гуглу — может быть, у них отлаженная инфраструктура
А вот у Яббла специализация чуточку другая. Они вроде пока только собирались строить вычислительный центр к 2013 году. Да и вообще, пожизненное право пользование Siri при единовременной оплате — это весьма существенная уступка
А не подскажете, где словари для программ-болталок брали?
Вообще, в iOS 5.1 уже вроде встроили API speech-to-text, может так проще будет. Не уверен насчёт русского.
Помоему, только на iPhone 4S эта фича будет работать (незнаю насчет The new iPad). В доке про это сказано.
Может стоило к ней еще wikipedia прикрутить?
Попробуйте для синтезации голоса VitalVoice, у него более вменяемое произношение, а то у Кати оно немного походит на дислексичку.
Спасибо, отправил им запрос. А какие у них расценки?
Расценки у нас простые: 1 доллар = 1 минута речи.
Этот тариф подходит для наших основных клиентов — call-центров.
Но поскольку к нам сейчас обращается множество стартапов, объем трафика которых не всегда предсказуем, — общаемся в индивидуальном порядке, что конечно не есть хорошо…

Типичный пример коммуникации выглядит следующим образом:
— Дайте ключ API!
— Для каких целей?
— Хочу озвучивать свое шоу/видео/аналог siri/переводчик и т.п. Я даже готов платить. Сколько стоит?
— Есть стандартный тариф — доллар минута. Но в зависимости от ваших нагрузок, мы можем сделать для вас индивидуальный тариф.
— Вы офигели?! Для меня это дорого.
— Спрогнозируйте ваши приблизительные месячные нагрузки.
— …

обычно на этом этапе коммуникация обрывается.

Мы, понятно, не Google, и о нагрузках на сервер беспокоимся в первую очередь. Понятно, что о наших затратах на сервера молодой и активный стартапщик, готовый прям сейчас захватить мир, и которому мешают всякие поставщики технологий, которые зажимают товар, — не думает по определению.

Стараемся разрулить…
Спасибо большое сейчас протестирую.
Надо просто скорость речи увеличить немного.
Знаете, я попал впросак. Около трёх месяцев назад там была тестовая страничка, где можно было набрать текст не более 250 символов длиной. Думаю, вам бы сгодилось, дал ссылку, а там, оказывается, уже API для разработчиков без теста.
Ничего, я им запрос отправил.
Произвольный текст можно ввести на сервисе открыток. Используется обязательная музыкальная подложка и ограничение по количеству символов… уж извините.
>> Я прекрасно понимаю, что для создания действительно чего то похожего на Siri, нужны гигантские ресурсы и много средств.

Ресурсы на что? Вообще, что у сири уникального, своего? Распознавание — ньюанс. Парсинг — вольфрам. Поиск — гугл, бинг и еще кто-то там. Не знаю, правда, на счет генерации, но не удивлюсь если тоже не их. Так что в них такого инновационного? :)
Sign up to leave a comment.

Articles