Мне нравится приложение, да и русского аналога я еще не видел, будет пользоваться популярностью.
К серверам стало подключаться быстрее. Над дизайном стоит еще поработать, я так думаю. Имя «Катя» это у всех такое имя?)
Сделайте API, чтобы можно было свои сервисы подключать к вашей программе. Приезжает запрос, вы дёргаете партнёров, партнёры вам отвечают свои предложения, выбираете наилучшее и показываете юзеру. Получится убийца Siri. С серверной частью могу помочь.
Мне кажется, что время ответа очень увеличится. Лучше сразу договориться с партнерами. Приходит запрос, идет обращение к АПИ партнера и выводится ответ.
Мыслите шире. Вы предоставляете уникальный сервис. Поставщики контента будут вас упрашивать подключить их. Они подстроятся под любой ваш каприз. Придумайте удобный для вас API и опубликуйте его.
По сути, должен быть всего один запрос — вы передаёте строчку, вам отвечают небольшим документиком — ключевые слова, по которым распознался запрос, и сам ответ — текст, ссылка, координаты на карте или ещё какие-то типы контента, которые вы сами определите. Вы потом ранжируете ответы по каким-то признакам и возвращаете клиенту лучшие варианты.
Если Java знаете особых проблем не будет. Насколько я помню там при записи уже можно выбрать низкое качество и записывать можно в amr вес будет в 10 раз меньше чем тут выходило и при перекодировке затрат меньше.
Имхо лучше всего сконцентрироваться на возможностях яндекса по поиску близлежащих объектов типа общепита и транспорта, прокладке маршрутов с учетом пробок, а также на сокращении роли серверной составляющей в обработке запросов. Даже если последнее сильно замедлит быстродействие и увеличит жор батареи, все равно это улучшит рентабельность, что для стартапа не последнее дело.
А уже при платной подписке можно как угодно обрабатывать запрос, фокусируясь на времени и точности обработки.
Вот пробки пока не может, не научил еще. Думаю это будет тяжеловато.
Ведущая роль была отдана серверу по нескольким причинам: 1. очень сложно проходить ревю у apple всяким аналогам сири;2. не все всегда часто обновляют программу, а тут изменил код на сервере и добавил функционал.
Насчет быстродействия Вы не правы, предыдущая версия подтормаживала и вызывала много нареканий, ни кто не хотел общаться с «тормознутой».
Но никто не сможет общаться если вам еще на стадии тестирования понадобится мощный кластер и канал в 500 мегабит.
на счет апстор да, возможно, но может они пропустят аналог для России, особенно если сделать так чтобы работало только в России (Российском апсторе).
Трафик такой: с телефона на сервер передается Wave файл, в среднем где то 100-150 Кб. После конвертации во flac размер уменьшается процентов на 40. И уже flac «скармливаю» гуглу. Ссылку на mp3 поток передаю на телефон и он ее воспроизводит сам, тут сервер не задействован. Так что для обработки одного запроса трафика не много.
Ну я на сервере так и запускаю flac из консоли. Просто для того чтоб использовать эту библиотеку в iPhone она должна быть предназначена для работы под arm7, а все что мне удавалось находить было под i386. А я, боюсь, не обладаю такими знаниями, чтоб самому скомпилить библиотеку из исходников под arm7
Еще не предлагали. Думаю и не предложат. Сама то задача не сложная: речевой движок, база знаний, быстрые сервера и немного лингвистики. Apple, если бы захотела, русифицировала бы Сири запросто. Наверное у Apple какие то свои планы, о которых мы не знаем.
В России даже AppleStore нет и не будет, продажи новых устройств в россии происходят после всех остальных стран, а вы удивляетесь почему они русифицировать Сири не спешат. Им не особо интересен наш рынок и погоды не делает. Даже в маленькой Польше все есть, а у нас нет.
По поводу бронирования отелей и гостиниц… можно к нам обращаться в www.aviasales.ru.
Будем рады сотрудничеству, к тому же и по нашей партнёрской программе будут свои «плюсы» :)
Посмотрел Ваш сайт. Интересно. А АПИ у Вас есть? Например телефон передает текущее месторасположение и город куда хочет улететь, а с сайта получает страничку сверстанную под мобильный уже с готовым поиском?
Да, API у нас есть. И по расположению ищет. А также по фразе из google, например: www.google.com/webhp?q=site:aviasales.ru+авиабилеты+иркутск+магадан#hl=en&output=search&sclient=psy-ab&q=site:aviasales.ru+авиабилеты+иркутск+магадан&oq=&aq=&aqi=&aql=&gs_l=&pbx=1&bav=on.2,or.r_gc.r_pw.r_cp.r_qf.,cf.osb&fp=97b893ac5db2d6bb&biw=1439&bih=679 идёт автокомплит.
Полнотекстовый поиск есть, его надо немного доработать, чтобы лишние слова не мешали искать рецепты. И у нас база не очень большая — цезаря там нет, к сожалению.
Это дело используется в приложении Talking Tom cat.
Единственное замечание — надо добавить настройки для того, чтобы увеличить/уменьшить максимальную паузу между словами.
Я как понимаю серверная часть на php? Если вдруг на python — пишите, помог бы :)
Реализация (судя по скриншотам) очень неплохая, но пока-что нехватает всяких штучек для интеграции ответов (как вы описали с погодой, парсить все подряд :)
Гугл принимает голосовой запрос потоком, а как оно будет работать без вайфая и сжатия, с перекодированием на стороннем сервере — страшно подумать О_о Отправлять такое в аппстор вообще самоубийство, как ваш сервер выдержит нагрузку?
Интересно было бы реализовать именно кодирование на телефоне, родное гугловое приложение с этим отлично справляется даже на самом первом айфоне.
По Wi Fi работает нормально, по 3G тоже, конечно при GPRS интернете притормаживает, а без подключения к интернет, вообще не работает. Дальше я не понял вопроса про что Вам страшно думать.
Если Вам что то интересно реализовать, берите и реализовывайте, в чем проблема?
Ну не поняли, ничего страшного. Поймёте позже, когда ваш сервер ляжет под нагрузкой. Передавать через сервер — тупиковый путь ещё потому, что тут не решить проблему лага. Нужно отдавать потоком в гугл с телефона.
А проблем что-то реализовать у меня нет, проблема (задача) сейчас у вас. Жаль, что вы её пока не смогли решить. Если вдруг получится, будет интересно посмотреть реализацию. Я только это имел ввиду.
Как раз путь то и не тупиковый. Я планирую приобрести речевой движок и установить его на свой сервер и надобность в гугле тогда отпадет. Не люблю от кого то зависеть. Просто, скорее всего одним-двумя серверами я не обойдусь. Но, как говорится, буду решать проблемы по мере их поступления. Пока проблем нет.
Тут мало того, что сервер является узким и зависимым местом (упадёт сервак — перестанет работать программа у всех), так ещё и гугл будет «ддоситься» с одного сервера каждым запросом, обычно они такого не терпят и блокируют на время. Или же вы используете «правильный» API? Опять же он, кажется, не безлимитный за бесплатно.
И сразу, ещё в первой статье не написал, но тут укажу: поправьте грамматику. Например, «что-то» пишется именно через дефис. Написание «Вы» тоже скачет – то с маленькой, то с большой. «Вы» с большой, мне кажется, плохо подходит для программ подобного рода. Может, наоборот, для некоторого сближения виртуального ассистента стоит перейти на «ты»?
В клиент-серверной технологии, сервер везде узкое место. На данный момент данный путь кажется мне оптимальным.
За грамматику спасибо, поправлю.
Насчет «ты-вы» подумаю.
Даа, всю картину портит угрюмый, коверкающий голосовой двиг, напоминает Алёну, но видимо не настроено, в этом направлении тоже надо поработать…
А в будущем, лучше дать пользователям возможность настраивать тембр и скорость голоса.
Тем более, гугл все-таки не регламентирует обращение к своему движку.
Не стремно планировать сервис в таких условиях?
[офф]
и все равно не понимаю смысл в «сири» и аналоги на мобильных.
другое дело с дивана на телек кричать без пультов www.nuancemobilelife.com/dragontv/
[/офф]
Смотрите Nuance движок не продает, цены на распознавание у них «мама не горюй», бесплатный пакет 20 запросов на устройство в день. Тогда уж лучше гугл.
Я сейчас, как раз занимаюсь, поиском движка, чтоб приобрести, поставить на свой сервер и ни от кого не зависеть.
Я думаю, для телеков еще наступит время.
Продолжение истории про разработку русского аналога Siri