Pull to refresh

Comments 77

Мне нравится приложение, да и русского аналога я еще не видел, будет пользоваться популярностью.
К серверам стало подключаться быстрее. Над дизайном стоит еще поработать, я так думаю. Имя «Катя» это у всех такое имя?)
Спасибо.
А что в дизайне надо доработать?
UFO just landed and posted this here
Сделайте API, чтобы можно было свои сервисы подключать к вашей программе. Приезжает запрос, вы дёргаете партнёров, партнёры вам отвечают свои предложения, выбираете наилучшее и показываете юзеру. Получится убийца Siri. С серверной частью могу помочь.
Мне кажется, что время ответа очень увеличится. Лучше сразу договориться с партнерами. Приходит запрос, идет обращение к АПИ партнера и выводится ответ.
Лимит поставить 3-4 секунды на ответ. Не успел ответить — его проблемы.
Я подумаю над этим. Но вряд ли, у кого то есть готовые АПИ.
Мыслите шире. Вы предоставляете уникальный сервис. Поставщики контента будут вас упрашивать подключить их. Они подстроятся под любой ваш каприз. Придумайте удобный для вас API и опубликуйте его.

По сути, должен быть всего один запрос — вы передаёте строчку, вам отвечают небольшим документиком — ключевые слова, по которым распознался запрос, и сам ответ — текст, ссылка, координаты на карте или ещё какие-то типы контента, которые вы сами определите. Вы потом ранжируете ответы по каким-то признакам и возвращаете клиенту лучшие варианты.
Да. была бы хорошая платформа для монетизации приложения
Ну так если не пропустят, можно в Cydia уйти.
Хотя и не все её любят.
Не будем о грустном. Надеюсь, что пропустят.
Будет. Это не сложно, 90% всей работы делает сервер.
Помощь не нужна? С удовольствием поучаствую.
а можно версию для симбиан или J2ME для нищебродов?
Для этих устройств я разрабатывать не умею
Если Java знаете особых проблем не будет. Насколько я помню там при записи уже можно выбрать низкое качество и записывать можно в amr вес будет в 10 раз меньше чем тут выходило и при перекодировке затрат меньше.
Имхо лучше всего сконцентрироваться на возможностях яндекса по поиску близлежащих объектов типа общепита и транспорта, прокладке маршрутов с учетом пробок, а также на сокращении роли серверной составляющей в обработке запросов. Даже если последнее сильно замедлит быстродействие и увеличит жор батареи, все равно это улучшит рентабельность, что для стартапа не последнее дело.
А уже при платной подписке можно как угодно обрабатывать запрос, фокусируясь на времени и точности обработки.
Вот пробки пока не может, не научил еще. Думаю это будет тяжеловато.
Ведущая роль была отдана серверу по нескольким причинам: 1. очень сложно проходить ревю у apple всяким аналогам сири;2. не все всегда часто обновляют программу, а тут изменил код на сервере и добавил функционал.
Насчет быстродействия Вы не правы, предыдущая версия подтормаживала и вызывала много нареканий, ни кто не хотел общаться с «тормознутой».
Но никто не сможет общаться если вам еще на стадии тестирования понадобится мощный кластер и канал в 500 мегабит.
на счет апстор да, возможно, но может они пропустят аналог для России, особенно если сделать так чтобы работало только в России (Российском апсторе).
UFO just landed and posted this here
Могу сказать одно: двигаетесь в правильном направлении. Удачи ;)
Трафик такой: с телефона на сервер передается Wave файл, в среднем где то 100-150 Кб. После конвертации во flac размер уменьшается процентов на 40. И уже flac «скармливаю» гуглу. Ссылку на mp3 поток передаю на телефон и он ее воспроизводит сам, тут сервер не задействован. Так что для обработки одного запроса трафика не много.
Кстати если будете писать под андроид вполне можно использовать нативную unix библиотеку Flac. Не знаю можно ли так в iOS.
Библиотека то flac есть, но пока я не нашел, кому удалось ее скомпилировать для iPhone.
мм вроде же нет зависисмостей из homebrew, flac посмотри исходники обычное консольное приложение
Ну я на сервере так и запускаю flac из консоли. Просто для того чтоб использовать эту библиотеку в iPhone она должна быть предназначена для работы под arm7, а все что мне удавалось находить было под i386. А я, боюсь, не обладаю такими знаниями, чтоб самому скомпилить библиотеку из исходников под arm7
Даже не знаю, есть arm версии линукса например убунты, у них в репозитории есть эти библиотеки, посмотрите.
Та я вот пытаюсь уйти от формата flac к speex вроде с ним под айфон проще
А вам ещё не предлагали работу в Аpple? Может это помогло бы им приблизить появления официального Siri на русском. *так мысли вслух*
Еще не предлагали. Думаю и не предложат. Сама то задача не сложная: речевой движок, база знаний, быстрые сервера и немного лингвистики. Apple, если бы захотела, русифицировала бы Сири запросто. Наверное у Apple какие то свои планы, о которых мы не знаем.
В России даже AppleStore нет и не будет, продажи новых устройств в россии происходят после всех остальных стран, а вы удивляетесь почему они русифицировать Сири не спешат. Им не особо интересен наш рынок и погоды не делает. Даже в маленькой Польше все есть, а у нас нет.
если в России будут Apple Store, кто ж тогда будет очереди в Европе создавать в день запуска продуктов? ;)

Судя по репортажам, там больше половины соотечественников стояло…
Видео обзоры это хорошо, но когда уже будет хотя бы альфа версия для тестирования пользователями? (хотя бы для jailbreak устройств).
По поводу бронирования отелей и гостиниц… можно к нам обращаться в www.aviasales.ru.
Будем рады сотрудничеству, к тому же и по нашей партнёрской программе будут свои «плюсы» :)
Посмотрел Ваш сайт. Интересно. А АПИ у Вас есть? Например телефон передает текущее месторасположение и город куда хочет улететь, а с сайта получает страничку сверстанную под мобильный уже с готовым поиском?
Да, API у нас есть. И по расположению ищет. А также по фразе из google, например: www.google.com/webhp?q=site:aviasales.ru+авиабилеты+иркутск+магадан#hl=en&output=search&sclient=psy-ab&q=site:aviasales.ru+авиабилеты+иркутск+магадан&oq=&aq=&aqi=&aql=&gs_l=&pbx=1&bav=on.2,or.r_gc.r_pw.r_cp.r_qf.,cf.osb&fp=97b893ac5db2d6bb&biw=1439&bih=679 идёт автокомплит.
Отлично. Обязательно попробую!
Будем ждать результатов :)
Я готов подключить базу рецептов с кулинарного сайта. Ещё раз реквестирую API.
Кулинарный сайт это интересно. А поиск по ключевым словам у Вас есть. Например «рецепт салата цезарь»
Полнотекстовый поиск есть, его надо немного доработать, чтобы лишние слова не мешали искать рецепты. И у нас база не очень большая — цезаря там нет, к сожалению.
Интересный проект!
А вы не планируете сделать систему «свободного разговора»? То есть чтобы не надо было нажимать кнопку, чтобы что-то сказать?
Честно говоря, даже не задумывался об этом. Наверное, тут есть какие подводные камни, раз это еще никто не внедрил.
Это дело используется в приложении Talking Tom cat.
Единственное замечание — надо добавить настройки для того, чтобы увеличить/уменьшить максимальную паузу между словами.
Спасибо, возьму на заметку
Я как понимаю серверная часть на php? Если вдруг на python — пишите, помог бы :)
Реализация (судя по скриншотам) очень неплохая, но пока-что нехватает всяких штучек для интеграции ответов (как вы описали с погодой, парсить все подряд :)
Да сервер на PHP. Конечно дорабатывать еще есть что.
Неужели гугл-сервис умеет распознавать русские фамилии из Вашей адресной книги?
Отлично умеет распознавать. Он даже фразу «аста ла виста» распознает, правда одним словом.
Гугл принимает голосовой запрос потоком, а как оно будет работать без вайфая и сжатия, с перекодированием на стороннем сервере — страшно подумать О_о Отправлять такое в аппстор вообще самоубийство, как ваш сервер выдержит нагрузку?
Интересно было бы реализовать именно кодирование на телефоне, родное гугловое приложение с этим отлично справляется даже на самом первом айфоне.
По Wi Fi работает нормально, по 3G тоже, конечно при GPRS интернете притормаживает, а без подключения к интернет, вообще не работает. Дальше я не понял вопроса про что Вам страшно думать.
Если Вам что то интересно реализовать, берите и реализовывайте, в чем проблема?
Ну не поняли, ничего страшного. Поймёте позже, когда ваш сервер ляжет под нагрузкой. Передавать через сервер — тупиковый путь ещё потому, что тут не решить проблему лага. Нужно отдавать потоком в гугл с телефона.
А проблем что-то реализовать у меня нет, проблема (задача) сейчас у вас. Жаль, что вы её пока не смогли решить. Если вдруг получится, будет интересно посмотреть реализацию. Я только это имел ввиду.
Как раз путь то и не тупиковый. Я планирую приобрести речевой движок и установить его на свой сервер и надобность в гугле тогда отпадет. Не люблю от кого то зависеть. Просто, скорее всего одним-двумя серверами я не обойдусь. Но, как говорится, буду решать проблемы по мере их поступления. Пока проблем нет.
Тут мало того, что сервер является узким и зависимым местом (упадёт сервак — перестанет работать программа у всех), так ещё и гугл будет «ддоситься» с одного сервера каждым запросом, обычно они такого не терпят и блокируют на время. Или же вы используете «правильный» API? Опять же он, кажется, не безлимитный за бесплатно.
И сразу, ещё в первой статье не написал, но тут укажу: поправьте грамматику. Например, «что-то» пишется именно через дефис. Написание «Вы» тоже скачет – то с маленькой, то с большой. «Вы» с большой, мне кажется, плохо подходит для программ подобного рода. Может, наоборот, для некоторого сближения виртуального ассистента стоит перейти на «ты»?
В клиент-серверной технологии, сервер везде узкое место. На данный момент данный путь кажется мне оптимальным.
За грамматику спасибо, поправлю.
Насчет «ты-вы» подумаю.
Не думаю что речевой движок будет лучше гугла, во всяком случае в противостоянии нагрузке у гугла равных нет.
Да я пока вообще не могу найти что то приемлемое. Ну чтоб русский распознавало.
Скажите, Вы не планируете сделать к своему сервису кроме голосового еще и текстовый интерфейс?
Пока нет. Такая цель не ставится.
К чему там нужен текстовой интерфейс? Это вроде не английский сервис, говоришь — и не думаешь. вспоминать английских слов не надо
А вариант с сильными шумами на фоне? Хотя возможно я заблуждаюсь в возможностях распознавания речи
Даа, всю картину портит угрюмый, коверкающий голосовой двиг, напоминает Алёну, но видимо не настроено, в этом направлении тоже надо поработать…
А в будущем, лучше дать пользователям возможность настраивать тембр и скорость голоса.
Apple, зараза, отклонил таки приложение. Буду что то думать.
UFO just landed and posted this here
можно еще попробовать добавить переводчик
Да, вроде голосовых переводчиков и так навалом.
для универсальности =) наверняка какой-нибудь API можно прикрутить без особых сложностей
Добрый день.
Поучаствую в разговоре, так как занимаюсь схожей задачей.

Вы не изучали возможности SDK от Nuance?
У отцов-то все процессы уже продуманы тысячу раз как.

первая ссылка из последних, что нашел в яндексе:
www.rb.ru/article/nuance-nuance-mobile-advantage-ot-kompanii-nuance/6903857.html

руспредставительство на ФБ:
www.facebook.com/NuanceMobileLife

Тем более, гугл все-таки не регламентирует обращение к своему движку.
Не стремно планировать сервис в таких условиях?

[офф]
и все равно не понимаю смысл в «сири» и аналоги на мобильных.
другое дело с дивана на телек кричать без пультов
www.nuancemobilelife.com/dragontv/
[/офф]
Смотрите Nuance движок не продает, цены на распознавание у них «мама не горюй», бесплатный пакет 20 запросов на устройство в день. Тогда уж лучше гугл.
Я сейчас, как раз занимаюсь, поиском движка, чтоб приобрести, поставить на свой сервер и ни от кого не зависеть.
Я думаю, для телеков еще наступит время.
Снова добрый день.

Я в личной почте оставил вам свои координаты.

Поскольку занимаюсь аналогичными процессами, есть что сказать, и что спросить.

не сочтите за труд.
Координаты не получил. Отправьте еще.
Sign up to leave a comment.

Articles