Comments 49
Завтра покормить кота — сервис сказал, что кот — это город. о_О
А так сервис интересный. А есть какие-то лимиты на количество запросов?
А так сервис интересный. А есть какие-то лимиты на количество запросов?
+1
База Geonames содержит очень необычные города порой )) Уже почистили, спасибо.
Лимитов нет никаких.
Лимитов нет никаких.
0
А зря, потому что:
ru.wikipedia.org/wiki/%D0%9A%D0%BE%D1%82_%28%D0%93%D0%BB%D0%BE%D0%B4%D1%8F%D0%BD%D1%81%D0%BA%D0%B8%D0%B9_%D1%80%D0%B0%D0%B9%D0%BE%D0%BD%29
ru.wikipedia.org/wiki/%D0%9A%D0%BE%D1%82_%28%D0%A8%D0%BE%D0%BB%D0%B4%D0%B0%D0%BD%D0%B5%D1%88%D1%82%D1%81%D0%BA%D0%B8%D0%B9_%D1%80%D0%B0%D0%B9%D0%BE%D0%BD%29
ru.wikipedia.org/wiki/%D0%9A%D0%BE%D1%82_%28%D0%93%D0%BB%D0%BE%D0%B4%D1%8F%D0%BD%D1%81%D0%BA%D0%B8%D0%B9_%D1%80%D0%B0%D0%B9%D0%BE%D0%BD%29
ru.wikipedia.org/wiki/%D0%9A%D0%BE%D1%82_%28%D0%A8%D0%BE%D0%BB%D0%B4%D0%B0%D0%BD%D0%B5%D1%88%D1%82%D1%81%D0%BA%D0%B8%D0%B9_%D1%80%D0%B0%D0%B9%D0%BE%D0%BD%29
+1
Это должно решаться не чисткой, а системой ранжирования как именованных сущностей по отношению к общеупотребимым словам, так и сущностей между собой…
+4
Не совсем. Как я описал — SpeechMarkup работает вне контекста. Он просто ищет сущности в тексте. Кот для него — это либо текст, либо город. Т.к. был такой город (оказывается), то он был помечен. Но суть-то в том, что затем ваше приложение потребляет результат. А значит, если город его не интересует, то он будет проигнорирован.
0
0
Да, безусловно есть еще над чем работать. С одной стороны нужно все это реализовать, а с другой — сделать API понятным и простым для стороннего разработчика. Таким, чтобы он не требовал изучения сложных материй для реализации конкретных задач. Пример такой задачи я и описал в демо.
0
Из выделения сущностей демо пример смог распознать только имена (но может я плохо старался). С ними тоже не плохо бы поработать («Позвонить Анатолию Ивановичу» работает, «Позвонить Анатолию И.И.» уже нет).
Время выделяет не плохо (хотя тоже баги есть). Для заметок работает красиво =)
API должно быть таким, чтобы простые вещи можно было сделать просто, а сложные возможно. Если API позволяет делать только элементарные вещи, а шаг в сторону — уже никак, то зачем такое API нужно не ясно…
Время выделяет не плохо (хотя тоже баги есть). Для заметок работает красиво =)
API должно быть таким, чтобы простые вещи можно было сделать просто, а сложные возможно. Если API позволяет делать только элементарные вещи, а шаг в сторону — уже никак, то зачем такое API нужно не ясно…
0
Позвонить Анатолию И.И. — инициалы вам не распознает ни одна система распознавания речи. Но добавить распознавание инициалов — да, было бы хорошо, хотя и непонятно, кто будет стараться их вводить. Так только для тестов — да.
Насчет времени — вы бы не сочли за труд указать такие случаи? вот тут — github.com/Morfeusys/speechmarkup/issues
Спасибо
Насчет времени — вы бы не сочли за труд указать такие случаи? вот тут — github.com/Morfeusys/speechmarkup/issues
Спасибо
0
Могу конечно, правда мне сложно понять что для вас фича, а что проблема =)
Вот например «Позвонить подруге завтра в 11:00», скорее всего вы скажите, что такой формат мне «не распознает ни одна система распознавания речи»…
Вот например «Позвонить подруге завтра в 11:00», скорее всего вы скажите, что такой формат мне «не распознает ни одна система распознавания речи»…
0
Да, вам вернется Позвонить подруге завтра в 11 00
Под это сейчас и заточена первая версия сервиса. Но все же — напишите о всем таком, что нашли. Спасибо.
Под это сейчас и заточена первая версия сервиса. Но все же — напишите о всем таком, что нашли. Спасибо.
0
Очень интересно что под капотом, технологии, подходы, алгоритмы, инфраструктура?
+3
А есть ли что то аналогичное SpeechMarkup, но только оффлайновое, без обращение в Интеренет, что можно например развернуть на своем сервере?
+1
Голосовой андроид ассистент Дуся работает офлайн и использует похожий подход play.google.com/store/apps/details?id=com.dusiassistant
В принципе SpeechMarkup — это онлайн-версия этой разработки, только с более широкими возможностями.
В принципе SpeechMarkup — это онлайн-версия этой разработки, только с более широкими возможностями.
0
Было бы неплохо выпустить офлайновую библиотеку, пусть и платную. Даже не столько для своего сервера, сколько для работы приложения в офлайне. Ну и минимизировать задержки обработки.
0
Сейчас бесплатно, а когда раскрутитесь?
+4
Всегда бесплатно
+1
В чем подвох тогда? Функционал интересный. Можно подумать как это прикрутить к своему проекту. Но перед тем как использовать хотелось бы оценить стоимость.
Вам же как-то надо элементарно окупать нагрузку на сервер. Если бы это было open source решение, то понятно. А а так легко попасть на vendor lock.
Вам же как-то надо элементарно окупать нагрузку на сервер. Если бы это было open source решение, то понятно. А а так легко попасть на vendor lock.
+1
Сейчас используется довольно интересная инфраструктура, позволяющая свести к нулю все расходы на поддержку. А оптимальные алгоритмы позволяют хранить минимум данных, что также сводит к нулю и стоимость хранения информации. Быть может, я подробней расскажу об этом в следующей статье, если кому-то будет интересно…
+3
UFO just landed and posted this here
Самое интересное было бы, если бы вы распространяли свое серверное решение, к которому можно было бы привязать свои справочники.
+3
честно говоря, сколько не пробовал — ни одного правильно сработанного примера: все сущности определяются неверно. По моему сервис еще сырой и требует серьезной доработки.
0
Честно говоря, очень сильное утверждение )) А что конкретно «из примеров» у вас работает неправильно?? Какие сущности «определяются неверно»?
0
ну посмотрите логи.
Классический пример: «мама мыла раму» — почему рама, написанный с незаглавной буквы становится городом (почему не именем)? Так практически любое нарицательное слово может стать собственным и наоборот.
Не буду приводить более сложных примеров, типа «глубокая путина», где «путина» становится даже не Путина (еще бы ничего), а Путин.
Классический пример: «мама мыла раму» — почему рама, написанный с незаглавной буквы становится городом (почему не именем)? Так практически любое нарицательное слово может стать собственным и наоборот.
Не буду приводить более сложных примеров, типа «глубокая путина», где «путина» становится даже не Путина (еще бы ничего), а Путин.
0
Любая система распознавания речи (тот же гугл) приводит все к нижнему регистру. Любой пользователь может все писать в нижнем регистре. SpeechMarkup не работает в контексте. Если вам не нужна какая-то сущность — то вы просто ее отбрасываете и все.
0
Сервис разработан для сторонних приложений, которым нужно вытаскивать сущность заранее известного типа. А не просто «мама мыла раму». Кстати «Рама» не становится городом.
0
Да, я согласен, (тем более, если это речь), то регистр не важен. Но есть масса алгоритмов, которые различают собственные и нарицательные слова. Я, правда, не понял, что значит «Если вам не нужна какая-то сущность — то вы просто ее отбрасываете и все» и «вытаскивать сущность заранее известного типа»? То есть это полуавтоматическая система? Пользователь сам разгребает сущности? Тогда беру свои слова обратно.
Но могу сказать, что полуавтоматические системы мало кого интересуют. Когда заказчик говорит: «Сделай мне кнопку, на которую бы я нажал и получил, что хочу», по попробуй догадаться чего он хочет… А раз уж вы позиционируете понимание смысла, то как раз система и должна понять и порадовать любого пользователя.
Но могу сказать, что полуавтоматические системы мало кого интересуют. Когда заказчик говорит: «Сделай мне кнопку, на которую бы я нажал и получил, что хочу», по попробуй догадаться чего он хочет… А раз уж вы позиционируете понимание смысла, то как раз система и должна понять и порадовать любого пользователя.
0
В демо-примере кажется как раз и проиллюстрирована ситуация «Пользователь сам разгребает сущности». Здесь не предлагается система, которая «поймет» любой ввод для любой функции. У вас есть сервис, который должен реагировать на вполне конкретные сущности — вот эту задачу сервис и решает. Те сущности, с которыми сервис не работает, игнорируются. Именно это я и хотел сказать, ничего более.
+1
Я джва года ждал такое API.
0
Вроде как wit.ai платный и работает только с английским?
0
Бесплатный, если вы не хотите приват доступ к вашим наработкам фраз и вполне себе работает с русским (проверено на своем проекте).
0
Было бы здорово, если бы вы написали об этом статью! А то сервис интересный и довольно сложный в использовании.
0
Я попробовал вводить здесь wit.ai/getting-started русские фразы, однако не увидел магии. Можете показать пример?
0
Магии и не будет, т.к. эти примеры тренированы на английском языке. Создайте свой аккаунт, создайте парочку intents, обучите, сделайте entity, которые нужны.
Да, много встроенного функционала (built-in entity) не работает, т.к. изначально рассчитано на английский язык, но ничего не мешает сделать своё :)
Да, много встроенного функционала (built-in entity) не работает, т.к. изначально рассчитано на английский язык, но ничего не мешает сделать своё :)
0
Приветствую! Почему заглох проект?
0
Sign up to leave a comment.
SpeechMarkup API — превращаем речь в данные