Комментарии 6
Интересная статья, был опыт реализации REST-сервиса для индексов на Sphinx для поиска адреса с опечатками.
Спасибо автору за осознание того, что я мог выбросит на помойку свой REST, поскольку Sphinx может столько же и даже лучше =)
А где-то можно результат пощупать не воспроизводя все шаги? Демка общедоступная или типа того?
Ещё нет, надеюсь когда-нибудь дойдёт до прода, но от задумки до реализации… Может вообще положим под сукно.
А в докер не умею, каюсь — грешен. Мне бы Аредовы веки, на изучение.
А в докер не умею, каюсь — грешен. Мне бы Аредовы веки, на изучение.
Добрый день, Иван. у нас есть проект по определению адреса из голоса, основан на Яндекс speech kit и API Яндекс геокодинг. Потом из формата адреса Яндекса путём автоматизации переводится в формат ФИАС, т.к. учётная база именно в ФИАСе. Можно ли заменить Яндекс speech kit и геокодинг на sphinx's и ФИАС?
Здравствуйте.
Первая проблема: заменить speech kit, Sphinx тут ни чем не поможет. (Есть ещё CMU Sphinx, это другое, мы про Sphinx Search) Можете посмотреть в строну webkitSpeechRecognition но он совместим далеко не со всеми браузерами.
Когда Вы переведёте голос в текст, то Sphinx его конечно сможет найти, если в вашей БД есть координаты то он вернёт и их и есть функция для работы с координатами можно с её помощью искать ближайших, сортировать по расстоянию и т.д.
Но вторая проблема: в выгрузках ФИАС нет координат, только адреса и идентификаторы, и куча всего, что они туда ещё напихали. Поэтому с геокодированием беда. У Яндекса есть яндекс.карты, он по ним и геокодирует, а у Sphinx есть только то, что вы ему скормите.
Как на свободный аналог Яндекс.Геокодинг можете посмотреть nominatim. Только его с ФИАС не скрестить, он с данными OSM работает, и адреса и координаты берёт там.
И бесплатные решения обычно бесплатны для тех, кто не ценит своё время. Может и не стоит отказываться от текущей реализации.
Первая проблема: заменить speech kit, Sphinx тут ни чем не поможет. (Есть ещё CMU Sphinx, это другое, мы про Sphinx Search) Можете посмотреть в строну webkitSpeechRecognition но он совместим далеко не со всеми браузерами.
Когда Вы переведёте голос в текст, то Sphinx его конечно сможет найти, если в вашей БД есть координаты то он вернёт и их и есть функция для работы с координатами можно с её помощью искать ближайших, сортировать по расстоянию и т.д.
Но вторая проблема: в выгрузках ФИАС нет координат, только адреса и идентификаторы, и куча всего, что они туда ещё напихали. Поэтому с геокодированием беда. У Яндекса есть яндекс.карты, он по ним и геокодирует, а у Sphinx есть только то, что вы ему скормите.
Как на свободный аналог Яндекс.Геокодинг можете посмотреть nominatim. Только его с ФИАС не скрестить, он с данными OSM работает, и адреса и координаты берёт там.
И бесплатные решения обычно бесплатны для тех, кто не ценит своё время. Может и не стоит отказываться от текущей реализации.
Всё-таки сделал наконец Docker образ. Можно его пощупать.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Интернационализация поиска по городским адресам. Реализуем русскоязычный Soundex на Sphinx Search