Sphinx *

Система полнотекстового поиска

СтатьиПостыНовостиАвторыКомпании

NikitaOsokin_ON 14 мар в 20:39

Как мы избавились от копипаста в технической документации

Простой

5 мин

7.8K

Python * Sphinx * PDFТекстовые редакторы и IDE * Подготовка технической документации *

Кейс

Из песочницы

Всем привет. Меня зовут Никита, я руковожу командой Цикл‑ОН. Мы уже более 5 лет ведем проекты по заказной разработке ПО и, как и многие, сталкиваемся с необходимостью разработки не только качественного кода, но и документацию на продукты. В нашей нише особенность, что заказчики живут в парадигме ГОСТа. Я бы здесь хотел оставить небольшую заметку о нашем опыте — как то, что для начаиналось как откровенное мучение превратилось сначала в умную идеологию, а по итогу в самостоятельное решение для подготовки документации.

ManticoreSearch 19 сен 2025 в 05:08

Автоэмбеддинги: поиск на ИИ без лишней мороки

Средний

10 мин

9.5K

Поисковые технологии * Open source * Базы данных * Sphinx *

Перевод

Мы рады представить новую возможность, которая делает создание приложений с семантическим поиском таким же простым, как написание SQL-запроса: Автоэмбеддинги. Теперь Manticore Search берёт на себя генерацию эмбеддингов — без дополнительных пайплайнов, внешних сервисов и лишней мороки.

nyygnet 3 апр 2025 в 04:15

AI в работе технического писателя

Средний

4 мин

5.6K

Sphinx * Искусственный интеллектПодготовка технической документации * Python *

Из песочницы

Всем привет! Меня зовут Севара Ахтямова и я работаю техническим писателем – аналитиком около 4 лет. В этой статье я расскажу, как AI помог мне справиться с рабочей рутиной — от генерации toctree до отладки сборки Sphinx-документации. Всё это — на реальных задачах. Я постаралась собрать побольше примеров из личного опыта. Надеюсь, не слишком много.

egor-iv 16 дек 2024 в 10:57

Организация поиска на сайте: выбираем между поиском Битрикса, Sphinx и Elasticsearch

Средний

9 мин

8.7K

Блог компании ИНТЕРВОЛГАSphinx * Поисковая оптимизация * 1С-Битрикс *

Мнение

Когда я пользуюсь сайтом, я хочу, чтобы поиск был максимально простым и удобным. Мы все уже привыкли к тому, как работают умные системы вроде Google или Яндекса, поэтому от любой другой поисковой строки ожидаем аналогичного уровня. Вбиваешь, к примеру, «телискп» или «пороцитомол», а в ответ получаешь список подходящих оптических приборов или лекарств с указанием, где их можно найти в каталоге.

Но как же поисковая система сайта понимает, что я имел в виду? Это какая-то магия или всё же наука? Давайте разберёмся, почему недостаточное внимание к внутреннему поиску может повредить бизнесу, как он способен сократить путь пользователя и что делает его важным инструментом для повышения конверсии.

svm 5 сен 2024 в 13:05

Manticore + Laravel + Scout

Средний

3 мин

4.3K

Поисковые технологии * Open source * Sphinx * Laravel *

Из песочницы

Простая интеграция поискового движка Manticore Search с фреймворком Laravel при помощи Laravel Scout и неофициального драйвера manticore-scout-engine.

Подробности

ENRUStudio 21 мая 2024 в 11:45

Создаём безукоризненную автодокументацию кода на Python с помощью Sphinx

Простой

8 мин

22K

Блог компании НетологияPython * Программирование * Sphinx * Подготовка технической документации *

Туториал

Перевод

В этой статье я расскажу о генераторе документации Sphinx, с помощью которого можно автоматически создавать документацию для модулей Python. Кроме того, я буду использовать шаблон проекта Cookiecutter Data Science в Visual Studio Code (VS Code), поскольку он легко интегрируется в Sphinx и имеет стандартизированную структуру директорий. Официальное пособие по использованию Sphinx — отличный ресурс для пользователей, которые хотят углубиться в детали. А моя статья — это краткое руководство по началу работы с этим инструментом.

Читать дальше →

+14

ManticoreSearch 29 фев 2024 в 16:01

Как использовать Elasticdump с Manticore

Простой

3 мин

2.4K

Open source * Sphinx * Базы данных *

Туториал

Перевод

Elasticdump - это инструмент для управления и миграции данных в Elasticsearch. Elasticdump позволяет пользователям перемещать и сохранять индексы, экспортируя данные в файл JSON, а затем импортируя их в другое место. Эта функциональность особенно полезна для целей резервного копирования и восстановления, а также для миграции данных между различными средами (например, из разработки в продакшн).

Rombneromb 24 ноя 2023 в 08:55

Андрей Аксёнов, создатель Sphinx и лауреат Highload++: Мой путь — это «святые» девяностые и алгоритмический джихад

9 мин

6.6K

Блог компании Конференции Олега Бунина (Онтико)Высоконагруженные системы * Поисковые технологии * Sphinx * Конференции

Интервью

Андрей Аксёнов нередко начинает свои доклады с такой самопрезентации: «воронежское быдло, интересуюсь информационным поиском». Правда, в Воронеже он уже давно не проживает, но информационный поиск по-прежнему в топе списка его интересов. Работает Андрей тимлидом в компании Avito и руководит юнитом инфраструктуры поиска. А ещё именно он создал поисковый движок Sphinx и не ограничился этим, а участвовал ещё во многих других проектах — работал в веб студиях, геймдеве (приложил руку к 10+ разных игр в начале 2000-х), немного помогал с движком Unigine, много выступал на IT конференциях. За эти заслуги его наградили Премией Highload++ в 2018 году. Мы расспросили его, что значит для него премия и как создать популярный и полезный open-source проект.

+11

ManticoreSearch 18 июл 2022 в 07:33

Manticore — альтернатива Эластику на C++ с 21-летней историей

53 мин

37K

Поисковые технологии * Sphinx * Базы данных *

5 лет назад мы форкнули Manticore из open source версии некогда популярного open source поискового движка Sphinx 2.3.2. У нас было ~~два пакетика травы, семьдесят пять ампул мескалина~~, три C++ разработчика, один саппорт-инженер, опытный пользователь, менеджер, мать пятерых детей, помогающая нам на полставки и гора багов, крэшей и технических долгов. И вот, по прошествии 5 лет и сотен новых пользователей мы готовы сказать, что Manticore можно использовать как альтернативу Elasticsearch и для полнотекстового поиска и для аналитики данных.

В этой статье хочется: вспомнить как всё начиналось и что было до SOLR и Elasticsearch, максимально объективно обрисовать текущую ситуацию, попытаться понять куда нам двигаться дальше.

+116

YARUSru 19 ноя 2021 в 07:53

Elasticsearch vs Sphinx

3 мин

18K

Sphinx * Поисковые технологии *

Recovery Mode

Каждый разработчик приложения рано или поздно сталкивается с таким важным вопросом, как выбор поискового движка. Мы рассмотрели два популярных, но принципиально разных варианта – Sphinx и Elasticsearch – и объяснили, почему сделали выбор в пользу первого для своего приложения.

-5

kalaverin 27 сен 2021 в 15:06

Sphinx Search 2 -> 3: бенефиты и проблемы миграции

13 мин

Блог компании ex-WargamingSphinx *

Автобиографический трактат о кардинальном обновлении версии поисковой системы, увлекательном приготовлении оного и ожидаемо скучный эпилог о том, как всё хорошо получилось: у нас был Sphinx Search 2.0.9, мы вовремя спохватились (посмотрев на календарь) и повезли актуальную версию.

Сделать что-нибудь — это полдела, сопровождать что-либо весь жизненный цикл — действительный путь настоящего уважающего себя самурая. Касается чего угодно — от проведения полноформатных ивентов с тысячами посетителей, до проектирования, запуска, серийного производства, обслуживания и выведения из эксплуатации с утилизацией пассажирских и грузовых авиалайнеров.

Проследовать в длиннопост

+12

velon 5 апр 2021 в 04:53

Продолжаем интернационализацию поиска по адресам с помощью Sphinx или Manticore. Теперь Metaphone

9 мин

4.7K

Поисковые технологии * Open source * Sphinx * Алгоритмы * Регулярные выражения *

Это продолжение публикации «Интернационализация поиска по городским адресам. Реализуем русскоязычный Soundex на Sphinx Search», в которой я разбирал, как реализовать поддержку фонетических алгоритмов Soundex в Sphinx Search, для текста написанного кириллицей. Для текста на латинице поддержка Soundex уже есть. С Metphone аналогично, для латиницы есть, для кириллицы не очень, но попытаемся исправить этот досадный факт с помощью транслитерации, регулярных выражений и напильника.

Это прямое продолжение, в котором разберём как реализовать оригинальный Metaphone, русский Metaphone (в том смысле что транслитерация не понадобится), Caverphone, и не сможем сделать Double Metaphone.

Реализация подойдёт как для использования на платформе Sphinx Search, так и Manticore Search.

В конце, посмотрим как Metaphone воспримет "ракомакофон".

Продолжаем...

velon 18 мар 2021 в 04:47

Интернационализация поиска по городским адресам. Реализуем русскоязычный Soundex на Sphinx Search

14 мин

Поисковые технологии * Open source * Sphinx * Алгоритмы * Регулярные выражения *

Как много в вашем городе иностранных туристов? В моём мало, но встречаются, как правило стоят потерянные посреди улицы и повторяют одно единственное слово – название чего бы то ни было. А прохожие пытаются им на пальцах объяснить куда пройти, а когда «моя твоя не понимать» – берут за руку и ведут к пункту назначения. Как это не удивительно, обычно цель в пяти минутах ходьбы, т.е. какое-то примерное представление о городе эти туристы всё же имели. Может по бумажной карте ориентировались.

А как часто лично вы оказывались в такой ситуации, в незнакомом городе в другой стране?

Появление смартфонов и приложений для навигации решило много проблем. Ура, можно посмотреть свою геолокацию, можно найти куда идти, прикинуть в каком направлении и даже проложить маршрут.

Осталась одна проблема: все улицы в приложении подписаны местными иероглифами на местном наречии, и ладно если в стране пребывания принята латиница, клавиатура на латинице есть во всех смартфонах и мир к ней привык, и то я испытывал дискомфорт, из-за диакритических знаков, принятых в чешском алфавите. А боль и страдания иностранцев, видящих кириллицу, могу только представить, посмотрите псевдокириллицу и поймёте. Если бы я оказался на их месте, я бы писал названия и адреса латиницей, пытаясь воспроизвести звучание - фонетический поиск.

В публикации опишу как реализовать фонетические алгоритмы поиска Soudex на движке Sphinx Search. Одной транслитерацией здесь не обойдётся, хотя и без неё никуда. Получившийся конфигурационный файл, доступен на GitHub Gist.

Длиннопост

ManticoreSearch 8 фев 2021 в 14:21

Manticore Search — форк Sphinx: отчёт за 3 года

12 мин

23K

Sphinx * Open source * Поисковые технологии *

В мае 2017 мы, команда Manticore Software, сделали форк Sphinxsearch, который назвали Manticore Search. Ниже вы найдёте краткий отчёт о проделанной работе за три с половиной года, прошедших с момента форка.

+55

aszhitarev 23 авг 2020 в 14:37

О локальном поиске замолвите слово

5 мин

9.2K

.NET * Sphinx *

В стародавние времена я работал айтишником в одной фирме и в какое-то время возникла задача поиска по локальному хранилищу документов. Искать желательно было не только по названию файла, но и по содержанию. Тогда ещё были популярны локальные поисковые механизмы типа архивариуса и даже от Яндекса был отдельностоящий поисковик. Но это были не корпоративные решения их нельзя было развернуть централизовано для совместного использования. Яндекс, честности ради начал делать что-то похожее, но потом забросил.

Но у всех этих решений не было того, что мне нужно:

Централизованная установка
Поисковая выдача с учётом прав доступа
Поиск по содержимому документа
Морфология

И я решил сделать своё.

Читать дальше →

+11

ready_for_sky_team 9 июл 2020 в 08:12

Как мы обучили сфинкса для голосового помощника

6 мин

5.3K

Блог компании Ready for SkyC++ * Sphinx *

В процессе разработки проекта «голосовой помощник» одним из требований была возможность распознавания управляющих команд в оффлайн режиме. Это было нужно, так как в противном случае пришлось бы постоянно слушать и посылать поток с аудиоданными на распознавание, получать ответ и анализировать его.

Это весьма накладное решение, которое сложно реализовать из-за постоянной нагрузки на сервер, большого объема трафика и увеличенного время отклика всей системы. Для распознавания управляющих команд в режиме оффлайн мы выбрали Pocketsphinx.

Читать дальше →

matvey_travkin 24 мая 2019 в 14:27

SphinxSearch-meetup SuperJob

1 мин

3.4K

Блог компании SuperJobMySQL * Sphinx * Поисковые технологии *

28 февраля мы провели SphinxSearch-meetup SuperJob. Рассказываем, что обсуждали участники, делимся видео и презентациями.

+12

narkq 11 апр 2019 в 09:12

Свой велосипед для синхронизации MariaDB и Sphinx

13 мин

4.8K

Блог компании SuperJobGo * Sphinx * Поисковые технологии *

28 февраля я выступал с докладом на SphinxSearch-meetup, который проходил в нашем офисе. Рассказывал о том, как мы пришли от регулярного перестроения индексов для полнотекстового поиска и отправки обновлений в коде «по месту» к рейлтайм-индексам и автоматической синхронизации состояния индекса и базы данных MariaDB. По ссылке доступна видеозапись моего доклада, а для тех, кто предпочитает чтение просмотру видео, я написал эту статью.

Читать дальше →

+11

Egor812 5 фев 2019 в 13:44

Настройка поиска Sphinx для интернет-магазина

5 мин

44K

Разработка под e-commerce * Sphinx *

Из песочницы

Информации по Sphinx не так много, как хотелось бы. Лишняя статья не помешает.
Первые шаги в освоении Sphinx мне помогли сделать статьи Создание ознакомительного поискового движка на Sphinx + php и Пример Sphinx поиска на реальном проекте — магазин автозапчастей Tecdoc Советую начать с них.

Некоторое время на моем сайте работал поиск через LIKE по каждому слову запроса. Хотелось большего, и вот какие случаи теперь будут обрабатываться правильно:

Словоформы. Выдача по «винты» и «винтов» должна быть одинаковой.
Поиск по фрагменту слова.
Поиск нецелых чисел. Разделитель точка и запятая.
Буква Ё
Типичные ошибки. Например «Аммортизатор».
Синонимы. Регулятор и ESC.
Язык. mAh и мАч, В и V, AAA латиницей и кириллицей.
Слово из букв и цифр. 10х15х4, 6000mAh

Читать дальше →

+16

matvey_travkin 29 янв 2019 в 09:26

Приглашаем на SphinxSearch-meetup SuperJob

2 мин

1.4K

Блог компании SuperJobПоисковые технологии * Поисковая оптимизация * Sphinx * IT-компании

28 февраля в офисе SuperJob состоится встреча разработчиков, посвящённая системе полнотекстового поиска Sphinx.

Специалисты Avito и SuperJob поделятся своим опытом использования технологии. Участники встречи смогут задать свои вопросы автору Sphinx Андрею Аксёнову. Традиционно в программе бургеры и неформальное общение.

Дата и время: 28 февраля c 19:00 до 21:30
Адрес: Москва, Малая Дмитровка, дом 20
Регистрация: superjob-meetup.timepad.ru/event/894409

Читать дальше →

+10

2 3 4