Комментарии / Профиль redmadrobot / Хабр

@redmadrobot

Пользователь

396

Подписчики

ПрофильСтатьи224ПостыНовости8Комментарии124

Как мы сделали гибридный AI-поиск по смыслу книг: двухконтурная архитектура и семантическое ранжирование

redmadrobot 5 фев в 08:35

Мы здесь не соревнуемся с веб-поисковиками — у них другой масштаб данных, бюджеты и задачи.

Наш кейс — это поиск внутри книжного сервиса, а значит:

• мы выдаём только те книги, которые реально есть в библиотеке и которые можно сразу открыть;

• решаем задачу «поиска по описанию» прямо в поисковой строке сервиса, где обычно работает только полнотекст или ключевые слова.

Веб-поиск действительно может дать релевантные подборки, но он ищет по интернету. Мы же сравниваем себя скорее с поиском внутри других книжных сервисов — и там запросы вида «книги похожие на Дориана Грея» или «мрачная классика про внутренний распад» обычно либо не работают, либо сводятся к точным совпадениям.

Как мы сделали гибридный AI-поиск по смыслу книг: двухконтурная архитектура и семантическое ранжирование

redmadrobot 5 фев в 08:34

Логлайны — это направление, которое мы исследовали как следующий шаг. Идея в том, чтобы опираться не на маркетинговый текст в аннотации, а на более структурированное описание: тема, герой, конфликт, место действия, время. В таком виде семантический поиск работает заметно стабильнее.

Как мы сделали гибридный AI-поиск по смыслу книг: двухконтурная архитектура и семантическое ранжирование

redmadrobot 5 фев в 08:34

Мы построили гибридный поиск, который умеет работать со свободным описанием запроса и переводить его в несколько параллельных поисковых сигналов.

LLM сначала разбирает запрос читателя: выделяет жанры, темы, настроение, ограничения, язык.

Далее запускаются три контура поиска:

• векторный поиск по текстам из каталога (аннотации + название + автор);

• полнотекстовый поиск по автору, названию и тегам;

• генерация списка кандидатов от LLM как гипотез.

Все результаты ре-ранжируются, валидируются по наличию в библиотеке и только после этого собирается финальная выдача.

За счёт этого поиск работает с описаниями «по смыслу», а не только с ключевыми словами.

MCP Tool Registry: автоматизированное создание систем RAG

redmadrobot 30 дек 2025 в 20:54

Статья написана человеком и отредактирована человеком, хотя и не без помощи LLM, но лишь ситуативной. Длинные тире были правилами хорошего тона любой редактуры задолго до появления нейросетей.

Все LLM в одном окне: как мы сделали AI-сервис Daisy

redmadrobot 29 авг 2025 в 10:17

Да, конечно. Например, сначала можно использовать 50 запросов к GPT-4о, потом ещё 200 к 4о mini или к другим моделям — всего в сумме 1400 запросов к моделям в сутки.

Все LLM в одном окне: как мы сделали AI-сервис Daisy

redmadrobot 28 авг 2025 в 11:40

Daisy — не просто API к LLM, как мы показываем в статье. У сервиса собственная уникальная архитектура и дополнительные фичи, которые улучшают выдачу, поиск, обработку документов и изображений. На подходе интеграция в сервис AI-агентов и кастомных пайплайнов, которые сделают работу с разными нейросетями ещё удобнее.

Все LLM в одном окне: как мы сделали AI-сервис Daisy

redmadrobot 28 авг 2025 в 11:13

Добрый день! Для разных моделей разные лимиты. Например, вот как выглядят ограничения на тарифе Pro. Соответственно, одно сообщение в чате — один запрос к выбранной модели.

Все LLM в одном окне: как мы сделали AI-сервис Daisy

redmadrobot 28 авг 2025 в 10:50

В Daisy есть собственная модель для генерации изображений на базе Flux с улучшенным репромтингом, а также внутренний RAG-пайплайн для обработки документов и поиска в интернете.

Все LLM в одном окне: как мы сделали AI-сервис Daisy

redmadrobot 28 авг 2025 в 10:31

В целом у нас суммарно ко всем моделям 1400 запросов в сутки на тарифе Pro.

Все LLM в одном окне: как мы сделали AI-сервис Daisy

redmadrobot 27 авг 2025 в 18:05

Спасибо за фидбек! Daisy пока ориентирован на обычных пользователей, которым достаточно текущих лимитов. В будущем будем разрабатывать большие тарифы под нужды аудитории.

Вайб-кодинг + AI-хакатон = продукт за 12 часов

redmadrobot 18 апр 2025 в 11:40

Всем привет! AI-хакатон был закрытым мероприятием, поэтому мы не показали ход разработки продукта, а просто поделились новостью про такие ивенты — что они проходят, команды разрабатывают на них реальные инструменты для бизнеса, и вайб-кодинг в разы ускорил эти процессы.

Если вы хотите больше хардовых технических материалов со строчками кодами и подробным описанием разработки — читайте наши статьи. Например:
Как AI-платформа помогает строить микросервисную архитектуру;
Кейс автоматизации управления данными с помощью AI-агентов;
Как собрать аналог протокола MCP своими руками.

Ушли слушать колонку ;)

design_vesna by red_mad_robot

redmadrobot 11 апр 2025 в 08:20

Йоу! CoFo Sans

Как AI-агенты ускоряют работу девелопера: автоматизация данных и управление знаниями

redmadrobot 8 апр 2025 в 09:38

Спасибо! Для высокой скорости при не самом лучшем качестве ответов можно уменьшить количество шагов — вплоть до простого KNN — тогда время до первого чанка составит не более 0.8 мс. Но если пользователь не понимает, что именно хочет узнать и как лучше задать вопрос, время на поиск может увеличиться до 1-2-5 минут

Как AI-агенты ускоряют работу девелопера: автоматизация данных и управление знаниями

redmadrobot 3 апр 2025 в 18:28

Добрый день! Немного отредактировали статью, уточнив терминологию

Как AI-агенты ускоряют работу девелопера: автоматизация данных и управление знаниями

redmadrobot 3 апр 2025 в 18:27

Супер, спасибо! Мы использовали модели семейства qwen 2.5, она встроена в сайт, где сразу отвечает на вопросы клиентов в чате, а также помогает сотрудникам формулировать ответы при запросе

Как AI-агенты ускоряют работу девелопера: автоматизация данных и управление знаниями

redmadrobot 3 апр 2025 в 18:15

Спасибо за поддержку! Мы использовали модели семейства qwen 2.5, развёрнутые на нашем локальном сервере с доступом через Private Cloud

Как AI-агенты ускоряют работу девелопера: автоматизация данных и управление знаниями

redmadrobot 3 апр 2025 в 18:04

Данные клиента мы раскрывать не можем, но скажем, что потенциальная прибыль от автоматизации процессов существенно больше стоимости разработки

Сено, чанки, два промпта: кто такой MarkUp-инженер и как его обучать

redmadrobot 22 ноя 2024 в 07:57

Обязанности MarkUp несколько шире, чем у обычного верстальщика: туда входят также тестирование, выбор промпта, вёрстка документов в читаемый вид — лишь верхушка айсберга.

За что дали Нобелевскую премию по химии: да, снова за AI-модель

redmadrobot 7 ноя 2024 в 11:16

Наш аналитический центр передаёт — спасибо!

За что дали Нобелевскую премию по химии: да, снова за AI-модель

redmadrobot 7 ноя 2024 в 11:13

Рады помочь разобраться! Вот здесь написали про Нобелевку по физике:

https://habr.com/ru/companies/redmadrobot/articles/850112/

2 3 ...

6 7