Обновить
51.84

Поисковые технологии *

От AltaVista до Яндекса

Сначала показывать
Порог рейтинга
Уровень сложности

Чипсы вместо поиска: рекомендации пользователям, когда о них ничего не известно

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров160

На mir-kvestov.ru нужно давать рекомендации пользователям, про которых мы почти ничего не знаем: большинство не авторизованы, истории просмотров нет, на сайте только точный поиск по названию квеста. Т.е. не было даже нормальной истории текстовых запросов, из которой можно было бы собрать частотные подсказки или похожие запросы. Я обучил решающее дерево на 6500 анкетах пользователей, превратив 60 вопросов анкеты в 5 кликов по чипсам под строкой поиска. Так появилась фича, которая за пять шагов отправляет человека в нужный тип квестов. По пути пришлось согласовать математическую модель с пониманием стейкхолдеров о том «как правильно». Из этого конфликта родилось гибридное дерево, понятное и людям, и метрикам.

Читать далее

Новости

Нейросеть — это хорошо, но дайте выбор. Как я убрал «Алису» из поиска Яндекса

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров2.7K

Привет, Хабр! Нейросети стремительно входят в нашу жизнь, и вот уже Яндекс встроил свою «Алису» прямо в поисковую выдачу. Иногда это удобно, но часто хочется видеть классический список ссылок, а не огромный блок сгенерированного текста, который отодвигает всё остальное вниз.

Я решил вернуть себе контроль над поиском и написал простое браузерное расширение, которое убирает всё лишнее, например когда пишешь олимпиаду с проктором. Назвал его «Bye Bye Alice AI». В этой короткой статье я покажу, как оно устроено.

Читать далее

Выбираем open-source эмбеддинг-модель для AI-консультанта на русском (RAG-подход)

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров5.8K

Разрабатывая AI-консультантов и ассистентов на базе RAG-архитектуры, работающих с корпоративными базами знаний на русском языке, мы столкнулись с вопросом: какие открытые эмбеддинг-модели дают лучший баланс качества семантического поиска на русском и скорости работы. Особенно это актуально, когда запросы и документы русскоязычные, но внутри часто попадаются фрагменты кода/SQL и англоязычной терминологии.

Мы прогнали 9 open-source эмбеддинг-моделей через несколько тестов, включающих проверки:

Читать далее

AI‑поиск по патентам от Perplexity: для чего использовать?

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.3K

AI‑поиск по патентам в Perplexity: смысл вместо ключевых слов. Оценка патентного поверенного: применимость, ограничения, риски.

Читать далее

Айсберг регистрации товарного знака: что упускает быстрый поиск и вскрывает полноценная проверка

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров450

Бесплатная проверка товарного знака за 5 минут не даёт полную картину. Когда (и как?) можно проверить самому и когда нужен специалист — чтобы не потерять бюджеты на 10 месяцев продвижения бренда и вынужденный ребрендинг.

Читать далее

Я протестировал все AI браузеры. ChatGPT Atlas — далеко не топ, и вот почему

Уровень сложностиПростой
Время на прочтение16 мин
Количество просмотров8.8K

Я протестировал все доступные для скачивания AI браузеры, чтобы это не пришлось делать вам: ChatGPT Atlas, Comet, Fellou, Genspark, Dia, Brave, Яндекс Браузер, Edge. Рассказываю про каждый из них — про плюсы, минусы и фишки, — а процесс тестирования приложен на видео, чтобы вы все видели своими глазами.

Читать далее

ChatGPT Atlas: реальные отзывы пользователей показывают разрыв между обещаниями и практикой

Время на прочтение8 мин
Количество просмотров12K

OpenAI выпустила ChatGPT Atlas 21 октября 2025 года — первый браузер с AI-агентами, встроенными прямо в ядро. Компания обещала революцию в том, как мы работаем в интернете. Спустя несколько дней после релиза люди уже протестировали браузер на реальных задачах — и результаты получились неоднозначными.

Агентный режим работает крайне медленно и часто не справляется с задачами, батарея на Mac разряжается с космической скоростью, а обещанная «революция в браузинге» пока больше похожа на сырой бета-продукт. При этом главный конкурент — браузер Comet от Perplexity — показывает себя в 8 раз быстрее при выполнении тех же задач.

Читать далее

Как RuStore читает мысли пользователей (и причём тут теги)

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.4K

Когда пользователь открывает RuStore и вводит запрос вроде «тренировки дома» или «обои с кошками», он ищет не конкретное приложение, а способ решить задачу. Наша цель, как стора, — понять, какое приложение действительно поможет ему это сделать.

За этим стоит сложный ML-пайплайн: сначала модель отбирает кандидатов по смысловой близости запроса, затем ранжирует их по релевантности. А поисковые теги помогают системе уловить контекст — в каких ситуациях и по каким запросам ваше приложение должно оказаться в топе выдачи.

Меня зовут Анастасия Войцешко, я продакт-менеджер в RuStore. В этой статье расскажу, как устроен поиск внутри стора, какую роль теги играют и как подобрать их так, чтобы повысить шансы приложения попасть в релевантную выдачу.

Читать далее

Документный хаос? RAG-система придёт на помощь

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров3.8K

Статья описывает практическую реализацию системы Retrieval-Augmented Generation (RAG) для превращения документов в интерактивную базу знаний. Показано, как хранение эмбеддингов в Qdrant и интеграция с языковой моделью (LLM) позволяют быстро получать точные ответы на вопросы. Рассматриваются архитектура, ключевые компоненты и внутренние механизмы работы системы, полезные для разработчиков и новичков в области RAG.

Читать далее

Как Google S2R (speech-to-retrieval) решает проблему непонимания голосовых запросов

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.2K

«Чай. Эрл‑Грей. Горячий». Помните эту фразу капитана Пикара из «Звёздного пути»?

Меня всегда поражало, с какой лёгкостью компьютер «Энтерпрайза» понимает команды Пикара. И вы замечали — никому на мостике корабля никогда не приходится повторять сказанное?

Никто не раздражается, когда просит компьютер выдать информацию. Машина не превращает слова в текст, не сверяет звучание похожих слов, не ищет в базе совпадения. Она просто... понимает. Проще говоря, намерение переходит от речи к действию без трения — мгновенно и безошибочно.

Читать далее

Как включить ИИ-поиск Google по умолчанию в браузере Chrome

Уровень сложностиПростой
Время на прочтение1 мин
Количество просмотров12K

Короткая инструкция, как включить новый режим Google AI Mode и сделать его поиском по умолчанию в Chrome. Теперь запросы из адресной строки сразу открываются в «Режиме ИИ».

Читать далее

«Первые плоды неправильного использования ИИ» или «Что же случилось с поиском работы на должность разработчика?»

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров34K

Всем привет, я Кирилл, и я оказался на рынке труда осенью 2025 года. Давайте разберем, почему же нам, разработчикам с большим стажем перестали приходить отклики, количество собеседований уменьшилось до нуля, а со всех сторон все HR-специалисты трубят о нехватке кадров в IT. А также рассмотрим новую боль всех HR-ов. Статья носит статистический характер, пару советов и философские высказывания автора, и немного юмора.

Читать далее

Reddit в SEO 2025: как выигрывать на новом поле битвы

Уровень сложностиСредний
Время на прочтение25 мин
Количество просмотров1.7K

Пока вы оптимизировали meta-теги, Reddit стал третьим по влиянию SEO-сайтом в США. Разбираемся, почему Google теперь любит форумы больше ваших статей — и что с этим делать.

Читать далее

Ближайшие события

Что такое LLMS.TXT и почему эксперты продают бесполезный файл

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров3.2K

Страшно, когда эксперты пишут, пережевывая то, что написали уже другие, да еще и бездумно с помощью нейросетей. А потом все дружно внедряют llms.txt, не разобравшись зачем он нужен и работает ли вообще.

Читать полностью

Scaled Rank Fusion — объединяет значения из нескольких списков с учётом масштаба

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров476

Семейство методов Rank Fusion включает различные алгоритмы объединения нескольких ранжированных списков результатов в один улучшенный ранжированный список с целью повышения качества и надежности итогового ранжирования.

Основная идея — агрегировать информацию из разных систем или моделей, которые могут по-разному оценивать релевантность документов.

Rank Fusion широко применяется в информационном поиске, мультимедийном поиске, гибридных системах поиска, системах на основе модели Retrieval Augmented Generation (RAG), а также в задачах ансамблевого обучения.

В статье описан новый алгоритм семейства Rank Fusion, а может и не новый, дайте знать.

Читать далее

Garbage In, Garbage Out: как мы учили ИИ искать не в веб-помойке, а в библиотеке. И чему мы научились сами

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров5.2K

Ищем как Perplexity по базам научных публикаций, стандартам, книгам, мессенджерам и социальным сетям.

Читать далее

Zip-бомбы против агрессивных ИИ-краулеров

Время на прочтение4 мин
Количество просмотров32K

Некоторые владельцы сайтов жалуются на большое количество ботов, которые создают нагрузку на серверы, особенно краулеры для LLM (ИИ). По информации аналитического отчёта Fastly, краулеры, скраперы и фетчеры иногда создают нагрузку на сайт до 39 тыс. запросов в минуту.

В 2025 году нагрузка от скраперов выросла на 87%, причём основной трафик идёт от RAG-скраперов, а не для первичного обучения моделей.

Читать далее

Как ИИ меняет поиск людей и построение социальных связей

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1K

Сегодня - о новом подходе к поиску людей и построению социальных связей через искусственный интеллект.

В качестве примера в этой статье я использую наш проект Linkeon. Воспринимать его как единственно возможное решение, конечно, не стоит.

Проблема: поверхностность современных социальных сетей

Современные социальные сети и сервисы знакомств решают задачу соединения людей через примитивные критерии: возраст, внешность, геолокацию, общие интересы. Но эти критерии не отражают глубинные ценности и намерения людей.

Когда мы ищем партнера для бизнеса, единомышленника для проекта или просто близкого по духу человека, нам важны не хобби и внешность, а то, что движет человеком изнутри. Его ценности, убеждения, жизненные цели и намерения.

Классическая проблема: мы тратим месяцы на общение с людьми, которые на первый взгляд подходят нам, но в итоге оказываются на совершенно другой "частоте". Разные ценности, разные цели, разные представления о жизни.

Особенно остро это проявляется в профессиональной сфере:

В своей предыдущей статье о ключевых качествах сотрудников я писал, что для меня критически важными являются мотивация и обучаемость. Но посмотрите на любую платформу поиска работы - hh.ru, LinkedIn, SuperJob. Там вообще нет полей для этих качеств!

Система ищет по навыкам, опыту, образованию — но не по тому, что действительно определяет успех сотрудника в долгосрочной перспективе. В итоге HR‑менеджеры тратят кучу времени на собеседования, пытаясь понять, подходит ли кандидат по «мягким» навыкам, которые невозможно оценить по резюме.

Читать далее

Поиск собственных файлов как в браузере (Google поисковике)

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров2.9K

Поиск собственных файлов как в браузере (Google поисковике).

Даже при аккуратной структуре папок и нейминге найти нужный файл часто было непросто. Рано или поздно все превращалось в большой хаос из набора файлов и папок. 

Я пробовал программы по типу Everything, которые ищут по названию файла, пробовал obsidian и xyplorer, которые дают возможность добавлять теги, но хотелось простой возможности описать то, что ищешь, и получить результат - как в браузер поисковике. Затем я подумал - ведь все может быть контекстом...

Читать далее

Как попасть в ответы ChatGPT, Perplexity и Google AI: практическое руководство по GEO

Уровень сложностиСредний
Время на прочтение20 мин
Количество просмотров11K

Три месяца назад ко мне обратился клиент с проблемой, которую я теперь вижу еженедельно. Позиции в топ-3 Google по всем ключевым запросам. Контент написан экспертами с многолетним опытом. Техническая оптимизация выполнена безупречно — скорость загрузки под секунду, мобильная версия идеальна, Core Web Vitals в зелёной зоне.

Трафик падает. Минус 35% за квартал.

Я открыл Google, ввёл их главный запрос. Первое, что увидел — AI Overview с развёрнутым ответом на три абзаца, занимающий половину экрана. Конкуренты цитируются там с названиями компаний и прямыми ссылками. Мой клиент? Его нет. Даже упоминания.

Проверил ChatGPT Search по тому же запросу. Система выдала структурированный ответ с пятью рекомендованными решениями, описаниями, ценовыми диапазонами. Мой клиент снова отсутствует. Открыл Perplexity — тот показал топ-7 источников с краткими описаниями и ссылками. Результат идентичный — полная невидимость.

Понимаете, что произошло? Правила игры изменились радикально, а стратегия продвижения застряла в 2020 году.

Исследование seoClarity показывает цифры, которые невозможно игнорировать: AI Overviews теперь появляются в 10.4% всех десктопных поисковых запросов в США по состоянию на март 2025 года — это исторический максимум с момента запуска функции. Более того, согласно независимому анализу Ahrefs, позиция номер один в органической выдаче теряет 34.5% кликов при наличии AI Overview над ней.

Вдумайтесь в эту цифру. Вы на первом месте в поиске. Но треть Вашего потенциального трафика испаряется. Просто потому что искусственный интеллект ответил на вопрос пользователя раньше, чем тот успел добраться до Вашей ссылки.

Читать далее
1
23 ...

Вклад авторов