Как стать автором
Обновить
42.14

Поисковые технологии *

От AltaVista до Яндекса

Сначала показывать
Порог рейтинга
Уровень сложности

Почему Tesla не видит смысла в лидарах на своих роботакси

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров4.5K

Большинство производителей автономных машин вооружают свои автомобили лидарами, радарами и HD-картами. Tesla идёт против течения: только камеры, никакого лазера. В июне 2025 её роботакси выходят на дороги Остина — без карт, без подстраховки. Почему Маск уверен, что этого достаточно? И к чему приведёт этот технологический азарт?

Читать далее

Новости

Я сделал поисковик хуже Elasticsearch

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров5.7K

В этой статье я хочу поделиться своим стыдом, вызванным попыткой создания библиотеки поиска. В этом стыде и вы можете прочувствовать смирение и осознание того, что реальный качественный поисковый движок, а не создаваемый как хобби-проект, должен делаться для того, чтобы лексический поиск был быстрым.

BEIR — это бенчмарки поиска информации, ориентированные на сценарии использования в формате «вопрос-ответ».

Мой хобби-проект SearchArray добавляет в Pandas полнотекстовый поиск. Поэтому естественно, чтобы ощутить трепет от моих потрясающих навыков разработчика, я решил использовать BEIR для сравнения SearchArray с Elasticsearch (с тем же запросом + токенизацией). Поэтому я потратил субботу на интеграцию SearchArray в BEIR и измерение релевантности и производительности с корпусом MSMarco Passage Retrieval (8 миллионов документов).

Барабанная дробь...

Читать далее

Сравнительный обзор: Shodan, ZoomEye, Netlas, Censys, FOFA и Criminal IP. Часть 2

Время на прочтение11 мин
Количество просмотров927

Во второй части сравнительного обзора продолжается анализ ведущих интернет-сканеров и OSINT-платформ. На этот раз внимание сосредоточено на Censys и FOFA — двух мощных инструментах, каждый из которых предлагает уникальные подходы к сбору и структурированию данных об открытых сервисах в интернете. В статье рассматриваются архитектура платформ, синтаксис запросов, охват портов, возможности поиска по сертификатам и телу веб-страниц, а также примеры реального применения.

Читать далее

Как измерить сезонность в SEO: пошаговая инструкция

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров2.6K

Измерение сезонности в SEO — один из ключевых аспектов продвижения в поисковых системах. Оно позволяет составить представление о том, как сезонные колебания спроса могут влиять на поведение пользователей и показатели сайта, и на основе этого выстроить грамотную стратегию продвижения и оптимизации.

Чтобы понять, как сильно сезонка влияет на показатели сайта, необходимо определить ключевые запросы, проанализировать динамику запросов и позиций, а затем сравнить показатели разных сезонов. На каждом шаге можно использовать свои инструменты.

Привет! Я Миша, младший специалист по продвижению сайтов в Selectel. В этой статье я расскажу, как определить тенденции роста и снижения трафика в зависимости от сезона, чтобы на основе этих данных выстроить стратегию продвижения сайта. Подробности — под катом.
Читать дальше →

Как генеративная оптимизация (GEO) меняет SEO рынок

Время на прочтение8 мин
Количество просмотров3.8K

Аналитика от Andreessen Horowitz про влияние Generative Engine Optimization (GEO) на SEO, маркетинг и брендинг.

Читать далее

Тиндер для работодателей и соискателей: как мы разработали алгоритм мэтчинга на Авито

Время на прочтение10 мин
Количество просмотров5.5K

Всем привет! Я Владислав Урих, работаю продуктовым аналитиком в Авито, сейчас занимаюсь построением алгоритмов мэтчинга в новом транзакционном продукте — Авито Подработка. В статье рассказываю, как мы построили алгоритм мэтчинга — инструмент подбора оптимальной выдачи для каждого конкретного покупателя.

Вы узнаете, почему алгоритмы поиска в категориях Авито работают по-разному, как собрать и использовать больше данных о пользователях без анкет, легко проверить гипотезу в офлайн-тестах и получить значимые продуктовые улучшения. 

Текст будет полезен всем продуктовым аналитикам, ML-инженерам и продакт-менеджерам, которые работают с алгоритмическими продуктами.

Читать далее

Сравнительный обзор: Shodan, ZoomEye, Netlas, Censys, FOFA и Criminal IP

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров1.7K

В современном интернете всё, что подключено к сети, может быть найдено — было бы желание и подходящий инструмент. Сканеры вроде Shodan, ZoomEye, Netlas, Censys, FOFA и Criminal IP давно вышли за рамки «поисковиков для хакеров» и стали рабочими лошадками для специалистов по кибербезопасности, Red Team, SOC‑аналитиков и OSINT‑энтузиастов. Они позволяют буквально заглянуть в «техническое подбрюшье» интернета: найти уязвимые камеры, забытые базы данных, тестовые серверы без авторизации и промышленное оборудование, случайно выставленное наружу.

В этой статье приводится сравнение шести наиболее популярных и полезных поисковых систем открытых хостов. Рассматриваются особенности архитектуры, синтаксис запросов, доступность функций, а также возможности каждой платформы — включая API, интеграции с другими решениями, систему алертов, поиск по сертификатам, изображениями и т. д. Отдельное внимание уделено примерам практического применения и оценке релевантности данных. Это первая часть серии, посвящённой сравнительному обзору. В ней подробно рассматриваются возможности Shodan и ZoomEye. В следующих частях будет проведён анализ Censys, FOFA, Netlas и Criminal IP.

Читать далее

Хаус-кипер 2.0: Как создать ИИ, к которому пользователи привяжутся

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров547

В статье рассказываем, почему современные ИИ остаются безликими утилитами и как вдохновение образом хаус-кипера XIX века помогает строить эмоционально близких цифровых спутников. Делимся принципами: персонализация через контекст, прозрачная логика, эмоциональный UX и интеграция в экосистему. Для разработчиков, UX-дизайнеров и всех, кто хочет сделать ИИ частью жизни, а не временным инструментом.

Читать далее

Простое объяснение AI-поиска

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров2.1K

AI-native search меняет правила игры. Теперь системы не просто ищут страницы по словам, а понимают запросы и дают готовые ответы, ссылаясь на источники. Это переворачивает классическое SEO и открывает новые возможности для быстрого поиска знаний в любой сфере.

В статье описывается как работает AI-поиск без сложных деталей.

Читать далее

Интеграция Kafka с Manticore Search: пошаговое руководство по обработке данных в реальном времени

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров1.7K

Kafka — это популярный брокер сообщений, который используется в самых разных проектах: от обработки логов и управления очередями задач до персонализации контента и аналитики в реальном времени. Например, его можно использовать для индексирования изменений в Википедии или поиска товаров в интернет-магазинах. Manticore Search, в свою очередь, поддерживает интеграцию с Kafka, что позволяет автоматически импортировать данные и использовать их для полнотекстового поиска, аналитики, векторного поиска и многого другого.

При импорте данных в Manticore вы можете гибко их обрабатывать:

Читать далее

Gemini 2.5 Pro возглавил все ИИ-бенчмарки: Google возвращает корону технологического лидера

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров20K

Лучший в мире ИИ уже встроен в ваш телефон, почту и поиск, а вы даже не заметили?

Gemini 2.5 Pro занимает первое место на всех ИИ-бенчмарках и предлагается пользователям бесплатно

Узнаете, почему интеграция с семью платформами-миллиардниками делает позиции Google неуязвимыми

Читать далее

Патентный поиск без боли. Руководство для инженеров и не только

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров2.2K

Патентный поиск — не только удел патентных поверенных. Инженер, владеющий этим инструментом, экономит время, деньги и лучше понимает технический ландшафт. В этом гайде — как самостоятельно искать патенты, разбираться в публикациях и использовать найденное для вдохновения, проверки патентной чистоты и оценки патентоспособности.

Читать далее

Как рассказать о сайте поисковой системе 2

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.4K

Доброго времени суток. В этой статье я хочу дополнить первую часть рассказа о том как же донести поисковику информацию о своём сайте. Здесь будут рассмотрены такие темы как IndexNow, security.txt, schema.org.

Читать далее

Ближайшие события

Как я пытаюсь восстановить трафик сайта после падения на 90%: ошибки и уроки

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3.4K

Привет. Меня зовут Вячеслав Гришанков, и у меня есть сайт, который я очень ценю. Появился он в 2014 году — собран на коленке в общаге в свободное от учебы время (его было много).

Читать далее

Рецензия на книгу «Elasticsearch в действии, 2-е издание»

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров2.7K

Книга Elasticsearch в действии. Второе издание — это подробный (~650 страниц в русском переводе) путеводитель по созданию масштабируемых поисковых систем на базе Elasticsearch. Второе обновленное издание знакомит с архитектурой, API и реальными сценариями применения Elasticsearch — от полнотекстового поиска до визуализации данных и машинного обучения. Книга — отличный выбор для начинающих разработчиков, но наверняка может быть полезна и для практикующих специалистов. 

Читать далее

Сервис поиска за три недели: как сделать и не пожалеть через год

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров2.7K

Как запустить поисковый сервис, если у тебя всего три недели, а данные нужно агрегировать с десятков источников, каждый из которых работает по своим правилам? Как обойти жёсткие лимиты партнёров, которые ограничивают запросы в 500 RPM и p99 до 5 секунд, когда для быстрой загрузки первых результатов нужно минимум 1000 RPM? Как справиться с геопоиском, когда традиционные решения вроде Elasticsearch не подходят?

В 2022 году 2ГИС запустил сервис бронирования Отелло, и перед нами стояла амбициозная цель — не просто создать поиск, а сделать его быстрым, надёжным и масштабируемым, чтобы успеть занять место на рынке. Спойлер: мы справились. В этой статье расскажем, как именно.

Материал будет полезен бэкенд-разработчикам и продакт-менеджерам, которые сталкиваются с задачами интеграции сложных данных, высокой нагрузки и оптимизации поисковых алгоритмов. А если тебе понравится наш проект, рассмотри нашу вакансию — мы в поисках Senior Golang Engineer

Читать далее

Как работают поисковики: 4 точки зрения (ни одной правильной)

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров5.9K

Привет! Меня зовут Андрей Попов, я SEO-специалист в AGIMA. В современном мире несколько подходов к пониманию поисковых систем вроде Google и Яндекс. Каждый из них имеет право на существование, у каждого свои апологеты и противники. Но, скорее всего, в этом вопросе истина лежит где-то посередине, а абсолютной правды не знает никто.

В этой статье расскажу, как работают поисковики по версии их разработчиков, по мнению SEO-специалистов и по данным официальных гайдов. А в конце приведу универсальную точку зрения, в которой лично я нахожу гармонию и баланс. Вряд ли что-то в этом обзоре вас удивит, но вопрос в любом случае спорный — интересно будет обсудить.

Читать далее

Google и правило 130 дней: стратегия индексирования для уже проиндексированных страниц

Время на прочтение6 мин
Количество просмотров2.6K

Алгоритмы ранжирования Google основываются на наборе внутренних параметров, которые вручную определяются его инженерами.

Другими словами, это фиксированные параметры, которые не изменяются динамически и применяются как абсолютные правила.

В этой статье мы рассмотрим одно из таких значений — ключевой элемент, который проливает свет на то, как ведущий поисковик мира управляет фундаментальным аспектом своей системы ранжирования: индексированием.

Читать далее

Почему Google не индексирует сайт или ностальгия по DigitalOcean

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.8K

Сайтам нужна поисковая индексация, они без этого просто не живут. Это все давно знают. Известно также и то, что хостинг играет большое значение. Я опишу свою странную историю, которая происходит в данный момент и кажется лишена какой-либо логики. Однако по анализу происходящего может быть связана с серверными настройками хостинга, хотя проверка непосредственно моего VPS, не показала ничего подозрительного. А чтобы не оказаться в статусе белой вороны, скажу, что о точно такой же проблеме ранее сообщал другой пользователь (из Турции кажется), но сообщество зарубежного форума только «развело руками» и дало ему простейшие рекомендации проверить на ошибки файл robots.txt или на наличие тега noindex.    

Читать далее

Я больше не доверяю Google Search, но каковы альтернативы?

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров31K

Довольно актуальная тема, согласитесь? Ощущение, что разные приложения, которым ты когда-то доверял, просто перестали адекватно работать. Примером того может быть ваш Nest Hub Max, который способен ответить разве что на самые базовые запросы, хоть и использует передовую модель Gemini от Google. Или же различные социальные сети типа Instagram, Facebook и Twitter — которые раньше заполняли вашу ленту постами друзей и близких, а теперь впихивают в неё «рекомендации», рекламу и сгенерированный ИИ шлак.

Сложно сказать, стал ли причиной этого ощущения главный продукт Google. Обсуждения на тему ухудшения их поисковой системы звучат по всему интернету — даже сейчас вы тому свидетель — но насколько серьёзны все эти претензии? Достаточно ли их, чтобы вынудить человека перейти на другую платформу? Готов с уверенностью сказать, что да. Google Search стал настолько ужасен, настолько засорился неточной информацией и стал выдавать ошибочные результаты, что доверять ему в качестве основного механизма поиска я больше не могу.
Читать дальше →
1
23 ...