Свободное API для поиска в интернете

Во время разработки некоторых проектов может понадобиться удобное API для поиска в интернете. К сожалению, популярные поисковики, такие как Google и Яндекс, не дают свободного доступа к своей поисковой выдаче.

На замену закрытым API приходит Searx.

Searx — это свободная поисковая система, объединяющая результаты других поисковых систем, но не хранящая информацию о своих пользователях.

Создать свой инстанс Searx может каждый. Полный их список есть на сайте searx.space. Для своих целей мы будем использовать Roughs Searx, так как он никак не ограничивает число запросов и позволяет получать поисковую выдачу даже с помощью автоматизированных скриптов.

Адрес API-сервиса: https://searx.roughs.ru/search

Поддерживаются как GET, так и POST запросы.

Параметры запроса

  • q — (обязательно) Текст запроса, результаты которого нужно получить.

  • format — (обязательно) Формат вывода результатов. Доступные форматы: json, csv, rss.

  • categories  Список категорий поиска, разделенных запятыми.

  • safesearch — Фильтр безопасного поиска. 0 — выключен, 1 — включен.

С полным списком параметров можно ознакомиться на этой странице.

Примеры запросов

Найти новость по запросу «Технологии» и вывести результат в формате RSS:
https://searx.roughs.ru/search?q=Технологии&format=rss&categories=news

Выполнить поиск картинок по запросу «Горы» с фильтром безопасного поиска и вывести результаты в формате json:
https://searx.roughs.ru/search?q=Горы&format=json&categories=images&safesearch=1

Найти решение для «2+2*2» с помощью WolframAlpha и получить ответ в формате таблицы CSV:
https://searx.roughs.ru/search?q=2+2*2&engines=wolframalpha&format=csv

Средняя зарплата в IT

120 000 ₽/мес.
Средняя зарплата по всем IT-специализациям на основании 6 532 анкет, за 1-ое пол. 2021 года Узнать свою зарплату
Реклама
AdBlock похитил этот баннер, но баннеры не зубы — отрастут

Подробнее

Комментарии 18

    +1
    Хотелось бы больше подробностей
      +1

      Как заменить дефолтный поиск в браузерах на свой SearX инстанс?

        +1

        searx.roughs.ru/about
        Здесь информация о том, как выбрать SearX поиском по умолчанию.

          0
          Дополнение «Add custom search engine» для Firefox помогло настроить поиск сразу на свой инстанс SearX.
        0
        Коротко и полезно. Спасибо.
          +1
          Расскажите подробнее — как он внутри устроен, по каким алгоритмам выбирает и парсит сайты, есть ли смысл поднимать свой инстанс, какие будут при этом бонусы и проблемы, и т.д.?
            0

            Не забудьте, что за свой парсер можно быстро попасть в бан-листы

              +1
              Он не парсит сайты. SearX это метапоисковый движок, аггрегатор, если угодно. Автор почему-то это не упомянул.
                0
                Если SearX не парсит, тогда каким образом он получает результаты из других поисковых систем?

                Ведь:
                К сожалению, популярные поисковики, такие как Google и Яндекс, не дают свободного доступа к своей поисковой выдаче.
                  0
                  searx.github.io/searx/dev/engine_overview.html

                  З.Ы. Что не очень понятно, так это почему в настройках тех инстансов, которые я смотрел, есть яндекс, но он отключен и не работает, с подписью «не доступен на этом языке», но и в списке адаптеров я его не вижу.

                  З.Ы. 2 Ну то есть, глядя адаптер того же гугла или бинг, можно увидеть, что используют они вполне существующие api
                    +1
                    Движок Яндекса отключен потому, что Яндекс ограничили доступ к своему поисковому API.
              +1
              А возможно использовать оператор site для сужения области поиска?? Вроде site:habr.com
              0
              Да. Хотелось бы подробностей. Например, можно ли без создания инстанса делать поисковые запросы?
                0
                Можете делать запросы на уже существующий инстанс.
                –2
                Со временем как обычно станет платным?
                Так таких полно, типа SERPRiver и им подобных на основе получения данных через Яндекс XML и парсинга живой выдачи гугла.
                  –2
                  но не хранящая информацию о своих пользователях

                  Да-да, даём честное слово. Ведь джентльмены должны верить друг другу на слово.

                    +1
                    Джентльмен может поднять свой инстанс, посмотреть исходники того что поставил и не ёрничать.

                  Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                  Самое читаемое