Как стать автором
Обновить

Yacy — распределённый не цензурируемый поисковик: три года спустя

Время на прочтение2 мин
Количество просмотров144K


Yacy — это децентрализованная поисковая машина, которая позволяет осуществлять поиск информации в интернете без локальной или глобальной цензуры или любых других ограничений.

Первое и единственное упоминание о нем на хабре было 29 ноября 2011.

Но с того времени многое изменилось, давайте посмотрим на него еще раз.

Основные возможности и преимущества Yacy:


— Децентрализованный поиск и хранение индекса — в сети DHT
— Три режима работы: 1) Глобальный поисковой индекс, 2) Групповой индекс, 3) Локальный индекс
— Отсутствие рекламы
— Отсутствие какой-либо цензуры (государственной, копирайтной)
— Огромное количество настроек

Основные недостатки:


— Время поиска (из-за децентрализованной природы, поиск непопулярного контента может занимать значительное время)
— Релевантность (алгоритм релевантности был переработан за эти три года, но все равно он отстает от поисковых гигантов)

Что изменилось за три года ?


— Поддержка русскоязычных поисковых запросов
— Появились подсказки в во время ввода поискового запроса
— Опережающий поиск — пока вы печатаете yacy уже ищет пиров с данным контентом
— Улучшились алгоритмы поиска и выдачи — более релевантный результат
и миллионы других мелких изменений под капотом.

Как работает Yacy?


Индексирование

Индексирование может быть инициировано следующими путями:
1) Принудительное указание начала сканирования
2) Удаленный запрос от другого пира
3) Настройка проксирования всех запросов от браузера к Yacy с последующий индексацией того, что вы читаете

После составление базы индекса она сохраняется локально, рассылая в сеть информацию о том, что она у вас есть, и распределяется по DHT на соседних пиров.

Поиск

Во время процесса поиска Yacy сначала ищет результаты в локальном индексе, а затем в глобальном, связываясь по DHT c пирами, у которых есть сведения об индексе того или иного запроса/сайта.

Результаты поиска от Yacy:





Официальный сайт проекта yacy.net/en
Windows yacy.net/release/yacy_v1.68_20140209_9000.exe
Linux yacy.net/release/yacy_v1.68_20140209_9000.tar.gz
OS X yacy.net/release/yacy_v1.68_20140209_9000.dmg

Тестовая поисковая страницы search.yacy.net (которая может упасть от большого трафика)

PS Последняя статья была три года назад, если хабр пользователям будет интересна тема децентрализованных поисковых систем, я готов сделать обзор всего функционала Yacy и рассмотреть подробно как она работает
Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.
Хотите ли вы пользоваться децентрализованными поисковыми системами?
84.13% Да1866
15.87% Нет352
Проголосовали 2218 пользователей. Воздержались 634 пользователя.
Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.
А почему вы хотите/не хотите ими пользоваться?
48.82% Хочу, Они не сохраняют никакой обо мне информации1093
48.64% Хочу, Информация о том, что я искал не может быть передана никому1089
72.58% Хочу, Отсутствие цензуры1625
46.14% Хочу, Отсутствие рекламы1033
8.17% Не хочу, Сложность использования183
24.83% Не хочу, Малая база индекса сайтов556
11.43% Не хочу, Меня не волнует слежка256
22.82% Не хочу, Мне важна релевантность поиска в ущерб приватности511
Проголосовали 2239 пользователей. Воздержались 640 пользователей.
Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.
Хотите еще почитать про Yacy?
88.32% Да определенно2027
11.68% Нет меня это не интересует268
Проголосовали 2295 пользователей. Воздержались 470 пользователей.
Теги:
Хабы:
Всего голосов 128: ↑113 и ↓15+98
Комментарии143

Публикации

Истории

Ближайшие события

7 – 8 ноября
Конференция byteoilgas_conf 2024
МоскваОнлайн
7 – 8 ноября
Конференция «Матемаркетинг»
МоскваОнлайн
15 – 16 ноября
IT-конференция Merge Skolkovo
Москва
22 – 24 ноября
Хакатон «AgroCode Hack Genetics'24»
Онлайн
28 ноября
Конференция «TechRec: ITHR CAMPUS»
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань