Comments 31
Кстати вчера хотел его поставить, но потом передумал когда он сказал что требуется 30гб для кеша, а у мени они отсутствуют.
-5
В FAQ написано:
You don't need a fast machine to run YaCy. You also don't need a lot of space. You can configure the amount of Megabytes that you want to spend for the cache and the index. Any time-critical task is delayed automatically and takes place when you are idle surfing (this works only if you use YaCy as http proxy).
+2
Прочел как «ЯйЦа»
-7
Поставил ноду в виртуалку.
+1
Кириллица в поиске не работает.
Релевантность на 0 (по запросу «windows 7» предложил скачать Putty и сходить на lenta.ru)
Кстати, интересно, что будет если нода отключится? В торрентах все раздают одно и то же и отключение пира лишь уменьшает число сидеров на 1. А тут получается, что может выпадать часть поискового индекса.
Релевантность на 0 (по запросу «windows 7» предложил скачать Putty и сходить на lenta.ru)
Кстати, интересно, что будет если нода отключится? В торрентах все раздают одно и то же и отключение пира лишь уменьшает число сидеров на 1. А тут получается, что может выпадать часть поискового индекса.
+3
Уверен, что разработчики позаботились о репликации.
0
Примечательно, что кириллица не работает только в демке.
По релевантности — интереснее. Похоже, нода выдаёт то, что именно ей кажется более близким. Демка правда даёт что-то, не имеющее отношения к windows 7, у меня выдаются новости overclockers.ru (сильно подозреваю, что потому, что указал проиндексировать этот сайт)
По релевантности — интереснее. Похоже, нода выдаёт то, что именно ей кажется более близким. Демка правда даёт что-то, не имеющее отношения к windows 7, у меня выдаются новости overclockers.ru (сильно подозреваю, что потому, что указал проиндексировать этот сайт)
+1
UFO just landed and posted this here
Кстати, название (YaCy) из-за первых двух букв наталкивает на мысль о Яндексе.
+2
> Никакого хранения истории запросов, никаких следящих кукисов.
Ну то есть они никогда, увы, не смогут догнать коммерческие поисковики. Сильно сомневаюсь, чтобы это было возможно без анализа поведения пользователей и без поведенческого таргетинга.
Ну то есть они никогда, увы, не смогут догнать коммерческие поисковики. Сильно сомневаюсь, чтобы это было возможно без анализа поведения пользователей и без поведенческого таргетинга.
0
А зачем их собственно «догонять» в количестве рекламного мусора и нарушении конфиденциальности?
0
в этой области не обязательно. но анализ поведения используется для улучшения качества поиска.
+1
Что-то сомневаюсь я, что пользователю всегда требуется именно такое «качество», в котором первые позиции занимают проSEOшенные локальные коммерческие ресурсы.
0
1. коммерческим поисковикам не выгодно, чтобы в первых рядах были «просеошенные ресурсы», им выгодно, чтобы деньги носили не к оптимизаторам, а за контекстную рекламу
2. борются с накрутками они, в частности, с помощью анализа поведения живых пользователей; получается у них с переменным успехом, а без этого инструмента, вероятно, еще труднее.
2. борются с накрутками они, в частности, с помощью анализа поведения живых пользователей; получается у них с переменным успехом, а без этого инструмента, вероятно, еще труднее.
0
А будет ли столько накруток в некоммерческом децентрализированном поисковике, сколько вирусов под Linux, например?
0
В ответ на запрос «WIkipedia» почему-то выдало первой строкой страницу из википедии об индийском кастовом ёге Шри Ауробиндо:). Что символизирует.
+2
Однако подозреваю, что самой вкусной опцией использование клиента сабжа является «Search portal for your own web pages», что позволяет формировать поисковые сообщества, по сути независимые от большого гугла, а заодно и от ручонок всяческих копирастов и цензоров.
+3
У меня вылетела на последнем секундах установки… Win7 x64
0
К сожалению на P2P хорошо ложится только обход и индексирование сайтов,
а для собственно поиска и ранжирования надо уметь отработать запрос на всех машинах где хранятся кусочки индекса. Либо у них будут потери в скорости ответа, либо будет поиск по ущербно малой части интернета.
а для собственно поиска и ранжирования надо уметь отработать запрос на всех машинах где хранятся кусочки индекса. Либо у них будут потери в скорости ответа, либо будет поиск по ущербно малой части интернета.
+3
ради релевантного ответа можно и подождать несколько секунд.
0
Если релевантность страдает сейчас, что будет, если там вдруг появится трафик и на поисковик обратят взор до сих пор невымершие спаммеры и дорвейщики?
0
>On linux you need OpenJDK6.
Г-р-ррр… Переписать им код на нормальном языке что ли?
Г-р-ррр… Переписать им код на нормальном языке что ли?
+4
А воз и ныне там…
Вот интересно, почему никто и нигде не описывает и не обсуждает трафик, который эта штука пожрёт у того, кто его себе поставит? Нигде никаких хоть примерных цифр!
А ведь неплохо б такие штуки ставить на автономные, маленькие, и постоянно подключенные к интернету компы, такие как в роутерах нынче.
Вот интересно, почему никто и нигде не описывает и не обсуждает трафик, который эта штука пожрёт у того, кто его себе поставит? Нигде никаких хоть примерных цифр!
А ведь неплохо б такие штуки ставить на автономные, маленькие, и постоянно подключенные к интернету компы, такие как в роутерах нынче.
0
Sign up to leave a comment.
Распределённый поисковик YaCy версия 1.0