Search
Write a publication
Pull to refresh
0
0
Send message
1. Постараемся сегодня-завтра собрать список лучших сайтов и тут отпишемся.
2. Окончания срезаются.
3. Строка будет токенизирована на слова, поиск будет происходить по словам. Поддержку поиска по фразе в кавычках улучшим чуть позже.
Вы не могли бы прислать в личку адрес сайта?
Если подразумевается ajax-сайт, то индексация suggest.io работает по этой спеке гугла путем конверсии ajax-ссылок типа http://host.ru/rsc#!a=b в http://host.ru/rsc?_escaped_fragment_=a=b.

Обычно на таких сайтах главная страница тоже аякснутая (т.е. неиндексируемая «в лоб»), поэтому админу нужно ещё sitemap.xml для таких ссылок создать и прописать его в robots.txt. В общем, всё тоже самое, что и для гугла.
Если поставить поиск на сайт, то будет работать мониторинг сайта на предмет новых страниц.
Лимита на количество страниц пока нет.
С ajax-ссылками типа #!? Или что имеется в виду под генерацией страниц?
С 'cp-*' кодировками вроде исправили проблему.
> установить время, задержки

Можно через robots.txt Crawl-Delay для User-Agent: suggest.io/crawler или User-agent: *

В robots.txt так же поддерживаются стандартные директивы и яндексовский Clean-Param.

Information

Rating
Does not participate
Registered
Activity