Comments 24
Если они сделают социальный поисковик с хештегами (уже есть), с лентой(анализ поисковых запросов юзера и выдача ему новых страниц, аля лента в твитере), то может и прокатит. Ну и для сеошников примочки, что бы пиарили…
800 серверов — не слишком ли много для начала ?)
а механизмы релевантности?
blekko.com/ws/http:%2F%2Fhabrahabr.ru%2F+/urlseo
frequent words: vogue (6) mercurial (6) peertopeer (5) apache (5) kinect (5) javascript (4)
вот такие мы
blekko.com/ws/http:%2F%2Fhabrahabr.ru%2F+/urlseo
frequent words: vogue (6) mercurial (6) peertopeer (5) apache (5) kinect (5) javascript (4)
вот такие мы
Эх… хочу туда на работу…
> Новый поисковик Blekko начал работу полтора месяца назад и вполне естественно привлёк к себе пристальное
> внимание экспертов. Не только благодаря инновационному интерфейсу и слэштегам, но и в принципе
Ой, какой приторный текст. Это вы стебетесь так, или на полном серьёзе таким языком говорите?
> Секрет успеха такого неординарного решения — Perl
Довольно странный выбор. Сейчас всё больше на python каком пишут, а на perl разве что дописывают то, что десяток-другой лет назад создавалось.
BTW, удачи вам. Пусть гугл не слишком расслабляется.
> внимание экспертов. Не только благодаря инновационному интерфейсу и слэштегам, но и в принципе
Ой, какой приторный текст. Это вы стебетесь так, или на полном серьёзе таким языком говорите?
> Секрет успеха такого неординарного решения — Perl
Довольно странный выбор. Сейчас всё больше на python каком пишут, а на perl разве что дописывают то, что десяток-другой лет назад создавалось.
BTW, удачи вам. Пусть гугл не слишком расслабляется.
Будем надеяться, что их ждет больший успех, нежели cuil.com.
Который был довольно многообещающий и амбициозный поначалу.
Который был довольно многообещающий и амбициозный поначалу.
Perl рулит
В CPAN достаточное количество тормозных модулей. Надеюсь они не юзают LWP для crawling'a :)
Гм. Хороший RAID ускоряет работу HDD. О чем это они?
Интересно что они юзают для краулинга.Наверняка AnyEvent или что-то более низкоуровневое на базе EV
Серверы в децентрализованной сети обмениваются данными, так что в каждый момент времени копия информационных блоков содержится на трёх машинах. Как только диск или сервер выходит из строя, остальные серверы сразу это замечают и начинают процесс «лечения», то есть дополнительной репликации данных с потерянной системы
На базе чего это реализовано?
Серверы в децентрализованной сети обмениваются данными, так что в каждый момент времени копия информационных блоков содержится на трёх машинах. Как только диск или сервер выходит из строя, остальные серверы сразу это замечают и начинают процесс «лечения», то есть дополнительной репликации данных с потерянной системы.
На базе чего это реализовано?
Меня действительно удивило это:
The real shocker was the strftime() C function's bad behavior. They were tracking down an intermittent performance problem and discovered that it would sometimes access up to 50 files from disk, shoving a stick in the spokes of any application that relied on fast response times thanks to the unexpected disk seeks this causes. It turns out that the function will load information from locale files to help with its formatting job, and even worse it will periodically recheck the files to see if they've changed. This may not sound like much, but for a programmer it's as unexpected as discovering your grandmother moonlighting as a nightclub bouncer.
В вольном переводе это означает, что Сишная функция strftime() обращается к файлам (до 50 файлов!) для выполнения преобразования.
Более того, данная функция периодически проверяет не изменились ли эти файлы.
The real shocker was the strftime() C function's bad behavior. They were tracking down an intermittent performance problem and discovered that it would sometimes access up to 50 files from disk, shoving a stick in the spokes of any application that relied on fast response times thanks to the unexpected disk seeks this causes. It turns out that the function will load information from locale files to help with its formatting job, and even worse it will periodically recheck the files to see if they've changed. This may not sound like much, but for a programmer it's as unexpected as discovering your grandmother moonlighting as a nightclub bouncer.
В вольном переводе это означает, что Сишная функция strftime() обращается к файлам (до 50 файлов!) для выполнения преобразования.
Более того, данная функция периодически проверяет не изменились ли эти файлы.
интересно, хот в одном поисковике будет когда нибудь реализован полноценный поиск по регулярным выражениям?? у этих перл, могли бы для эксперимента прикрутить…
Sign up to leave a comment.
Инфраструктура Blekko: 800 серверов, свой краулер и модули Perl