Search
Write a publication
Pull to refresh
0
0
Ратмир @johnRATA

Пользователь

Send message

Caffeine – новая система индексирования веб-сайтов от Google

Reading time2 min
Views9.1K
Кэрри Грим, разработчик Google

Сегодня мы рады сообщить вам о завершении работы над нашей новой системой индексирования веб-сайтов – Caffeine. Caffeine на 50% «свежее» предыдущего индекса и представляет собой самую большую коллекцию веб-страниц за нашу историю. Что бы вы ни искали — новости, сообщения в блогах или на форумах, — нужные вам страницы теперь еще быстрее попадут в наш индекс, а вы сможете их быстрее найти.

Несколько слов для тех, кто не так хорошо знаком с поисковыми технологиями. Когда вы ищете информацию в Google, вы не работаете с «живой» сетью. Поиск осуществляется по индексу сети, созданному Google. Этот индекс очень похож на предметный указатель в конце книги, помогающий вам найти нужную информацию.

Зачем нам понадобилось создавать новую систему индексации? По двум причинам. Во-первых, количество информации в сети растет, а форматы ее представления становятся все разнообразнее. На современном сайте вы найдете видеоролики, изображения, новости и обновления в реальном времени. Страницы стали насыщеннее и сложнее по структуре. Во-вторых, люди ждут намного большего от поиска. Пользователей интересует самая свежая информация по теме, а издатели хотят, чтобы их аудитория могла найти материал сразу же после публикации.

Чтобы не отставать от стремительного развития сети и удовлетворять растущим ожиданиям пользователей, мы и создали систему Caffeine. На картинке вы видите, как работала старая система индексации и как теперь работает новая.



В нашем старом индексе было несколько слоев, некоторые из которых обновлялись регулярнее, чем другие. Большая часть индекса обновлялась каждые две недели. Чтобы обновить слой индекса, нам нужно было проанализировать всю сеть, что создавало задержку между моментом нахождения страницы и тем, когда она становилась доступной пользователю.

Caffeine, в свою очередь, позволяет нам анализировать информацию в Интернете «по частям» и непрерывно обновлять наш поисковый индекс. Это означает, что результаты поиска будут отображать максимально свежую информацию, вне зависимости от времени и места публикации.

Каждую секунду система обрабатывает сотни тысяч страниц. Если мы представим себе, что эти страницы бумажные, стопка из них росла бы со скоростью около 5 км в секунду. В базе данных Caffeine содержится порядка 100 млн. гигабайт данных, а новая информация добавляется со скоростью нескольких сотен тысяч гигабайт в день. Вам бы понадобилось 625 тысяч iPod-ов с самым большим объемом памяти, чтобы сохранить такой массив информации.

При создании Caffeine мы ориентировались на будущее Интернета. Эта система является отличной основой для построения других, более быстрых и объемных индексов, так как она способна лучше адаптироваться к развитию сети. Этим летом появятся и другие улучшения. Следите за новостями!

Internet Explorer 9: наиболее полное руководство разработчика (и не только), часть 3

Reading time6 min
Views7.5K
HeaderLeft[1]
Это третья часть руководства по нововведениям в браузере IE9. В первой части я рассмотрел поддержку стандартов CSS, HTML5, DOM, вторая часть была посвящена реализации в IE9 технологии SVG. В третьей завершающей части я расскажу про поддержку в IE9 нового стандарта веб-шрифтов WOFF, ICC-профилях, форматов TIFF и JPEG XR, изменениях в JavaScript-движке, инструментах разработчика и об интерфейсе пользователя в IE9.

Читать дальше →

Аудио плеер под GNU/Linux — DeaDBeeF

Reading time1 min
Views12K
Сегодня обнаружил для себя очень симпатичный плеер DeaDBeeF. Да что уж говорить, после Audacious и Exaile это просто сказка, а не плеер. И так, что имеем:

DeaDBeeF — аудио плеер под системы GNU/Linux. Распространяется под General Public License version 2.

mp3, ogg vorbis, flac, ape, wv, wav, m4a, mpc, cd audio (и многие другие);
поддержка utf8, cp1251;
поддержка cuesheet (.cue файлы);
не зависит от GNOME, KDE;
трей;
drag and drop;
хоткеи;
плейлисты;
18-полосный эквалайзер (поддерживает пресэты от foobar2000);
радио;
плагины;
и многое другое
Читать дальше →

Об организации рабочей атмосферы и пространства

Reading time3 min
Views4.9K
Здравствуй, читатель.

Вот сижу и смотрю я на свой захламленный рабочий стол (на котором компутер стоит) и посетила меня мысль. А собственно, на сколько страдает наша продуктивность от порядка на столе, на сколько у нас в мозгу поворачивается та самая заслонка, которая приостанавливает мысли о работе.
Читать дальше →

ZendFramework QuickStart — Создание Проекта

Reading time11 min
Views14K
Данная статья не является чем то сверхестественным и подойдет скорее для тех, кто начинает изучать
Zend Framework. Так уж получилось что сам я начинал изучение с версии
1.7, но незадолго после начала познания данного инструмента меня забрали в армию, и год я программированием не занимался. Сейчас до возвращения в родные края остался месяц, а так же появилось свободное время.
В начале изучения какого либо инструмента, как я заметил по себе всегда хочется иметь его под рукой, чтобы сразу же при возможности
поковыряться а не перечитывать предварительно кучу документации.
Так у меня было с Zend Framework, когда он был еще версии 1.7
Пришлось перечиать несколько статей и пересоздать кучу каталогов,
чтобы настроить рабочий Zend Framework проект. Собственно данная статья является своего рода переводом статьи Zend Framework Quick Start | Create Your Project для версии Zend Framework 1.10.5
С некоторыми исправлениями и примечаниями.
Прочитав ее я думаю вы с легкостью создадите рабочий Zend Framework
проект и сразу же перейдете к изучению на практике.

В общем то, если все же кому то статья покажется по вкусу, возьмусь
за перевод всех статей серии Quick Start.

Итак, поехали…
Читать дальше →

Vkontakte Open Media Player

Reading time2 min
Views1.2K

Вступление


Хочу представить вам свою опенсорс разработку — Vkontakte Open Media Player, которая позволяет удобно смотреть кино и сериальчики из вконтакта с выбором качества (имеется ввиду разрешение видео, а не качество рипа, хотя и оно часто указано :) ).
Немного подробностей внутри.
Тут будут подробности.

На старт… внимание… up! Hi-tech в Израиле: индустрия стартапов

Reading time20 min
Views2.6K
Эта тема выбрана нами не случайно. Традиционный сезонный спад деловой активности в сочетании с перманентной экономической нестабильностью вынуждают вновь задаваться наболевшими вопросами и искать новые пути развития индустрии. Одним из таких путей является создание благоприятных условий для появления сегмента высокотехнологичных стартапов. Очевидно, что для этого необходимо радикальное реформирование отрасли – и экономическое, и технологическое, и социальное, не говоря уже об образовательном компоненте и поддержке государства. Именно поэтому мы предлагаем взглянуть на исторический опыт Израиля — страны, которой удалось совершить революционный прорыв в развитии hi-tech-индустрии – и экстраполировать его, насколько возможно, на постсоветские реалии.
Читать дальше →

Ловля бага #52001 в PHP 5.3: указатели и неициализированные переменные

Reading time2 min
Views1.1K
По следам недавно найденного tvv'ом бага.

При выполнении следующего кода в PHP версий 5.3.0-5.3.2 результат превосходил все ожидания.

<?php
f(0, $$var);
$x = 1;
$y = 2;
echo $x;
function f($a, $b) {};


В результате выводилось '2'. Мне удалось найти багу и поправить её: #52001. Коротко: затирался указатель на специльную переменную-затычку для неинициализированных переменных, через которую и создаются все CV переменные в PHP.

Читать дальше →

Проект твоей мечты

Reading time10 min
Views2K
Некоторым везет. Вы точно знаете такого. У него на столе широкоформатный монитор, которым можно заменить экран в кинотеатре. Компьютер, приютившийся под дорогим дубовым столом, мощнее WOPR из старого фильма «Военные игры». И, конечно же, не забываем, что всё это в отдельном кабинете, в котором даже можно закрыть дверь на ключ (само собой, по исключительно важным поводам). И если вам людишкам из-за офисных перегородок этого мало, то вспомните, что этот чувак отвечает за самые крутые проекты и использует самые сексуальные и новейшие технологий. Он из тех, кем все прочие смертные тоскливыми ночами мечтают быть, вместо того чтобы спать. Но какого же ему так везет?
Читать дальше →

Интересный баг PHP 5.3

Reading time1 min
Views2.6K
Сегодня был найден интересный баг PHP 5.3, который присутствует в версиях от 5.3.0 до последней 5.3.2.
Причем это наблюдается и под Linux, и под Windows.
В предыдущих версиях PHP данная проблема не наблюдается.

Итак:

<?php
f(0, $$var);
$x = 1;
$y = 2;
echo $x;
function f($a, $b) {}
?>


Логично предположить, что должно быть выведено число 1. Но увы, это не так, выводится 2.

На всякий случай Андрей Костин ( www.weblancer.net/users/Lisio ), с которым мы сегодня локализовали этот дефект, зарепортил его в баг-трекер PHP bugs.php.net/bug.php?id=52001

Кто-либо знает причину этого явления?

2000 часов в одиночестве, или как был сделан RSS reader / Я робокоп

Reading time14 min
Views6.7K
I. Am. Robocop.Всем привет,

Собираюсь поделиться с вами технической стороной того, как я за 16 недель сделал новый вебовый rss ридер, и чуть не сошел с ума.
Отходя от долгой предыстории, будем считать, что все началось в феврале этого года, когда мы с Дэвидом (dmiloshev, UI-дизайнер) решили сделать прототип нашего детища вдвоем.
«В одиночестве» — потому, что не было никаких скрамов, совещаний, «коллективного разума», а всю техническую часть, довелось делать самому.

Если бы меня попросили описать всю статью в одном предложении, то получилось бы:
No-SQL, mongodb, node.js, фак мой мозг, Evented I/O, очереди, выводы, git, nginx, memcached, Google Reader, Atom, TTL, PHP, ZF, jQuery, выводы.
Читать дальше →

Как на самом деле работает мозг

Reading time4 min
Views99K
На хабре довольно популярны статьи о различных техниках повышения работоспособности, улучшения памяти, самомотивации и т.д. и т.п. Увы, зачастую авторы этих статей совершенно не представляют себе, что такое мозг, как он работает и почему всё устроено именно так.

Прежде всего, необходимо понять вот что:

Думать дорого

12 портативных приложений для веб-разработчика

Reading time3 min
Views19K
image

Любой веб-разработчик всегда должен иметь под рукой свои рабочие инструменты. Конечно, зачастую вы работаете дома или в офисе, со своим рабочим компьютером. Но если вы часто находитесь в разъездах, или же устариваете демонстрации своей работы в офисе у клиентов, то вам на помощь придут портативные версии необходимых программ.
Читать дальше →

Особенности краудсорсинга тестирования для заказчика

Reading time6 min
Views5K
Обратил внимание, что практически нет заметок, посвященных интересному, на мой взгляд, сервису uTest.com. Я работаю с ним уже в течение полугода, протестировал около десятка релизов, однажды даже получил награду как лучший тестировщик проекта, принимал участие в соревновании Bug Battle, общаюсь на форуме и с штатными сотрудниками.

В данной заметке я поделюсь своими мыслями, с какими особенностями тестирования может столкнуться заказчик тестирования, обратившийся в uTest, и какую выгоду он может извлечь. Если тема интересна, позже напишу о том, что получает исполнитель, вступая в это сообщество, какие виды заработка доступны и как лучше начать карьеру внештатного тестировщика в uTest. Если у вас есть какие-то вопросы по теме, которые по каким-либо причинам не могут быть заданы в комментариях, пишите на почту.
Читать дальше →

Как прокачивать мозг

Reading time8 min
Views174K
В этой теме я хочу поделиться своими знаниями про устройство мозга и тем, как применяю это на практике.

Не правда ли, картинка объемна?

Итак, как известно, мозг — важнейший орган нашего тела. Кто-то говорит, что он — самая сложная вещь во вселенной. И незнание некоторых его особенностей может очень плачевно сказать на жизни человека.

Но обо всем по порядку.

Понимание роли мозга


Нет невежества страшнее, чем невежество по отношению к самому себе.

Мозг управляет почти всем в нашем организме — от дыхания, работы органов чувств до сложных мыслительных процессов и воображения. Существует множество методик и советов по развитию, однако, как я убедился, мало какие делают упор на роль мозга в процессе.
Читать дальше →

Аутичный onPHP: обзор

Reading time10 min
Views7.1K
Приветствую, хабралюди.

onPHP OnPHP — это фреймворк, как не трудно догадаться, написанный на PHP. Как и любой подобный инструмент он обладает своими преимуществами и недостатками и, как я считаю, первых у него больше.

Как ни странно, на хабре я не нашел ни одного топика, посвященного этому фреймоврку. Видимо причина в том, что у фрейморка напрочь отсутствует документация, отчего он напоминает «фреймворк в себе» и «для своих». Однако это не совсем так, но об этом чуть позже.

Читать дальше →

Новые ULV-процессоры

Reading time1 min
Views22K
   В ряду мобильных процессоров от компании Intel появилось несколько ULV-новобранцев. Вкратце – новые представители линеек Core i3, i5 и i7 стали на треть компактней, на треть производительней и на 15% экономичней.

image

Ура, еще один шаг навстречу ультракомпактным ноутбукам.
Читать дальше →

Хочу сайт или 5 ступеней познания Дао

Reading time5 min
Views22K
«Вы знаете, что в Китае живут китайцы, и даже сам император – китаец». Так, помнится, начиналась знаменитая сказка Ганса-Христиана Андерсена «Соловей». В подражание Андерсену мы решили рассказать типичную китайскую притчу о некоем человеке и его пути к просветлению.

image

«Сказка – ложь, да в ней намёк», — сказал другой сказочник. Наша история описывает ряд классических ошибок, совершаемых заказчиком сайта, спотыкающимся на каждой из 5 ступеней, ведущих к прибыли.

Ступень первая. «Хочу сайт».


В провинции Сычуань жил человек по имени Ляо. Ляо торговал джинсами и ничего не знал об Интернете, методах продвижения, оптимизации, блогах, социальных сетях и прочих виртуальных прелестях. Единственное, чего он страстно желал – заработать денег.
Читать дальше →

Поднимаем софтверный бизнес

Reading time8 min
Views1.9K
WEBO SoftwareЭто вторая статья о становлении софтверного (интернет-) бизнеса в России (первая тут). В ней я собираюсь раскрыть некоторые ключевые моменты адаптации продукта под рынок (под требования пользователей), о преодолении тенологической пропасти, и чуть-чуть о реалиях российского бизнеса.

Данный топик хочу приурочить к тому, что год назад (может, чуть раньше или чуть позже) появился продукт WEBO Site SpeedUp (ранее Web Optimizer). Мысли немного сумбурны, но, видимо, для каждого направления все сильно специфично, поэтому ценными будут только общие идеи, направления и подходы к решению проблем (в чем я искренне надеюсь :). Здесь и далее речь идет о создании коробочного решения (а не софтверном аутсорсе).
Читать дальше →

Information

Rating
Does not participate
Location
Киев, Киевская обл., Украина
Registered
Activity