Как стать автором
Обновить
335.89
FirstVDS
Виртуальные серверы в ДЦ в Москве

Google Search: от идеи до доминирования в Интернете

Время на прочтение11 мин
Количество просмотров2.4K

Прямо сейчас я пишу эту статью в одном из реально удобных сервисов Google Docs. Да и каждый из нас по много раз в день контактирует с каким-то сервисом Google: просматривает почту на Gmail, смотрит ролики на YouTube, ищет информацию в Chrome, пользуется смартфоном на Android и так далее. В общем, Google вряд ли нуждается в представлении. 

Но есть у компании и провальные проекты вроде Google Glass. Еще на нее сыплются многочисленные иски от недовольных пользователей, а правительства выписывают многомиллионные штрафы за монополизацию. Тем не менее этот колосс стоит крепко и падать не собирается. Например, недавно Google включился со своим Gemini в нейросетевую гонку с OpenAI. 

А ведь компании могло и не случиться, если бы не настойчивость двух студентов, которые создали лучшую поисковую систему в мире. О них и их главном детище — наш сегодняшний рассказ. 


Знакомство основателей

История многих сегодняшних техногигантов началась с идеи, рожденной в голове основателя. В нашем случае таких голов было две. 

Сергей Брин родился в 1973 году в Москве. Семья была напрямую связана с точными науками: отец Михаил занимался математикой, а мать Евгения — исследованием космических полетов. В 1977 году после возвращения с математической конференции в Варшаве отец принял решение эмигрировать в США.

Как известно, в те времена нельзя было просто получить визу и уехать из Союза. Прямой билет был возможен только если ты лишался гражданства — как Солженицын или Ростропович с Вишневской.

Основатель Google в нежном 17-летнем возрасте
Основатель Google в нежном 17-летнем возрасте

Прознав о желании сотрудника покинуть страну, руководство университета, где Михаил Брин работал преподавателем его незамедлительно уволило. Евгению постигла та же участь.

В течение следующих восьми месяцев, не имея стабильного дохода, семья была вынуждена перебиваться случайными заработками. Однако в мае 1979 года, как раз после «парада отъездов» за границу известных деятелей культуры, семья Брина наконец получила официальные визы и разрешение покинуть страну. 

Поначалу семья жила в Вене и Париже, пока Михаил Брин добивался возможности попасть в США. Позже они получили поддержку от общества помощи еврейским эмигрантам и наконец прибыли в США 25 октября 1979 года. Михаил Брин получил должность профессора математики в университете штата Мэриленд, а его супруга стала работать в Центре космических полетов имени Годдарда, в НАСА. 

Сергею Брину тогда только исполнилось 6 лет. Спустя год он пошел учиться в местную школу Paint Branch Montessori School, а затем продолжил образование в Eleanor Roosevelt High School в Гринбелт. С самого детства у него был явный интерес к математике, и отец всячески поощрял его занятия в этой сфере. Поэтому было понятно, что Сергей вряд ли пойдет на актерские курсы или станет художником.

В 1990 году Брин поступает в Мэрилендский университет, где спустя 3 года получает степень бакалавра наук на факультете компьютерных наук. Причем имея отметку «отлично» по базовым для себя предметам — информатике и математике. 

В 1995 году он заканчивает обучение по стипендии Национального научного фонда уже в Стэнфордском университете, получив степень магистра прикладных наук. После этого в 1997 году он начинает масштабную работу по исследованию интеллектуального анализа данных. Всего за Брином числится 17 работ в Стэнфордском университете. И по счастливой случайности Сергей встречает в университете другого энтузиаста — Ларри Пейджа. 

Ларри Пейдж и Сергей Брин в годы совместной работы в Стэнфордском университете
Ларри Пейдж и Сергей Брин в годы совместной работы в Стэнфордском университете

Ларри Пейдж родился в один год с Брином (1973), но в истории его семьи не было столь знаковых событий вроде эмиграции и проблем с выездом из страны. Отец Пейджа был профессором информатики в Университете штата Мичиган, а мать Глория работала преподавателем компьютерного программирования в колледже Лаймана Бриггса. 

С детства Ларри увлекался компьютерами — первым его устройством стал Exidy Sorcerer на базе легендарного процессора Zilog Z80. Именно на нем он постигал азы написания программного кода и даже стал первым учеником в истории школы Montessori Radmoo, кто сдал домашку на текстовом процессоре, а не бумаге. 

Пейдж получил степень бакалавра наук в Мичиганском университете в 1995 году по специальности «компьютерная инженерия». А в 1998 году — степень магистра в области компьютерных наук Стэнфордского университета. Именно в этот период обучения Пейдж и знакомится с Сергеем Брином. 

В те годы Ларри Пейдж занимался исследованием Всемирной паутины, а именно ранжированием страниц и вопросов адекватности выдачи информации. Ведь до появления Google поисковые системы уже вовсю существовали, но их работа была далека от идеала. 

Идея двух студентов

До появления поисковиков пользователь был вынужден заходить на FTP-серверы и вручную просматривать каждый документ, ориентируясь только на краткое описание. Вы не могли ввести куда-то запрос из серии: «Сколько весит слон?» и получить мгновенную пачку ответов. Проблему вызвался решить Алан Эмтейдж, который в 1990 году разработал первый в мире поисковик Archie на Unix

Кстати, недавно появилась новость, что Archie возобновил работу после двух десятков лет забвения. Подробности можно найти по ссылке.

Если кратко, Archie представлял собой набор скриптов, которые выполняли поиск по списку общедоступных FTP-серверов с использованием протокола Telnet и создавали индексные файлы. Пользователь вводил тему и получал в ответ список адресов в виде доступного каталога документов. При этом Archie оказался удивительно производительным: мог обработать до 2 миллионов файлов, распределенных на сотнях серверов всего за пару минут. 

Интерфейс первого в мире поисковика Archie. Правда не все с этим согласны.
Интерфейс первого в мире поисковика Archie. Правда не все с этим согласны.

Вот лишь некоторые примеры тех поисковых систем, которые появились в период с 1990 по 1998 год:

  • Wandex (1993 год), разработанный Мэтью Грэем. Работал на базе первого поискового веб-робота Wanderer, написанного на языке Perl. Он уже умел сканировать заголовки сайтов, но выдавал все подряд, не обращая внимания на то, соответствует ли порядок выдачи запросу или нет. 

  • Excite (1994 год), созданная студентами Стэнфордского университета. Кроме выдачи, система позволяла смотреть новости, погоду и обмениваться мгновенными сообщениями.

  • WebCrawler (1994 год), придуманный Брайаном Пинкертоном из Вашингтонского университета. На момент запуска в базе данных компании было 4000 веб-сайтов, а через шесть месяцев был возможен поиск уже по миллионному запросу. Является самой старой действующей системой

  • AltaVista (1995 год) — супер популярный поисковик, один из главных конкурентов Google на раннем этапе. Был самым быстрым на тот момент — работал на базе мощного 64-битного сервера DEC Alpha. Дополнительно поддерживал ввод сразу на нескольких языках. 

  • Yahoo (1995 год) — кажется, что он не нуждается в отдельном представлении. Одним из первых, кто предложил целую экосистему, а не просто поиск по сайтам. 

Ранние поисковые системы — многим хабровчанам они могут быть хорошо знакомы. Мы не рассмотрели еще с десяток поисковых систем, но про них лучше будет подготовить отдельный материал.
Ранние поисковые системы — многим хабровчанам они могут быть хорошо знакомы. Мы не рассмотрели еще с десяток поисковых систем, но про них лучше будет подготовить отдельный материал.

Собственно, Ларри Пейдж пытался понять, почему тот или иной материал или сайт может быть полезен пользователю. Потому что поисковики на тот момент не умели выдавать релевантные запросу результаты. 

Пейдж представлял всю интернет-сеть в виде огромного разветвленного графа, в котором одни сайты ссылались на другие. А что, если присвоить вершинам графа (страницам на сайте) весовой коэффициент, в зависимости от количества входящих в него ребер (гиперссылок)? По идее, чем больше материал упоминается на других ресурсах, тем он полезнее для большинства. А следовательно, с большей вероятностью понравится и одному конкретному пользователю под похожий запрос. 

Примитивная иллюстрация алгоритма PageRank
Примитивная иллюстрация алгоритма PageRank

Но какие же нужны вычислительные мощности для того, чтобы проанализировать миллиарды связей? Точнее, около пяти миллиардов ребер и двух миллиардов узлов на тот момент? 

В 1996 году Пейдж знакомится с Сергеем Брином — великолепным математиком, который достиг значительных успехов как раз в анализе огромных массивов данных. Их сотрудничество приводит к появлению алгоритма PageRank. Краеугольного камня современного веб-поиска, который учитывал не только количество раз, когда ключевое слово появлялось на веб-странице, но также качество и релевантность входящих ссылок. 

В 1996 году Брин и Пейдж получают гранты по программе стипендии Национального научного фонда и запускают в работу проект BackRub, чтобы проверить свои идеи на практике. По сути, это был мощный веб-сканер, который должен был проиндексировать миллионы страниц, выявить все взаимосвязанные обратные ссылки и проверить алгоритм ранжирования. Как бы построить тот самый граф Ларри Пейджа. 

Брин и Пейдж при посредничестве других выпускников Стэнфорда Скотта Хассана и Алана Стеремберга собрали на базе университетских серверов систему и запустили ее в работу летом 1996 года. При этом BackRub занимал примерно половину вычислительных ресурсов сети кампуса. К 29 августа 1996 система проиндексировала порядка 75 миллионов URL-адресов, загрузила 30 миллионов страниц и суммарно выкачала 207 Гб информации. Неудивительно, что университетская сеть несколько раз чуть не легла, а руководство Стэнфорда регулярно получало жалобы от пользователей. 

Страница BackRub до сих пор доступна
Страница BackRub до сих пор доступна

Технически BackRub был написан на Python и Java. Для работы использовалось несколько производительных рабочих станций Sun Ultra второго поколения, а также множество дополнительных накопителей для хранения информации. 

Сейчас один из серверов стал экспонатом музея в Стэнфорде
Сейчас один из серверов стал экспонатом музея в Стэнфорде

Чтобы продемонстрировать результат работы поисковика, Пейдж и Брин разместили страницу по адресу google.stanford.edu (от термина googol — единицы со ста нулями, чтобы показать масштаб идеи) и z.stanford.edu. Первыми пользователями были, разумеется, студенты Стэнфорда. И они были поражены, насколько быстро происходил поиск и ранжирование материалов в поисковой выдаче. Ну а дальше эффект сарафанного радио привел к тому, что к началу 1998 года на демонстрационную страницу приходило уже больше 10 000 запросов в день

Пейдж и Брин решили, что из этого эксперимента может что-то получиться. 29 января 1998 года они публикуют статью The PageRank Citation Ranking: Bringing Order to the Web (по ссылке — оригинальная статья с подробным описанием работы алгоритма PageRank), которая перевернула представление о поиске в интернете.

После этого появляется еще одна их статья, которая станет одной из самых цитируемых в истории: The Anatomy of a Large-Scale Hypertextual Web Search Engine. В ней Сергей и Ларри подробно описали архитектуру и принципы работы поисковой системы Google. В ней рассматриваются ключевые аспекты: серверная инфраструктура, алгоритм PageRank для оценки релевантности веб-страниц, методы краулинга и индексации, а также подходы к обеспечению высокой производительности и масштабируемости системы. Эта работа заложила основу для создания современных поисковых систем.

Успех поисковика

В августе 1998 года соучредитель Sun Microsystems Энди Бехтольшайм выписал Ларри и Сергею чек на 100 000 долларов для того, чтобы они основали свою собственную компанию Google Inc.

Брин и Пейдж арендовали гараж у своей подруги Сьюзен Воджитски на окраине Менло-Парка, Калифорния, и зарегистрировали компанию 4 сентября 1998 года. К тому моменту домен google.com уже был ими зарегистрирован. Ларри Пейдж стал генеральным директором, а Сергей Брин — президентом. 

Гараж, в котором начиналась история корпорации Google
Гараж, в котором начиналась история корпорации Google

После этого они купили собственные серверы, которые использовались в дополнение к вычислительной мощности Стэнфорда — руководство университета обожало своих талантливых выпускников и решило помочь им. Но все равно этого не хватило бы для глобальных охватов, учитывая скорость появления новых материалов в интернете. Поэтому дальше началась «любимая» часть для всех стартапов — поиск инвесторов. 

Одна из первых серверных стоек, которая была смонтирована в гараже
Одна из первых серверных стоек, которая была смонтирована в гараже

Но как говорится, проще сказать, чем сделать. Когда деньги кончились, а по-новой занимать у друзей и брать кредиты в банках было нельзя, Брин и Пейдж в отчаянии приняли решение продать компанию и вернуться к научной деятельности в Стэнфорде. Выбор пал на уже упомянутый выше Excite — до этого они поглотили WebCrawler и в целом выглядели весьма амбициозно. 

В 1999 году Брин и Пейдж пришли в офис Excite с предложением продажи Google Inc в 1 млн долларов (только вдумайтесь — сейчас материнская компания Alphabet имеет капитализацию 2 трлн долларов).

Но когда директор Excite Джордж Белл услышал цифру, то он рассмеялся и сказал, что ни за что не потратит такие деньги на никому не известный стартап. Снижение предложение до 750 000 долларов тоже не помогло. Тогда основатели Google поняли, что это — не вариант, и нужно двигаться дальше. Примечательно, что сама Excite была продана спустя 4 года, а решение Белла названо одним из самых глупых в истории

Тем не менее удача улыбнулась Пейджу и Брину. Случился внезапный рост поисковых запросов в интернете и пузырь доткомов начал активно раздуваться. Тогда в Google решили удачно вложиться инвесторы вроде Дэвида Черитона, Кляйнера Перкинса, Кавитарка Шрирама и небезызвестного Джеффа Безоса — сумма инвестиций составила порядка 25 млн долларов. Это позволило окончательно отказаться от продажи и сосредоточиться на развитии поисковика. 

В марте 1999 года компания, которая насчитывала уже больше десятка человек, по совету инвесторов переехала из гаража в новый офис в Пало-Альто. Логично, поскольку этот район можно назвать кварталом технологических стартапов Кремниевой долины. А спустя еще пару лет головной офис перебрался в стеклянное здание в Маунтин-Вью, которое прозвали Googleplex. 

Переломный момент случился 10 марта 2000 года, когда лопнул пузырь доткомов. Огромное число компаний, относящихся к интернету, были вынуждены закрыться из-за катастрофического падения стоимости акций и ухода инвесторов. Некоторые сумели выжить, например, Amazon, ebay и Booking. Но что касается Google, их крах не только не затронул, но и позволил со своим революционным алгоритмом стать лидерами отрасли. Ведь люди продолжали пользоваться интернетом, и если кто-то предлагает это быстрее и удобнее других, то почему бы не пользоваться этим сервисом? 

26 июня 2000 года Google официально объявил, что проиндексировал 1 млрд URL адресов — порядка 560 млн полнотекстовых проиндексированных веб-страниц. В тот же день компания анонсировала специальное соглашение с Yahoo, согласно которому в Yahoo будут использовать поисковый движок Google. Возможно, после этого и появились штуки вроде: «Что делает поисковик …. (подставить любое название)? Он гуглит!». С учетом того, что Yahoo в 2003 году поглотил популярную AltaVista через покупку их владельцев Overture Services, Inc, легко представить, что конкурентов у поисковика Брина и Пейджа практически не осталось. 

Лаконичный дизайн стал отличительной чертой
Лаконичный дизайн стал отличительной чертой

К слову, в 2004 году Yahoo после покупки AltaVista разорвал партнерское соглашение с Google, но вернуть себе лидирующие позиции, как было в конце 90-х годов, компания уже не смогла. А Google в том же году приобрела Pyra Labs — самую крупную на тот момент платформу для блогеров. Это позволило дополнительно оптимизировать алгоритм и в том числе оценивать релевантность статей, основываясь на мнении популярных в интернете пользователей. 

23 октября 2000 года Google совершила еще одну революцию в мире интернета — представила сервис AdWords. Пользователи могли регистрироваться на условиях полного самообслуживания и устанавливать сумму, которую готовы были платить за тысячу показов их рекламы. Тот, кто предлагал больше, получал более высокую позицию в поисковой выдаче. Теперь маркетологи любых компаний, размещающих рекламу в интернете, могли смотреть метрики и охваты, измерять эффективность баннеров и многое другое. 

Прибыль от новой рекламной модели поначалу не могла сравниться с оплатой за клик (PPC) от Overture (бывший поисковик GoTo, позже приобретенной Yahoo), но тем не менее принесла Google более 70 млн долларов в первый год. Надо отметить, что Брин и Пейдж изначально были против подобной монетизации, однако совет директоров во главе с Эриком Шмидтом настоял на том, что это увеличит капитализацию компании.

Собственно, когда Google 20 августа 2004 года вышла на IPO, это событие стало одним из самых долгожданных для многих инвесторов за последние годы. Первое размещение при цене 85 долларов за акцию (хотя изначально ожидалось порядка 135 долларов за акцию) позволило привлечь 23 млрд долларов.

Google сейчас

C 2004 года Google официально стал доминирующей компанией в области веб-поиска и сохраняет эти позиции и сейчас. 

Доля ведущих поисковых систем с 2015 до 2024 года
Доля ведущих поисковых систем с 2015 до 2024 года

В том же 2004 году Шмидт, Пейдж и Брин приняли решение заняться и другими направлениями. Вот лишь некоторые из них:

  • 2004 год — запускают почтовый сервис Gmail для конкуренции с сервисами Yahoo. Сейчас почта Google имеет 1,5 млрд пользователей, в то время как у Yahoo только 220 млн пользователей. 

  • 2005 год — появляется Google Maps, который является ребрендингом программы Earth Viewer купленного ими стартапа Keyhole, Inc.

  • 2005 год — покупка Android за 50 млн долларов. В 2008 году он был презентован как ответ на появление iPhone с собственной ОС.

  • 2006 год — покупка YouTube, на тот момент уже популярного стартапа. 

  • 2006 год — появление облачных сервисов для работы с документами: Google Docs, Google Sheets и так далее. 

  • 2007 год — Google покупает компанию онлайн-рекламы DoubleClick за 3,1 миллиарда долларов, чтобы компенсировать падение доходов от рекламы за счет использования cookies. 

  • 2008 год — Google выпускает браузер Chrome, который быстро побеждает в конкуренции с Microsoft Internet Explorer и Apple Safari.

Ну и еще десятки других интересных сервисов, о каждом из которых лучше будет написать отдельный материал, как и о Google Search. Как все знают, далеко не все из них были успешными: начиная от тех же Google Glass и заканчивая многочисленными попытками создать собственную социальную сеть.

Но безусловно, первоосновой компании, которая сейчас имеет капитализацию 2 млрд долларов, является именно поисковый движок. Здесь их доминирование продолжается уже 20 лет и конца этому не видно, особенно с учетом того, что Google продолжает идти в ногу со временем и уже внедряет свой ИИ прямо в поиск, как ответ на использование ChatGPT в поисковике Bing от Microsoft. Посмотрим, к чему это приведет.


НЛО прилетело и оставило здесь промокод для читателей нашего блога:

-15% на заказ любого VDS (кроме тарифа Прогрев) — HABRFIRSTVDS.

Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.
Хотели бы вы работать в Google?
34.48% Спрашиваете еще, конечно!20
24.14% Не хочу14
5.17% Уже там работаю3
36.21% Хочу посмотреть ответы21
Проголосовали 58 пользователей. Воздержались 6 пользователей.
Теги:
Хабы:
+20
Комментарии9

Публикации

Информация

Сайт
firstvds.ru
Дата регистрации
Дата основания
Численность
51–100 человек
Местоположение
Россия
Представитель
FirstJohn