Алгоритм + толпа — этого недостаточно

Original author: Rand Fishkin
  • Translation
В последнее десятилетие онлайновым миром управляли две родственные силы: Толпа и Алгоритм. Коллективные «пользователи» интернета (Толпа) создают контент, кликают и голосуют, в то время как математические уравнения привносят масштабируемость и возможность поиска по этому огромному массиву данных (Алгоритм).



Словно луна над океаном, взаимодействие этих двух сил создаёт волны популярности (и забвения) в интернете. Информация более доступна, полезна и эгалитарна, чем когда бы то ни было.

Но со временем (по крайней мере, мне) стали видны слабости системы «алгоритм+ краудсорсинг». Следующая революция кажется неотвратимой.

Давайте для начала рассмотрим некоторые примеры краудсорсингового, алгоритмического прогресса:

Netflix — мы смотрим, ставим рейтинги и отзывы. Netflix рекомендует (они даже закраудсорсили свой алгоритм).

Amazon — мы выбираем, покупаем, ставим рейтинги и отзывы. Amazon анализирует данные, пока точно не узнает, что именно рекомендовать (очевидно, что это критическая часть их бизнеса).

Expedia — мы летаем, снимаем комнаты, спим и отдыхаем. Машины Expedia анализируют, устанавливают цены и вычисляют, как получить максимальную прибыль.

Google — мы создаём контент, цитируем других и обмениваемся ссылками. Google ползает, сортирует, выдаёт и ранжирует (базируясь в основном на созданном людьми графе ссылок).

Facebook — мы дружим, обновляем и лайкаем. Facebook строит идеальную систему для таргетинга контента и рекламы.

Reddit/Digg/StumbleUpon — мы предлагаем темы и голосуем за контент. Они принимают их и определяют, как долго тема должна висеть на главной странице и для кого она будет видима.

Yelp — мы ужинаем, посещаем заведения и делаем покупки, оставляем отзывы. Yelp классифицирует, ранжирует и рекомендует.

Мы не полностью зависим от этих алгоритмов, ведь имеем возможность копать глубже, искать дальше и собирать больше данных для принятия решения (и часто мы так делаем). Но, поскольку машины делают предположения о том, что нам надо, бывает легче воспользоваться решением по умолчанию, чем искать альтернативный путь.

Сравните это с альтернативными методологиями до эпохи интернета:

Видеопрокат — кассету для просмотра помогали выбрать секции «рекомендации персонала», «выбор критиков» и «номинант премий».

Журнал о технике (Consumer Reports) — эксперты анализировали и тестировали продукт со всех сторон, а потом ставили оценки и рекомендовали лучший, с их точки зрения.

Турагенты — путешествия бронировались профессионалами, которые имели уникальный доступ к базам данных с информацией о билетах и гостиницах.

Путеводитель по ресторанам — такие справочники включали в себя рейтинги ресторанов и отзывы от анонимных оценщиков из десятков городов.

Личные рекомендации — когда не было ни одного справочного ресурса, то друзья, родственники, коллеги и различный сервисный персонал (консьерж в доме, справочная по телефону) могли предложить свои варианты настолько личные, релевантные и ценные, что эта методология часто используется даже сегодня.

Поймите меня правильно, я считаю, что в большинстве случаев эти предшественники современного подхода «алгоритм+краудсорсинг» не могут сравниться по качеству, надёжности и полезности. Их диапазон часто были слишком ограниченным, иногда искажённым коммерческой выгодой и временами просто неправильным.

Но эти предшественники имели реальные преимущества — главное, что каждый мог понять, на чём основана рекомендация. Сравните это с загадкой наших сервисов «алгоритм+краудсорсинг».

Почему эта страница выводится первой по определённому запросу Google? Почему одна ссылка держится на главной странице Reddit часами, а другая с таким же количеством голосов исчезает за несколько минут? Почему Facebook показывает мне рекламные объявления о работе в службе поддержки Comcast? Почему Amazon рекомендует покупать цельное молоко вместе с этим самодельным танком?

Если мы не понимаем, в чём причина подобных рекомендаций, может ли это снизить наше доверие к будущим рекомендациям этих сервисов?

Фред Уилсон недавно написал интересную историю о том, почему мы не должны инвестировать в то, чего не понимаем:

… отрасли рынка венчурного капитала заполнены инвесторами, стремящимися за прибылью. И некоторые из них не понимают, во что они инвестируют. Несколько недель назад мне позвонил частный инвестор, который хотел вложиться в одну компанию из нашего портфеля. Он задал несколько вопросов о компании, и стало вполне ясно, что человек не вполне понимает суть её деятельности. Но затем он предложил свои инвестиции. Это меня пугает.

Меня в последнее время посещают некоторые иностранные представители, многие из которых инвестируют миллиарды долларов от имени своих боссов. Все они хотят влезть в наши фонды и в наши сделки. Когда я спрашиваю о причинах, они не могут даже сформулировать убедительный аргумент об экономическом потенциале социальной сети. Но они видят прибыль и тоже её хотят. Это меня пугает.


Я считаю, что для некоторых людей в равной степени трудно и глупо доверять сервисам рекомендаций, чьи алгоритмы они не могут понять. Эти самые люди могут обратиться за рекомендациями к источникам, которые им понятны, и результаты которых они могут логически вывести.

Моя точка зрения не в том, что Google, Netflix, Amazon, Yelp или кто-то ещё обречён на неудачу. Но я считаю, что есть бизнес-возможность для предпринимателей, веб-сайтов и компаний добавить редакторский компонент в парадигму «алго-толпы».

Многие стартапы уже действуют в этом ключе.

Quora / FormSpring / StackExchange — в отличие от ответов Google или даже Википедии, где порядок выдачи результатов либо источник информации неизвестны и свободны от ответственности, современные системы Q+A отдали власть в руки толпы, алгоритмов и экспертов.

Techmeme / Memeorandum / Mediagazer — толпа блогеров создаёт контент и цитирует друг друга. Алгоритм компилирует и сортирует информацию, в то время как кураторы обеспечивают качество и актуальность.

Alltop — отобранная под надзором Гая Кавасаки коллекция фидов по отраслям. В данный момент алгоритмический элемент отсутствует, но я думаю, так долго не может продолжаться.

Oyster / Raveable — Туристические сайты печально известны слишком большим количеством сомнительных комментариев и лишённых достоверности отзывов подозрительного качества от коммерческих партнёров, финансово мотивированных аффилейтов. Oyster действует, посылая в отели редакционных экспертов для написания собственных отзывов, а затем применяя пользовательские данные и алгоритмическое ранжирование/оптимизацию, чтобы помочь читателям сделать наилучший выбор. Raveable сочетает лёгкий редакторский надзор с мощным дата-майнингом и алгоритмом сортировки для помощи в поиске отеля.

Groupon / LivingSocial / Gilt Group — Сайты с купонами и предложениями в Сети уже около десяти лет, но эти три (и ещё куча похожих на них) произвели революцию в индустрии и становятся одними из самых известных брендов в онлайне благодаря социальным фичам (краудсорсинг маркетинга и рекламы предложений), алгоритмической фильтрации для персонализации/локализации предложений и редакторскому надзору (так что сделки, которые они предлагают, действительно достойные).

TheSixtyOne / Pandora / Last.fm / Spotify — Музыкальные рекомендации становятся всё лучше, и последнее поколение подобных сервисов представляет собой помесь алгоритмов, краудсорсинга и редакторского выбора, которая доставляет симфонический восторг многочисленным пользователям.

Я думаю, мы увидим ещё больше примеров подобного подхода в будущем, возможно, даже на сайтах/сервисах, которые я упомянул в самом начале (Yelp, Amazon, Netflix и др.). Я уверен, что алгоритмы и краудсорсинг можно сделать сильнее с добавлением третьей опоры — уверенных, благожелательных редакторов.
AdBlock has stolen the banner, but banners are not teeth — they will be back

More
Ads

Comments 9

    –2
    Картинка красивая. Откуда?
      +3
      наноболты… не узнали?!
      +2
      сумбурно, не формализированно, но спасибо за агрегацию ссылок в пост ))
        0
        очень много полезных ссылок))
          +1
          Так вот оно что! Автор придумал модераторов? 0_O
            +2
            редакторов жеж!!!
            0
            Мне кажется, что вы описываете переход от web2.0 к так называемому web3.0.
              +1
              Во-первых, спасибо за хороший русский перевод (а не тот словесный катыш, который выдают автоматические «трансляторы»- зачастую мелькает на Хабре).

              Во-вторых, спасибо за интересный текст и актуальные размышления. Некоторое время назад я выкладывал статью как раз на эту тему. В чём я согласен с автором? «Технологическая элита» должна быть, и она должна устанавливать направление движения всего сообщества в рамках своей ниши. Не все могут адекватно и хорошо разбираться в обсуждаемом вопросе, а значит и сила влияния на свою нишу на должна быть разной.
              С другой стороны, мне кажется, что автор стоит около открытой двери и не делает следующий шаг. Очевидно, что этот следующий шаг — создание системы, которая отбирает этих самых экспертов. Думаю, что такая система будет неизбежно жёстко привязана на оффлайн. Например, отбор экспертов в области С++ должен базироваться на характеристиках реальных оффлайновых проектов, которые успешно реализовал человек. Тот, кто сможет создать такую систему, сможет создать успешное сообщество, которое будет жить и развиваться.

              И, наконец, в третьих. Я бы хотел предложить ознакомиться с книгой «Манифест новой экономики» Александра Долгина. Она как раз про нашу обсуждаемую тему. Автор предполагает, что при некотором балансировании экономики, алгоритмов и сообществ, технологическая элита в сообществах выделится сама собой. Сомневаюсь в том, что оно произойдёт само, но кое-что рациональное в размышлениях автора, уверен, есть.
                0
                Хабру почему зыбыли упомянуть? Например, в компании «Techmeme / Memeorandum / Mediagazer»?

                Only users with full accounts can post comments. Log in, please.