Критерии ранжирования: От каждого по способности, каждому по труду (№3 )

    Чисто социалистический лозунг, вынесенный в заголовок этой заметки – третьей в серии «Как нам обустроить социальный веб?», может оказаться совсем не плохим применительно к Web 2.0. Да, и, если хорошо подумать, не такой он уж и плохой для реальной жизни. Беда только в том, что никто его и никогда не собирался в этой жизни по настоящему использовать.

    В предыдущей заметке этой серии (все заметки серии будем помечать их относительным порядковым номером) мы рассмотрели инструментарий, с помощью которого каждый зарегистрированный пользователь может выразить своё отношение к различным входным сообщениям, поступающих от других пользователей. В этой остановимся на том, для чего, как, когда, и в какой степени при ранжировании информации и пользователей система (ресурс, ИСР) должна использовать, проставленные оценки.

    В предложенном подходе к выбору основного критерия ранжирования участников прямые пользовательские оценки либо вообще не учитываются, либо идут с меньшим весом, косвенные действия читателей, которые объективно отражают их реальный интерес к сообщениям оцениваемого участника. Ведь и в самом деле трудно предположить, что вы будете знакомиться с неинтересными и бесполезными для вас материалами, голосовать по ним и участвовать в их обсуждениях. Другими словами, практика (ваши действия, а не намерения и пристрастия) – критерий истины.

    О чём речь

    В общем случае, процедурам ранжирования в социальных ресурсах подвергаются объекты трёх типов:
    1. Основные сообщения (темы/topics)
    2. Пользователи
    3. Сайты (ресурсы – источники информации)

    В качестве исходной информацией для ранжирования при этом могут выступать:
    1. Прямые пользовательские оценки:
    -данного объекта, например, как мы это видели в предыдущей заметке применительно к сообщениям
    -другого объекта, например, сообщения при оценке его автора
    2. Косвенные действия пользователей, которые могут что-то сказать об интересе к ранжируемому объекту

    А теперь рассмотрим всё это конкретнее применительно к каждому из трёх видов объектов ранжирования. Как всегда, сначала будем говорить о существующих ресурсах, а затем о том, что предлагается для типового интеллигентного социального ресурса (ИСР). При этом хочу сразу предупредить, что, говоря о существующих ресурсах и в некоторых случаях не зная точных алгоритмов их работы, я буду опираться на свои наблюдения. Непрозрачность алгоритмов ранжирования – это вопрос отдельного разговора

    Ранжирование основных сообщений
    Ранг сообщения в существующих ресурсах определяется как:

    digg – некоторая функция от сумм всех пользовательских «за (digg it) и «против» (Bury) по отношению к данному сообщению. Такая интегральная оценка здесь называется Популярностью сообщения.

    reddit — некоторая функция от сумм всех пользовательских «за (Up/like) и «против» (Down/dislike) по отношению к данному сообщению. Однако такая функция рассматривается здесь только как один из вариантов ранжирования. Почти на равных используются и другие, например, по «противоречивости» (Controversy) и актуальности (Hot)

    news2 – некоторая функция от сумм всех пользовательских «за (Отметить) и «против» (проблема?) по отношению к данному сообщению. Такая интегральная оценка здесь называется Качеством сообщения.

    habrahabr – некоторая функция от сумм всех пользовательских «за и «против» по отношению к данному сообщению. Такая интегральная оценка здесь называется Хабрасилой

    del.icio.us – некоторая функция от сумм всех пользовательских «за (save it) по отношению к данному сообщению. Такая интегральная оценка здесь называется Популярностью сообщения.
    bobrdobr.ru — ранжирование сообщений не используется (или мне так показалось?)

    У меня есть подозрение, что на значения аргументов типа «за» и «против» в некоторых ресурсах также влияют ранги голосующих пользователей. Также думаю, что иногда на значение такого весового коэффициента влияет и сумма комментариев к данному сообщению. С большей вероятностью последнее предположение верно для reddit при ранжировании по «противоречивости» и актуальности.

    Предлагается для ИСР:

    1. Ранжирование по номинациям — многокритериальное ранжирование
    2. Равноправность всех номинаций – пользователь сам выбирает, какая номинация его больше устраивает и даже может соотнести такую номинацию со своей домашней страницей
    3. Актуальность сообщения является самой «объективной» номинацией для сообщений, хотя рассматривается системой только как первая среди равных. Именно по критерию актуальности ранжируются сообщения, выдаваемые на главную страницу по умалчиванию. Как мы увидим дальше — этот же критерий является основным (если не единственным), используемым при ранжировании пользователей.
    4. Равноправность «оценивающих» пользователей в части возможности высказать свою оценку любого сообщения (не своего, конечно). Что касается весовых коэффициентов такой оценки, то статус голосующего в определённых случаях может оказать влияние на такой весовой коэффициент. Но этому планируется посвятить отдельный разговор.

    Сформулированный подход, с моей точки зрения, является гарантией высокого уровню плюрализма ИСР и предотвращает возможность когда либо некоторой группе пользователей навязывать свои «идеологические» пристрастия остальным.

    Сначала несколько слов о номинациях ранжирования основных сообщений, каждая из которых связана со своим критерием. Вообще говоря, их может быть сколь угодно много. Я приведу только несколько (названия условные; как и номенклатура номинаций, это дело вкуса разработчиков ИРС):
    Актуальность (популярность, востребованность) сообщений – как мы уже отметили, это основной критерий. Поэтому, с моей точки зрения, он является обязательным для любой ИРС. Подробнее об этой номинации смотри ниже.
    Общепризнанность сообщений – содержат идеи (мысли, предложения, выводы), с которыми согласны большинство ознакомивших с ними
    Неприемлемость сообщений — содержат идеи (мысли, предложения, выводы), с которыми не согласны большинство ознакомивших с ними
    Противоречивость сообщений – содержат спорные идеи (мысли, предложения, выводы).

    Рассмотри подробнее критерий ранжирования по актуальности информации. Остальные критерии (номинации) ранжирования будут представлены в следующей заметке.

    Ранг сообщения в номинации актуальность определяется как функция от сумм всех пользовательских:

    1. просмотров (View) этого сообщения. Имеется, конечно, в виду, что пользователь сначала получает только общий список сообщений.
    2. прямых ответов — комментариев верхнего уровня к этому сообщению
    3. голосований Согласен — Не согласен, не зависимо от того, как конкретно проголосовал каждый пользователь
    4. комментариев более нижних уровней, связанных с этим сообщением
    5. голосований к этим комментариям, опять же независимо от того, какие они

    Каждый аргумент (сумма) имеет свой весовой коэффициент, выбор которого может сыграть решающую роль в корректности номинации. Не углубляясь пока в тонкости этого вопроса можно, в общем, наметить следующие приоритеты (в порядке убывания значения весовых коэффициентов): 2, 1, 3, 4, 5. При этом для аргументов 4 и 5, связанных с комментариями нижнего уровня, весовой коэффициент должен резко понижаться для каждого следующего уровня.

    Почему я всё-таки отдаю предпочтение комментариям по отношению к обычным просмотрам (прочтениям) сообщений. Ответ, мне кажется прост. Мы все мастера делать броские аннотации, как я по совету уважаемого sheller я и сделал к этой заметке. В тоже время тяжело не согласиться с утверждением dik, что за «заманчивой превьюшкой», часто «скрываться откровенная пустышка» (смотри комментарии к предыдущей заметке в habrahabr). Надеюсь, к моим заметкам это не относится:). А вот комментарий каждый из нас, как правило, будет писать только в том случае, если материал его задел за живое.

    Как мы видим, здесь прямые пользовательские оценки либо вообще не учитываются (например, «нравится — не нравится»), либо идут с меньшим весом («согласен- не согласен»), чем его косвенные действия, которые объективно отражают реальный интерес пользователя к данному сообщению. Ведь и в самом деле трудно предположить, что вы будете знакомиться с неинтересными и бесполезными для вас материалами, голосовать по ним и участвовать в их обсуждениях. Другими словами, практика (ваши действия, а не намерения и пристрастия) – критерий истины.

    Только один пример для иллюстрации сказанного. Есть у меня один верный читатель – мой заклятый друг. Нет, не тот, о котором вы подумали — здесь всё в рамках допустимого, хотя иногда и тянет на Что- то не так. Кто он и и откуда, не имеет сейчас никакого значения. Главное, что не пропускает «мой друг» почти ни одной моей заметки. При этом чистит меня, как только может и минусы соответствующие расставляет. Почти риторический вопрос, актуальны ли для него мои мысли или нет? А может быть это просто такой себе современный информационный Робин Гуд, который посвятил всю свою жизнь защите сирых и бедных пользователей социального веба?

    Нетрудно также заметить, что в определении критерия актуальности я следую известному правилу: «новое – это хорошо забытое старое». Ведь вспомним, какие постинги мы, прежде всего, читаем на форумах, построенных на традиционных движках типа IPB? Правильно, те, которые до нас больше всего просмотрели и прокомментировали другие. Правда, в известных мне форумных движках в выходных листингах редко производится упорядочение сообщений по критерию актуальности, но ведь и времена сейчас другие:). Это, кстати, ещё раз к прозвучавшему в мой адрес намёку об использовании «перелицованного форума».

    А теперь нам будет проще перейти и к самому «больному вопросу социалки». К вопросу о том, кто, как и почему нас с вами ранжирует. Об этом читайте в расширенном варианте заметки, размещённом в iTech Bridge (Внимание! Честно предупреждаю, заметка опять получилась достаточно длинная).
    Share post

    Comments 8

      0
      все это напоминает нейронные связи
        0
        Мне кажется, что нейронные связи это НЕ напоминает именно потому, что все влияют на всех, то есть все сообщество влияет на каждого конкретного человека (нейрон). Именно поэтому лично меня все приведенные ресурсы и не устраивают, потому я и взялся за Паранойю. Да, конечно, самостоятельно выстраивать свои связи (дендриты, если уж пользоваться нейросетевой терминологией) всяко сложнее, чем пользоваться эффектом толпы, но, как я думаю, именно и только это и "предотвращает возможность когда либо некоторой группе пользователей навязывать свои «идеологические» пристрастия остальным".
          0
          А Вы считаете, что предложенная в заметке схема исключает как следующий шаг «самостоятельно выстраивать свои связи (дендриты)»? Мне, как раз кажется, что наоборот.
            0
            Нет, ни в коем случае не считаю, разумеется. Просто в статье об этом ничего не было сказано, а я же не могу понять то, что автор еще не сказал :). Просто вся статья пронизана понятиями общей оценки чего-либо, общей оценки сообщений, общей оценки пользователей - а с этим я категорически не согласен. Если и вы с этим не согласны, то нам по пути :)
              0
              Судя по тому, что Вы сказали в своих комментариях, я надеюсь, что нам всё-таки по пути:)

              Просто я вижу на «этом пути» два последовательных шага от общего к частному: от критериев «общих» оценок, которые я рассматриваю в двух своих заметках (именно в заметках, а не статьях, Вы, конечно, хорошо понимаете разницу), к системе персональных фильтров, которые я хотел бы рассмотреть позже. При этом такой двух шаговый подход – это не просто приём для описания моей концепции, но и предполагаемая последовательность её практической реализации.

              О том, что второй шаг неизбежен, я прямо и говорю в конце своей заметки (прошу прощения за самоцитирование):

              «Остаётся один вопрос. А можно ли попытаться всё-таки найти некоторый интегральный критерий ранжирования, где в одной гремучей смеси перемешать академиков, белых ворон, выразителей чаяний и возмутителей спокойствия? Долго думал над этим и пришёл к выводу - нет, нельзя. Хотя, может быть, и найдётся алхимик, который умудрится это сделать. Мне же кажется, что сосредоточиться надо на другом - дать каждому пользователю возможность адаптировать все номинации по своему вкусу и даже приближаться к своему персональному интегральному критерию. Но об этом позже...»
                0
                А, понятно, это в заметке, но не на хабрахабре. Отлично, что ж, идея витает в воздухе, очень многие думают примерно в том же направлении. Мои пять копеек в этом направлении находятся здесь: http://greg.southural.ru/paranoia/
                  0
                  >>А, понятно, это в заметке, но не на хабрахабре.

                  К сожалению, не Вы один, прочтя только сокращённые варианты моих заметок на Хабре и не заглянув в мой iTech Bridge блог, делают не совсем точные выводы.

                  >>Мои пять копеек в этом направлении находятся здесь: http://greg.southural.ru/paranoia/

                  Ну, почему так скромно :) Познакомился с Вашим проектом перед тем, как вступить в разговор. Проект мне показался очень интересным (кроме названия, конечно - на рынке с ним нечего делать). Мы, действительно, идём с Вами почти по одной дороге, а, может быть даже без «почти» .
                    0
                    Приглашая Вас принять участие в работе нашего коллективного блога. Вы можете разместить в нём информацию о концепции своего проекта и обсудить её с другими пользователями хабра. Если Ваша карма пока не позволяет сделать это, можно воспользоваться механизмом Общества Непризнанных Гениев , специально предусмотренным для подобных случаев.

          Only users with full accounts can post comments. Log in, please.