Как нам обустроить социальный веб? — Ранжирование информации: точки зрения и кочки злости

    Один из моих первых руководителей в критические моменты развития некоторого проекта любил спрашивать у сотрудников: «Работать будем или чувствовать?». После публикации своей «дуэльной» заметки с «чувствами» я завязал окончательно:). Пора начинать работать! Именно на эту саму работу и направлена серия моих заметок «Как нам обустроить социальный веб?». В ней рассматриваются общие подходы к организации интеллигентного социального ресурса (ИСР), независящие от того, кто и для кого его строит, и какие функции в него закладываются. Ниже идёт вторая заметка данной серии.

    А где первая, спросите вы? Действительно, почему в нашем коллективном блоге я начинаю размещение заметок этой серии не со вступительной заметки, в которой надо было бы более упорядочено и в уточнённом виде сформулировать общие принципы создания интеллигентного социального ресурса (ИРС)? Скажу честно, что заметка с принципами уже готова, но я решил от её публикации пока воздержаться. И делаю это по «политическим» соображениям.
    Более подробный ответ заинтересованный читатель может найти в моём iTech Bridge блоге. Подчёркиваю, заинтересованный, так как вся указанная серию ориентируется только на таких читателей — потенциальных партнёров, участников коллективного блога «Интеллигентный социальный веб» и других, кто согласен с тем, что не всё ещё ладно в королевстве социального Интернета. Всем остальным рекомендую не терять время – заметки очень конкретные, а поэтому, несмотря на конспективность изложения, получились достаточно длинными..

    Итак, начинаю с первой группы конкретных требований к ИРС – требования к ранжированию информации.

    О чём речь

    Информация, которая так или иначе, больше или меньше ранжируется в любом социальном ресурсе, — это, прежде всего, различного вида сообщения: основные (исходные постинги, темы/topics) и комментарии к ним.

    В общем случае, все основные сообщения (постинги) можно разделить по следующим типам:
    Оригинальное информационное сообщение, в том числе:
    — интервью
    — перевод
    Оригинальное сообщение — Опросник (анкета, голосование)
    Ссылка:
    — без аннотации
    — с краткой аннотацией
    — с развёрнутой аннотацией (реферат)
    — на иноязычный источник:
    — с краткой аннотацией
    — с рефератом.

    Говоря о ранжировании любых сообщений, мы имеем в виду три группы вопросов:
    1. Инструментарий для оценки информации, предоставляемый ресурсом пользователям
    2. Критерии ранжирования информации, которые используются системой (ресурсом), производящей упорядочение основных сообщений на базе их прямых и косвенных пользовательских оценок. Сюда же отнесём вопрос о том, как система должна реагировать на пользовательские оценки, непосредственно не влияющие на ранжирование.
    3. Варианты выдачи ранжированной информации из памяти системы на экран (листинг, rss-ленту и т.п.).

    Последовательно рассмотрим все три группы вопросов. Возьмём для этого шесть реальных ресурсов с более или менее пересекающейся функциональностью (digg, reddit, news2, habrahabr, del.icio.us, bobrdobr.ru) и проанализируем, как они отвечают на вопросы каждой из трёх групп. А затем по каждой группе сформулируем требования к идеальному (опять же с моей точки зрения), но пока, к сожалению, почти мифическому интеллигентному социальному ресурсу (ИСР). При этом, как я уже заметил, функциональность ИСР в нашем случае не играет никакой роли. В этой заметке начнём с первой группы.

    Кочки злости

    Вернёмся к цитате, которая и была окончательной каплей, заставившей меня сделать прямой вызов маленьким злым человечкам. Но сейчас, как я и обещал, поговорим совсем о другом.

    С учётом слов, прикрытых в указанной цитате «фиговыми листочками» (я их называю кочками злости), подобный комментарий, безусловно, должен был бы отнесён к разряду грязных, а его автор удалён из числа пользователей ресурсов. Даже, если бы мы встретили в сообщении только одну такую кочку. Это моё глубокое убеждение. Кто и как должен привести приговор в исполнение, — это отдельный вопрос, заслуживающий специальной заметки. Здесь же, забегая несколько вперед, только скажу, что отлучение от ресурса, это тяжёлое наказание. Несмотря на возможность инкарнации. Ведь при этом теряется всё заработанное тяжёлым информационным трудом. Теряется твой рейтинг и связанные с ним возможности. Поверьте мне, прошедшему через это:). Кстати, именно поэтому я и предложил своим оппонентам такие «жёсткие» условия дуэли.

    Пока же посмотрим, как сейчас может пользователь, согласный с моей «карательной» точкой зрения, отреагировать на появление подобного комментария.
    Для того, чтобы прямо пометить некоторое сообщение, как содержащее кочки злости, мы с вами имеем:

    Если это основной постинг:
    digg – нужно последовательно выбрать bury, а затем spam
    reddit – нужно выбрать report
    news2 – нужно последовательно выбрать проблема?, а затем спам
    habrahabr – нет прямой возможности
    del.icio.us (bobrdobr.ru) — нет возможности

    Если она встретилась в комментарии:
    digg — нет прямой возможности
    reddit — нужно выбрать report
    news2 — нет прямой возможности
    habrahabr — нет прямой возможности
    del.icio.us (bobrdobr.ru) — комментарии не используются

    Как мы видим, три ресурса предлагают некоторую возможность указать на неприемлемую информацию. При этом только reddit позволяет сделать подобное не только для основного постинга, но и для комментария. Я пока не проверял реакцию reddit на пометку report. Что касается остальных, то здесь реакция явно замедленная. И даже «НЛО», которые в habrahabr иногда довольно быстро «прилетает» и удаляет «плохие» комментарии, может быть выходом из положения, только в том случае, если они управляются живыми существами, а не роботами. Ведь последним не ведомо, чем «плохие» сообщения отличаются от «хороших». Таким образом, в подавляющем большинстве случаев перед вами три варианта: или смириться с необходимостью постоянно натыкаться на грязь, или перестать пользоваться ресурсом, или сколотить из друзей «похоронную команду» и, в конце концов, «закопать» явного нарушителя, пользуясь легальными средствами описанными ниже. В том числе, и призвав на помощь «НЛО», управляемый роботами. Правда, reddit даёт ещё одну возможность – используя команду hide, вы можете просто удалить из своего обозрения всё, что считаете для себя неприемлемым. Но это слабое утешение.

    Точки зрения

    Теперь давайте несколько препарируем нашего подопытного. Результат без кочек злости может выглядеть примерно так (надеюсь, что проблем с авторских правами у меня не возникнут:)):

    Сударь, при всём моём уважении к Вам, не могу не отнести Вашу позицию к фашисткой идеологии. Поэтому настоятельно рекомендую Вам, как можно быстрее, починить свою машину времени и, воспользовавшись этим механизмом, отправиться в столь любимый Вами 19 –й век.


    А сейчас мы переходим с вами к самому интересному. То, что мы прочли — это уже точка зрения. Вы с ней можете быть согласны или не согласны. Но тем не менее, никуда от этого не денешься. Что же вам сегодня предлагают для выражения своего отношения к этому сообщению? Об этом читайте в расширенном варианте заметки, размещённом в iTech Bridge (Внимание! Ещё раз предупреждаю, заметка получилась достаточно длинная).

    И, как всегда, читайте полный текст этой заметки в iTech Bridge (Внимание! Ещё раз предупреждаю, заметка получилась достаточно длинная).

    Similar posts

    AdBlock has stolen the banner, but banners are not teeth — they will be back

    More
    Ads

    Comments 44

    • UFO just landed and posted this here
        0
        Обману Вас, если скажу, что не хочу. Но у каждого свой стиль и мои читатели к моему уже привыкли. Это, кстати, с моей точки зрения, один из принципов ИСР. Одеако за совет спасибо и в будушем всё-иаки постараюсь его учесть.
          +1
          Вы совершенно правы. Читателям, которым не чуждо скорочтение, иногда бывает проще скользнуть по всему тексту и ухватить суть, чем идти неизвестно куда вслед заманчивой превьюшке, под которой может скрываться откровенная пустышка.
            0
            >>проще... ухватить суть, чем идти неизвестно куда вслед заманчивой превьюшке, под которой может скрываться откровенная пустышка.

            Как раз эту Вашу мысль я и развиваю в своей следующей заметке. Спасибо за образное выражение. Обязательно использую с ссылкой на автора:)
              0
              Буду с нетерпением ждать продолжения вашего цикла.
          • UFO just landed and posted this here
              0
              А Вы уверены в этом?
                –1
                Это очень уверенный человек. Поверьте, он, как никто другой изучил поведение индивидуумов в социальных сетях, а также ИСР, SMO и SMM.
                • UFO just landed and posted this here
                    0
                    Решил прислушаться к Вам. Следующую свою замету организую по Вашему «рецепту». Несмотря на то, что больше согласен с точкой зрения dik о том, что под «заманчивой превьюшкой» часто «может скрываться откровенная пустышка». Так как новая заметка по форме и тематике будет аналогичной данной, то эксперимент получится интересным. Не согласны ли?
                    • UFO just landed and posted this here
                0
                терпеть не могу каты, и крайне признателен, например, Анатолию Левенчуку за то, что он ими не пользуется в отношении своих интересных текстов именно по принципиальным соображениям.

                так что фраза про привыкших читателей справедлива
                +1
                Господин Seller, покорнейше прошу меня извинить что отвлекаю вас от организаторской деятельности на Хабрахабре, но коль уж вы являетесь сотрудником News2, ответьте пожалуйста господину amilner и заинтересованной публике, с чьего попустительста с ним так жестоко обошлись в вашей компании ? Не является ли ваша сегодняшняя реплика средством уколоть лишний раз талантливого оппонента, от которого ваша компания пожелала откреститься ?
                • UFO just landed and posted this here
                    0
                    Господин sheller, не казните за опечатку. Только пожалуйста не блокируйте мой акк на N2.
                      0
                      Господин sheller, я уже выучил Ваш ник. Разрешите обратиться ?
                        0
                        Sheller, я правильно написал ваш ник ? Может быть, предварить его Mr. ?

                        Снизойдите до ответа. Планирует ли ваша компмания News2 крупномасштабное гонение dik ?
                          –1
                          Sch
                          0
                          Я благодарю Вас за столь высокую оценку моей скромной деятельности. Честно скажу, именно от Вас этого не ожидал:)

                          Что касается Вашего вопроса к г-ну sheller, то он, мне кажется, не по адресу. Вернее, может быть, и по адресу, но тогда совсем в другой постановке: «До каких пор владельцы и администраторы социальных ресурсов будут прятать голову в песок и не замечать, что предлагаемые ими правила ранжирования информации и пользователей способствуют тому, что реальнуя власть в большинстве из них захватили веб –большевики? Сами же администраторы играют при этом роль английской королевы». И дело здесь совсем не в во взаимоотношениях между news2 и amilner. И тот, и другой объект не лучше и не хуже себе подобным, соответственно, ресурсам и лицам с тем недостатком, что эти самые лица посмели иметь собственное мнение, разошедшее с мнением реальную власть придерживающих.

                          Что касается, news2 и меня лично, то первому просто не повезло, что свои «социальные эксперименты» я, уподобясь средневековому доктору, начал проводить на себе и, именно, этом ресурсе:)
                            –2
                            Вы не представляете себе, насколько не повезло всем кто читает ваши бредни.
                              0
                              Очень рад, что подобных становится всё больше.

                              >> Буду с нетерпением ждать продолжения вашего цикла.

                              Ну, а Вы, вообще, мой постоянный читатель:), ведь это же Ваша цитата. Так что не знаю, должен ли я Вас жалеть или нужно гордиться таким верным любителем «бредней»?
                                0
                                Я испытываю угрызения совести за то что увидев симптомы вашей гениальности и совершенно бескорыстные позывы служению обществу, коими было наполнено всё ваше существо, не смог уберечь вас от гнева толпы.

                                А теперь, да, постоянно читаю, потому что нахожу порой забавные и иногда даже очень вещи.

                                Надеюсь, что в этом виртуальном мире вы построите свой "Город Солнца" где всё обустроите согласно своим представлениям о идеальном мире, тем паче что у вас есть всё необходимое - удачная фирма, квалифицированные разработчики и ваш гений организатора.
                                  0
                                  Да, в отсутствии чувства юмора Вас не обвинишь:)

                                  А если без шуток, то как оппоненту цены Вам нет. Спорить с Вами всегда интересно. Одно только но, срываетесь иногда и переходите на личности. Понимаю, когда этим занимаются люди, которым сказать нечего. Не понимаю, Вам то это зачем?
                                    0
                                    Вы наверное меня с кем то путаете. Я никогда не спорю. Это бесполезно. Игра словами - да есть :)
                                    Только лишь для продолжения землевращения в том же темпе.

                                    Так вы посмотрите на своё последнее творчество и обвинительные процессы. Это очень забавно, не находите ?
                                      +1
                                      No comments more…
                        0
                        Достаточно интересная тема, с удовольствием и с большим интересом буду ждать продолжения. Может подскажете, где можно ознакомиться с математическими моделями систем рейтингов и ранжирования? Если такие есть ...
                          0
                          Спасибо за отзыв. К сожалению, нигде таковых не встречал, поэтому и занялся этой проблемой и в концептуальном, и в теоретическом, и, конечно, практическом аспектах.
                            +2
                            есть такие, это называется теория экспертных оценок
                            про них было совсем немножко книжек (вернее про ранжировки), которые достаточно тяжело достать
                            было несколько в советские времена ГОСТов, где очень хорошим языком разъяснялись все мат. модели и вообще методы проведения как раз экспертных оценок, кои сводятся как правило к операциям:
                            - выявлению критериев оценки (их классификации и оценки их значимости)
                            - классификации объектов
                            - ранжирования объектов (порядкового [методом непосредственного ранжирования по всему множеству объектов, методом парных оценок], балльного)
                            - численного оценивания различных параметров

                            у меня есть сканы этих и нескольких других текстов (неподъёмные по размеру), и я немножко этим научно увлекаюсь, надо бы статью уже написать, но всё руки не доходят выучить TeX, чтобы хорошо формулы набирать
                              +1
                              а, так вот конкретно не сказал какие книжки и госты

                              1. Дэвид Г. Метод парных сравнений: Пер. с англ. — М.: Статистика, 1978
                              2. Холлендер М., Вулф Д. Непараметрические методы статистики: Пер. с англ. — М.: Финансы и статистика, 1983
                              3. Д. С. Шмерлннг, С. А. Дубровский, Т. Д. Аржанова, А. А. Френкель. ЭКСПЕРТНЫЕ ОЦЕНКИ. МЕТОДЫ И ПРИМЕНЕНИЕ (Обзор). М.:Наука, 1977. Сборник «Статистические методы анализа экспертных оценок».
                              4. ГОСУДАРСТВЕННЫЙ СТАНДАРТ СОЮЗА ССР. Система управления качеством продукции. ЭКСПЕРТНЫЕ МЕТОДЫ ОЦЕНКИ КАЧЕСТВА ПРОМЫШЛЕННОЙ ПРОДУКЦИИ. ГОСТ 23554.0-79. Основные положения
                              5. ГОСУДАРСТВЕННЫЙ СТАНДАРТ СОЮЗА ССР. Система управления качеством продукции. ЭКСПЕРТНЫЕ МЕТОДЫ ОЦЕНКИ КАЧЕСТВА ПРОМЫШЛЕННОЙ ПРОДУКЦИИ. ГОСТ 23554.1-79. Организация и проведение экспертной оценки качества продукции.
                              6. ГОСУДАРСТВЕННЫЙ СТАНДАРТ СОЮЗА ССР. Система управления качеством продукции. ЭКСПЕРТНЫЕ МЕТОДЫ ОЦЕНКИ КАЧЕСТВА ПРОМЫШЛЕННОЙ ПРОДУКЦИИ. ГОСТ 23554.2-81. Обработка значений экспертных оценок качества продукции.

                              названия ГОСТов, конечно, звучат зверски, но в те времена по-другому редко писали.
                              и хоть написано, что промпродукция, но по сути там всё в общем виде написано, для любых объектов.
                          0
                          Большое спасибо за ссылки. Поищу. Ну, а что такое ГОСТы в те времена знаю не по слухам. Сам составлял:)Но без них, думаю, ещё хуже.
                            0
                            я думаю, что может за август эти госты всё-таки отверстаю в приличную электронную форму, и пусть даже с формулами в ворде, потому что хоть как-то, но лучше им быть. очень развивающее чтение, на самом деле. там большие комиссии из и математиков, и психологов и технологов были, ну и вообще эту тему много в центральном экономико-математическом институте АН СССР прорабатывали, а сейчас у нас в Вышке пытаются как-то продолжать, в частности вот тот профессор Шмерлинг, который среди авторов обзора [3].
                            [1] вообще не представляю можно ли в интернете найти, у меня ксерокопии с него, сканировать долго
                            [2] и ещё немного хорошей литературы по непараметрической статистике можно найти на natahaus.ru - какие то добрые люди отсканировали.
                              0
                              и на самом деле, исходя из посыла, что экспертные оценки включают в себя и классификацию объектов, а также классификацию и ранжирование критериев оценки, то почему, собственно, не отдать этот процесс на откуп экспертам (как это и делается, кстати, при оценках продукции), то бишь — пользователям.
                              хотя конечно это только красивая математическая абстракция, пользоваться которой на практике, вряд ли можно.
                                0
                                Нет, это не математическая абстракция, а реалия. Конечно, нужно отдать пользователем, что все и делают. И для ИСР я только за это. Но всё здесь упирается в критерии. Поэтому давайте , прежде всего, уточним вопрос, а что является "продукцией" в нашем случае: информация, другие пользователи или ешё что-то ?
                                  0
                                  ну на хабре, например, в роли оцениваемых объектов выступают люди, коллективные блоги, посты и комментарии (ничего не забыл?)
                                  в моём посте чуть выше к этому списку добавляются критерии и методики оценки.
                                  но эти метаскакания можно делать бесконечно. оценивать оценки оценок.
                                  в гостах для того чтобы этот процесс остановить, говорится о том, что должна быть "рабочая группа" — коллектив не-экспертов, которые составляют правила оценки исходя из её целей, которые определяются заказчиком (ЛПР, как это принято было говорить), который хочет посредством оценки получить ответы на какие-то свои вопросы.

                                  возвращаясь к вопросу, что мы оцениваем в этом самом интеллигентном проекте?
                                  я бы ответил так — а кто у нас является заказчиком этого проекта, что нам надо в итоге-то?
                                  как-то исходя из этого надо рассуждать. можно наверное посмотреть на первый пост блога и понять, что есть идеальный ИСР, и исходя из него отвечать.
                                  какие там объекты на идеальном майспейсе выделить можно?
                                    0
                                    > (ничего не забыл?)
                                    ещё компании
                              0
                              Большое спасибо за источники! На данный момент мне эта тема более чем интересна, и хотя названия звучат действительно зверски, уверен там есть что почерпнуть! Теперь главное, чтобы моего черепка хватило все это постичь :) Вернее все то, что удастся найти. Если таки да, удастся - дам вам знать.

                              p.s. пишите статью :) А то уже интересно :)
                              0
                              Очень жаль, что автор не удосужился сформулировать постановку задачи или дать на нёё ссылку.

                              Ну, ранжируется информация в социальном вебе - а зачем? Каковы цели ранжирования? Чего этим добиваются?

                              Требования про "Средства защиты от кочек злости", "Средства оценки точек зрения" представляют собой чистейший волюнатризм - ну захотел автор, чтобы у системы были такие свойства и что? Как это отвечает интересам других людей?

                              Вообще статья висит в воздухе, без оснований. Либо нужно быть в контексте серии публикаций автора, чего у меня не получилось (надо ходить и раскапывать).
                                0
                                К сожалению, всем одновременно не угодишь. Если повторяю мысль от заметки к заметке, обвиняют в ненужных длиннотах. Делаю ссылки, «получаю по шее» за трудно обозримые цепочки заметок.

                                Вы спрашиваете, а зачем ранжирование информации, вообще, нужно. Повторяюсь: (1)чтобы занятый читатель мог быстро просмотреть самые актуальную информацию и(2) чтобы на основании ранжированной информации можно было корректно проранжировать её источники, пользователей, прежде всего. Последнему как раз и будет посвящена следующая моя заметка. Ну, а зачем ранжировать пользователей? Да, чтобы иметь инструмент их поощрения за информационный труд "на благо социума"
                                  0
                                  Что значит самую актуальную информацию? Самую актуальную для кого?
                                  У людей разные интересы, one man's heaven is another's hell, etc.

                                  Есть задача отбора и обуздания бездонного инфопотока.

                                  Поймите, меня не интересуют в своей массе оценки и мнения людей, которых я не знаю, которые не являются авторитетами в какой-то теме ДЛЯ МЕНЯ. И я утверждаю, что для большинства людей это так. В случае усреднения по всей популяции "экспертов" мы получаем на поверхности поп-продукт, лубок, жвачку, ДОМ-2. lothar хорошо процитировал вот здесь: http://curlybrace.habrahabr.ru/blog/2117…

                                  Поэтому имхо вы исходно идёте не тем путём, подменяете требования, опирающиеся на инфопотребности (отбор качественной ДЛЯ МЕНЯ информации) решениями по реализации (ранжирование).

                                  Ранжирование имеет смысл только в том случае, если вы доверяете вкусам и мнению ранжирующего большинства.

                                  Поэтому разумнее рассматривать варианты с созданием сетей доверяй, сетей экспертов - людей, которые являются для вас проводниками качественного контента. Т.е. грубо говоря, в своей ленте событий/новостей/анонсов я должен видеть их отсортированных в порядке убывания значимости, которую проставила им МОЯ сеть доверия, а не СТАДО леммингов.
                                    0
                                    Либо Вы невнимательно читаете мои заметки (не воспринимайте это как упрёк), либо мы с Вами говорим об одном и том же, но разными языками - что вполне естественно.

                                    Предлагаю продолжить этот разговор после моей следующей заметки (плюс, может быть, ешё одной). Тогда, думаю, всё станет более ясно.
                                +1
                                Вообще я здесь не вижу почему-то распространённого термина "коллаборативная фильтрация" (collaborative filtering), а он здесь ключевой.
                                  0
                                  Впервые слышу этот термин. Прочитал о нем в Википедии походил по ссылкам, и понял, что то, что я придумал в течении последней недели - это было коллабративная фильтрация :) Огромное спасибо за такой мощный поток информации, теперь мне будет проще двигаться дальше :)

                                  Вопрос, может не в тему. Есть ли под этим всем какой-то математический аппарат ? Спасибо!
                                    0
                                    Вот например перечень работ, найденных по ссылкам в википедии: http://www.andreas-ittner.de/index_rs.ht…
                                      0
                                      Спасибо! Когда понимаю сколько информации еще надо усвоить, становится немного не по себе. И заодно придает драйва :)
                                • Only users with full accounts can post comments. Log in, please.