Предопределение развития информационных волн

    Привет хабр!

    Я уже писал о возможности предугадывать развитие информационных волн и общественных трендов путём анализа диффузии инновации для конкретной выборки. Прошло какое-то время, я посоветовался с корифеями медиа-аналитики и статистики, приобрёл новые знания по теме и сформулировал новые идеи.

    Начну по порядку.

    Существует теория диффузии инноваций. Это теория, призванная своим существованием объяснить как, почему и с какой скоростью новые идеи и технологии распространяются в обществе. Главную суть теории, пожалуй, можно выразить одним графиком.


    Само собой разумеется что процентное соотношение на графике приведено среднее, и в зависимости от выборки и тематики оно будет меняться вместе со всеми переменными. Куда важнее то, что форма графика функции всегда будет однообразной. Это в принципе понятно любому и означает лишь что всякому тренду, как и всему живому на земле, когда-то приходит начало и когда-то конец.

    Николас Кристакис и Джеймс Фаулер (учёные мужи из Гарварда), с помощью теории диффузии инноваций и построения социальных графов в какой-то момент сделали потрясающее открытие, открытие очевиднейшее до гениальной степени.
    Взяв связанную меж собой выборку людей и определившись с единицей распространяемой информации, они делили выборку в соотношении 10/90, где группа А — 10% людей с наибольшим количеством социальных связей внутри выборки, а группа B — все остальные. По каждой группе, для одной и той же темы составляли графики диффузии инноваций.
    Результат всегда получался такой:


    То что группа А, обладающая большим количеством социальных связей и располагающаяся ближе к центру социального графа воспринимает все информационные волны раньше группы B очевидно, в принципе, и без построения графиков. Куда как важнее что форма таких графиков, разумеется в соответствующем процентном соотношении, будет всегда стремиться к абсолютному подражанию. Это означает что отслеживая распространение информации у определённой группы пользователей, мы можем предугадать за вполне уважаемый срок (зависит от среды, информации и качеств акторов сети) распространение такой информации у группы, в 10 раз превышающей наблюдаемую.

    Мне кажется, что это восхитительно.

    Альберт-Ласло Барабаши — создатель теории безмасштабных сетей. Сетей, в которых степени вершин распределены по степенному закону. Эмпирическим путём доказано что безмасштабные сети — один из любимых инструментов матушки-природы, ведь большинство естественным путём получаемых сетей (биологических, космических и, конечно, социальных) построены именно таким образом.



    Слева на рисунке показана обычная сеть, основанная на случайно составленных данных.
    Она чувствительна к атакам, если случайным образом вынуть из неё несколько акторов, то ущерб может быть велик вплоть до полного разрушения.
    Справа безмасштабная сеть, небольшое число узлов в ней характеризуются многочисленными связями, а многие узлы имеют лишь небольшое число связей, поэтому и нанести ей урон случайным удалением акторов менее вероятно.

    Разумеется любой социальный граф будет являть собой безмасштабную сеть.
    Значит, в нём можно выделять наиболее обоснованные группы акторов.
    Значит, в зависимости от веса акторов (возможностей распространения информации), их можно объединять в группы и сравнивать с акторами более крупными (например большую группу пользователей с газетой).
    Значит, акторы можно распределить в целую пирамиду социального веса и отслеживать распространение информации на каждом уровне.

    Не знаю как вас, но меня такой метод восхищает до самой глубины души и пиков воображения.
    Но и слишком радоваться тут нельзя. Разумеется, что на распространение информации влияет множество сторонних факторов, отследить которые через интернет (а мы ведь говорим о нём) попросту невозможно. Абсолютно предопределить никакую информационную волну нельзя, но есть и хорошие новости — к абсолюту можно стремиться бесконечно, создавая например бесчисленное количество матриц по конкретным характеристикам темы или выборки.

    Отдельно стоит поднять этический вопрос отслеживания людских настроений.
    Напрашивается сравнение с ядерной энергетикой, которую можно упаковать в бомбы и выдавать в розницу диктаторам третьего мира, а можно и раздавать оптом в розетки всех желающих.

    Спасибо за внимание и проявленный интерес.

    Комментарии 9

      +6
      Интересно, слышали ли ученые мужи из Гарварда о точках бифуркации.
        0
        m7d7o7: у вас поверхностное понимание теории диффузий инноваций, кривая Роджерса имеет очень много истолкований, то что вы написали про неё — это самое поверхностное понимание. Как пример эта кривая утверждает, что подавляющее большинство общества не готово работать над своими идеями полностью бескорыстно хотя бы на первых порах (таковых не более 2, 5 процентов в среднем) — это и есть таки называемые инноваторы, фаза 1. Судя по тому что вы таки хотите создать какой-то стартап, скорее сего вы входите в эти 2, 5 процентов.
          +1
          Действительно, в тексте ТДИ указана лишь поверхностно, но и не о ней одной я писал статью.
          Такого поверхностного описания достаточно для понимания общей концепции, которую я хотел донести, если же кто-то заинтересуется сильнее, то там есть линк на википедию.
          0
          А количество социальных связей не подчиняется нормальному распределению (или похожему)? Если есть только «активные» и «пассивные» участники, то будет первая волна, по которой можно предсказывать вторую. А если в системе есть участники с любой активностью, то нельзя будет выделить какие-то волны — всё сольется в кучу. Да, будет какой-то размазанный пик, но не «волна».

          Но вообще — да, как-то это можно применять. Если на Лепре уже банят за Gangnam Style, то через год будут банить и во Вконтакте.
            0
            В социальных сетях распределение степеней в большинстве случаев подчиняется степенному закону ("Power Law")
            0
            Я наверно не уловил сути послания, потому что в голову приходят банальные фокус-группы.
              +1
              Интересно, но я честно не пойму в чем гениальность того, что при большем количестве источников информации я, например, узнаю о чем-то раньше большинства, до которого она распространится чуть позже? Я всего-то немного ближе к эпицентру.
              К тому же, как правило, трудно предугадать какие мелкие флуктуации вызовут то или иное событие, а пытаться что-то сделать с уже известной информацией, разница доступности которой, между отдельными связями, в текущих реалиях не так уж велика — чрезвычайно трудоемко.
                0
                Комментарий к первой картинке: 73.5% статистических данных берутся с потолка.
                  0
                  Статья немного сумбурная, посоветую пройти хороший курс Мичиганского университета по анализу соц. сетей, class.coursera.org/sna-2012-001/lecture/index, вот он на ютубе, сказали что уже закрыт доступ (https://www.youtube.com/results?q=1+1+1A+why+detect+communities&oe=utf-8&aq=t&rls=org.mozilla:ru:official&client=firefox-a&um=1&ie=UTF-8&gl=RU&sa=N&tab=w1 и сбоку по номерам 1 1 1A, 1 2 1B и т.д. двигайтесь )
                  habrahabr.ru/post/164307/ вот моя статья в тему.

                  Вообще же существует несколько разных моделей, Барабаши одна из первых, потом было развитие, Клейнберг, Ньюмен и др, исследовали сети с преимущественным присоединением («богатые становятся богаче»), Милгрэм (6 рукопожатий, уже 5.5 кстати). К тому же есть еще bypartite графы, они вообще плохо изучены, т.к. сложные расчеты метрик у них.

                  Этический вопрос никого не волнует — пока что плохо разработана семантическая модель оценки позитива\негатива — поэтому отслеживается вручную.

                  Я это все пишу к тому, что не понял чем вы хотите в стартапе заниматься, теоретической подкованности не видно сильно и конкретики мало.

                  Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                  Самое читаемое