Математическая модель предсказывает исход кампании на Кикстартере с 76%-й достоверностью через 4 часа после её начала

    Исследователи из Федеральной политехнической школы Лозанны построили статистическую модель, предсказывающую успех или провал кампании на Кикстартере на основе динамики финансирования и социальных взаимодействий. Более ранние попытки предсказать итог кампаний совместного финансирования опирались на статические показатели, то есть те, которые известны до начала кампании: размер собираемой суммы, наличие видео, тематика. Такие модели достигали точности в 68%.



    Швейцарские учёные собрали данные по 16 042 кампаниям, которые проходили с сентября 2012 года по май 2013. Кроме данных о динамике поступления взносов, они мониторили Твиттер на предмет появления твитов со словом «kickstarter» и ссылкой на страницу проекта и исследовали состав бэкеров проекта — их активность в других проектах, типичные суммы взносов и т.п… Именно использование комбинированной модели с учётом социальных взаимодействий позволило значительно улучшить качество предсказания. Уже через 4 часа после начала кампании можно предсказать её исход с 76% уверенностью. По истечении 10% отведённого на кампанию времени, то есть в среднем через три дня, точность увеличивается до 85%.

    У этой методики есть неплохие перспективы дальнейшего увеличения точности — более тщательный анализ социальных графов, использование других социальных сетей кроме Твиттера. Кроме того, пока что модель выдаёт лишь вероятность успеха, но не называет возможных причин и конкретных рекомендаций по улучшению кампании.

    Один из авторов методики, Венсан Этер, запустил сайт, на котором можно видеть результат работы модели для текущих проектов в реальном времени и скачать все исходные данные, которые использует модель. Научную работу в формате PDF с более подробным описанием модели и методики можно скачать здесь.

    AdBlock has stolen the banner, but banners are not teeth — they will be back

    More
    Ads

    Comments 19

      +1
      А можно как-то проверить уже закончившийся «забег с препятствиями»?
      Я про сбор средств на телефон от Canonical — угадал бы метод или нет.
        0
        Они же вроде на IndieGoGo собирали, а не на Кикстартере.
        • UFO just landed and posted this here
            +4
            Не обязательно. Модели поведения пользователей могут быть разными на разных площадках. Например, граждане разных стран могут по разному оценивать полезность одних и тех же идей.
        +1
        Интересно как повлияет на статистику то, что особо грамотные юзеры будут перед тем как бекерить смотреть на процент успешности кампании и принимать решение учитывая успех проекта в целом?
          +17
          Как же еще, увеличит точность метода. Метод сказал «не полетит», никто не вложился и в итоге на самом деле «не взлетит» =)
            0
            В итоге швейцарским ученым профит, кампаниям на Кикстартере, особенно с рейтингом где-то посередине между «взлетит» и «не взлетит» могу посочувствовать. И вангую возможные проплаты швейцарским ученым за накрутку рейтинга для успешности кампании)) Наука она такая!
              0
              А если люди будут ждать 4-5 часов для того, чтобы статистика получила процент побольше и из-за того, что масса людей «ждёт» — этот процент катится в пропасть?
            0
            Понятное дело как: как самореализующееся пророчество.
              0
              Уже давно есть Kicktraq, который делает ровно то же, просто с меньшей точностью. Так что никак не повлияет.
              +2
              Сделали бы прогнозирование планируемой кампании, когда она еще не запущена!
                0
                кнопка «бабло»)
                +22
                76%, несмотря на достаточно большое на первый взгляд число — достаточно слабый результат для бинарного классификатора в этом случае.
                Предположим лучший случай, 50% кампаний завершаются успехом, 50% — неудачей. Тогда тривиальный классификатор выдаст 50% точность. Но ведь в реальности на кикстартере успехом завершаются далеко не 50% кампаний, поэтому разрыв с тривиальным классификатором еще меньше. Тут интереснее было бы посмотреть на false positive/false negative и историческое распределение успехов/провалов, чем на агрегированную «точность» (в оригинальной статье по ключевым словам false/positive/negative ничего не нашел).
                • UFO just landed and posted this here
                    0
                    sidekick.epfl.ch/stats

                    И правда далеко не 50%.
                      0
                      Удивительно, конечно. Не думал что почти каждая вторая кампания завершается успехом. Но с другой стороны — они пишут что у них не все кампании, возможно они отсеили что-то закрывшееся или совсем неудачное.
                    0
                    Хорошо, допустим проект опубликовали на Кикстартере в субботу, а массовую PR-кампанию начали в понедельник. Как считать?
                      +1
                      Считаете надо менять тип подсчета?
                      +2
                      Моделирование поведения масс — это выглядит так самоуверенно…
                      Первой подобной попыткой был т.н. Гарвардский барометр в начале XX века. Экономисты решили, что с помощью выведенных формул могут предсказывать динамику стоимости акций. Биржевые спекулянты тут же взяли его на вооружение. И естественно, он перестал работать.

                      Only users with full accounts can post comments. Log in, please.