Комментарии 27
Это же технический сайт — поделились бы деталями реализации?
если в очень общих чертах, то:
1. есть платформа iLook, которая собирает и накапливает публичные сообщения соцмедиа
2. по ключевым словам из платформы выделяются сообщения типа «я люблю» или «я ненавижу»
3. сообщения геолоцируются на основании анализа открытых данных профилей, географических меток к сообщениям и анализа текстов самих сообщений.
В результате получаем и сравниваем количество сообщений в каждом регионе по каждой тематике.
1. есть платформа iLook, которая собирает и накапливает публичные сообщения соцмедиа
2. по ключевым словам из платформы выделяются сообщения типа «я люблю» или «я ненавижу»
3. сообщения геолоцируются на основании анализа открытых данных профилей, географических меток к сообщениям и анализа текстов самих сообщений.
В результате получаем и сравниваем количество сообщений в каждом регионе по каждой тематике.
позитивные эмоции (например, «я люблю», «обожаю» и т.п.)
Обожаю наше Правительство/страну/руководство компании/проч.
Люблю я эти утренние совещания по понедельникам.
да, это тоже «о любви» и вполне позитивно ;)
Понимаю, о чем вы, но в подобных сообщениях даже для человека сарказм не очевиден. Однако объем сообщений, проанализированных за время исследования, позволяет говорить о репрезентативных результатах.
Понимаю, о чем вы, но в подобных сообщениях даже для человека сарказм не очевиден. Однако объем сообщений, проанализированных за время исследования, позволяет говорить о репрезентативных результатах.
Люблю отчизну я, но странною любовью!
Люблю ненавидеть.
Надеюсь, я ничего не сломал.
Надеюсь, я ничего не сломал.
Средняя температура по больнице
От индекса любви до министерства любви осталось чуть… :)
Карелия, так держать!!!
На карте «добрые» области более светлые?
Хотелось бы увидеть сравнение используемого алгоритмического метода оценки с экспертным — каков процент ложноположительных и ложноотрицательных срабатываний? Насколько точно получены данные о географическом положении, ведь в анкете можно указать совершенно другой город и т.п.?
Да что там можно другой город… Можно два города и больше!
Гео определяется не только по данным, указанным в профиле. Анализируется каждое сообщение автора, гео-метки к каждому сообщению, данные прогоняются через собственные словари и информация о географическом положении актуализируется с каждым новым сообщением. То есть, например, если в профиле написано, что пользователь из Майами, а он «чекинится» на Тверской, то мы понимаем, что он в Москве.
Не встречала подобных исследований, поэтому даже не знаю с чем сравнивать, хотя было бы интересно, да. Что касается актуальности метода в принципе, то в исследованиях, базирующихся на анализе соцмедиа (т.н. оперативная социология), результаты как правило соотносятся с теми, что получены любыми другими способами, но являются более актуальными (пример), благодаря возможности реал-тайм анализа, что особенно актуально, например, для прогнозирования.
Курган: все, кто ненавидел, уже уехали.
А учитывалась ли разная плотность населения и разное покрытие доступа в интернет по регионам?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Новое исследование: Любовь и ненависть на карте России