Как стать автором
Обновить

Комментарии 27

Это же технический сайт — поделились бы деталями реализации?
если в очень общих чертах, то:
1. есть платформа iLook, которая собирает и накапливает публичные сообщения соцмедиа
2. по ключевым словам из платформы выделяются сообщения типа «я люблю» или «я ненавижу»
3. сообщения геолоцируются на основании анализа открытых данных профилей, географических меток к сообщениям и анализа текстов самих сообщений.
В результате получаем и сравниваем количество сообщений в каждом регионе по каждой тематике.
«я люблю ниших депутатов».
«Как же мне нравятся все эти новые законы».
И подобные сообщения относятся к позитивным? Тогда понятно что взбесившийся принтер поднял уровень позитивных сообщений в сети.
да, такие упоминания относятся к позитивным, потому что без контекста их невозможно трактовать иначе
позитивные эмоции (например, «я люблю», «обожаю» и т.п.)


Обожаю наше Правительство/страну/руководство компании/проч.
Люблю я эти утренние совещания по понедельникам.
да, это тоже «о любви» и вполне позитивно ;)
Понимаю, о чем вы, но в подобных сообщениях даже для человека сарказм не очевиден. Однако объем сообщений, проанализированных за время исследования, позволяет говорить о репрезентативных результатах.
Лекция по филологии. Cтарый профессор рассказывает:
— В некоторых языках мира двойное отрицание означает согласие. В других, двойное отрицание так и остается отрицанием. но нет ни одного языка в мире, в котором двойное согласие означает отрицание. Голос с задней парты:
— Ну да, конечно.
Люблю отчизну я, но странною любовью!
Люблю ненавидеть.
Надеюсь, я ничего не сломал.
Впору вспомнить двойное отрицание — ненавижу ненавидеть.
ненависть, на что бы она ни была направлена, — это негатив. Даже, если направлена сама на себя
Средняя температура по больнице
От индекса любви до министерства любви осталось чуть… :)
да оно уже давненько существует, только с другим названием )
Карелия, так держать!!!
На карте «добрые» области более светлые?
Нет, более тёмные (если верить про Курганскую область).
Чем больше «любви», тем выше индекс, и тем темнее цвет на карте.
Вы бы использовали более яркий и позитивный цвет. Например, градацию от красного (ненависть) до зелёного (любовь). Было бы нагляднее.
Или хотя бы легенду к диаграмме добавили.
А, вы о картинке в статье? Это просто КДПВ, нормальная интерактивная карта с легендой и подсказками, и таблица с раскладкой по всем регионам тут.
Хотелось бы увидеть сравнение используемого алгоритмического метода оценки с экспертным — каков процент ложноположительных и ложноотрицательных срабатываний? Насколько точно получены данные о географическом положении, ведь в анкете можно указать совершенно другой город и т.п.?
Да что там можно другой город… Можно два города и больше!
Гео определяется не только по данным, указанным в профиле. Анализируется каждое сообщение автора, гео-метки к каждому сообщению, данные прогоняются через собственные словари и информация о географическом положении актуализируется с каждым новым сообщением. То есть, например, если в профиле написано, что пользователь из Майами, а он «чекинится» на Тверской, то мы понимаем, что он в Москве.
Не встречала подобных исследований, поэтому даже не знаю с чем сравнивать, хотя было бы интересно, да. Что касается актуальности метода в принципе, то в исследованиях, базирующихся на анализе соцмедиа (т.н. оперативная социология), результаты как правило соотносятся с теми, что получены любыми другими способами, но являются более актуальными (пример), благодаря возможности реал-тайм анализа, что особенно актуально, например, для прогнозирования.
Курган: все, кто ненавидел, уже уехали.
А учитывалась ли разная плотность населения и разное покрытие доступа в интернет по регионам?
Нет, поскольку абсолютные значения не сравниваются между разными регионами, сравниваются только индексы (то есть количество сообщений о любви разделить на количество сообщений о ненависти)
Зарегистрируйтесь на Хабре, чтобы оставить комментарий