Как стать автором
Обновить

«Любовь и ненависть» на карте России, зима 2014-2015: четвертое исследование эмоционального состояния 35 млн пользователей социальных медиа

Время на прочтение3 мин
Количество просмотров11K
Всего голосов 23: ↑11 и ↓12-1
Комментарии46

Комментарии 46

нет, сарказм и ирония не учитывались, Ваше сообщение попадает в категорию «Любовь» :) Но тут необходимо учитывать, что сарказм и ирония не учитываются в обоих случаях, то есть влияние их и на то, и на другое количество сообщений одинаково, а рейтинг строится на основании индекса (количество о любви/количество о ненависти в каждом регионе).
сарказм и ирония не учитываются в обоих случаях, то есть влияние их и на то, и на другое количество сообщений одинаково

Мне кажется, это не совсем так. Разве мы иронизируем с одинаковой частотой как над позитивными вещами, так и над негативными?
Согласен. Боюсь там ни черно ни белого нет. Это не более, чем частотка слов и словосочетаний никаким образом не привязанная к смыслу текста: «я люблю критиковать» — позитив, да? или «ненавижу терроризм» — должен быть негатив, видимо…
Я так полагаю, Кавказ внизу рейтинга, т.к. культурные особенности не позволят ни женщинам ни мужчинам писать «люблю» на стене и других публичных местах.
Связь между сменой правительства в Калмыкии и тем, что люди пишут друг другу слово «любовь» конечно же не требует доказательства, ее можно просто высосать из пальца. Вот то, что проходил праздник это аргумент, в праздники люди друг друга поздравляют и любят.
Спорное обоснование подобрали и для Амурской области. В холода и метели, когда люди сидят дома они будут писать чаще слова «любовь». Вообще в трудных условиях потребность в любви возрастает.

Вообще исследование показывает только карту использования слов «любовь» и «ненависть» и ничего больше. Рост упоминания любви может рости и при улучшении ситуации и при ухудшении.
Интересная гипотеза по поводу Кавказа, но учитывались не именно признания в любви, а сообщения, в которых есть те или иные однозначно выраженне эмоции — слова типа «я люблю», «мне нравится», «обожаю» и др. Большинство сообщений о любви — к родителям (традиционно), детям (это тренд именно декабря), много сообщений о любви к музыкальным исполнителям, песням, книгам, фильмам и др. То есть это именно выражение эмоций. Аналогично и о ненависти — не только «я ненавижу», но и «меня бесит», «все бесит», «бесяево», "#ненависть" и др.
Например, «ненавижу эту долбанную зиму» или «бесит меня эта погода» — попадает к нам в исследование в категорию ненависть. Зачастую плохая погода вызывает именно негативные эмоции, и выражаются они не только по отношению к погоде.
НЛО прилетело и опубликовало эту надпись здесь
А мне кажется, что на Кавказе больше выражают чувства на местных языках, а не на русском.
Я думаю, что более вероятная причина в том, что там люди чаще ведут переписку на национальных языках, чем на русском.
С Амурской областью всё проще. До осени-зимы она жила торговлей с Китаем, а потом ₽ рухнул, а ¥ взлетел, тут стало как-то не до радостей.
Что-то я никакого улучшения соц. обстановки в Калмыкии не заметил. Вот праздник Зул — это да, весело :)
в Калмыкии (по сравнению с майскими данными) ненависти стало меньше и в количественном и в процентном выражении. Если бы индекс увеличился только из-за роста количества сообщений о любви, то тогда можно было бы сказать, что именно праздник повлиял. Но вот снижение негатива (ненависти) свидетельствует в пользу улучшения соц обстановки в регионе в целом. Плюс мы проверяем цифры и анализом контента, естественно.
НЛО прилетело и опубликовало эту надпись здесь
это сообщение про любовь, но поскольку у Вас в профиле указана Одесса, то оно вообще не попадет в исследование)
ненавижу социологические опросы, а так-же анонимный сбор статистики без явнго уведомления пользователей!
НЕНАВИЖУ!
Не специалист, но мне кажется неанонимный сбор будет давать более значимую погрешность.
Совершенно верно — для опросной социологии. В опросной социологии расхождения могут возникать не только в формулировке вопроса, но даже в зависимости от того, кто спрашивает: девушка или мужчина :-)

Кстати, по большому счету, трактовать подобные масштабные исследования соцмедиа как «социологический опрос» — уже само по себе большая ошибка. Как и привычное понятие «погрешность» в социологии для подобных объемах данных. Но это уже должна быть другая статья или даже цикл, и, вероятно, не на Хабре, где кое-кто путает «опросы» с «анализом».
ну да, ну да. Вы сейчас ненавидите процентов 90 создателей сайтов в рунете. Мои поздравления. А в тех сайтах, которые вы делаете, вы преднамеренно выключаете ВСЕ системы веб-аналитики, не устанавливаете GA и Метрику. Какой же вы лицемер.
>>>А в тех сайтах, которые вы делаете
С чего вы взяли, что пользователи Хабра вообще обязаны делать сайты?!
Вы написали «А в тех сайтах, которые вы делаете, вы преднамеренно выключаете ВСЕ системы веб-аналитики, не устанавливаете GA и Метрику. Какой же вы лицемер» пользователю, у которого код на гитхабе состоит из C#-файлов, в интересах у него ".NET, Brainfuck, C#", а ни в одном из легко гуглимых профилей нет персонального сайта, ни то что портфолио сделанных сайтов.

Вот и возникает вопрос, о каких таких его сайтах вообще идёт речь. И даже если они существуют, откуда вам знать, что на них действительно установлено, а что нет?
У нас в республике тоже не особо принято афишировать эмоции но это не мешает находиться на 3-м месте :)
Измерялась относительная величина — позитив, деленный на негатив. Культурные особенности — сдержанность — не могли на нем сказаться. Поскольку в этом случае вы также сдержаны и в выражении негатива.
Интересно, а какие слова-маркеры брали для вычисления негативных постов? В соцсетях позитивные эмоции выражают обычно более-менее просто: поздравляю, счастье, любовь, котики. А вот с негативными вариаций на порядки больше. Ради интереса прочитал с десяток люто негативных постов из ленты и в них не было ни одного внятного маркера. Оказалось, возможностей выразить негативные эмоции значительно больше, чем позитивные :) Это как считать смайлики в постах. Улыбающиеся смайлы используют значительно чаще. Но строить аналитику «любви» на этом основании я бы поостерегся.
А позитивную динамику я бы объяснил очень просто — Новый Год + Рождество + Первый Снег. Эти даты генерируют невероятное количество поздравительного спама.
С «любовью» тоже все не так просто, как кажется на первый взгляд. Поздравительный спам и «котики» в данном случае не учитываются. Учитываются только четко выраженные эмоции от первого лица: «люблю», «обожаю», «нравится», «радует», «тащусь» и др. Для ненависти — «ненавижу», «бесит», «бесяево», «раздражает» и тд. Но да, Вы правы — для ненависти поисковый запрос состоит из большего количества слов-маркеров. Все раскрывать не будем, уж простите ;)
Но если в спаме написано что-то в духе «мне нравится читать чужую почту вконтакте бесплатно скачать трояна здесь», получается что этот спам влияет на вашу статистику?
Коротко: нет, поскольку спам не учитывается.

P.S. Длинно: про что есть спам, а если спам — это не-спам и не-спам — спам (пародия на Звездочета из кино про волшебную лампу Алладина) — долго расписывать. Если вдруг такая тема будет важна для пары десятков хаброжителей, то распишем отдельной статьей.
Подобная методика исследования уровня напряженности в региональном разрезе по социальным медиа не нова. Ее проводят исследовательские группы в разных странах. Например в университете Вермонта — russian.rt.com/article/4847. Мы его немного адаптировали для увеличения точности — взяли эмоциональные высказывания только от первого лица и в настоящем времени; составили русскоязычный словарь выражения эмоций (провели соответствующий частотный анализ выражений на русском языке); взяли не только Твиттер, а все русскоязычные соцмедиа (поскольку проникновение Твиттера у нас не слишком большой, особенно по регионам).

Основная предпосылка исследования — при повышении негатива в окружении человека увеличивается его раздражительность, которая часто проявляется по отношению к посторонним вещам, а не к причине раздражения (плохо на работе, пойду пну собаку; когда мне хорошо, я вижу больше позитива, чем негатива). Меряем выражение эмоций — можем сделать вывод об удовлетворенности жизнью.

Кстати, сарказ и ирония — это менее 0,1% всего объема сообщений. Никак не сказывается на общих результатах.
> Рост индекса Любви, несмотря на низкие позиции в рейтинге, показали все регионы-аутсайдеры предыдущего исследования.

Я просто оставлю это здесь
А сказать чего хотели-то?
Адекватные измерения количества ненависти в рунете без учёта мата, похоже, невозможны.

А ещё интересно как оценивались негативно\позитивные посты:

«Люблю выйти по утру и побить как следует урода-соседа, чтоб не шумел ночами, падла»
Тональность — объектная, по отношению к первому лицу (в данном случае это Вы). Поскольку Вы обожаете по утрам бить соседа, то получатся для Вас — это позитив. А что касается соседа — об этом он напишет сам :-)
Ну да, а вдруг я ещё с сарказмом про «обожаю» писал — ведь бить кого-то это тоже малоприятное занятие.

Энивэй, бить кого-либо, не есть позитив — как ни крути, насильственные действия уменьшают градус позитива, даже если кому-то это понравилось. Врядли программа всё это считала.
«Вдруг», «врядли», «энивей»… Очень много извращений даже для человеческого мозга, чего уж там говорить про чипованный :-)

Желающим продолжать дискуссию в подобном вероятностном духе можно посоветовать почитать облегченные версии изложения Закона больших чисел Чебышева, Бернулли, или или хотя бы вспомнить уроки физики (Броуновское движение и почему чайник никогда не поднимется в воздух). Эгоцентризм — не самая лучшая точка отсчета для исследований огромных популяций.
А вдруг-то вам чем не угодило?
«Вдруг — бывает только 'пук'». В социальных процессах «вдруг» — понятие практически невозможное. Это же не «Челябинский метеорит», настроения и привычки людей, этносов, народов формируются десятилетиями и столетиями.
Вы смотрите на этот вопрос сугубо как на статистку, а выбивающиеся из статистики показатели либо игнорируете, либо приводите к общему знаменателю. Я же вижу общество «союзом» личностей, где каждый представитель может эти самые законы статистики нарушать без всяких на то веских предпосылок (я имею ввиду предпосылки на уровне «этносов и народов»).

Опять же, позволю себе высказать сомнение что в данном исследовании при сборе и оценке данных учитывались «настроения и привычки людей, этносов, народов».

Или ещё пример. Как бы вы трактовали, скажем, непредвзятое описание человека, который прибил свои гениталии к красной площади? Данный поступок, формально, не вписывается даже в «настроения народа». Какую ему окраску предавать?

Если вам непонятен пример из моего предыдущего комментария — есть люди, которые вообще без сарказма в соцсеть ничего не пишут. Это никак учесть не возможно без соответствующего пристального анализа.

Да и вообще, рассуждать о статистике и социальных науках можно очень долго, только вот без сколько-нибудь точного анализа использованной в статистике человеческой речи это всё бессмысленно. Вообще такой анализ сейчас проводить умеют, в частности в различных лингвистических институтах, но основываясь на данных статьи, можно сделать вывод что подобный анализ не использовался.
"- Уинвуд Рид хорошо сказал об этом, — продолжал Холмс. — Он говорит,
что отдельный человек — это неразрешимая загадка, зато в совокупности люди
представляют собой некое математическое единство и подчинены определенным
законам. Разве можно, например, предсказать действия отдельного человека,
но поведение целого коллектива можно, оказывается, предсказать с большей
точностью. Индивидуумы различаются между собой, но процентное отношение
человеческих характеров в любом коллективе остается постоянным. Так
говорит статистика." (с) А.К. Дойль.

«Короче, Склифасовский...» (с) если не уразуметь, что есть уникальные личности, но голосуют миллионые аудитории, то все остальное пустое бла-бла-бла. Разговаривать в том же духе — на уровне «мои три друга всегда говорят с сарказмом» — в оценке свободного словоизъявления масс — только время терять. Обоюдно.
Да, понимаю, Конан Дойл серьёзный источник. Как раз для подобных исследований.
М-да, все-то Вам не угождает, а зря так о гениях… Ну раз все так серьезно, посмотрите сайт Vox-Populi.ru — там с популярными примерами.
Как Крым мог получить прирост +30 позиций, если на прошлом исследовании его вообще не было, а всего позиций без Крыма должно было быть 83, так же как и Севастополь с его +28.

А вообще бесит, когда специально делают акцент на крымнаш.
Бесит, когда несут ахинею и специально делают акцент на «крымненаш».
br-analytics.ru/blog/?p=1489 — предыдущее исследование (ко Дню России, июнь 2014г).
А вообще лучше быть спокойными и умными, а не бешенными.
там в статье ссылка на «Как и в предыдущих исследованиях» ведет сюда br-analytics.ru/blog/?p=638
Точно, Вы совершенно правы — ссылка ведет на исследование 2013го года. Видимо при размещении лоханулись, надеюсь увидят и поправят :-)
Спасибо за бдительность, исправили ссылку)
Зарегистрируйтесь на Хабре, чтобы оставить комментарий