Pull to refresh

Накрутки на КиноПоиске, посмотрим на аккаунты поближе

Reading time4 min
Views32K
По мотивам последних новостей о взломе аккаунтов на КП захотелось побаловаться со статистикой оценок, которую можно частично подсмотреть на сайте.

Примечательно, что уже 18 сентября, в интернете писали, что другим фильмам, выходящим 28 сентября скручивают рейтинг, но КП долго тупил, хотя все аккаунты занижающие рейтинги там были новореги, примерно по две недели. Эти пользователи ставили 2-3 рандомных оценки при регистрации и ещё 2-3 в момент скрутки рейтинга (Притом, что первые три были 5-10, а вторые 3-4-5, т.е. совсем палевно). Я думаю с этих же аккаунтов и накрутили рейтинг ожиданий, другому фильму, который пока не будем называть. Почему их нельзя было подчистить до 28го — загадка, на форуме КП, пару раз в сутки трут по странице комментов на тему…

Ставили оценки лентам: Не твоё тело (2017), Ежик Бобби: Колючие приключения (2016) и Хорошее время (2017), имеют ник вида IvanIvanov96, зареганы менее месяца и поставили менее 20 оценок.

Таких оценок ~10к.

Поскольку в последний раз изучал веб-программирование в 11 классе, то использовать стильно-модно-молодёжные языки программирования пригодные для парсинга интернета не вышло и пользовался тем, что было под рукой, а именно MATLAB-ом. Т.к. КП использует динамически подгружаемые данные на странице оценок, то не придумал ничего лучше, чем долистать ручками до конца, а сайт считает, что 1000 оценок будет достаточно (наверное можно поиграться с параметром prem_max_page и может получится и больше сохранить) и сохранить это в виде html файлика к себе на диск.

Дальше поиском по файлу ищем строки /votes/" class="comm-link" рядом с которыми находятся id интересующих нас пользователей.

Сохранив в массив id пользователей оценки которых нам известны можно посмотреть их профили и странички с оценками. Для этого сохраним странички вида https://www.kinopoisk.ru/user/***id***/ и https://www.kinopoisk.ru/user/***id***/votes/ замечательной командой websave(filename,url,options)
И как только несколько тысяч страничек скачаются (а это долго, тут нужно играться с задержками между запросами, чтобы не ловить ошибки по timeout) можно посмотреть, что же там интересного. В ход идут strfind() и textscan() со всякими кусочками адресов. Мне удалось собрать 3740 оценок отсортированных по дате и ещё 2245 уникальных при сортировке по имени пользователя, итого 5985 страничек оценивших фильм #928796 из 12к всех оценок (не смог найти 6000 оценок 3-4-5, остальных оценок было меньше 1000, так что среди них пропусков нет) оценки к другим двум фильмам с 11к оценками КП скрывает под предлогом малого числа валидных оценок.

Вот так выглядело распределение числа оценок для пользователей с количеством оценок от 1 до 20 и для остальных у кого 21 и более. Присутствует такой заметный пик пользователей с 5 оценками.



Регистрировались аккаунты в течение 20 дней, начиная с 24 августа.



Если посмотреть за кого ещё активно голосовали эти пользователи, то кроме двух указанных выше фильмов, можно выделить Крым (2017) и Любовь прет-а-порте (2017).



Для создания видимости больше пары сотен голосов отдано за фильмы из первой тысячи и последним популярным (типа Зверополиса и Ла-Ла-Ленда), которые уже не идут в кино, распределения у всех примерно похожи, оценки только от 3 до 9 с горкой на 7-8 и небольшим горбиком на 3ке (не понятно зачем). Я вообще с трудом представляю человека, ставящего 3 Побегу из Шоушенка)).

Топ 3 оценок, они конечно, совсем не палились:

Хорошее время: 5215 подозрительных оценок



Не твоё тело: 5090/5215



Ежик Бобби: Колючие приключения: 5079/5215



И дальше новенькое, хотябы распределение оценок какое-никакое прикрутили…

Любовь прет-а-порте: 4432/5215



Крым: 793/5215 (Интересно, скоро ли он попадёт в топ худших)



Ну и как пишут на Пикабу, все эти фильмы связывает некто Алексей Пиманов



Из 5217 подозрительных аккаунтов 5215 имеют ссылку на страницу в вконтакте, так что думаю люди ставили какую-нибудь игрушку/приложение (типа посмотри кто ходил на твою страницу) в vk и она их регала на КП с их ведома или без, ну или просто имеют лёгкий пароль. Если кто-то хочет поизучать, все ссылки тут. И я очень сомневаюсь, что сообщение от администрации Кинопоиска, дойдёт до пользователей вконтакта и они хоть как-то пошевелятся и оповещать пользователей должна администрация Вконтакте. На мой взгляд КП вполне мог бы совсем подчистить эти аккаунты.

UPD1: Пока смотрел на оживившихся ботов, которые начали ставить Крыму оценки от 4 до 10, заметил, что информация профилей различается с информацией со страниц Вконтакте и при регистрации через него, даётся ник из вконтакта, так что скорее всего вконтактик использовался просто как база имён и фотографий для регистрации, без угона учёток.

UPD2: Если вдруг эту страничку читают сотрудники Кинопоиска, прошу их сразу проверить рейтинг ожиданий фильма Танкисты (2017) т.к. очень много фейков, которые сейчас вваливают за Крым имеют только его в списке ожиданий, который пока на 12к голосов. Чтобы не сбавлять его в последний день перед премьерой… Если не успеют, придётся всю ночь качать странички ожиданий и строить ещё картинки и показывать где фейки точно проставлены и засчитаны Кинопоиском.

А пока я с нетерпением жду, когда Кинопоиск свершит возмездие, про которое напоминает на каждой страничке:
Преступление и наказание

Некоторые пользователи хотят повлиять на рейтинг лучших фильмов КиноПоиска — Топ-250, регистрируя несколько аккаунтов и/или выставляя фильмам только единицы или десятки. Специально для таких посетителей сайта действует простое правило — для расчета рейтинга Топ-250 применяется несколько фильтров, отсеивающих подобные накрутки (рейтинг учитывает голоса регулярно голосующих пользователей, отсеивая 100% ложных десяток и единиц).

Все попытки недобросовестных пользователей «накрутить» рейтинг будут пресечены. В лучшем случае такие оценки будут просто удалены, в худшем случае аккаунт (или аккаунты) редиски будут забанены, доступ к сайту перекрыт, компьютер вскоре сломается, а в доме злоумышленника появится недружелюбное привидение.

Потом не говорите, что вас не предупреждали. :)
Tags:
Hubs:
Total votes 60: ↑56 and ↓4+52
Comments61

Articles