Исследователи из Университета штата Иллинойс в Чикаго занялись проблемой поддельных отзывов, которая, по их словам, может серьезно повредить онлайн-бизнесу. Поддерживаемое Google исследование нацелено на поиск организованных групп комментаторов-мошенников, на автоматизацию процесса их выявления и закрытия.

Поддельные рецензенты могут иметь поистине разрушительное влияние на различные интернет-предприятия, но особое значение проблема поддельных пользовательских комментариев приобрела в социально-ориентированных сервисах, таких как Yelp и TripAdvisor, где позитивные (для поддержки бизнеса) и негативные (для вреда конкурентам) комментарии стали настоящей эпидемией.

Исследователи говорят, что для пострадавших бизнесов отсев поддельных комментариев стоит достаточно дорого — сам процесс трудоемкий и не поддается автоматизации.

В своей статье ученые из университета и сотрудник Google представляют алгоритм GSRank, который поможет бороться с подделкой пользовательских обзоров.

Ключом к выявлению групп организованных комментаторов служит их поведение, говорится в статье, ключевыми параметрами служат:

  • Временное окно — члены группы, работающие над повышением или понижением продукта или услуги, часто оставляют комментарии в достаточно узком временном промежутке.
  • Отклонение — отличается от естественного, так как группа нанята для того, чтобы подвинуть рейтинг в ту или иную сторону, и все ее посты несут определенный рейтинг. Степень, в которой оценки группы отличаются от естественного фона, позволяет понять, что кто-то пытается обмануть систему.
  • Схожесть контента — группа часто использует не только одинаковые оценки, но и одинаковый контент для описания. Кроме того люди, зарабатывающие деньги на этом, часто имеют определенный набор фраз, который они используют раз за разом в разных обзорах.
  • На первом месте — исследователи также обратили внимание, что поддельные отзывы обычно публикуются в начале жизненного цикла продукта или сервиса. «Спамеры как правило проявляются раньше всех, чтобы получить наибольшее влияние», — пишут они. «Когда работники мошеннической группы среди самых первых комментаторов — они могут сформировать настроение». Знание такого шаблона может помочь в их выявлении.
  • Размер группы — размер группы и ее отношение к количеству настоящих комментариев может показать наличие спамеров, к тому же сложно предположить, что, допустим, 10 персонажей будут раз за разом комментировать самые разнообразные продукты. Наличие устоявшейся группы, замеченной в обзорах разных продуктах, говорит о наличии злого умысла.


Исследователи отметили, что они не могут отличить нескольких лиц, работающих вместе или одного спамера, использующего множество пользовательских логинов. Однако, так как алгоритм опирается на поведение, а не на личности, это уже не имеет занчения.