Как стать автором
Обновить

Создан первый «перцептивный» блокировщик рекламы, который не зависит от разметки страницы

Время на прочтение 3 мин
Количество просмотров 27K

Как показывает практика, борьба блокировщиков рекламы с рекламой превращается в бесконечную гонку вооружений. Издатели выкатывают новые форматы рекламы, которая трудно отличима от пользовательского контента. А блокировщики рекламы быстро находят способы, как эти форматы определять — и блокировать. В свою очередь, издатели снова изменяют код, чтобы обходить фильтры. И так далее до бесконечности.

Разработчики первого перцептивного блокировщика рекламы считают, что эта игра в кошки-мышки не будет продолжаться вечно. Специалисты из Принстонского и Стэнфордского университетов предлагают радикально иной подход к блокировке баннеров — распознавать рекламу не по разметке HTML, а по визуальным маркерам рекламы. Так же, как это делают люди. Это сводит на нет попытки некоторых сайтов внедрить блокировку блокировщиков рекламы.

Идея основана на базовой предпосылке. В соответствии с нормативными документами издатели обязаны явно выделять рекламу, чтобы она была различима людьми. Если человек может её различать, то и компьютер сможет.

Исследователи считают, что нынешняя «гонка вооружений» между издателями и разработчиками блокировщиков рекламы представляет собой проблему безопасности. Во-первых, блокировщики можно считать функцией, которая улучшает безопасность системы, поскольку не допускает выполнение на компьютере потенциально вредоносных скриптов. Во-вторых, игра в кошки-мышки напоминает вечную борьбу вирусов с антивирусами: это взаимно враждебные процессы, которые выполняются в общей среде — в браузере. Но юридическое регулирование связывает руки издателям, так что блокировщики рекламы получают большую фору по сравнению с антивирусами.

В этой взаимной борьбе всё-таки у блокировщиков бóльшие привилегии в системе, так что за ними всегда последнее слово. То есть в этой системе из четырёх состояний, которая представляет собой полную модель системы, именно блокировщики должны выигрывать в итоге (состояния 2 и 4).


Эта модель разбивается на три «мини-битвы», которые относительно просто анализировать, пишут авторы научной работы.

Архитектура перцептивного блокировщика рекламы изображена на иллюстрации внизу. Основная часть работы выполняется в «перцептивной библиотеке», которая должна быстро адаптироваться к новым техникам маркировки рекламы.


Например, Facebook помечает рекламные баннеры сразу несколькими способами, которые легко определяются на глаз и распознаются перцептивным блокировщиком.


Пока что авторы выпустили инновационный блокировщик только в виде расширения для Chrome Facebook Ad Highlighter. Самая первая предварительная версия вышла 11 августа 2016 года. Она была минимально зависима от анализа разметки HTML. Что интересно, Facebook заметил появление нового инструмента — и изменил разметку, чтобы обойти перцептивный блокировщик. В ответ авторы научной работы выпустили новую версию, в которой зависимость от разметки полностью снята. Правда, у расширения сейчас ограниченная функциональность. Оно только выделяет рекламу, но не вырезает её со страницы. Это сделано специально, потому что учёные не хотят ввязываться в этические конфликты, говорит один из авторов.


Поскольку в Интернете не так много способов пометки рекламных объявлений, этот блокировщик — довольно универсальный инструмент и очень легковесный. Не нужно его часто обновлять, а каждый новый модуль (против новой техники пометки) требует всего нескольких десятков строк кода. Во время тестирования он успешно заблокировал рекламу на 50 из 50 протестированных сайтов.

Тесты показали, что блокировщик замедляет загрузку страницы всего на 0,53±0,15 с. Но это только если отключить модуль распознавания текста OCR, который довольно сильно тормозит работу (ещё примерно +1 с). Зато блокировщик показал примерно такую же высокую эффективность даже с отключенным модулем OCR. Разработчики говорят, что если реализовать нативное распознавание текста, то производительность должна сильно возрасти, потому что они в своём концепте использовали реализацию на JavaScript. Испытания реализации Tesseract C++ показала скорость работы примерно в 10 раз выше, чем на JavaScript.

Несмотря на это небольшое замедление скорости загрузки, пользователи всё равно выигрывают, потому что рекламные баннеры и скрипты на странице сами по себе замедляют страницы, в среднем, на 44%, к тому же излишне нагружают CPU, что ведёт к лишнему расходу заряда батарей на мобильных устройствах. И как было сказано выше, они сами по себе несут угрозу безопасности, потому что через баннерные сети нередко распространяется вредоносный код, не говоря уже о слежке за пользователями через следящие куки.

По мнению некоторых экспертов, онлайн-реклама сейчас представляет собой серьёзную проблему и конфликт. Это конфликт вовсе не между пользователями и рекламодателями, а между рекламодателями и издателями. Рекламодателей очень огорчает тот факт, что онлайновая реклама вызывает проблемы у пользователей, представляет угрозу приватности и безопасности. Им не нужна такая реклама. И это проблема издателей, которые не могут предложить вменяемые форматы. В этом смысле блокировщики рекламы устраняют дисбаланс и помогают найти приемлемое решение для внедрения более адекватной рекламы.
Теги:
Хабы:
+24
Комментарии 180
Комментарии Комментарии 180

Публикации

Истории

Ближайшие события

Московский туристический хакатон
Дата 23 марта – 7 апреля
Место
Москва Онлайн
Геймтон «DatsEdenSpace» от DatsTeam
Дата 5 – 6 апреля
Время 17:00 – 20:00
Место
Онлайн