У nginx в этом плане много гибкости. На сайте одного крупного вендора продуктов здорового питания используется блокировка от атак именно на на основе nginx. Достаточно быстрое решение, но в случае крупного вендора — свой сервер.
С парсингом лог файла, тоже отличная идея. Но у хостеров это подключаемая опция, т.е ведение лога начинается после активации этой опции.
Ну и запись в БД «живых запросов» мне показалась более быстрой с точки зрения реализации
Для крупных порталов, да — это возможно. Но в статье я рассматривал небольшой ресурс провинциального масштаба.
Так же всегда есть возможность самостоятельно проверить IP (кто, от куда) и скорректировать правило.
Или пойти дальше и блокировать таких «ботов» на определённое время Ещё извращённей вариант, это показывать заглушку до основного роута cms с предложеним ввести капчу :)
Так как «пишу» и «писал» ранее много парсеров, то в своей работе использовал и simplehtmdom, затем по каким-то причинам перешёл на phpQuery (перешёл наверное из за того что сначала просто попробовал, а потом заметил кратное увеличение скорости работы парсреа) и она мне понравилась больше (она это библиотека). Совсем недавно попробовал для парсинга DomCrawler от Symfony и мне она по удобству показалась такой же как phpQuery. Даже сказал бы так что «phpQuery»==«DomCrawler» для разбора страниц.
PS: Про удобство DomCrawler конечно же имею ввиду вкупе с css-selector пакетом
Вообще отличная идея писать подобный код:
1. Для саморазвития и мотивации
2. Для получения замечаний от неравнодушных
3. Думаю даже получится заработать на что-то
Статья понравилась, бросилось в глаза только наименование функций
Автор молодец. Сам бы продал свои проекты для WP, которые сейчас имеют хорошую популярность, но поддерживать их уже нет времени.
Кстати некоторые пользователи неожиданно спрашивают кошелёк и перечисляются туда ну совсем не неожиданные деньги.
Ну и запись в БД «живых запросов» мне показалась более быстрой с точки зрения реализации
Так же всегда есть возможность самостоятельно проверить IP (кто, от куда) и скорректировать правило.
Или пойти дальше и блокировать таких «ботов» на определённое время
Ещё извращённей вариант, это показывать заглушку до основного роута cms с предложеним ввести капчу :)
PS: Про удобство DomCrawler конечно же имею ввиду вкупе с css-selector пакетом
1. Для саморазвития и мотивации
2. Для получения замечаний от неравнодушных
3. Думаю даже получится заработать на что-то
Статья понравилась, бросилось в глаза только наименование функций
Кстати некоторые пользователи неожиданно спрашивают кошелёк и перечисляются туда ну совсем не неожиданные деньги.