Pull to refresh
39
0
Максим Кульгин @makasin4ik

Защита от скликивания рекламы clickfraud.ru

Send message
в закрытые разделы сайта мы не лезем, если вы про это. Собирается только открытая для общественности информация.
я в том плане что парсер не кликает.
так хедХантер защищается, смотрят — есть ли клики вообще :)
все верно. это самое правильное, но тогда у нас отнимут хлеб :)
ну говорить про это точно не принято всуе
можно еще смотреть были вообще клики :)
блин, хотел поставить лайк, рука дрогнула поставил минус, прошу прощения, вы правы. А отменить минус нельзя. блин
Да, можно защититься от «студентов». Факт. А по вашему вопросу — насколько знаю — нет. Мы запускаем Хромиум и все ОК, получается где-то 1 товар в 4-5 секунд можно брать, нас это устраивает…
4 виртуалки, безлимитный трафик, 4 процессора на каждой, 8 гб памяти, windows server… Пока хватает, на каждую новую партию из условно 50 сайтов — нужна своя виртуалка. Но сильно зависит от самих сайтов.
передам разработчикам :) может у нас «глаз замылился» мы пошли через распознование картинки, которую получали из шрифра.
в 90% парсинг html страниц. 10% — chromium в особо тяжких случаях. Например, для парсинга я.Маркета мы используем хромиум. Надо отметить, что единицы сайтов защищаются так, что требуется хромиум.
нет, не парсим выдачу. Не просили, да и там через запросов 100 сразу будет капча, нужны чистые прокси, а их сложно достать или дорогие…
да. два года назад я и сам бы сказал, что парсить 300+ сайтов ежедневно — невозможно :)
Возьмите отсюда уже готовые данные парсинга https://xmldatafeed.com — много бесплатного.
На базе этого подхода, кстати, и разработан наш конструктор мобильных приложений appropio.com — а автор статьи — идеолог. Код доступен на git всем желающим.
Конструкторы мобильных приложений, к сожалению, требуют реально высоких компетенций у компаний. Это я сужу по нашим заказчикам (https://appropio.com)…
Вы сделали классный инструмент, но в RSS не смог найти ссылку на картинки… Что очень на самом деле важно.
Ох. это я призову специалистов. Пока отказались от этой идеи делать связки по эластику. Точнее работают те, когда совпадение 99%.

Information

Rating
Does not participate
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Date of birth
Registered
Activity