Search
Write a publication
Pull to refresh
9
0.5

Automation enthusiast

Send message

HTTP или SOCKS прокси, что выбрать? Чем отличаются HTTP(S) и SOCKS прокси — разбор дилетанта

Level of difficultyMedium
Reading time10 min
Views16K

Прокси-серверы давно стали неотъемлемой частью современной сети. Они используются для повышения анонимности, обхода блокировок, балансировки нагрузки и контроля трафика. Однако далеко не все понимают, что существует принципиальное различие между HTTP(S)-прокси и SOCKS-прокси. В этой статье я попробую подробно разобрать технические аспекты работы обоих типов, рассмотрю их преимущества и ограничения, а также приведу примеры настройки и использования, но это уже скорее в виде факультатива (можно и без этого, просто хочется).

Читать далее

Мобильные прокси — подробный гайд, чтобы разобраться чем они отличаются от других видов прокси (просто о сложном)

Reading time9 min
Views6.8K

Многие пользователи интернета (я имею ввиду стандартного юзера, не знакомого с этими вашими автоматизациями) уже неплохо разбирается в реалиях современного интернета, и знаком с такими определениями, как ВПН или прокси. Но прокси - достаточно разнородное понятие и их существует огромное количество видов - я уже писал общую статью по видам и чем они отличаются - резидентные, мобильные и серверные прокси - в чем отличие?

В этой статье я решил намного ближе изучить мобильные прокси, зачем они нужны, как работают и почему это флагман среди всех видов прокси по моему мнению.

Читать далее

What the different between Residential Proxy, Mobile Proxy and Datacenter Proxies? A Dilettante’s Perspective

Level of difficultyEasy
Reading time5 min
Views778

The topic of proxies has always been approached (at least, that’s how the publications I encountered did) from the standpoint of complex terminology, which often remains unclear to the layman—someone not particularly versed in these internet matters. I decided to delve into the issue, and here is what I came up with:

Read more

Developing a Python Script — Geetest CAPTCHA solver: How to bypass Geetest 4 and any others

Level of difficultyEasy
Reading time13 min
Views1.5K

These days, Chinese products and services have seeped into nearly every niche. Sure, when someone mentions a Chinese development, you might chuckle and be reminded of those 90’s internet gems like “Glasses, do you need ‘em?”—and honestly, not much has changed. Even DeepSeek ended up being neither truly deep nor entirely seek. Yet, there’s something they’ve perfected, which leaves many SEO optimizers weeping salty tears while trying to bypass the Geetest CAPTCHA.

Read more

Разработка скрипта для обхода Geetest CAPTCHA на Python: от идеи до реализации

Level of difficultyEasy
Reading time14 min
Views1.2K

В последнее время китайские товары и сервисы можно встретить практически в любой нише. Да, когда ты слышишь, что это китайская разработка, с улыбкой вспоминаешь 90-е и знаменитые ролики в интернете «Очки н‑н-надо?», и в большинстве случаев мало что изменилось, даже вон DeepSeek по итогу получился не совсем Deep и не до конца Seek. Но кое‑что у них все же получилось, и получилось так, что многие оптимизаторы глотают соленые слезы, пытаясь обойти Geetest капчу.

Читать далее

Плагин для Wordpress, который вам нужен если у вас туристический проект! Плагин, который построил Чат…

Reading time3 min
Views923

Когда у тебя есть свой сайт, хочется его постоянно допиливать, а делать это сильно непросто, когда у тебя опыта в реализации всяких технических штук ноль!

Читать далее

Google Keyword Scraping: A Detailed Guide to Building a Free Google Scraper

Level of difficultyEasy
Reading time8 min
Views1.7K

Any SEO expert knows the pain of collecting Google keyword data. It’s one thing if you can count all the queries on one hand, but what if they number in the thousands? How do you check the search volume in Google for each keyword? Frankly, once you hit tens of thousands of keywords, it’s enough to make your head spin. You’ll be tempted to reach for outdated, familiar tools, only to find modern reality throwing a curveball: the old formula of Key Collector + Google Ads + a few proxies simply doesn’t cut it anymore. We’re entering a new era, and without direct access to the official API, things get grim and complicated fast.

Read more

Парсинг поисковой выдачи Google по ключевым словам — подробный гайд как сделать парсер Гугл (аналог вордстат в Гугл)

Level of difficultyEasy
Reading time9 min
Views3.2K

Любой SEO специалист знает, какая боль собирать семантику для Гугла. Одно дело, когда запросы можно пересчитать по пальцам, а когда они исчисляются тысячами, а не штуками? Как посмотреть количество запросов в Гугл по ключевым словам? Честно говоря, когда речь заходит о десятках тысяч ключевых слов, становится не по себе — голова идёт кругом, руки тянутся к старым привычным инструментам, а реальность бросает вызов. Так уж устроен сегодняшний Google Ads: привычная связка Key Collector + Google Ads + несколько прокси больше не спасает. Наступает новая эпоха, где без прямого обращения к официальному API всё становится мрачно и сложно.

Читать далее

Advanced CAPTCHA Bypass Techniques for SEO Specialists with Code Examples

Level of difficultyEasy
Reading time11 min
Views1.5K

Every SEO professional has encountered CAPTCHA. If not, they are either not professionals, misunderstand the term SEO (possibly confusing it with SMM or CEO), or are very new to this challenging field.

One could endlessly deny and argue that CAPTCHA is overrated and does not deserve significant resources. But these arguments end the moment one needs data from a search engine result page, like Yandex, without knowledge of XML requests… Or, say, a client wants to scrape the entire Amazon (just because they do) and offers good pay...

Read more

Обход капчи продвинутым способом — рекомендации для SEO-специалистов с примерами кода

Level of difficultyEasy
Reading time12 min
Views3.7K

Любой профессионал в SEO сталкивался с капчей — а если нет, то он либо не профессионал, либо некорректно понимает абревиатуру SEO (может путает ее с SMM или СЕО) либо только начал заниматься этим нелегким делом.

Читать далее

How to bypass CAPTCHA: Breaking Down a Complex Process in the Simplest Terms

Level of difficultyEasy
Reading time7 min
Views4.9K

CAPTCHA is not just a single word that can be defined; it's an acronym consisting of nine words (and two prepositions): Completely Automated Public Turing Test To Tell Computers and Humans Apart. This mouthful was shortened to the concise CAPTCHA to avoid creating yet another hard-to-pronounce term. Translated into Russian, this abbreviation sounds like "Полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей" (Fully Automated Public Turing Test to Differentiate Computers and Humans).

Read more

Распознавание капчи – разбираемся в сложном для понимания процессе максимально просто

Level of difficultyEasy
Reading time7 min
Views3.4K

Капча – это не отдельное слово, которому можно дать определение, а целых девять слов (и два предлога) - Completely Automated Public Turing Test To Tell Computers and Humans Apart. Сократили это все до емкого CAPTCHA, чтобы не создавать очередное сложнопроизносимое слово. В переводе на русский эта аббревиатура звучит так - Полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей.

Не получается из этого набора слов КАПЧА, правда? Да это в принципе и не нужно, всем и так понятно о чем идет речь. Найди указанные картинки, или введи указанный текст, чтобы подтвердить что ты не робот.

Читать далее

Data labeling – training on cats

Level of difficultyEasy
Reading time8 min
Views650

At some point while diving deeper into automation processes you are faced with the need for data labeling, although just a couple of weeks ago, the phrases data labeling and you were standing at a party called "Earnings on the Internet" in different rooms. Or it would be better to say that you were standing by the pool, and the data labeling was on the third floor, smoking on the balcony with experts in the field of machine learning. How did we meet? Probably, someone pushed it off the balcony into the pool, and I helped it out, soaking my clothes along the way.

Read more

Разметка данных — тренируемся на кошках

Level of difficultyEasy
Reading time8 min
Views1.3K

Погружаясь все глубже в процессы автоматизации в какой то момент ты сталкиваешься с необходимостью разметки данных, хотя буквально пару недель назад, словосочетания — разметка данных и ты, стояли на вечеренике под названием «Заработок в интернетах» в разных комнатах, вернее ты стоял около бассейна, а разметка данных была на третьем этаже, курила на балконе со специалистами в области машинного обучения. Как мы встретились? Вероятно кто‑то столкнул ее с балкона в бассейн, а я помог ей выбраться, попутно замочив и свою одежду.

И вот, вы сидите на кухне, курите одну сигарету на двоих и пытаетесь разобраться, чем каждый из вас занимается, и как вы можете быть друг другу полезными?

В общем не так важно, для чего мне это понадобилось, но тот факт, что у меня это получилось намного интереснее. И теперь, когда вам уже достаточно душно (или нет), переходим к сути.

Читать далее

CacheBrowser experiment: bypassing the Chinese firewall without a proxy by caching content

Level of difficultyMedium
Reading time7 min
Views1.3K

Today, a significant portion of all content on the Internet is distributed with the use of CDNs (Content Delivery Networks). At the same time, there is no research on how various censors extend their influence on such networks. Scientists from the University of Massachusetts analyzed possible methods of blocking CDN content using the example of the practices of the Chinese authorities, and also developed a tool to bypass such blocks.

We (specialists from proxy service) have prepared an overview material with the main conclusions and results of this experiment (translate of this material).

Read more

How to Save on Your Netflix Subscription: A Step-by-Step Guide Using Proxies and Antidetect Browser

Level of difficultyEasy
Reading time3 min
Views985

Corporations that dominate the market can impose their conditions on customers. This is also the case with everyone's favorite Netflix. When you make good content and you are sure that your audience wants to consume your content, you can start to increase the subscription price gradually. But the distribution of subscription costs around the world is unequal. This happens not only with Netflix, it happens with many big corporations: Microsoft, Sony, etc.

Naturally, everyone wants to watch high-quality content, but no one wants to overpay for it. And that led to creation of different schemes, for example, the one I'm going to describe here.

The essence of the scheme is simple – you buy a subscription for another region while staying in your home region. Of course, you can do this, but before I describe the scheme in detail, you should understand that Netflix is not as simple as it seems. When buying a subscription, for example, as a user from Pakistan, you should know that only the content that is allowed in that country will be available to you. Meaning, any sign of eroticism in movies, for example, is forbidden there.

And now this scheme appears in a completely opposite light. You can use my scheme if you want to access content that is blocked in your country, but you need to be prepared that the price will not be the same as for your region.

Top Three cheapest countries (in terms of the Netflix subscription price)

Read more

Массовое вытаскивание урлов из нескольких xml карт сайта

Level of difficultyEasy
Reading time3 min
Views917

Периодически приходится решать достаточно интересные задачи, а иногда достаточно нудные и скучные, когда надо просто механически повторять один и тот же порядок действий, и длиться это может достаточно долго. что отнимает ресурс в виде времени.

Ну а зачем тратить час на ручную работу, если можно потратить 2 часа на то, чтобы это автоматизировать, правда? Сказал бы я вот так и потратил бы на это часа три, а то и четыре. Но слава нейросетям, помогают сократить это время до минимума.

Суть задачи - надо вытащить урлы из xml карты сайта, но карта разбита на несколько мелких карт по 1000 урлов, соответсвенно это осложняет процесс загрузки этих урлов.

Резонный вопрос, а на кой ляд тебе понадобились эти урлы? Для того, чтобы отправить их на индексацию через Google Indexing API, как я это называю - принудительная отправка на индексацию большого массива.

Можно пойти простым путем, открывать каждый урл руками, сохранять его как xml на своем компьютере, далее собрать их все в одну папку и открыть принудительно все скопом через Power Query (кто не знает. что есть такая офигенная штука у Гугл таблиц - с добрым утром, рекомендую погуглить).

Но открыть 100 ссылок руками - ну такое, правда? Поэтому, за 1 минуту был сгенерирован скрипт на Питоне, которые решил задачу за 1,5 минуты. Мне не понадобилось много времени, скрипт заработал со второго раза, поэтому я делюсь им с вами, может кому будет полезен.

Читать далее

Удочка в виде Upwork — процесс регистрации на зарубежной фриланс бирже

Level of difficultyMedium
Reading time4 min
Views8.2K

Продолжая свое путешествие по миру заработка в этих ваших интернетах я наконец то полностью преисполнился и принял тот факт, что доход в бурж сегменте намного выше, чем доход в русскоязычной сфере. Даже такая простейшая схема, как посредничество (берем заказ у русскоязычного пользователя – несем его на бурж фриланс рынок и получаем результат там) в некоторых нишах приносит неплохие плоды (х2 профита, слышал что подобная схема называется барыжничество, но зачем мне продавать свои знания дешево, я не знаю).

Тем не менее, сейчас не про способ заработка, а лишь про то, где взять удочку. А как на этом заработать вы уже будете решать сами. Тем более, что моя тема еще далеко не исчерпала себя и палить ее в паблике нет желания.

Итак, в данной статье я бы хотел разобраться, как зарегестрироваться на бирже фриланса Upwork и начать там зарабатывать, в качестве фрилансера (если у вас неплохой английский, то в честной конкуренции с индусами вы можете урвать неплохие заказы по очень вкусной цене), ну а если пораскинуть мозгами, можно и заработать в качестве заказчика.

С Upworkom следует быть максимально аккуратным, так как одно неверное действие и вы лишились аккаунта. Как говориться, я 100 раз так делал, пока не научился нескольким простым правилам при работе с Upwork.

Читать далее

Как подключить Нетфликс в России — простой способ с нюансами

Level of difficultyEasy
Reading time4 min
Views19K

Ну что, вот и начали появляться новости про возвращение того или иного бренда, зачем то покинувшего РФ.

Например, на сервисе Netflix, с определенного времени появились русские субтитры к некоторым фильмам, что говорит о том, что сервис не готов полностью отказаться от российской аудитории. Да и в принципе, русский язык присутствует в качестве одного из языков, при настройке аккаунта после его регистрации.

Читать далее

The Salmon Project: how to counter Internet censorship effectively using proxies with user trust levels

Level of difficultyMedium
Reading time5 min
Views658

Governments in many countries restrict citizens' access to information and services on the Internet in one way or another. Combating such censorship is an important and difficult task. Usually simple solutions cannot boast about high reliability or long-term efficiency. More complex methods of overcoming blocks have disadvantages in terms of usability, low performance, or they do not allow you to maintain the quality of Internet use at the proper level.

A group of American scientists from the University of Illinois has developed a new method of overcoming blocks, which is based on the use of proxy technology, as well as segmenting users by trust level to effectively identify agents working for censors. We present you with the main theses of this work.

Description of the approach

Scientists have developed the Salmon tool, a system of proxy servers operated by volunteers from countries without restrictions on Internet use. In order to protect these servers from blocking by censors, the system uses a special algorithm for assigning a level of trust to users.

The method involves exposing potential censor agents that pose as ordinary users in order to find out the IP address of the proxy server and block it. In addition, countering Sybil attacks is carried out through the requirements to provide a link to a valid social network account when registering in the system or to receive a recommendation from a user with a high level of trust.

How it works

It is assumed that the censor is a state–controlled body that has the ability to take control of any router within the country. It is also assumed that the task of the censor is to block access to certain resources, and not to identify users for further arrests. The system cannot prevent such a course of events in any way – the state has plenty of opportunities to find out what services citizens use. One of them is the use of honeypot servers to intercept communications.

It is also assumed that the state has significant resources, including human ones. The censor can solve tasks that require hundreds and thousands of full-time employees.

A few more basic theses:

Read more

Information

Rating
958-th
Location
Анапа, Краснодарский край, Россия
Date of birth
Registered
Activity