Комментарии 10
Парсинг заголовкой объявлений
Хабр становится сложным для понимания.
Нарываемся на любую защиту от ботов и весь парсинг данной библиотекой трещит по швам.
Справедливости ради:
1) Полно источников данных без защиты,
2) Антифингерпринт - отдельная (хотя и связанная) тема.
Можно симулировать пользователя через куки, а для разгадывания капчи задействовать сервисы или "индусов". Пока пользователь физически может зайти на ресурс, можно парсить. Парсинг усложнится, но всё-таки быстрее, чем самому ходить и копировать.
Я не являюсь профессионалом в сфере парсинга данных
"Но на мой канал вы подписывайтесь"
А где парсер?
Как заметки для себя нормально, я когда начинал программировать тоже примерно теже шаги выполнял, только не публиковал.
Я бы порекомендавал пока не стремиться к народной любви и потратить это время на практическую и теоретическую подготовку. Когда начинаешь въезжать в тему, знания очень быстро накапливаются и каждый день - это новое открытие. Когда выйдете на плато, тогда самое время систематизровать знания и ими делиться.
Устанавливаем библиотеку BeautifulSoup командой “pip install BeautifulSoup”
Хорошим тоном сичтается устанавливать через `pip install -r requeirements.txt`, это не единственный хороший вариант, но один из самых частых.
Постарался к каждой строке кода дать соответствующий комментарий, чтобы было понятно, что делает каждая строка.
Что делает строка - можно прочитать из кода. Пишите зачем вы это делаете. Конечно лучше не пишите вообще, а выражайте в именх функций и переменных. Как минимум комментарии нужно вычитать перед публикацией, если их нет то меньше работы.
Код лучше как текст, картинку цитировать неудобно.
Роман, еще на картинке можно случайно какие-нибудь персональные данные пошарить.
Парсинг заголовков объявлений