Pull to refresh

Comments 6

Красавчик, все классно и круто) Альтернативу сельдерею (NoDriver) смотрел около года назад - было сыровато. Интересно, что сейчас?

Тогда уже было нормально, сейчас стало лучше, развивается и отлично работает)

После этой статьи родилась фраза. Выстирай свой грязный html :)

Что ж они api BS не применили?

Переписывать 20-30 тыс строк под даже лучше работающую либу - бизнес ресурсов не даст.

Тот же Polars поступил умнее, весь переезд это:

import pandas as pd

меняем на

import polars as pd

Полностью согласен, но имеем, что имеем.

Selectolax действительно крутая штука, особенно когда нужна скорость на "грязном" html.

Но я бы ещё присмотрелся к parsel - это обёртка над lxml, которую используют в Scrapy. Поддерживает и css селекторы, и XPath, причём XPath иногда даёт больше гибкости для сложных выборок. По скорости где то между BS4 и selectolax, но синтаксис очень удобный.

Sign up to leave a comment.

Articles