Comments 6
Красавчик, все классно и круто) Альтернативу сельдерею (NoDriver) смотрел около года назад - было сыровато. Интересно, что сейчас?
После этой статьи родилась фраза. Выстирай свой грязный html :)
Selectolax действительно крутая штука, особенно когда нужна скорость на "грязном" html.
Но я бы ещё присмотрелся к parsel - это обёртка над lxml, которую используют в Scrapy. Поддерживает и css селекторы, и XPath, причём XPath иногда даёт больше гибкости для сложных выборок. По скорости где то между BS4 и selectolax, но синтаксис очень удобный.
Sign up to leave a comment.
Selectolax: быстрая альтернатива Beautiful Soup