Очень ценно, когда мы обмениваемся знаниями, но было бы хорошим тоном указывать ссылки на оригинальные статьи, если используем информацию или материалы из них 😊
У меня оказался очень прагматичный дедушка мороз, решил "убить двух зайцев" и подарок пришёл ещё и ко дню рождения!) Большое спасибо, очень приятно!^^)
P.S. мне не хотелось бы просто халявной кармы, если это возможно, пожалуйста оцените (естественно объективно), мою последнюю статью, буду очень признателен =)
Добрый день! Библиотека на Python очень давно не обновлялась и нужно подготовить хорошие XML-кейсы для бенчмарка, как найду на это время - обязательно отпишусь
Код бенчмарка здесь - ссылка, вы можете попробовать перевести его на Polars, корректировки потребуются в utils.py и main.py. Правда у Polars, не все перечисленные форматы поддерживаются "из коробки".
Беглым запуском (не ручаюсь за точность) у меня получились такие данные, для Parquet и CSV:
Очень ценно, когда мы обмениваемся знаниями, но было бы хорошим тоном указывать ссылки на оригинальные статьи, если используем информацию или материалы из них 😊
Delete
Отрывок так погрузил, что к его концу я не сразу опомнился, что я всё ещё на Хабре. Спасибо за обзор и купон, книгу приобрёл =)
У меня оказался очень прагматичный дедушка мороз, решил "убить двух зайцев" и подарок пришёл ещё и ко дню рождения!) Большое спасибо, очень приятно!^^)
Плюсанул, с Наступающим!)
Помог)
Помог)
Спасибо за оценку и проблематику, учту в дальнейшем)
У меня был кейс, где нужно парсить несколько страниц, но очень быстро - так и зародилась идея бенчмарка, и в моём случае исследования пригодились)
Очень приятно, что прочитали и выразили своё мнение, правда, большое спасибо
Спасибо уже зарегистрировался, с Наступающим Вас!)
Спасибо большое, с Наступающим Вас!)
P.S. мне не хотелось бы просто халявной кармы, если это возможно, пожалуйста оцените (естественно объективно), мою последнюю статью, буду очень признателен =)
Отписываюсь, хотелось бы поучаствовать :)
Добрый день! Библиотека на Python очень давно не обновлялась и нужно подготовить хорошие XML-кейсы для бенчмарка, как найду на это время - обязательно отпишусь
Код бенчмарка здесь - ссылка, вы можете попробовать перевести его на Polars, корректировки потребуются в utils.py и main.py. Правда у Polars, не все перечисленные форматы поддерживаются "из коробки".
Беглым запуском (не ручаюсь за точность) у меня получились такие данные, для Parquet и CSV:
Спасибо, очень приятно! :)
Как верно отметил @MentalBloodтам околонулевой расход текстового формата и погрешность
Спасибо, очень приятно, рад что понравилась :)