Comments 13
Rust сила!
Самый быстрый способ читать Excel в Python
Копируем выбранный блок ячеек Эксела в буфер обмена и вставляем его в текстовый файл. Разделителем данных в строках, при этом, является табулятор, что вполне устраивает. Этот текстовый файл идеально подходит для обработки в Питоне. Чем, лично я, постоянно пользуюсь. Метод – супер, даже, для огромных файлов!
Хотел бы увидеть в списке polars. В свое время использовал ее вместо pandas. С lazy loading пережевывал гигатонны логов в приделах минуты.
Для чистоты эксперимента можно было бы добавить ещё ручной разбор xlsx прямо в python анализатором xml.
на сколько помню DuckDB тоже на Rust, по крайней мере как минимум одно из расширений для уткобазы на нем написано
Нет. Duckdb на плюсах написана. https://github.com/duckdb. Она еще в sql запросы напрямую к pandas dataframe умеет. Пока у меня рекорд - в 98 раз быстрее чем родные методы панды.
А где polars?
Будет ли он так же быстр в случае xlsb?
Самый быстрый способ читать Excel в Python