python_leader Sep 3 2025 at 10:00

Самый быстрый способ читать Excel в Python

Easy

14 min

15K

Programming * Python *

Analytics

Translation

+19

Comments 13

Dhwtj Sep 3 2025 at 12:05

Rust сила!

Emelian Sep 3 2025 at 13:11

Самый быстрый способ читать Excel в Python

Копируем выбранный блок ячеек Эксела в буфер обмена и вставляем его в текстовый файл. Разделителем данных в строках, при этом, является табулятор, что вполне устраивает. Этот текстовый файл идеально подходит для обработки в Питоне. Чем, лично я, постоянно пользуюсь. Метод – супер, даже, для огромных файлов!

Dhwtj Sep 3 2025 at 14:17

Только шапку надо корректную

А так да:

Ctrl a, Ctrl c, alt tab, ctrl v, ctrl s

S0mbre Sep 3 2025 at 17:08

Зачем в файл? Сразу из буфера парсить.

AnthonyDS Sep 4 2025 at 03:33

Зачем из буфера, сразу из исходного... 😅

AndrewBond Sep 3 2025 at 13:57

Хотел бы увидеть в списке polars. В свое время использовал ее вместо pandas. С lazy loading пережевывал гигатонны логов в приделах минуты.

S0mbre Sep 3 2025 at 17:08

Для чистоты эксперимента можно было бы добавить ещё ручной разбор xlsx прямо в python анализатором xml.

0xMihalich Sep 3 2025 at 21:43

на сколько помню DuckDB тоже на Rust, по крайней мере как минимум одно из расширений для уткобазы на нем написано

mordens Sep 4 2025 at 06:18

Нет. Duckdb на плюсах написана. https://github.com/duckdb. Она еще в sql запросы напрямую к pandas dataframe умеет. Пока у меня рекорд - в 98 раз быстрее чем родные методы панды.

0xMihalich Sep 4 2025 at 08:47

да, действительно, прошу прощения. некоторые расширения на rust, например, chsql_native, но утка и excel на плюсах

Ryav Sep 4 2025 at 05:26

А где polars?

XVlady5 Sep 5 2025 at 04:20

Меня смущает тут панда - там же под капотом либа для чтения. По идее нужно её проверять.

Gbor Sep 4 2025 at 10:13

Будет ли он так же быстр в случае xlsb?