Как стать автором
Обновить
0
0

Пользователь

Отправить сообщение

Ясно. Кстати, вот что мне написали разработчики поларса - что им идея показалась, скажем так, интересной. Ну, ждём реализации)

Ну, сравнения с конкурентами я приводил.

Результаты: около 330 файлов у xlsx и около 280 у xlsx2csv. Получается, моя библиотека примерно в 33 раза быстрее, чем у конкурентов =)

За остальное огромное спасибо. Если что, у меня околонулевой опыт в написании статей на айтишную тему, особенно когда дело касается программирования.

Спасибо за комментарий. Ну, на деле у данной библиотеки есть вполне практическая задача, ну, и я решил выложить проект в открытый доступ, чего бы и нет?

Как раз подсказали выше, как обойти ограничения в формате даты и времени, буду внедрять

Что же, это оказался не просто бинарник. Он ссылается на собственные сишные библиотеки, которые надо как минимум в path запихивать. А таких пакетов там 17.

Проще говоря, трудозатраты на извращение (установка 17ти пакетов вручную, без рут прав) кратно выше, чем установка моей честно украденной библиотеки

Да, Вы правы, технически, можно установить и запустить и без рута. Но тогда давайте посмотрим на список зависимостей

The following additional packages will be installed:
gnumeric-common gnumeric-doc libgoffice-0.10-10 libgoffice-0.10-10-common libgsf-1-114 libgsf-1-common
libjavascriptcoregtk-4.1-0 libmanette-0.2-0 libwebkit2gtk-4.1-0 libwpe-1.0-1 libwpebackend-fdo-1.0-1 libyelp0
pxlib1 xdg-dbus-proxy yelp yelp-xsl
Suggested packages:
gnumeric-plugins-extra libgsf-1-dev gstreamer1.0-alsa
The following NEW packages will be installed:
gnumeric gnumeric-common gnumeric-doc libgoffice-0.10-10 libgoffice-0.10-10-common libgsf-1-114 libgsf-1-common
libjavascriptcoregtk-4.1-0 libmanette-0.2-0 libwebkit2gtk-4.1-0 libwpe-1.0-1 libwpebackend-fdo-1.0-1 libyelp0
pxlib1 xdg-dbus-proxy yelp yelp-xsl
0 upgraded, 17 newly installed, 0 to remove and 28 not upgraded.
Need to get 50,4 MB of archives.
After this operation, 162 MB of additional disk space will be used.
17 пакетов =) Каждый из которых надо будет скачать ручками, установить и ничего не сломать. Кстати, прямо сейчас попробую установить такое без рут-прав, интересно, сможет ли линукс создать зависимости без рут-прав и утилиты dpkg?

У меня была задача - работа именно с Excel файлами. Их бухгалтеры ни про какую sqlite не в курсе.

Только что проверил - скорости работы этой самой утилиты как раз как у xlsx2csv. Кроме того, для того, чтобы такую утилиту установить на сервер, нужны рут-права, для моей же честно украденной работы это не обязательно

Другие понимают что им нужно. И то, что сделал ты - просто никому не нужно, либо есть другие способы, более качественные, как ускорить процессы.

Хм... прошу прощения, но Вы гуглить умеете? Потому как я секунд за 10 нашёл вот такой Issue

Firstly, I've also worked with openpyxl and it just works, but I've found that it's very slow for me and sometimes very inefficient.

Кроме того, моя честно украденная работа создана не под питон, а под TypeScript, где тот же Polars вообще не поддерживает чтение из Excel. Необходимо сначала конвертировать в csv, и только после этого работать. Конвертировать надо, естественно, сторонними методами, которые не быстрее, чем xlsx2csv или openpyxl.

Прямым же текстом написано, как я это сделал.

"Дальше я нагуглил библиотеку calamine, и тупо из примеров разработчика взял кусок кода."

Впрочем, спасибо за верные слова, я поступил не правильно, сказав "я написал библиотеку". Должно быть, например, "я адаптировал код".

Спасибо за грамотные слова. К сожалению, хабровчане решили опустить рейтинг, так что могу достаточно редко комментировать.
Насчёт во-первых, я с тобой полностью согласен.
Насчёт во-вторых.

  1. Я действительно знаю недостаточно. Однако смог сделать то, что другие почему-то не сделали. Это больше всего удивило меня. Не в смысле что я смог, а в смысле, что никто другой таким не занялся.

  2. у меня не получилось заставить это работать на винде, поэтому я просто свичнулся на линукс Я не смог запустить из-за ошибки, касательно которого завёл Issue. Разработчик ответил, что исправит это в следующем билде =) Посоветовал использовать cargo clean, но мне не помогло даже пересоздание проекта с нуля.
    Что бинарник на гитхабе - мой косяк. Впрочем, вот эти ребята тоже бинарники не в релиз выложили, а к ним вопросов никаких или эти. В течение ближайшего времени (как только доделаю порт на питон) стуктурирую.
    А касательно количества работ библиотек - одна из библиотек для сравнения была xlsx2csv (на питоне (Вот эта)), и единственное, что она делает - превращает xlsx в csv. Да, возможностей предоставляет больше, в частности, можно выбирать название листа. Однако после небольшого допила это сможет и моя работа, что не должно вообще никак сказаться на производительности. И она работала в моих тестах даже медленнее, чем "общая" библиотека xlsx для typescript. И да, мне известно, что TypeScript сам по себе работает быстрее питона. Интересно будет посмотреть замеры библиотеки в питоне, как только доделаю.
    Насчёт замеров согласен, они не были выполнены в лабораторных условиях. Но тут погрешность даже в 100% не изменит вывода - моя xlsx2csv самая быстрая в мире для Typescript. . Кстати, Вы хорошо ли знаете питон и раст? Если да, можете помочь?

Полистал я код и не увидел конвертации в csv.

Если Вы запустите код, то обнаружите, что он работает. Я, признаюсь честно, сам плохо понимаю то, за счёт чего он работает, но Вы всегда можете спросить у разработчика библиотеки, конкретно, вот касательно этого куска кода в examples.

ЧатГПТ 4. И фиг поймёшь, прошёл он тест или нет

Планы, как обычно, не сбудутся - будет больше. Пока внедрение зелёной энергетики значительно превосходит любой прогноз, сделанный ранее.

Во-первых, АЭС выключили не из-за зелёной повестки, а из-за истерии на фоне аварии в Японии

Вообще-то нет. Решение о (поэтапной) остановке реакторов было принято в далёком 2002, задолго до Фукусимы. И уже остановили. Если в 2002 Германия произвела на АЭС 155 ТВт*час, то в 2010м 133 ТВт*час, это, +-, три реактора с КИУМ 90%

"Пора бы этим зелёным понять, что чистой энергетики быть не может, пока энергия в принципе потребляется
Если что, чистота - понятие относительное. Если смотреть на ветряную и солнечную относительно конкурентов (уголь, нефть, газ, атом с его отходами), они действительно чистые.
А что пиковые нагрузки - в чём это проблема, кстати? Пиковое потребление происходит днём, как раз во время пика солнечной активности. Другой вопрос, что атомщикам это как раз нужно, но зелёные в абсолютном большинстве своём не атомщики =)

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность

Специализация

System Administration
Junior