Pull to refresh

Comments 40

Пока в вот этом вот, не запустят DOOM, говорить не о чем :)

Было бы интересно почитать про сравнение MS Excel и LibreOffice Calc на тех же условиях

Пользуюсь обоими, Calc проигрывает в производительности при фильтрации столбцов, очень сильно((( хотя с включенной подсветкой дублирующих строк и Excel не летун ни разу

На момент, когда последний раз сравнивал в лоб на одном гигантском файле (~600МБ), да была последняя версия (прошлое лето) с тех пор не переизмерял результаты. Может и поменялось, но верится с трудом, слишком уж большая разница была.

ну 600 мегов - это, ИМХО, количество данных, которое упорно хочет в базу данных

Да оно и хранится, и взято было именно из БД и в ней же работает прекрасно, но так получилось, что сотрудник, которому хотелось пофильтровать данные, просто не умеет в select'ы, только в Эксельчике)) вот и была возможность посмотреть, как такое чудовище будет обрабатываться в качестве электронной таблицы, в т.ч. и в Калке ради эксперимента.

Примерно в 8 раз получалась разница, 30 минут против 4 часов в пользу Экселя. Понятно что если 0.1 секунды против 0.8 секунды пользователю будет не критично, то на гигантских объемах это прям печаль. Справедливости ради такие объемы пользователям нужны раз в сотню лет и то не каждому.

Искренне скажу - мне бы тоже. Но без моего участия даже за 60-летний виски)

А теперь серьезно - уже через полчаса я примерно понял расклад, но сама кончательная проверка гипотез и формулирование тезисов заняла еще 1.5-2 часа. Остальные 18-20 часов - оформление, видеофиксация и преодоление желания "забить". К слову, в процессе изучения возможностей Р7 он упал у меня минимум 30 раз, может 40. Excel же ни разу. Только в одном случае сам грохнул процесс, тк по ошибке не тот 10млн csv грузил чтобы лишний раз увидеть обрезанный до 1048к строк результат

Calc сильно тормозит, но на мощном компьютере даже можно работать.

Что характерно, даже в Ubuntu под wine MS Excel сильно быстрее.

Calc сильно тормозит, но на мощном компьютере даже можно работать

Ещё бы пример или файл, где он тормозит..

Было бы интересно почитать про сравнение MS Excel и отброшенного Python. В большинстве случаев, когда делается что то реально большое и сложное, мне кажется MS Excel может быть только прототипом, в котором отрабатывают взаимодействие частей. Иначе будет как в комменте ниже - миллионные бизнес процессы крутятся на табличках.

Attention! В статье .gif файлов на 50MB трафика (а если бы не ограничения Хабра, то гораздо более качественные и однотипные .gif весили бы на порядок больше).

Говорят, что если вместо gif'ок вставлять webm, то трафика будет значительно меньше.

Спасибо, учту на будущее! Но поступлю как MS и продолжу распространение статьи по лицензии "как есть, без ответственности за причиненный ущерб в следствие продолжения использования")

В сводных таблицах Р7 отсутствует функция GETPIVOTDATA / ПОЛУЧИТЬ.ДАННЫЕ.СВОДНОЙ.ТАБЛИЦЫ, а без нее приходится использовать SUMIF / СУММЕСЛИ на исходных данных, что крайне медленно при большом количестве вызовов.

Кроме того, уже более года как Р7 не исправляет баги с фильтрами/сортировкой в таблицах, приводящими к искажению формул и данных, а также проблемы с потерей строк при печати таблиц на принтере. И это не говоря уже о большом перечне других мелких проблем, которые требуют постоянного использования обходных путей.

Поэтому, хотя продукт и очень впечатляющий, но при возможности использовать Excel пользователи отдают предпочтение последнему.

Р7 научился фильтровать по датам?

Фильтр по столбцу с типом «дата» все еще не структурирован по годам/месяцам/дням, если вы об этом. А фильтр по текстовым значениям дат конечно же работает.

Помнится, нельзя было задать фильтр меньше/больше хх.хх.хххх, был доступен только числовой фильтр, который не воспринимал формат дат

Перепроверил сценарий ограничения дат меньше/больше - нет, на последней 2025.1.1.763 версии все еще не позволяет такое делать. В фильтре есть только "сортировка по возрастанию/убыванию" (теперь хоть сортирует даты правильно, а ведь еще недавно была неправильная алфавитная сортировка) + числовой фильтр, который не воспринимает даты в формате "дд.мм.гггг".

А самое печальное в производительности Р7 - он однопоточный. Поэтому там, где много распараллеливаемых вычислений, Excel быстрее в то количество раз, сколько у вас независимых потоков на процессоре.

Эксель, кстати, тоже однопоточный. Включение галочки поддержки GPU в настройках не ускоряет, а замедляет его. Просто из личного опыта с Эксель 2007-2019. А VBA 100% однопоточный.

При перерасчете большого количества формул в огромной таблице в диспетчере задач по загрузке процессоров видно, что Excel успешно распараллеливает нагрузку и загружает все потоки процессора (и даже пишет об этом в в своем статусе внизу таблицы), а Р7 - нет. (Все это без галочки GPU, а VBA в статье договорились вообще не трогать.)

Р7 он не однопоточный. Ядро там вполне себе бинарное и в теории вполне себе параллелится.. А вот UI, для каждого отдельного документа да, однопоточный JS, впрочем который стратует через worker, что немного спасает, но не сильно.

Здесь важен финальный результат: большие расчеты в таблицах используют один поток и не распараллеливаются. А почему именно оно так получается - тут может быть миллион различных причин.

Я полагаю, что MS Экселька - это стандарт, после которого любое другое решение воспринимается как суррогат. Но это этого продукты MS, в моих глазах, не становятся менее масдай. В том числе и потому, что они определяют стандарты. Привычка к нему очень часто плодит труднопереносимых монстров, типа бизнес логики на vba.

бизнес логики на vba.

Промазал и поставил минус, но ловите плюс в карму. Я вообще предлагал бы расстреливать тех, кто этим злоупотребяет. Весь мой прошлый опыт четко подсказывает, что файл с макросами в 95% случаев превращается в неподдерживаемую плохопахнущую субстанцию после увольнения автора. Мало кто готов в этом копаться и еще меньше знает vba для целей разбора подобного легаси. KISS в Excel прямо мастхэв и чем проще и понятнее формулы - тем лучше всем.

А теперь представьте, когда это все НАДО переносить в Р7, потоу что есть приказ перейти. И на этом плохопахнущем идет прогнозирование на многие миллиарды руб... И когда ещё и консолидация нужна из нескольких файлов, да ещё и раньше это все работало в связке с Access (недавний кейс нашей конторы) Перенос 3 макросов в итоге занял 3 месяца, и продолжается с плясками и бубнами ещё какое то время точно

Access на что-то поменяли или все Р7 вытягивали?

Распотрашили БД Access на кучу отдельных экселевских таблиц (впрочем, они туда и загонялись изначально, на какой то ляд), и оттуда дергали с помощью js библиотеки AlaSQL. Очень рекомендую, для схожих задач вполне норм решение. Есть вариант ещё через Питон дергать непосредственно из файла базы, но у нашего заказчика возникли некие сложности с установкой Питона на рабочих местах, так что пришлось импровизировать таким вот способом

@Exosphere присмотритесь, пожалуйста, к последнему голосованию. 10 лет назад на похожее предложение в поддержку меня послали мне не ответили. Может и правда стоит ввести? Особенно глядя на наличие иных популярных (нет) хабов, да и мем на самом деле,

ни разу не мем

Р7 одним словом - это полная дичь. О каких миллионах строк вы говорите, если он старательно думает над файлом 50k. И нет Р7, есть OnlyOffice, а Р7 это форк не самый лучший

Это в целом одно и тоже. Там разраб один НКТ...

Уже нет, почти как год.

А теперь всю правду: это была лучшая попытка для Р7. До "покрутить данные" я так и не дошел в этом разделе.

Это без учёта того, что по-хорошему в Excel уже давно PowerQuery стандарт и csv сильно больше 100 тыс. строк. Ну и коннект к любой БД уже мастхэв для "покрутить".

Т.е. тот же LibreOffice при 64Гб RAM ещё норм, но вот все эти офисы на JavaScript - вообще не годятся.

Лучше даже не пробовать. Это создавалось только чисто для облегчения деплоя макрсов через облако. Но создавать эти макросы там такое же ковыряние и головная боль, как и в Р7!

Сегодня с ChatGPT это должно быть гораздо проще.

Очень спорное утверждение! Не понимаю всю это новоявленную любовь к ИИ.
Начнем с того, что ИИ ( в том числе и ChatGPT) очень много придумывает своих вариантов несуществующего АПИ, которые мягко говоря надо чистить. Или обучать на примерах, которые опять же надо ручками сперва создать. И причем не простейшие варианты типа - покрасить ячейку это так то, а открыть внешнюю связь, это загрузить либу такую то, скачать данные из файла так то, и потом дергаем там ячейку таким - то образом. Плюс, в большом числу случаев, большие куски кода просто удаляются, и где то есть только пометка, что типа тут пилите напильником, ибо JS не поддерживает то, что жлементарно в VBA И т.п. И видно такие пропуски далеко не сразу чаще всего. И это не говоря про то, что АПИ в Р7 мягко говоря далеко не столь полное как в MS Office+VBA

Я как раз о MS Office, а не P7.

Это да, если вопрос не типичный, то нужно думать самому.

А вот для типичных задач, очень хорошо экономит время порой.

Как-то убил пару часов с ЧатомЖПТ на простую задачу ради эксперимента... Очень сложно его натаскать, быстрее иногда самому написать.

Уже 4 год пользуюсь Р7, для рабочих задач хватает с головой (пользую веб версию в корпоративном облаке), сводные таблицы работают аналогично Excel, макросы на JavaScript - мне удобнее, привык к JavaScript. Фильрация по датам имеет проблемы и есть особенности со сводными таблицами. Решение конечно не уровня Excel и имеет свои проблемы, ну так и Excel не "вчера" был создан)). Во многих статьях про импортозамещение прослеживается ненависть к процессу а не оценка продукта... И да, Р7 был бесплатно передан во все школы региона, а дома можно юзать его родителя).

Sign up to leave a comment.

Articles