MaxRokatansky Jun 27 2019 at 17:03

Что я узнал про оптимизацию в Python

12 min

17K

OTUS corporate blogPython*Programming*

Translation

+19

Comments 11

menstenebris Jun 27 2019 at 17:37

Интересно что заставляет людей писать статьи про оптимизации без цифр. Ни timeit.timeit(), ни time.perf_counter(), вообще ничего. Мы просто скажем что эта операция долгая, а эта быстрая. Написанному верить. Штамп. Подпись.

Если вам по какой то причине необходимо ломать pythonic way, то вы делаете что-то не то. Не знаете как это написать быстрее на чистом python пишите на чем то еще: cython, C, C++(boost.python), Rust(PyO3). Большая часть примеров из статьи могла быть ускорена иными методами следующими pythonic way.

GCU Jun 27 2019 at 19:09

Умные мысли:
— читать из одного большого файла быстрее, чем открывать и читать несколько маленьких
— читайте только то, что надо сейчас а не всё подряд (ленивый импорт)
— если надо запускать CLI много и часто — сделайте его демоном и кормите через канал (pipe)
— вызов функции это долго, всякую мелочь можно писать так (inline)
— поиск атрибута тоже занимает время в интерпретируемых языках
— создание новых объектов занимает время, даже если вы их потом не используете
— использовать ссылки быстрее, чем копировать содержимое

mst_72 Jun 27 2019 at 19:23

не используйте python, если важна скорость?
Мне иногда кажется, что те, кто пишут про оптимизацию на python тупо издеваются...

menstenebris Jun 27 2019 at 20:13

Вовсе нет. В основном уровень кода в большинстве компаний где я работал настолько низок что написав просто правильно получаешь прирост производительности в 10-20 раз. Нужно просто знать какие операции на python медленные, а какие быстрые. Для большинства типовых вещей все написано на Си. Поэтому в подавляющем большинстве случаев оказывается что тормозит как раз та часть которая не на питоне. Не потому что она не на питоне, а потому что на нее больше всего вычислений падает. Но ее ты уже не можешь ускорить, а писать на питоне все еще можешь. быстро и удобно.
Например. Есть у меня видеопайплайн. Казалось бы какое видео на python. Но декодированием занимается gstreamer данные передаются через tcp сокеты, а основную обработку выполняет opencv, numpy и tensorflow. И в итоге весь код на python занимает 3-5% от общего времени вычисления. С точки зрения бизнеса проще купить железо чуть мощнее чем тратить месяцы человекочасов на оптимизацию в 2%.

iHateCpp Jun 27 2019 at 23:29

Спасибо, спасли нам несколько минут жизни!

worldmind Jun 28 2019 at 10:43

вызов функции это долго, всякую мелочь можно писать так (inline)

это почти гарантированное убийство читаемости, тут хорошо сказал предыдущий комментатор

GCU Jun 28 2019 at 13:39

Это статья такая :)
Я лично не считаю что это должен делать программист — руками портить код. В идеале интерпретатор/компилятор может это и самостоятельно сделать, можно ему подсказать (как inline в С++) если надо.
Полагаю что со временем:

— вызов функции это долго, всякую мелочь можно писать так (inline)
— поиск атрибута тоже занимает время в интерпретируемых языках

перестанет быть актуальным, сам Python это оптимизирует. Да и сейчас как хорошо сказал предыдущий комментатор это спорные оптимизации.

ppl2scripts Jun 28 2019 at 17:43

Демон и канал это вредный путь. Почему бы сразу не написать очередь и воркеры?

GCU Jun 28 2019 at 18:28

Это статья такая :)
Автор описывает сложности при создании CLI (hg) распределенной системы контроля версий Mercurial.
Это собранный PyOxidizer «родной» бинарник, внутри которого запакован Python cо всеми необходимыми библиотеками/зависимостями который собственно и запускается.
Как CLI это не супер-быстро запускается и в этом проблема. Но можно его запустить один раз как демон и кормить через канал (а через что ещё CLI работать должен ?).

Очередь и воркеры можно использовать когда Python уже работает, какое отношение они имеют к изначальной проблеме медленного запуска?

nomhoi Jun 28 2019 at 03:34

Ты говорил "Это самый быстрый корабль в галактике"!.

Тише едешь, дальше будешь.

ford153focus Jul 1 2019 at 15:32

Первое правило оптимизации Python-кода — не использовать Python.

-3