ris58h22 мая 2023 в 19:54

Пишем на Python как на Rust

Средний

17 мин

34K

Python * Программирование * Качество кода * Проектирование и рефакторинг * Rust *

Перевод

+94

Комментарии 42

mclander 22 мая 2023 в 21:13

Прикольно! В питоне тоже есть typescript)

astronom 5 июн 2023 в 20:59

Не совсем, вы сможете выполнить код на питоне даже если в типах указан str, а вы подаете на вход int, просто линтер будет ругаться, а код будет выполняться:). Не знаю, как в TS это сделано - скорее всего, код там работать не будет, я прав?

mayorovp 6 июн 2023 в 06:14

В TS тоже есть режим, при котором компилятор ругается, но всё равно компилирует некорректный код.

Alexander428 22 мая 2023 в 22:16

Классная статья! Вам удалось собрать в одной статье много полезных советов. Я сам пишу и на Rust и на Python, тоже пытаюсь использовать "плюшки" Rust везде, где можно, но некоторые способы продемонстрированные здесь более лаконичные чем мои. Спасибо)

Единственное что, разве в Python с его GIL нужны мютексы? Разве что для модуля multiprocessing какого-нибудь.

ris58h 22 мая 2023 в 22:42

Это перевод. Можете попробовать спросить автора в комментариях к его посту на Reddit.

Alexander428 25 мая 2023 в 05:51

А, не заметил)

mayorovp 23 мая 2023 в 03:32

GIL избавляет вас от повреждения памяти, и гарантирует что любые объекты, с которыми вы работаете, остаются корректными объектами Python, но он не защищает состояние этих объектов от гонок.

Банальный код вроде foo.bar += 1 уже содержит гонку если объект foo разделяемый и не защищён мьютексом.

НЛО прилетело и опубликовало эту надпись здесь

mayorovp 23 мая 2023 в 12:35

Ну, переменные редко бывают разделяемыми между потоками, поэтому я и привёл чуть-чуть более сложный пример. А так да, i += 1 не атомарна.

jacob1237 23 мая 2023 в 21:34

Стоит добавить что GIL в каком-то смысле гарантирует бОльшую производительность (особенно для однопоточных приложений), потому что потокобезопасные структуры данных мало того что требуют дополнительного времени на качественную разработку и отладку, так еще и зачастую просаживают производительность, т.к. сами по себе используют различные примитивы синхронизации.

Даже lock-free структуры используют в том или ином виде атомарные операции CPU (cmpxchg и его друзья), что примерно раза в 2 медленнее чем подобные неатомарные операции.

Поэтому GIL, можно сказать, гарантирует отсутствие головной боли у контрибьюторов CPython :)

Helltraitor 23 мая 2023 в 00:14

Добавьте проверку во время выполнения, чтобы убедиться, что нормализованная ограничивающая рамка действительно нормализована

Использует assert

Другим подходом может быть полное удаление метода close и просто использование клиента в качестве менеджера контекста

Автор, видимо, не в курсе что менеджеры и были созданы для решения данной задачи

По поводу мьютексов: менеджеры работают и тут https://docs.python.org/3/library/threading.html#using-locks-conditions-and-semaphores-in-the-with-statement

Правда, поскольку нет системы владения, нет смысла и передавать в мьютекс что-то (хотя могли бы фичу такую добавить)

ris58h 23 мая 2023 в 06:55

Автор, видимо, не в курсе что менеджеры и были созданы для решения данной задачи

Автор в курсе. В одном из параграфов об этом упоминается:

Блокировки Python реализуют интерфейс context manager, что означает, что вы можете использовать их в блоке with,
чтобы быть уверенными, что они автоматически разблокируются в конце области
действия.

MountainGoat 23 мая 2023 в 03:59

В Питоне есть незаслуженно забытый TypedDict, позволяющий фиксировать по типам содержимое словаря. Хорош, чтобы вернуть из функции 3-4 разных значения, но при этом dataclass делать не хочется, так как больше нигде они пачкой не идут.

morijndael 24 мая 2023 в 23:43

Так ведь TypedDict тоже надо объявлять. Только датакласс вам ещё сгенерирует конструктор, проверит типы, и вообще сделает всю рутину

TypedDict лучше оставить для легаси, которое использовало словари, и API которого так просто не изменить

ri_gilfanov 25 мая 2023 в 13:37

Типизированные словари лучше ложатся на SELECT запросы к базам данных.

Если ключ employee_pk в словаре TaskSelectDict содержит None, значит клиент хочет получить задачи, к которым не назначен исполнитель.

Если этого ключа в словаре нет -- клиент хочет получить задачи, независимо от того назначен им исполнитель или нет.

В случае же с классами данных надо придумывать другой способ логического разделения этих двух случаев использования.

Только датакласс вам ещё сгенерирует конструктор

У словарей по умолчанию есть конструктор.

проверит типы

Если речь о статической проверке, MyPy умеет проверять типы и для TypedDict, и для dataclass.

Во время исполнения -- ни TypedDict, ни dataclass никаких проверок типов не делают. Если, конечно, Вы не имели ввиду dataclass из библиотеки Pydantic.

ReadOnlySadUser 23 мая 2023 в 04:28

Не хочу разводить холивар, но в сущности вы изобрели более страшную и менее производительную версию С# :)

Amka 23 мая 2023 в 05:31

Не холивар, так обесценивание)) Красота дело субьективное, конечно. Но с точки зрения питона это большой и отличный шаг вперёд.

gnomeby 23 мая 2023 в 08:47

Идея понятна, но на мой взгляд у каждого языка есть некоторое сочетание компактности/безопасности, нарушение которого увеличивает накладные расходы и превращает этот язык в другой язык.

Наверное проще сразу взять другой язык, а в питоне просто больше интеграционных тестов написать.

Но жменьку полезных советов оценил.

Gadd 23 мая 2023 в 09:28

db = Database() car_id = db.get_car_id("Mazda") driver_id = db.get_driver_id("Stig") info = db.get_ride_info(driver_id, car_id)
Заметили ошибку?

Тут можно так же использовать keyword-only аргументы

class Database:    
    def get_car_id(self, brand: str) -> int:    
    def get_driver_id(self, name: str) -> int:    
    def get_ride_info(self, *, car_id: int, driver_id: int) -> RideInfo

В итоге имя аргумента придется задавать явно, например следующий вызов будет смотреться как минимум странно:

info = db.get_ride_info(car_id=driver_id, driver_id=car_id)

Попытка вызова метода без явного указания имени аргументов будет вызывать ошибку при попытке запуска скрипта.

Но, конечно же, в таком случае нельзя полагаться на то, что mypy или другой анализатор выдаст ошибку. Но зачастую такой подход тоже полезен.

LinearLeopard 24 мая 2023 в 08:26

Можно создать разные типы с помощью NewType https://docs.python.org/3/library/typing.html#typing.NewType

Тогда CarId и DriverId будут разные типы, которые нельзя будет смешивать (типо разные BBox из статьи), но в некоторым местах надо будет кастить, что не особо удобно, особенно в тестах, потому что там будет много таких кастов, но терпимо.

def get_car_id():
    result = ...
    return CarId(result)

НЛО прилетело и опубликовало эту надпись здесь

Paskin 23 мая 2023 в 15:56

У меня такое впечатление, что производительность тут явно будет принесена в жертву безопасности.

ris58h 23 мая 2023 в 16:10

Какие основания для такого впечатления? Это проверки времени компиляции.

gnomeby 23 мая 2023 в 16:12

Какого же времени компиляции, всё в рантайме будет создаваться и оперироваться более сложными типами.

ris58h 23 мая 2023 в 16:54

всё в рантайме будет создаваться

Расскажите пожалуйста что именно "всё" и какими более сложными типами оперировать. PEP-484 вам в помощь.

andreymal 23 мая 2023 в 17:10

Очевидно, датаклассы. Когда счёт объектов идёт на тысячи — уже начинает быть заметно, что манипуляции с датаклассами в несколько раз медленнее манипуляций с кортежами. А ещё вы не использовали slots, на чём потеряли ещё несколько процентов производительности

UPD: а впрочем, есть же typing.NamedTuple. Если задача не требует мутабельных объектов, то, наверно, можно попробовать позаменять датаклассы на NamedTuple, совместив таким образом удобство датаклассов и скорость кортежей. А если мутабельность всё-таки нужна, то там же рядышком есть typing.TypedDict — в рантайме обычный dict, немножко медленнее чем кортежи, но всё ещё быстрее датаклассов

ris58h 23 мая 2023 в 17:43

Очевидно, датаклассы.

Только они или как было заявлено "всё"? По ним согласен.

gnomeby 23 мая 2023 в 19:40

NewType тоже.

Changed in version 3.10: NewType is now a class rather than a function. There is some additional
runtime cost when calling NewType over a regular function. However, this
cost will be reduced in 3.11.0.

-----

Ну хорошо, не всё вообще, а всё что заменяет примитивные типы на более сложные.

mayorovp 23 мая 2023 в 16:10

Вряд ли она просядет сильно (да и если экономить на всех спичках — в первую очередь надо менять язык). Кроме того, часть советов тут вообще никак не влияет на рантайм.

slonopotamus 23 мая 2023 в 16:40

Производительность уже принесена в жертву в момент выбора питона.

Paskin 23 мая 2023 в 21:46

Совсем не факт, особенно в сложных приложениях. Мне как-то пришлось переписывать с С++/STL на Java некий компонент телекоммуникационого приложения - просто "переведенный" построчно, он уже работал почти в 2 раза быстрее за счет более оптимизированных библиотек.
Не говоря уже о времени, которое занимает написание одного и того же кода...

slonopotamus 23 мая 2023 в 22:34

за счет более оптимизированных библиотек

... которые написаны на чём? На сишечке. И при чём тут питон тогда?

shpaker 24 мая 2023 в 03:41

А какая разница на чем оно под капотом написано если ты этого никогда не видишь и не трогаешь?

Paskin 24 мая 2023 в 04:29

При том, что Питон - это гораздо более удобное средство вызова "оптимизированных библиотек", чем С/С++. Позволяющее быстро получить работающий код, а потом - если такая нужда возникнет - его оптимизировать. А не наоборот, что как известно - "the root of all evil".

slonopotamus 4 июн 2023 в 21:12

А чо сразу C/C++? В мире вагон других языков.

kapkekes 24 мая 2023 в 07:33

Поправьте, если не прав, но ведь альтернативные конструкторы (секция про функции-конструкторы) создаются через @classmethod, а не @staticmethod, нельзя же внутри метода класса прямо ссылаться на него.

К тому же, в лоб указывать тип "Rectangle" тоже идея не лучшая: получится, что отнаследованные классы всё ещё будут возвращать Rectangle, а не себя. Сейчас (начиная с 3.11) эту напасть можно решать через typing.Self, раньше как-то нужно было оперировать на typing.TypeVar.

А статья неплохая, нашёл полезные моменты, спасибо.

ris58h 24 мая 2023 в 07:36

Про typing.Self в статье есть упоминание в последнем параграфе соответствующей части.

Xobotun 27 мая 2023 в 04:14

Я так понял, что то, что через @staticmethod создаётся, то не очень конструктор, а больше фабричный метод. Если мне память насчёт GoF не изменяет. :)

WASD1 26 мая 2023 в 21:10

Дам ещё один совет (он у меня вырос на распробовании Haskell - но Rust, во многом, его идеями вдохоновлялся (в купе с zero cost abstractions)).

- Стараться пользоваться иммутабельными данными
- Создавать новые структуры данных при необходимости (используя map \ filter \ reduce)
- в развитии предыдущего: стараться, чтобы каждой переменной вы могли дать обозначение в терминах "бизнес-логики" что примерно эквивалентно "одинаковому уровню абстракции в рамках одной функции".

boenu 26 мая 2023 в 22:35

А в чем смысл статьи? "Используйте строгую типизацию в питоне"? Так все используют, иначе это адский ад, прямо как в нативном JS

ris58h 26 мая 2023 в 22:44

Вы можете спросить о смысле автора на Реддит. В конце есть ссылка.

Если пробежитесь по разделам статьи то заметите, что речь там не только про строгую типизацию.

По поводу "все используют" хотелось бы подкрепления фактами.

astronom 5 июн 2023 в 20:58

В питоне есть встроенная типизация уже, typing практически не нужен, есть list, dict, any и тп. По поводу Dataclass - можно использовать NamedTuple.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий