gromyko2115 мар 2024 в 06:30

Аннотировать или да?

Простой

4 мин

9.9K

Python * Программирование *

Из песочницы

Комментарии 58

tumbler 15 мар 2024 в 06:57

По опыту, большинство аннотаций помогают тому же PyCharm с автокомплитом - что несомненно плюс.

Использование MyPy может найти пару ошибок в аннотациях (но и только!) - тут скорее минус, с учетом времени, которое можно потратить на попытки убедить MyPy в том, что ты правильно всё аннотировал.

gromyko21 15 мар 2024 в 07:01

Да, порой с MyPy приходится потанцевать, но мое мнение - он все же помогает повысить стабильность системы.

НЛО прилетело и опубликовало эту надпись здесь

gromyko21 15 мар 2024 в 07:26

Интересная картинка, кажется та же проблема остается по сей день в JS?)

Sap_ru 15 мар 2024 в 08:08

Хуже того. Она учащается и в TS частично перекочевать, так как операторы сравнений работают также, а это проблема не столько типов, сколько приведения типов

НЛО прилетело и опубликовало эту надпись здесь

fireSparrow 15 мар 2024 в 08:02

Речь-то в статье вообще про другое. В питоне и так типы есть, сложить строку с числом у вас не получится. Проблема в том, что тип становится известен только в процессе выполнения.

Поддерживать код, у которого не размечены типы - очень-очень больно.

Сейчас я работаю на проекте, где в одном из сервисов есть огромное число функций, которые принимают аргумент opts, или params, или оба этих аргумента одновременно. Эти аргументы являются словарями, которые формируются постепенно - то есть по мере того, как они пробрасываются из функции в функцию, они могут обогащаться новыми ключами.

В итоге глядя только на функцию, вы не можете знать, какие ключи вообще есть в этих словарях, и какой формат могут иметь их значения. Приходится каждый раз долго лазить по всему коду, и всё равно полной уверенности нет.

А если бы в эти аргументы передавались датаклассы, и были бы проставлены соответствующие аннотации, то это полностью избавило бы меня от такой проблемы.

НЛО прилетело и опубликовало эту надпись здесь

fireSparrow 15 мар 2024 в 11:55

>> разве аннотаций недостаточно?

Ну, если у вас словарь, то вы, конечно, можете написать аннотацию dict[string, Any], но толку тут не много, вы всё-равно не знаете, какие ключи в этом словаре. А в датаклассе полностью определён перечень полей и типы их значений.

НЛО прилетело и опубликовало эту надпись здесь

fireSparrow 15 мар 2024 в 13:14

В питоне под аннотациями понимают вполне конкретную вещь. В статье речь именно про питоновские аннотации.

fireSparrow 15 мар 2024 в 12:01

>> а сконкатенировать?

А что вы вообще подразумеваете под конкатенацией строки и числа применительно к питону? И чем это отличается от сложения строки и числа?

НЛО прилетело и опубликовало эту надпись здесь

rSedoy 15 мар 2024 в 12:49

вы упорно приводите примеры проблемы, которой нет в Python, вам упорно говорят, что тут подняли немного другую проблему

НЛО прилетело и опубликовало эту надпись здесь

rSedoy 15 мар 2024 в 14:15

Ваш пример для ЯП со слабой типизацией, у python она строгая, а тут подняли проблему динамической типизации, это как бы совсем другое.

fireSparrow 15 мар 2024 в 13:29

>> То, что Python криво задизайнили

А в чём именно вы видите кривой дизайн? В том, что в питоне нельзя по ошибке применить конкатенацию вместо сложения?

>> пытаются вылечить головную боль методом внедрения гильотин

А вот здесь вообще о чем речь? Ещё раз повторюсь - в питоне вообще нет никакой путаницы сложения и конкатенации. Поэтому в питоне никто не пытается решить эту проблему, за отсутствием проблемы. Аннотации используются вообще для другого.

>> И я говорю о проблеме в целом (об исследовании Ларри), а не о Python конкретно.

О какой проблеме-то? Во многих языках (включая питон) нет проблемы с неоднозначностью сложения/конкатенации, а польза от типов - есть.

И типы, внезапно, нужны не только для того, чтобы сделать счастливым компилятор. А ещё и для того, чтобы сделать работу программиста проще и сократить число ошибок.

И, кстати, почему вы упорно называете Ларри Уолла только по имени? Вы с ним лично знакомы?

НЛО прилетело и опубликовало эту надпись здесь

fireSparrow 15 мар 2024 в 14:05

>> в бестиповом языке

Вот только в питоне строгая типизация.

НЛО прилетело и опубликовало эту надпись здесь

fireSparrow 15 мар 2024 в 14:12

Вы когда-нибудь занимались поддержкой проекта на 100000+ строк, в который два десятка программистов несколько лет писали?

Я бы посмотрел, как вы это будете без типов делать.

НЛО прилетело и опубликовало эту надпись здесь

gromyko21 16 мар 2024 в 03:37

Расскажи в чем конкретно был гемор? Неправильно определили типы?

НЛО прилетело и опубликовало эту надпись здесь

gromyko21 16 мар 2024 в 05:59

Я, в случае, если метод принимает 3+ аргумента сразу разному каждый из них на новую строку, для лучшей читаемости, а рядом ставлю тип, что никак не увеличивает количество строк.

Если говорить про 1-2 аргумента - оставляю их на одной строке и на ней же добавляю типы, что так же никак не увеличивает количество строк.

fireSparrow 16 мар 2024 в 07:40

del, не туда ответил

fireSparrow 16 мар 2024 в 07:41

Я не знаю, что у вас за специфичный проект такой был.

В моей практике большинство проектов пишутся за достаточно небольшой период времени, а потом годы занимает их поддержка и доработка. И поэтому основную часть времени разработчик читает код, а не пишет. В таком режиме хорошо расставленные типы могут сократить затраченное разработчиком время в десятки раз. И значительно сократить количество багов при изменении существующего кода.

Ну и расстановка типов не увеличивает как-то драматически ни объём кода, ни затраченное время на его написание.Уж точно не в разы, даже если сказать, что на 10% - то это достаточно пессимистичная оценка.

НЛО прилетело и опубликовало эту надпись здесь

fireSparrow 16 мар 2024 в 09:38

>> за необоснованный ООП

За необоснованное что угодно можно бить по рукам.

Но при правильном использовании и ООП, и типы, облегчают работу с кодом, а не усложняют. Если у вас типы и ООП только мешают - то либо вы работаете с какими совсем уж специфичными кейсами, либо вы просто не умеете их готовить.

НЛО прилетело и опубликовало эту надпись здесь

fireSparrow 15 мар 2024 в 11:58

В питоне для датаклассов обычно не используются какие-то отдельные функции конструкторы. А само по себе инстанцирование датакласса занимает примерно столько же места, сколько и создание словаря.

Andrey_Solomatin 15 мар 2024 в 15:57

Это больше похоже на плохую архитектуру, язык здесь вторичен.

Мапы объектов можно и в типизированных языках передавать.

Если нет требования по производительности, просто делайте всё неизменяемым и создавайте обхект нового типа на каждной стадии. Если нет, то паттерн строитель.

Датаклассы не очень помогут, Any | None поменятеся на int | None и поля будут определены. Если вы не можете посчитать состояния объекта по пальцам одной руки, это уже сложно для восприятия. Два optional поля дают 4 варианта состояния. None(еще на заполнен) и None(Заплненное значение) это два разных стостояния, но из вообще не отличить.

longclaps 15 мар 2024 в 07:48

С момента создания питона разработчики языков додумались, удивительное дело, в статически типизированных языках типа Kotlin выводить тип переменной из вида (написания) присваемого значения. Меньше синтаксического мусора, почти как в питоне).

Вольное присваивание аргументам функций в питоне значений произвольного типа - это удобное решение для скриптовых языков. В котлине сходной гибкости и выразительности добиваются созданием нескольких одноименных функций с разной сигнатурой, но писанины больше. Аннотирование функций в питоне подравнивает ситуацию по объёму писанины, но котлином его не делает, в смысле строгости и производительности. Так что присоединяюсь к автору статьи: хочешь типов - присмотрись к другим языкам.

Andrey_Solomatin 15 мар 2024 в 16:08

Аннотирование функций в питоне подравнивает ситуацию по объёму писанины

Это в простых случаях. А в сложных в Питоне просто забиваешь и работает, а в статических языках придётся решать. А там это делать куда сложнее.

gromyko21 15 мар 2024 в 16:13

Сложнее и дольше - да. Но на действительно больших проектах это будет работать стабильнее)

Sap_ru 15 мар 2024 в 08:10

А ничего, что это все пришло из C/C++, где можно перегружать функции почти произвольным образом? Правда поломать совсем всё не даст жёсткая типизация. Проблема вовсе не в том, что можно обсудить функции с разной сигнатурой, но одним именем. Котлин тут отстаёт. Проблема в слабой типизации. А у Python еще и в, что перегрузка сделана через такие же костыли, что и все остальные типы, и реализация таких функции ведёт к небходимости избегать строгой проверки типов и куче трудно уловимых ошибок.

tenzink 15 мар 2024 в 08:28

У python всё-таки типизация сильная (нельзя сложить яблоки со столами), но динамическая. То есть до момента выполнения в общем случае вы не знаете точно пытаетесь ли складывать яблоки со столами

Sap_ru 15 мар 2024 в 09:44

То, что программа закрашится, это (наверное) хорошо. Но она откомпилируется и запустится. И может даже пройти все тесты, а закрашиться потом в самый неподходящий момент. Особенно актуально для перегрузки функций, где весь лоск немедленно слетает и заход солнца программист неизменно выполняет вручную.

tenzink 16 мар 2024 в 05:48

Именно поэтому предпочитаю писать на языках со статической типизацией, чтобы компилятор бил по рукам. Да и в python я бы предпочёл статическую типизацию, если бы она там была

gromyko21 16 мар 2024 в 06:00

Если бы она тут была - это был бы уже не python)

tenzink 16 мар 2024 в 06:13

Безусловно, это был бы другой язык с которым было бы интересно поработать. Всё равно я продумываю данные и типы и мой прикладной python код скорее всего отлично бы ложился на статическую типизацию

Andrey_Solomatin 15 мар 2024 в 16:12

Проблема в слабой типизации.

В Питоне сильная типизация. А еще она динамическая.

redfox0 15 мар 2024 в 08:29

К сожалению, в Python типизация не дает никакого прироста производительности, а только потенциальное замедление и увеличение потребления памяти.

Файлы *.pyi решают проблему "потенциального замедления и увеличения потребления памяти" и можно писать аннотаций сколько хочешь.

Код картинками жгёт. Проверил, аннотации не вырезаются из оптимизированного кода, в отличии от __doc__ и assert.

# python3 -OOO file.py
def custom_sum(first: int, second: int) -> int:
    return first + second
    
print(custom_sum.__annotations__)

gromyko21 15 мар 2024 в 08:37

Спасибо про замечание с кодом с картинками. Это моя первая подобная статья и я вообще не подумал, что их можно вставлять в виде текста и так будет комфортнее читать.

fireSparrow 15 мар 2024 в 12:05

Ну, логично, что аннотации не вырезаются.

Ведь они являются полноценным атрибутом, и программист вполне может завязать какую-то логику на проверку аннотаций функции. Было бы странно, если бы оптимизация ломала такую логику.

gromyko21 15 мар 2024 в 12:16

Да, тот же FastApi завязан на них

НЛО прилетело и опубликовало эту надпись здесь

Vindicar 15 мар 2024 в 09:03

Я воспринимаю аннотации типов скорее как декларативное описание "что в этом параметре/этой переменной". Условно, код на C-подобном языке float speed содержит описание типа, но не содержит сведения о том, как это значение интерпретировать - как метры в секунду или как километры в час. Тут ближе подходит концепция доменных типов, конечно - но аннотации в питоне являются приемлемым промежуточным решением, и позволяют добиться хоть какой-то ясности, не трогая саму логику.

Что касается вышеупомянутой проблемы со словарями - есть TypedDict, который позволяет, по сути, описать схему для словаря (по аналогии со схемой JSON).

vilgeforce 15 мар 2024 в 10:14

" типы из библиотеки typing по типу List " - в более современных версиях питона list - встроенный тип и его не надо испортировать из typing, как и dict

gromyko21 15 мар 2024 в 10:19

Есть такое) С модулем typing, как по мне получился более выразительный пример. Хорошо, что не останавливался на этом вопросе, а решил его опустить

NN1 15 мар 2024 в 12:02

Типы из typing потихоньку переходят в разряд устаревших.

Новые типы имеют поддержку в рантайме позволяя получить полный тип list[int] вместо List.

https://docs.python.org/3/library/typing.html#deprecated-aliases

Andrey_Solomatin 15 мар 2024 в 16:24

Кроме коллкеций который переехали, там есть и другие вещи.

Хотя большую часть из них я боюсь использовать в продакшен коде, сложновато. Питон не главный язык в команде и не все в него глубоко погружены.

NN1 15 мар 2024 в 16:27

Если есть 3.9 и выше, а скорее всего так уже и есть, стоит использовать новые аннотации вместо устаревших.

NN1 15 мар 2024 в 12:15

По умолчанию у MyPy довольно щадящие настройки.

https://careers.wolt.com/en/blog/tech/professional-grade-mypy-configuration

Можно немного сделать строже.

Andrey_Solomatin 15 мар 2024 в 15:38

Можно видеть проблему “опережающей ссылки”. Наш класс в одном из
методов хочет вернуть экземпляр самого себя, но не сможет этого сделать,
поскольку объект класса еще не определен, пока Python не закончит
вычисление его тела. В этом случае мы вынуждены записать возвращаемое
значение в виде строки.

Приветствую тебя гость из прошлого.

В 3.9 можно вот так:

from __future__ import annotations

https://peps.python.org/pep-0563/

omaxx 15 мар 2024 в 15:42

Вы поспешили написать этот комментарий до того как прочли следующий абзац?

Одобренный PEP 563 “Postponed Evaluation of Annotations” уменьшил время необходимое для обработки аннотаций типов во время выполнения. Аннотации типов больше не вычисляются в момент определения функции, вместо этого они сохраняются в аннотациях в строковой форме(не производя никаких вычислений). Чтобы достичь этого нужно сделать один import.

Andrey_Solomatin 15 мар 2024 в 16:41

Да, только проверил дату публикации.

Убирать не стал, так как второй обзац сфокусирован на другой проблеме и про что он решает "опережающей ссылки" нужно самому додуматься.

Посмотрел доку, а этот PEP до сих пор не включили в Питон.

Я его перепутал с https://peps.python.org/pep-0604/ которого мне в 3.9 не хватет.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий