ru_vds May 21 2019 at 09:30

Возможности Python 3, достойные того, чтобы ими пользовались

5 min

44K

RUVDS.com corporate blogWebsite development*Python*

Translation

+75

Comments 82

evgenyk May 21 2019 at 10:55

Мне кажется, абсолютно необходимо упомянуть, что аннотации типов это не проверка типов, а подсказка компилятору.

>>> def f(a: str):
...     print(a)
...     return
... 
>>> f('a')
a
>>> f(1.0)
1.0
>>> import sys
>>> sys.version
'3.5.2 (default, Nov 12 2018, 13:43:14) \n[GCC 5.4.0 20160609]'

gigimon May 21 2019 at 11:05

Не только компилятору, но и всяким IDE

evgenyk May 21 2019 at 11:09

Моя интуиция почему-то протестует против внесения в синтаксис языка фичей предназначеных для IDE. Слишком сильно связаны получаеются IDE и язык.

gigimon May 21 2019 at 11:30

а как комплиятор сейчас это использует? Насколько я читал, CPython пока никак не использует type annotation, а вот IDE уже вовсю

evgenyk May 21 2019 at 12:56

Сам компилятор в рантайме не использует, но можно подключить «runtime code evaluator» и он будет проверять данные в рантайме.
Ссылка: the state of type hints in Python

sehin_d May 21 2019 at 11:56

Использование аннотаций, помимо прочего, достаточно сильно повышает читаемость кода. Так что можно считать это не только фичей для IDE.

Xop May 21 2019 at 13:42

Есть еще анализатор mypy, который умеет проверять соответствие типов

UFO just landed and posted this here

evocatus May 21 2019 at 17:19

Там есть Any, Union (sum type), дженерики и пр. Т.е. можно описать любой тип, даже сложную вложенную структуру или функцию. Можно создать свой кастомный тип.
В общем Python списывает хорошее у Haskell ещё начиная со списковых выражений.
подробнее здесь: docs.python.org/3/library/typing.html

UFO just landed and posted this here

evocatus May 21 2019 at 21:27

чтобы у меня дженерик был не поверх любого типа T, а поверх только U[T] для фиксированного (или нет) U?

Кажется, да.

Много можно чего ещё скопировать из Haskell (и раздуться похлеще монстра C++), но задачи такой, как я понимаю, не стоит. Я просто имел в виду, что разработчики Python в сторону Haskell смотрят внимательно и заимствуются фичи оттуда давно, потому что list comprehensions в Python с 2000 года.

UFO just landed and posted this here

Tishka17 May 24 2019 at 19:04

Можно указать типы при создании TypeVar и будет он co-, contra- или in- вариантным. К сожалению, пока этот механизм в том же mypy и pycharm работает с проблемами

noth May 21 2019 at 12:40

Python это не компилируемый язык.
Код python исполняется интерпретатором, а он в свою очередь все эти аннотации типов полностью игнорирует, что вы же в своём примере и продемонстрировали.

Аннотации это для чего угодно, но не для исполнения кода: для читаемости, для подсказок в IDE, для статического анализа (mypy тот же самый), etc.

evgenyk May 21 2019 at 12:43

Ну здравствуйте, вроде как всю жизнь код питон компилируется в промежуточный байт-код и этот байт код затем исполняется.

lorc May 21 2019 at 14:43

Ну объектные файлы же не продуцируются. Слинковать с другими объектными файлами ничего нельзя.

Байт-код все равно исполняется виртуальной машиной.

evgenyk May 21 2019 at 15:01

С точки зрения типов, компилятор мог бы проверять типы на этапе компиляции байт кода. Таким образом, можно проверять код до его запуска. У чистого интерпретатора, без этапа компиляции такой возможности нет, в случае ошибки типа он все-равно должен закончить выполнение.
Т.е. у чистого интерпретатора мало смысла в проверке типов.
Я то сам, дне думаю, что для динамического языка не стоит внедрять обязательную проверку типов. Ну если только в качестве опции в виде билбиотеки. Не в ядре.
Я за то, чтобы сохранять ядро как можно более компактным.

UFO just landed and posted this here

assembled May 21 2019 at 17:07

С такой логикой любой язык можно назвать интерпретируемым, ведь в конечном итоге всё интерпретируется процессором.

ratijas May 21 2019 at 17:44

При всём уважении к Вашему юзернэйму, это так не называется.

assembled May 21 2019 at 18:09

Не называется, но если следовать логике lorc (при которой если язык компилируется в нечто, что далее интерпретируется, то сам язык считается интерпретируемым), все языки можно назвать интерпретируемыми.

lorc May 21 2019 at 18:40

Нет, это не моя логика. Пожалуйста, не надо приписывать мне то, чего я не говорил.

assembled May 21 2019 at 19:10

А это чьи слова:

Байт-код все равно исполняется виртуальной машиной.

И это в ответ на утверждение, что питон компилируется. Из контекста я понял, что вы считаете его интерпретируемым. Или я ошибаюсь?

-1

lorc May 21 2019 at 19:19

Да, я продолжаю считать питон интерпретируемым. И буду считать его таким, пока не смогу получить из программы на питоне объектный файл, скормить его ld и слинковать его с моей программой на С.

assembled May 21 2019 at 19:44

Из программы на питоне можно получить .pyc файл. И при этом ни строчки из этой программы не исполнить.

Al_Azif May 22 2019 at 17:06

Скажите, .pyc-файл исполняется непосредственно на процессоре, без вспомогательных прокладок?

Вот когда начнёт исполняться — тогда и будет компилируемым.

assembled May 23 2019 at 07:41

Но байткод-то в результате чего получается? В результате компиляции питонокода.

Машкод тоже может не исполнятся непосредственно на процессоре. В современных процах он собственно и не исполняется, а транслируется в микрокоды, которые затем исполняются.

igorp1024 May 24 2019 at 05:33

Компилируемый язык программирования — язык программирования, исходный код которого преобразуется компилятором в машинный код.

В машинный.
p.s. Тут какой-то спор о терминах, которые уже давно устоялись.

assembled May 24 2019 at 15:13

Кроме того, существуют реализации языков, которые компилируют исходный текст программы в байт-код, который затем либо интерпретируется, либо выполняется т. н. JIT-компилятором (или виртуальной машиной). Это привносит ещё больше неясности в вопрос о том, где именно должна быть проведена граница между компилируемым языком и языком интерпретируемым.

Можно и поспорить ;)

lorc May 21 2019 at 18:46

Нет. Компилятор производит объектные файлы, которые потом линкуются в исполняемый файл. Который потом может быть загружен в память и исполнен процессором. Это вроде бы обычный способ определять компилируемый язык.

И нет, если вы запакуете виртуальную машину и байт-код в один файл, то это все равно не будет скомпилированной программой. Ваша программа (а не ВМ) должна быть переведена в машинные коды, которые смогут исполняться процессором целевой платформы.

assembled May 21 2019 at 19:39

Во-первых, компилятор не обязательно генерирует объектный файл, он может генерировать и файл с байт-кодом, или сразу исполняемый файл, или вообще простой бинарный файл являющийся сырым образом программы и её данных (ещё возможен вариант генерации программы на другом языке, но это принято называть транспилером).
Во-вторых, компилятор может вообще не генерировать никаких файлов, а компилировать программу в памяти, снаружи он будет подобен интерпретатору, но компилятором от этого быть не перестанет.

если вы запакуете виртуальную машину и байт-код в один файл, то это все равно не будет скомпилированной программой

Здрасьте, а байткод откуда взялся, если не был скомпилирован?

Я бы называл питон компилируемым в байт-код. Но да, сам байткод при этом интерпретируется (как и машинный код).

Al_Azif May 22 2019 at 17:27

>>Я бы называл питон компилируемым в байт-код. Но да, сам байткод при этом интерпретируется (как и машинный код).

После последней фразы могу запостить только эту ссылку. Финиш, конечно:
www.youtube.com/watch?v=LLk9_EH6Pfo

assembled May 23 2019 at 07:46

Что тут для вас «поворот»?

bravmi May 21 2019 at 13:00

Эм в этом примере наоборот же получается, чистый питон игнорирует аннотации.

evgenyk May 21 2019 at 13:03

Ну да, я это и хотел показать. Что чистый питон не проверяет типы. Если бы проверял, он что-то бы сделал, например выбросил бы исключение.

menstenebris May 21 2019 at 13:17

Ну скажем так, это не настоящая проверка типов, но кое-где они проверяются. Например dataclass не создает параметр для __init__ у которого не проставлен тип данных или добавленная перегрузка overload, из того же пакета typing, вообще не работает. Очень надеюсь в будущих выпусках разработчики усилят это направление.

evgenyk May 21 2019 at 13:30

Для меня большой вопрос, нужно ли тащить статическую проверку типов в рантайм питона. Возможно просто я не сталкиваюсь с необходимостью статической проверки, но лично меня вполне устраивает дак тайпинг в питоне. Если нужна строгая типизация можно просто взять другой язык. Ну хотя бы тот же Cython. Или Си или C++.
Если все тащить в одну кучу получится еще один C++, точнее получим все недостатки C++, без его достоинств.
В моей практике ошибки с типами так редки, что ИМХО не стоит городить огород.

NeZanyat May 21 2019 at 13:36

Ну мне кажется что все таки неплохо иметь возможность при необходимости использовать типизацию (пусть даже если для того что бы она работала в рантайме надо подключить какой ни будь enforce) в основном для себя языке программирования.

evgenyk May 21 2019 at 13:49

В виде подключаемых библиотек я готов мириться. Пусть будет, для любителей. Но только не в ядре языка.
По моему это просто мода. Лично я накушался строгой типизации в C++. А так сначала можно затащить строгую типизацию в питон, а потом без дизайн паттернс ни шагу ступить нельзя будет.

menstenebris May 22 2019 at 04:51

Без аннотации типов командой больше 5 человек разрабатывать очень трудно. Совершенно непонятно что тебе пробросили через 3 функции. Или могу я вызвать чужой метод и отправить в него set вместо list. это нужно еще и чужой код просмотреть прежде чем использовать.

Ну и уж совсем мечты это нормально предсказание типов для LLVM и для компилятора в WebAssemly, а то питон сейчас жив одним ML

lega May 21 2019 at 15:01

~~строгая~~ статическая типизация

assembled May 21 2019 at 17:20

статическую проверку типов в рантайм

Статическая проверка не может быть в рантайме, она выполняется на этапе компиляции, проверки в рантайме называются динамическими.

Если нужна строгая типизация можно просто взять другой язык

Типизация в питоне, кстати, строже чем в большинстве скриптовых. Хоть функции и принимают любые объекты, но вольностей, типа складывания строки с числом он не позволяет, и неявных приведений типов (как в js — лишь бы что-то выполнить) он не делает.

UFO just landed and posted this here

assembled May 21 2019 at 18:14

Потому что это осмысленная операция, и, в отличие от всяких JS и PHP, питон не будет пытаться привести их к одному типу, т.е. для разных типов всегда будет False.

bolk May 21 2019 at 18:58

$ php -r 'var_dump(3 === "10");'
bool(false)

assembled May 21 2019 at 19:03

Ваше === — это костыль для замены == с его глупым поведением.

bolk May 21 2019 at 19:45

Невежа. Тьфу на вас.

-2

assembled May 21 2019 at 20:03

Просвятите, какая необходимость иметь в вашем языке оператор ==?

bolk May 22 2019 at 06:22

Мой язык — русский, в нём нет этого оператора. Кто касается ПХП, то достаточно вспомнить историю языка — простая работа с вебом, данные из форм приходят нетипизированно.

UFO just landed and posted this here

assembled May 21 2019 at 19:54

Это позволяет избежать лишних проверок типов руками. Обычное дело для функций, принимающих параметры различного типа.

UFO just landed and posted this here

assembled May 21 2019 at 20:07

С динамической типизацией тип параметров заранее может быть не известен же.

UFO just landed and posted this here

semen-pro May 29 2019 at 13:36

>> 3 == "10"
False

Правильнее так:

>>> print( 10 == "10")
False

Если числа разные — непонятно, что есть False

Без print не работает

>>>  3 == "10"
  File "<stdin>", line 1
    3 == "10"
    ^
IndentationError: unexpected indent

-1

netch80 Jun 1 2019 at 06:33

> Без print не работает

Конечно, если пробел впереди воткнуть — работать не будет.

>>> 3 == "10"
False
>>>  3 == "10"
  File "<stdin>", line 1
    3 == "10"
    ^
IndentationError: unexpected indent

только print тут ни при чём.

evocatus May 21 2019 at 17:27

Clojure — интерпретируемый язык с динамической типизацией, но там есть библиотека spec, которая позволяет описать «схему» данных примерно как в Python, но в рантайме это всё проверяется на корректность. И также есть аннотации типов, которые позволяют указать тип Java и это влияет на производительность, потому что можно написать алгоритм, который будет работать только со списком Long, не задействуя рефлексию.

worldmind May 21 2019 at 15:12

не компилятору, а статическому анализатору

evgenyk May 21 2019 at 15:40

Наверное лучше вообще убрать и компилятор и статический анализатор и просто написать; «это просто подсказки».

GamePad64 May 21 2019 at 20:33

Также, type hints можно использовать, когда нам нужна явная привязка названия переменной к её типу. Например, есть библиотека pydantic, которая использует type hint'ы в датаклассах для маршаллинга и валидации схемы данных. Мы перешли на неё с marshmallow, очень удобно.

Tishka17 May 22 2019 at 07:19

Стоит отметить, что pydantic использует свои классы вместо питоновских dataclasses, что может ограничивать применимость. Я в свободное время пилю библиотечку, которая может быть применима для уже существующих датаклассов без необходимости как-то их менять.

dim2r May 21 2019 at 14:16

Python молодцы. Многие языки еще долго будут догонять.

Еще бы добавить аннотаций для функционального программирования и будет еще круче

evgenyk May 21 2019 at 15:03

Повторюсь. Я за то, чтобы сохранять ядро языка как можно более компактным. Чтобы его можно бы было всюду использовать с минимальными изменениями.

-1

dim2r May 22 2019 at 05:18

По идее давно напрашивается модульный язык. Зачастую в энтерпрайзе надо чтобы программисты использовали одни и те же конструкции и не использовали какие-то другие. Надо научить язык отсекать лишние в конкретном проекте конструкции.

evocatus May 21 2019 at 17:32

В модуле typing вроде есть Callable? Т.е. функции высшего порядка вполне могут работать с этими аннотациями.

assembled May 21 2019 at 18:19

аннотаций для функционального программирования

Вы мне лучше скажите, какая аннотация должна быть у функции, принимающей совпадение по регулярке (тип _sre.SRE_Match)?

lega May 21 2019 at 15:04

Какие возможности Python 3 вы добавили бы в приведённый здесь список?

asyncio и холиварный := (3.8+)

smer44 May 21 2019 at 17:48

что сказать, язык будущего))

очень классно было бы действительно по желанию включать проверку либо по названию класса либо структуры обьекта в рантейме и где можно на этапе интерпретации, а то перепутаешь места в функции, а ошибку выдаёт из чёрт знает какого места, а потом в коде хорошо протестенном отключать

и очень интересная фича LRU кэш, я чессно не знал и dict юзал
кста вроде одинакого по скорости этот кэш и ручной через dict, кто нибудь протестил нормально скорость??

имхо, в Питон версии 100500 + следует ввести:

инспекцию структуры любого обьекта с преттипринтом или лучше в визуальном представлении, когда берёшь неизвестный модуль, где документация плохая а все типы стёрты
обьединить нотацию для класса и dicta, inst['field'] эквивалентно inst.field

интерпретировать сложные comprehention декларативно с оптимизаций и кешем где надо

встроить без геморa частичные функции, с поддержкой интерпретатора заместо partial:

def fn ( a,b,c) k = fn(1,2) #-> обьявление частичной функции k(c) c изсестными a,b, потом k[0] = 3 # безгеморная замена параметра на определённом месте

сложные lambda обьявления с функционалом как обычный метод

fib = lambda @lru_cache(maxsize=512), a: int ,b : int -> int : if number == 0: return 0 if number == 1: return 1 return fib_memoization(number-1) + fib_memoization(number-2)

kalininmr May 21 2019 at 19:49

кстати о f-string.
оно и раньше так же примерно работало

"Hello {user}!".format(**locals)

или **vars

lega May 21 2019 at 20:11

Все же не так красиво, да и по скорости f-string в разы* быстрее:

Type            Trial 1                 Trial 2                 Trial 3
%:              0.273233943000          0.268914790000          0.273714235000
str.format():   0.7942503730000681      0.793637686999773       0.7926878570001463
str.Template(): 3.3321329630002765      3.3256752329998562      3.315622544999769
f-string:       0.1914799450000828      0.18900782099990465     0.19004946999984895

Тестировалось на python 3.7, оригинал.

kalininmr May 22 2019 at 06:24

ну ясно дело оптимизировали и сделали изящнее.

onegreyonewhite May 22 2019 at 00:49

оно и раньше так же примерно работало

Нет, не так же. Можно было только подставлять значения, а делать вычисления прямо внутри было нельзя (теперь в f-string можно). Так что теперь нужно быть осторожнее с такими строками. <sarkazm>Это почти как маленький php внутри python.</sarkazm>
Ко всему + то что сказал lega производительность в разы больше.

Примерные тесты

~ $ python3.7 -m timeit 'a = 1' 'b = "string"' '"Test strings formatting: {a} {b}".format(**locals())'
500000 loops, best of 5: 620 nsec per loop
~ $ python3.7 -m timeit 'a = 1' 'b = "string"' 'f"Test strings formatting: {a} {b}"'
2000000 loops, best of 5: 157 nsec per loop
~ $ python3.6 -m timeit 'a = 1' 'b = "string"' '"Test strings formatting: {a} {b}".format(**locals())'
1000000 loops, best of 3: 0.599 usec per loop
~ $ python3.6 -m timeit 'a = 1' 'b = "string"' 'f"Test strings formatting: {a} {b}"'
10000000 loops, best of 3: 0.142 usec per loop
~ $ python2.7 -m timeit 'a = 1' 'b = "string"' '"Test strings formatting: {a} {b}".format(**locals())'
1000000 loops, best of 3: 0.435 usec per loop

splatt May 22 2019 at 07:46

Изменения крутые и полезные.
Очень хотелось бы что бы исправили концептуальные проблемы языка, даже если это означает python 4 и сломанную обратную совместимость.

Например те же импорты все ещё очень сложны для понимания новичками (особенно по сравнению с другими языками). При этом циркулярные импорты падают в рантайме с неадекватной ошибкой, а orm фреймворки вроде той же алхимии предлагают решать проблему просто — указывать название классов текстом *facepalm".

Tishka17 May 22 2019 at 09:21

К сожалению, я изучал питон очень давно и не могу 100% вспомнить какие у меня были проблемы. Но, кажется, импорты — это не та вещь, которая мне показалась непонятной.

Про циклические импорты действительно не мешало бы добавить текст более явный, хотя если посмотреть на стек это и глазами довольно легко понять.

В ОРМ циклические завимости надо решать не написанием названий классов текстом, а правильной расстановкой relation, мне кажется это в 95% случаев возможно (если я не прав — прошу привести пример).

smer44 May 22 2019 at 21:14

циклическая зависимость легко может разрешаться интерпретатором без жалобы на якобы ошибки, зря что так не встраивают. Странное дело её не разруливает даже maven в своих проэктах…

Tishka17 May 23 2019 at 05:47

На мой взгляд, циклическая зависимость в большинстве — ошибка проектирования и должна исправляться переразбиением модулей или снижением связности кода (иногда — использованием DI, например).

lega May 23 2019 at 06:39

циклическая зависимость легко может разрешаться интерпретатором без жалобы на якобы ошибки

Как такая цикличекая зависимость может решиться интерпретатором?

# a.py
import b
value = b.value + 5

# b.py
import a
value = a.value + 7

PS: В питоне нормально решаются циклические зависимости, проблемы не в питоне, а «в руках».

igorp1024 May 24 2019 at 05:37

её не разруливает даже maven в своих проэктах

Имхо, с ней намного проще получить в проекте одну и ту же зависимость с разными версиями. И долго искать причину фокусов в рантайме.

KonstantinSpb May 22 2019 at 18:31

LRU-кэш полезная штука, но надо пользоваться с умом, т.к. он подходит только для идемпотентных функций(методов)

danSamara May 29 2019 at 10:27

Если говорить о Python 3 в целом, то в версии 3.8 у нас будут Assignment Expressions (PEP 572):

if x := True:
     print(f'{x}')
# Выведет: True

x = 2
print([y := x**x, y**2, y**3])
# Выведет: [4, 16, 64]

И много разговоров про None-aware operators (PEP 505), значительно сокращающие код:

# Old
data = data if data is not None else []
# New
data = data ?? []

# Old
if lst:
    lst.append('string')
# New
lst?.append('string')

# Old
if callable(foo):
    foo()
# New
foo?()

# Old
if x:
   x + 1
# New
x? + 1

# Old
result = a
try:
    result = result.b
except AttributeError:
    pass
else:
    result = result.c
    try:
        result = result.d
    except AttributeError:
        pass
    else:
        result = result.e
# New
a?.b.c?.d.e

Однако PEP 505 сейчас в состоянии Deferred.

Ну и конечно следовало в статье упомянуть asyncio — это важная часть, по которой сделано много хорошей и качественно работы.

smer44 May 29 2019 at 22:17

а ничего что по идее должно выбрасываться exception и исполнение прекращается, а тут проглатываются эксепшены и выдаётся None которое может стать ложноположительным?

danSamara May 30 2019 at 07:57

Используйте a.b.c.d.e и будет exception