MidavNibush 18 апр в 16:51

Mojo: убийца Python и будущее AI

Простой

5 мин

29K

Блог компании RaftOpen source*Программирование*Машинное обучение*Искусственный интеллект

Обзор

+27

Комментарии 75

Jury_78 18 апр в 17:04

Ладно Питон, но почему C++ медленней?

+12

Aizz 18 апр в 17:48

Судя по всему, за счет мультитрединга и принципов работы с массивами. Незначительно, впрочем. Нагуглил статейку, там графики есть. Насколько можно доверять сайту и автору - не знаю.
https://engiware.com/benchmark/llama2-ports-extensive-benchmarks-mac-m1-max.html

Jury_78 18 апр в 18:02

Незначительно, впрочем.

А у автора то отличие в 10 раз получается.

ArtInt 19 апр в 13:27

Не совсем понял почему в 10 раз? Если вы про Go vs Mojo/C, то да. Я сам был удивлен что Go очень плох в сугубо вычислительных задачах.

Jury_78 19 апр в 15:29

Я что то не то увидел?

ArtInt 19 апр в 16:44

Как я полагаю это бенчмарк на алгоритме Mandelbrot причём на CPU Intel Xeon у которого 88 vCPU. Сам не проверял, но думаю что вполне может быть правдой, по причинам описанным в комантах -- меньший оверхед за счёт LLVM/MLIR трансляции, который обеспечивает улучшенную компиляцию под конкретные процессоры. MLIR имеет контекст более высокого уровня поэтому по словам создателей Mojo - это помогает с оптимизацией.

kuza2000 18 апр в 19:52

Тоже не понял, как C++ может быть медленнее. Параллелизм и в C++ есть. Да та же numba в питоне может циклы параллелить по ядрам процессора.

+13

ArtInt 19 апр в 13:31

Паралелизм паралелизму рознь. Многое зависит от оптимизатора. Проблема с современными C++ компиляторами в том что им приходится поддерживать 100500 различных платформ и архитектур, из за этого код под конкретную архитектуру может оказаться суб-оптимальным. А также с другой стороны general оптимизация компилятором проигрывает более правильно организованному коду высокого уровня. Т.е. грубо говоря если программист явно пишет какой цикл нужно векторизовать и какие нужно использовать параметры для SIMD операций -- код оказывается эфективнее чем оптимизатор будет делать предположения в жадном режиме.

NSZombie 23 апр в 17:18

Латтнер на подкасте Фридмана еще рассказывал про «autotuning» https://youtu.be/pdJQ8iVTwj8?t=1264&si=NyMFBGc_-Hd0FPdl, суть в том, что программа самомтоятельно подгоняется (методом перебора) под железо, на котором ее запускают. Чтобы больший КПД на этом сетапе получить

ArtInt 23 апр в 18:19

Да, autotune была фичей которую нужно использовать явно, но в последних версиях убрали её. Обещают в будущем вернуть после допиливания.

ArtInt 19 апр в 13:32

А супер оптимизированные вычислительные библиотеки такие как BLAS -- оказываются что супер раздуты там сотни тысяч строк кода, поддерживать это хозяйство да еще и под разные архитектуры тот еще челендж

ArtInt 19 апр в 13:25

? -- автор на связи!

Это бенчмарк от Октября 2023, уже не актуален. Тем не менее на устаревшей версии Mojo бенчмарк показал лучшую производительность Mojo против C на CPU вычислениях Apple Silicon в многопоточном режиме. Почему так? Как я понимаю отчасти потому что gcc/clang компилятор плохо справляется с оптимизацией под современные процессоры, особенно если это general оптимизатор который не знает какая логика/алгоритм исполняется в коде. При этом в Mojo можно задействовать низкоуровневые примитивы прямо из коробки, такие как SIMD.

А более новый бенчмарк (см. рисунок 1 из статьи) вообще показал что код на 1000 строк на Mojo написанный под конкретный алгоритм с помощью SIMD, Vectorze и Unroll сработал на некоторых кейсах быстрее чем супер оптимизированный c++ .

Основные вычисления происходят в matmul, но что примечательно в Mojo не используется никаких ассемблерных вставок.

Ps. На текущий день вышло несколько глобальных обновлений в Mojo которые ломают обратную совместимость, но интересно было бы сделать бенчмарк на последних версиях.. Возможно найду время и займусь этим в ближайшие дни..

waldesschrei 19 апр в 15:40

deleted

Jury_78 19 апр в 16:20

Хотя бы стало понятно, что это не Mojo такой хороший, а C++ плохо оптимизирован.

MidavNibush 19 апр в 20:41

Круто! Было бы интересно на это посмотреть!

GospodinKolhoznik 18 апр в 17:18

На данный момент Mojo поддерживается на Ubuntu Linux и macOS, но вскоре обещают добавить поддержку и на Windows.

Как правило это означает: через пару лут будет работать и на Windows. Ну не так чтобы прямо совсем работать. Ну по крайней мере что-то запустится. Даже некоторые библиотеки будут работать. Ну те, которые не зависят от других библиотек, которые не будут работать.

Ну, а BSD, конечно, в пролёте.

И откуда проблема со скоростью? Как я себе представлял Питон в части DS и ML это же просто обёртка для запуска быстрого Сишного и Фортрановского кода. Разве нет?

+20

saga111a 18 апр в 17:26

И откуда проблема со скоростью? Как я себе представлял Питон в части DS и ML это же просто обёртка для запуска быстрого Сишного и Фортрановского кода. Разве нет?

вероятно в том и проблема что запуск одиночной функции дешевая штука, а вот работа с памятью - передача данных между функциями уже медленное место.
Вообще было бы интересно на эту тему увидеть авторитетное мнение.

sshikov 18 апр в 17:59

передача данных между функциями уже медленное место.

Я думаю вы совершенно правы. Как минимум это одна из проблем.

Когда мы пишем на питоне (или любом медленном скриптовом языке) в стиле "скрипт" -> готовый быстрый фреймворк -> результат, то все нормально. А если фреймворк должен вызывать нашу функцию, которая что-то там считает внутри процесса в самом фреймворке, и которая написана на медленном языке - начинается передача данных туда-сюда, много раз в цикле, преобразования, и прочая и прочая. Это помимо того, что медленный кусок сам выполняется не быстро.

Это вполне типичная проблема, она например в Apache Spark имеет место - просто PySpark дает приемлемую производительность, но стоит на питоне написать UDF (ту самую функцию, которая каждую строку данных будет обрабатывать) - вот это вот все и начинается, с тормозами как следствие.

kuza2000 18 апр в 22:24

Просто передача между функциями - быстро. Передается просто указатель (адрес) на объекты в памяти. Например, если создать numpy.ndarray и вызывать методы numpy для обработки - это быстро. Ну как быстро... Если данные огромны, то затраты на вызовы функций малы по сравнению с временем на их обработку - это типичная ситуация для ML.

Другое дело, если данные маленькие - например, работать с массивчиком 100 чисел. Уже на вызовы будет затрачено значительное время.

Dynasaur 18 апр в 23:28

Ну не знаю. У меня вот вся программа это обёртка, чтобы вызвать одну единственную строку - инференс YOLO. От того, что я её напишу на C++ или Mojo - что у меня ускорится?

economist75 19 апр в 07:59

По личным ощущениям (которые не врут) медленность вездесущего (и неизбежного) Python в многоязычном DataScience-стеке приводит к том что "всё медленнее чем у крутых пацанов на С++/Julia/Rust итд" примерно в... 4 раза. Слишком много чтобы не заметить, но слишком мало чтобы ~выйти в окно~ броситься всё переписывать (на самом деле переучиваться самому и миллионам на планете).

Вот это 4:1 и является объективной мерой, а не 100 и 63k раз. Mojo может благотворно сказаться на всех нас, и даже на самом Python. Поэтому успехов проекту.

select26 19 апр в 14:21

Вот это 4:1 и является объективной мерой

Это значит что вам необходимо не 200 серверов, а 800, чтобы выполнить тот же объем вычислений. Когда речь идёт о 2 или 8 серверах, то может и не хочется ~выйти в окно~. А если сравнить 800 и 200, да ещё и перевести это в деньги, то картина меняется.

economist75 19 апр в 19:40

DS не про скорость расчетов вообще. А больше про скорость кодинга. Серверы, кстати, тоже не проблема. Вот выше написано что Python медленнее в 60000 раз чем С++. Так вот, никто не продаст 59999 серверов. Да и 3/4 никто не продаст. Потому что реальная разница 4:1 наблюдается вместе с проигрышем по времени кодинга. Его я оценить не могу, ну м.б. 1:2. А значит разница "всего в два раза", неосязаемо.

select26 21 апр в 10:51

Даже если "всего в два раза": сейчас нас десятки тысяч VM. Могло бы быть в два раза больше. Представляете сколько это стоит?
Вы поднимаете важный и интересный вопрос: стоимость разработки VS стоимость эксплуатации. Так вот на больших скейлах стоимость разработки ничтожна по сравнению со стоимостью эксплуатации. Там есть прямой смысл вкладываться в разработку: искать спецов по C, а то и оптимизировать критичный код на более низком уровне.
А вот если это разовый проект (расчет), то можно и на интерпретируемом языке запустить - один раз можно и подождать, заплатив в 10-20 раз больше за инстанс.

economist75 25 апр в 17:07

Стоимость разработки по честному посчитать невозможно. Но можно косвенно. Вот спецы по С стоят 6-7 тыс евро/мес и свободных практически нет. Надо учить новых. Питоны стоят 1-2 тыс. и их несравнимо больше.

mOlind 18 апр в 19:05

Ну так сишный код тоже не идеален. Быстрый код писать сложно. А mojo старается сделать всю сложную оптимизационную работу под капотом. Когда его анонсировали была хорошая статья с описанием как им удалось этого достичь. https://www.modular.com/blog/mojo-vs-rust-is-mojo-faster-than-rust

RichardMerlock 19 апр в 04:16

Ну так и получается, что для компилируемых языков в скорости соревнуются больше компиляторы, чем сами языки.

kuza2000 19 апр в 14:46

Да, но есть одно но...

Хороший язык даёт компилятору больше информации, и он может безопасно применить более эффективные приемы оптимизации.

НЛО прилетело и опубликовало эту надпись здесь

ArtInt 19 апр в 13:38

Я думаю у 99% программистов такое же впечатление (как и было у меня до того как я разработал llama2.mojo)

Хинт: Проблема современных вычислительных библиотек - это оверхед. Если в случае простых задач как обработка / передача http это норм, то уже для сложных вычислений оверхед связанный с абстракциями и удобством делает вот это

ArtInt 19 апр в 13:39

Чуть больше деталей в твиттере у Карпатого -- https://twitter.com/karpathy/status/1778841713605525889

nikolz 18 апр в 17:41

Что-то я не понял.

Разве это не под windows?

VanKrock 18 апр в 21:22

Это для visual studio code, причём тут windows?

Kralom 18 апр в 23:56

Это расширение VS Code для того, чтобы VS Code мог видеть синтаксис языка, но не сам компилятор/интерпретатор, вроде так :)

CHIM86 18 апр в 23:56

Это просто плагин для поддержки синтаксиса, т.е. ты можешь хоть в блокноте набирать код для Mojo, но запускать пока только на Ubuntu и Mac

nikolz 19 апр в 06:16

Понятно.

Нашел, что

Поддержка Windows будет добавлена в следующем выпуске Mojo SDK.

kuza2000 18 апр в 18:33

Эти и другие области ML объединяет то, что большинство библиотек для машинного обучения написано на Python.

Ну начнем с того, что большинство библиотек для машинного обучения для питона написано не на питоне)

А ещё питон активно развивается, в том числе и в сторону увеличения быстродействия. Не защищаю питон, я всегда за прогресс)

Но, если честно, не совсем понимаю смысл создания прямо таки специализированного языка для ML. Как я понял, его основная фишка - умение хорошо дергать питоновые либы. Ну и быстрее. Посмотрим. Есть шансы, что питон станет быстрее раньше, чем новый язык покорит мир ML.

dyadyaSerezha 18 апр в 20:37

Есть шансы, что питон станет быстрее раньше, чем новый язык покорит мир ML.

Нет, шансов нет без создания ещё одной, несовместимой с предыдущими версии питона с встроенной жёсткой типизацией, компиляцией до машиных кодов с тяжёлой оптимизацией и компактными объектами и массивами (как минимум).

А про медленные библиотеки для ML, это автор смешно написал)

kuza2000 18 апр в 21:59

Пожалуйста: встроенный тип array - компактный (типизированный) массив чисел. Типы любые числовые - int, long, signed/unsigned, double, float, все размеры от 1 до 8 байт. Но array крайне редко используют, так как используют библиотеки. Потому что медленный код.

Потом еще можно рассмотреть типы данных numpy. Это по типам данных, они есть. Вот с кодом сложнее. numba умеет использовать статические типы и делает компиляцию в машинный код. Да, весьма костыльно, куча ограничений, проблема с отладкой и др. Ее нельзя применить ко всему проекту. Но сделать одну-две функции, или даже целый модуль - вполне реально. Можно закрыть точечно потребность в каких-то вещах, которых нет в библиотеках. Причем закрыть весьма эффективно - статическая типизация, весьма эффективный, скомпилированный машинный код, распараллеливание циклов как OpenMP в C++. Можно сделать все то, для чего нужно было бы писать библиотечку на C/С++. Но писать при этом на питоне, с некоторыми нюансами.

Но в целом я согласен, для быстрого языка с компиляцией без нормальной, родной статической типизации не обойтись. Сделать еще одну, несовместимую с предыдущими версию питона? Ну а почему нет, переходили же с 2 на 3))

dyadyaSerezha 19 апр в 07:15

Вот эту новую версию и сделали. Называется Mojo. :)

FF_hunter 22 апр в 17:13

Сделать еще одну, несовместимую с предыдущими версию питона? Ну а почему нет, переходили же с 2 на 3))

Каков был объем написанного питоновского кода тогда и каков он сейчас? А к запуску Python 4 ситуация еще больше усугубится в этом плане. Логичнее уж тогда не забрасывая развитие третьей версии сделать форк, и... тут мы снова внезапно вернулись к Mojo)

kuza2000 18 апр в 19:01

Питон садится в лужу по быстродействию в ML, если нужно написать какой+то свой алгоритм, для которого нет подходящей библиотеки. Но для этого случая в питоне есть numba. С ней код работает на уровне лучших компилирующих языков - C/C++/Rust. То есть, быстрее уже некуда.

Да, там куча ограничений, но большую часть задач она покрывает.

dyadyaSerezha 18 апр в 20:38

Раз придумали Mojo, значит, numba не катит.

-9

kuza2000 18 апр в 22:03

Это не связанные вещи))

Flux 19 апр в 13:30

Раз придумали BolgenOS, значит, Ubuntu не катит.

alexanderniki 18 апр в 19:13

Open Source Mojo. С недавних пор этот проект является открытым и находится под лицензией Apache 2.0.

От опенсорса там только репозиторий с документацией, примерами и стандартной библиотекой. Сам же Mojo, как был закрытым проектом, так и остается. По крайней мере ни лицензии, ни новости об открытии ихсодников я не нашел.

+11

MidavNibush 19 апр в 00:27

По сути под "Open Source" авторы имели в виду возможность контребьюта в их проект, в частности, в стандартную библиотеку. Об этом можно почитать их блогпост здесь.

alexanderniki 22 апр в 20:59

На мой взгляд, со стороны Modular немного нечестно называть это Open Source :)

vaslobas 19 апр в 09:04

Не очень понимаю какой смысл делать новый ЯП не опенсорсным.
Какие из современных взелетвших языков не опенсорсные?

go, rust, swift все опенсорсные же.

gresolio 19 апр в 14:09

Скоро будет видно, как пойдёт дело дальше. Похоже что все основные компоненты будут действительно открыты. Пока что же есть такая инфа:

https://docs.modular.com/mojo/faq#open-source

Why not develop Mojo in the open from the beginning?
Mojo is a big project and has several architectural differences from previous languages. We believe a tight-knit group of engineers with a common vision can move faster than a community effort. This development approach is also well-established from other projects that are now open source (such as LLVM, Clang, Swift, MLIR, etc.).

alexanderniki 22 апр в 20:54

Да, есть такое. Однако, пока они не выполнят обещание и не откроют код, я бы не спешил пользоваться :)

kuza2000 18 апр в 19:48

Статью, конечно, плюсанул, все это очень интересно)

Но в такой статье очень не помешали бы примеры кода.

MidavNibush 18 апр в 20:10

Спасибо за отзыв! Возможно вскоре будет вторая часть уже с программированием на Mojo)

Squirrelfm 18 апр в 20:20

очень интересно

MidavNibush 19 апр в 00:10

Спасибо ?

Knkplua 18 апр в 21:38

Небольшое замечание по синтаксису. Mojo достаточно быстро изменяется, с декабря прошлого года взят курс на удаление ключевого слова let. В текущей версии оно вызывает ошибку при компиляции. Прочитать можно здесь и здесь.

MidavNibush 18 апр в 23:36

Спасибо за замечание. Учту этот момент)

Dynasaur 18 апр в 23:16

Ну, допустим, уговорили, хочу переехать с Питон на Можо. И что мне делать? У меня есть программка, которая использует Пандас, Нампи, Ультралитикс.Йоло, ОпенСиВи и ещё по мелочи. Как мне с этим добром перебраться на Можо и получить ускорение в 68000 раз?

MidavNibush 18 апр в 23:47

На данный момент говорить о переезде с Python на Mojo ещё рано. Проект ещё достаточно молодой и не поддерживает многие фишки и мелочи, которые вы имеете в виду. Список стандартных библиотек Mojo можно найти здесь.

Если вы хотите начать работу с Mojo, к примеру, чтобы провести свои исследования, то инструкцию по установке можно почитать здесь.

Jesstha 19 апр в 00:57

Мало что понятно, но очень интересно. Захотелось придраться к ошибкам. Вроде и статья умная, и человек её писал осознанно. Прогнать бы через ИИ хотя бы на ошибки.

производительность, а так же включает в себя возможность работы над моделями ... тут ТАКЖЕ пишется слитно.

проект, который написан с использование библиотеки Infermo (также написана на чистом Mojo)

Тут вообще букву потеряли (с использованиеМ).

Думаю, если поискать, можно найти ещё ошибки.

-2

MidavNibush 19 апр в 01:23

Спасибо вам за отзыв. Впредь постараюсь быть более внимательным при написании статей.

lrdprdx 19 апр в 12:33

Ваш текст читается хуже, чем у автора.

Цитирование форматируется символом > в начале строки:

Мало что понятно, но очень интересно.

Для выделения слов больше подходит курсив или жирный текст, а капс выглядит так, будто вы кричите :)

Захотелось придраться к ошибкам.

Я бы поспорил с корректностью термина в данном случае. Более подходящий термин - опечатки.

Alexander26984 19 апр в 08:59

Не очень понял по тексту, поэтому спрошу:

Можно ли в лоб копировать код на питоне и вставить его в интерпретатор моджо? Он будет работать? И если будет, то будет ли хоть какая-то разница?

VasiliyLiGHT 19 апр в 09:17

Mojo загружает интерпретатор Python и его модули во время выполнения, поэтому, где бы вы ни запускали программу Mojo, она должна иметь доступ к совместимому Python интерпретатору и находить любые импортированные модули Python.

Учитывая ещё и это. Я до этой статьи в детали не вдавался и думал, что это ещё один язык, похожий на питон. А так получается, что это какой-то .NET и различные #, грубо говоря)

Придётся почитать доки повнимательнее...

MidavNibush 19 апр в 11:49

Просто взять код с Python и вставить его в Mojo не получится, но вы можете интегрировать его интегрировать. О том, как это сделать можно почитать здесь.

vvf1973 19 апр в 10:14

Я только не понял, почему это называется искусственным интеллектом. Задачи по геометрии решать умеет? Нет. Такой бред генерирует. Сразу понятно, что интеллекта там никогда не было ни в каком виде. Какая-то бессмысленная генерация больших текстов "решений".

pda0 19 апр в 10:24

Python сейчас тоже ускорять взялись. GIL выпиливают, JIT запиливают...

Foggy4 19 апр в 10:25

Когда можно будет запустить Django на Mojo? :)

PavelSandovin 19 апр в 10:56

Mojo поддерживает только несколько типов данных: Int, Float, String, Bool, Uint. Т

А кортежи, списки, словари - все то, что так упрощает работу в Python и ООП (классы etc.) в нем есть?

MidavNibush 19 апр в 11:56

В Mojo на данный момент нет чего-то подобного. Но в языке есть класс SIMD, который в некоторой степени заменяет списки. О нём можно почитать здесь и здесь. Классы же в Mojo заменены структурами, Struct, о них можно почитать тут.

ArtInt 19 апр в 17:36

Классов действительно пока нет. Списки и словари появились в недавнем релизе Mojo StdLIb -- list, dict

moonroach 20 апр в 23:10

Сдается мне, что с развитием языка он замедлится, т.к. станет сложнее и появится больше зависимостей. Конечно в синтетических тестах мы этого не увидим, но в реальных приложениях будет не такая скорость

CatLecter 21 апр в 20:19

Очередной пересказ буклета от отдела маркетинга mojo и копирование результатов синтетических тестов... Никто не показывает решения реальных задач на mojo и сопоставление с аналогичными решениями на python. В текущие проекты mojo c разбегу не затащить вообще, поддержка синтаксиса питона это просто маркетинг, а если проект и запустится, то никакой обещанной производительности там и не будет и близко. Чтобы выжать максимум из mojo нужно переписывать все "производительный" синтаксис с использованием fn функций, let объявления переменных и поддерживаемых типов данных и т.д. и т.п. В итоге код, который может дать максиму от моджо больше похож на rust и очень далек от питона, так может и взять сразу раст (ну или RustPython)))? Причем даже в случае переписывания кода на "производительны" синтаксис не будет обещанной производительности. Короче все это материалы для менеджеров, которые будут потом ходить и говорить "хочу моджо!".

Sekekekeke 22 апр в 17:13

А что случилось с julia? Пару лет назад она была убийцей питона.

По факту статья больше похожа на маркетинговую агитку

alexanderniki 22 апр в 20:58

С одной стороны, похоже. С другой - проект таки действительно очень любопытный. Я бы сказал, с довольно нестандартным подходом.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий