Обновить

Сравниваю Jupyter Notebook, Google Colab, Kaggle и Marimo глазами исследователя и начинающего Data Scientist

Уровень сложностиПростой
Время на прочтение13 мин
Охват и читатели6.9K
Всего голосов 3: ↑3 и ↓0+4
Комментарии11

Комментарии 11

На самом деле, первый указанный минус Marimo это скорее плюс. В Jupiter очень легко создать (случайно) ноутбук, который у других не будет работать или будет работать неправильно, потому что какой-то промежуточный результат уже потерян или непреднамеренно зависит от порядка исполнения ячеек. По критерию создать и поделиться воспроизводимым результатом Jupiter довольно плох.

Согласен. Именно по этому и рассматривал их с точки зрения новичка. В Jupyter «особенно радует» ошибка импортов, которые были импортированы выше на пару ячеек 😀

По большой своей групповой статистике - основная часть ошибок блокнотов связана с быстро-правками ячейкой выше, того что объявляется ячейкой ниже. Лечится ударами плетью. Или скриптом, который делает в 12:00 рестарт группы кернелов, с этеншном. Люди быстро запоминают красноту стектрейсов и привыкают быстро-править ниже ячейки, чем снижают число ошибок до пренебрежимо малого числа.

Колаб - студентам, а во всем остальном одинаково легко создать то, что не заработает у других. И легко сломать чужое работающее, очередным невинным поутру pip install -U newlib

Но в JupyterHub есть готовый инструмент для решения всех этих вопросов: read-only user kernel
То есть просто чужой блокнот запускается автоматически в чужом неломаемом ядре. Это дает невероятную гибкость: ты запускаешь чужой файл в чужой программе, а свой - в своей, и все это в браузере. Для работы в команде это реально X2 производительности.

Спасибо за лайфхак🤝

Хорошо тему раскрыл ламодовец Петр Ермаков в видосах на YT, нам оставалось только поверить и повторить.

Спасибо! Обязательно посмотрю🙏

Скажу, как студент по специальности Data Science - Jupyter Notebook это просто база и первый реальный опыт для визуализации данных и машинного обучения. Пользуюсь им на постоянной основе для своих проектов и лабораторных, поскольку для меня он по-своему удобен. Google Colab и Marimo всё же когда-нибудь да и заюзаю в перспективе, но Jupyter уже в моём сердечке, так скажем)

Если что, это не реклама Юпайтера (мне никто не платил даже). Просто как уверенному джуниору, и по дизайну, и по функционалу он прям вполне мне подходит.

А он и не требует рекламы 😀

Colab, Kaggle, a ещё есть AWS SageMaker - это тот же Jupyter Notebook, только бегущий не локально, а "где-то там у них", и, соответственно, встроенный в экосистему "их" сервисов. Так что сравнение между ними - это сравнение, где ещё есть какие сервисы, а не чем они отличаются между собой. Вот сравнить их PyCharm это действительно прикольно.

Кстати, Вы можете так сделать у себя дома: если Вы с женой и сыном одновременно занимаетесь Data Science, a денег на 3 компьютера с мощными GPU у вас нет, Вы покупаете один, ставите на него Jupyter server и подключаетесь к нему каждый со своего дешевенького лаптопа.

И пишем логи конфликтов на почве постоянно занятого GPU 😃

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации