Как стать автором
Обновить

Комментарии 9

Отличная статья, хорошие примеры.
Отдельный респект за включение фрагментов кода

Начать погружение в питон с нуля в режиме стресса и дедлайна... Путь храбрых. Помнится мне подобным образом лет 10 назад эдак я начать изучать другой яп и так же лишь спустя некоторое время после сдачи проекта начал понимать что к чему по настоящему. К счастью такого перегруза не было - но боль я ощущаю.

Если вас успокоит, по моему ощущению даже человеку с опытом сходу понять питон задача не из лёгких. Базовые концепты - можно. Поиграться - можно. Однако (!). Когда дело заходит до реального мира и реальных библиотек, их тысяч вариаций, тысяч нюансов, тысяч непонятных и разнящихся стандартов именований и концептов - тут черт ногу сломит. Язык даёт слишком много свободы - и от этого головная боль.

Ваш первый вывод крайне важный. В вашем случае это могло бы сохранить время и главное нервные клетки и возможно даже намного проще решить задачу - но к этому надо придти с опытом. Как и последний пункт - однако работает лишь на начальных - средних этапах.

Скоро буду искать первую работу(в IT и вообще), и чувствую я что эта статья мне ОЧЕНЬ пригодится

Тут мало того, что человек не знает python, не знает библиотеку pandas, так в принципе имеет смутное представление о программировании. Это как неподготовленному человеку перевести стихотворение с суахили на древнегреческий.

По своему опыту, толковый экономист с наставником - с нуля постигает Python за 2-3 недели, а на "уверенный" Pandas уходит около полугода. Такой специалист сам напишет UDF и сделает ее методом датафрейма, закрыв потребность в ABC-анализе раз и навсегда. Метод работает максимально просто и понятно, не забудешь никогда:

df.ABC(['Контрагент', 'Выручка'])

Именно такие UDF в итоге сделают работу аналитика на порядок легче и эффективней, чем прежняя. Python-way для аналитики однозначно быстрее, увлекательнее и дешевле чем VBA-макросятничество или веселое накликивание в PowerQuery/DAX/M, или трехэтажное формулописательство в Excel. Если они уже в активе - это хорошо: UDF для ABC-анализа появится быстрее и будет применяться чаще и шире.

Но главное - ощущение простоты и надежности решения. С Python оно выше, чем с другими упомянутыми технологиями.

Извините, но про визуализации некорректно сравнивать python и powerbi. Основное преимущество второго - интерактивность, при чем такая, что первому и не снилась. На питоне только простейшие визуализации без интерактивности и сложных связей. На питоне выгрузка, подготовка данных - да, вполне, но визуализация - это не его, не функционально

Очень даже корректно. PowerBI в ru-зоне скоро будет мертв, поэтому о покойниках "...либо ничего". Но планку визуализаций он задрал очень высоко, признаю. Сам python ничего не визуализирует, а вот та же pandas поддерживает несколько бэкендов визуализации в простой обертке df.plot(), которую вынуждены были повторить почти все остальные DS-платформы. Я назову по памяти интерактивные библиотеки графиков для python/pandas: altair, bokeh, echarts, holoview, hvplot, plotly, vega. Кол-во графиков, которые умеют эти либы (больше сотни) примерно в 2 раза превышает возможности PBI. Кроме того, есть matplotlib, seaborn, которые (считается) что умеют еще пол-сотню DS-экзотики.
Если под связями вы имели ввиду готовый drill-down по связям таблиц, то это надо искать в прикладном ПО в Apache Superset, Dash или самому несложно кодить в Streamlit итп. Ах, да, все упомянутое мною ПО (кроме урезанного функционалом PowerBI) - полностью свободно и бесплатно для бизнеса. Pandas для drill-down предлагает лишь ipywidget в среде Jupyter/Lab, да пяток готовых EDA-инструментов. Все это освоить - не хватит жизни, но сопоставимый с PBI результат можно получить за погода с нуля. Сейчас самое время...

Это давно уже не так. Связки streamlit+понравившаяся_библиотека, dash+plotly, panel+matplotlib(ну или любая библиотека на выбор) ну и всякие малоизвестные. Тот же streamlit можно запустить в офисе со своего компа на локальную сеть, и твой коллега сможет легко его посмотреть даже без выхода в интернет. Или сохранить plotly график как html и отправить его по почте. Наверняка есть еще способы, видел даже как делают интерактивные презентации на основе юпитера и запихивают их в html. А если майки завтра решат блокирнуть PowerBI, что можно будет сделать? кроме как надеть деревянную ногу и попугая на шею конечно А python это сотни команд и в основном open source.

Так держать, Алексанра)

Спасибо за статью.

От себя добавлю. Гуглим про докстринги в пайтон.

Всегда пишем документацию к своим функциям

Юзаем pyCharm. Там уже встроены линтеры, авто форматирование кода и инструменты для рефакторинга.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории