Comments / Profile of i

Илья Шутов @i_shutov

Data Science

ProfileArticles77PostsNewsComments470

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 9 2022 at 07:29

Было уже в истории "Не читал, но осуждаю". В этой точке траектории разошлись.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 9 2022 at 07:27

В настоящем промышленном DS необходимо совмещать навыки математика, художника, алгоритмиста, настоящего разработчика, dba, сисадмина и devops. Пусть не с полным погружением, но хотя бы иметь некоторые представления об отдельных вопросах.
Чтобы включать инстинкты, их надо иметь. Чтобы их иметь, надо иметь немалый опыт за плечами в исполнении сложных командных проектов. Но такой опыт уже позволяет философски смотреть на ряд вещей.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 9 2022 at 07:23

Спасибо за ценные советы. Записал в блокнотик.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 9 2022 at 07:21

В этом рассуждении есть одна большая ошибка. Сила не в языках, а в библиотеках, алгоритмах и навыках. Есть прекрасная книга на эту тему: https://habr.com/ru/company/productivity_inside/blog/348116/

R позволяет решать практически все те же самые задачи, что и питон. Это тоже язык универсального назначения. В сети масса различных примеров есть.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 9 2022 at 07:12

Это Ваше частное мнение на которое Вы имеете полное право. Строится оно на полном знании вопроса или на полном незнании -- мне неведомо.

Похоже, что R вам показали не те люди и не с той стороны. Если вдруг захотите взглянуть с другой точки зрения -- приходите с вопросами в телеграм канал. Откроете новое для себя.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 8 2022 at 16:32

Много лет играю в тендеры всякие. В зависимости от матрицы приоритетов и методики оценки и рисков в т.ч. возможна любая степень вариативности результата.

Но вопросы применительно к проектной активности важные. Но именно здесь я сфокусировался на технике, оценочная часть в 90% случаев оставляет сильный осадок субъективности. Это не только про ЯП и даже далеко не про них.

Не хотелось сейчас туда залезать, да и предпосылок нет.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 8 2022 at 16:10

Нет, от заголовка до конца речь идет про аналитику.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 8 2022 at 16:07

Заметно все, а про пандас почитайте по ссылкам. 10-ти кратное превышение требуемой памяти -- это жесть. И по тестам (опять же, ссылки), он почти никогда не доезжает до конца, падает.

Писать красивый код надо уметь. Пайпы здесь ни при чем.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 8 2022 at 15:46

Вовсе нет.
Я же писал в ответах, что в рамках одного ноутбука можно запускать куски кода и на R и на SQL и на python. Ставится питон (желательно чистый, без анаконд), ставятся через pip пакеты и пишется микс без проблем, если надо.
Правда, нет никаких проблем. Нет ИЛИ, есть И.
И Apache Arrow как средство межплатформенного обмена.

А в тексте фокус на самых базовых вещах, фундаменте любых преобразований.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 8 2022 at 15:38

Питон отличный язык, тут нет вопросов. Но вот применительно к DS задачам -- масса неудобств. Они реально неудобства, но пока в детали не погрузишься, все кажется простым и надуманным.

Мне, правда, не хочется ни оставлять серьезные вопросы без ответа, ни разводить холивар. Очень-очень много специфики выплывает на микроуровне.
А бесконечная сумма малых величин дает значимый дефект. Приходите в группу в телеграм, если интересно. DS аналитики действительно другими вопросами и категориями мыслят.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 8 2022 at 15:23

Вы читаете через несколько строк. Посмотрите приведенные ссылки. Еще раз, Numpy придумали ученые астрономы, они это сделали по уму и хорошо. Но это исправление нашлепкой сбоку. И нашлепка все равно инородна.
Про параллельные вычисления пока речи нет. В R с этим все отлично. Но, если интересно, можете поглядеть предыдущие публикации.

У Вас есть сложившаяся точка зрения и видение. Оно не изменится ни при каких ответах. Например, потребность в векторизации возникает при решении соотв. задач. Нет задач -- нет потребности. Может тогда и не стоит копья ломать?

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 8 2022 at 15:17

питон изначально объекто ориентированный, он так проектировался. почитайте базовые типы. Все есть объект, народ это постоянно разжевывает, например: https://www.pythonmorsels.com/everything-is-an-object/
почитайте про пайпы по приведенным сслыкам. перенос по точке в питоне -- это просто костыль через форматирование.
разница между базовыми типами и суррогатами огромная. почитайте ссылки про missing data, например
в R и прототипирование и скорость и компактность можно получить одним махом в data.table
приведите аналогичный пакет для бенчмарка -- это будет ответ.
Polars -- слизан с `apache arrow` который сам по себе хорош и универсален. И он не может заменить пандас целиком.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 8 2022 at 15:10

Посмотрите предыдущие публикации.
R такой же язык общего назначения и на нем можно делать массу всяких вещей.
А про ненужности "руке рынка" специфических языков можно в SAS рассказывать.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 8 2022 at 15:08

Можно всякие штуки читать типа таких саммари (кроме what's new):
- https://antonz.org/python-stdlib-changes/
- https://nedbatchelder.com/text/which-py.html
- PEP
- ...
В силу архитектурных особенностей вещи типа полноценной векторизации и NSE принципиально не завезут.
Для задач DS все эти изменения идут почти в параллельном фоне. Ацент совсем на другом.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 8 2022 at 14:58

Давайте не переходить рубикон и не переходить на личности. Начинают сыпаться вопросы министерского уровня, если не выше.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 8 2022 at 14:56

Я постарался в тексте дать все комментарии. Еще там есть масса ссылок на тесты и публикации. Можете прочесть, если действительно интересно.
Мне неясен смысл Ваших вопросов и они сильно удаляются от исходного текста. Вы не согласны -- это очевидно. С чем и почему -- развожу руками.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 8 2022 at 14:40

По приведенным в публикации фактам и тезисам у Вас вопросы есть?
А то задаете мне какие-то отстраненные вопросы как гуглу.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 8 2022 at 14:29

В природе вообще все описывается колебательными процессами.
При низкой добротности все может за один цикл затухнуть экспоненциально. При высокой -- будет перекачка энергий.
https://studme.org/412961/meditsina/lisy_zaytsami_zhivut

Но все это не имеет ни малейшего отношения к исходной теме. Описаны недостатки питона, Вы можете сами все воспроизвести и проверить.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 8 2022 at 14:26

Ну Вы вопросы задаете...
Это ж кого спрашивать и как считать.
И питон надо разделять. Отдельно для DS страту вытягивать.

Look

Кто за всех решил, что python удобен для «гражданской» аналитики?

i_shutov Jun 8 2022 at 13:55

нет низкого порога, он везде одинаков и минимально таков:
- изучение базовых типов;
- изучение конструкций языка;
- изучение типовых операций и подходов для решаемых задач.

если и из этого сделать "брифли", то ценность такого специалиста вызывает большие сомнения.

Look

1 2 3 4

6 7 ...

23 24