Как стать автором
Обновить

Комментарии 18

Что-то среднее между LINQ и языком запросов в MongoDB

Код скриншотами — здорово придумано. С телефона так вообще самое то.

а как удобно копировать чтобы попробовать у себя

НЛО прилетело и опубликовало эту надпись здесь
отличная идея

Что Вы имеете ввиду под исходниками? Данные, которые подаются на вход?

НЛО прилетело и опубликовало эту надпись здесь

Ну да, хорошая идея!

А что с джойнами? Особенно интересует full outer

И с джойнами тоже все хорошо.
titanic_df.join(some_df, on='some_column', how='outer')

Это если у some_df индекс совпадает с каким либо столбцом, или
titanic_df.merge(some_df, left_on='some_columnin_table1', right_on='some_columnin_table2' how='outer')

если это не так.
Использую в основном pandas для анализа логов интеграции, за пару недель, когда много данных ему плоховато становится, там уж лучше идти в сторону dask. А так, да, мне с pandas проще работать, чем с SQL, сразу можно и картинку данных увидеть и данные почистить, мне нравится.
Теперь вы научились переписывать SQL-запросы на Python с помощью Pandas.

Что будет со скоростью обработки запросов? А таблицы миллионники?

Некропостю, для потомков ))


Всё плохо у pandas с большими объемами данных и их обработкой. Он очень чувствителен к памяти. Например, при парсинге даты, если не хватает памяти, то парсинг будет идти медленней чем на чистом питоне.


Pandas создан для аналитики, т.е. для свертки больших, возможно даже грязных данных в маленький конечный результат. Если же вам нужно обработать огромные данные целиком, то pandas вам скорее всего не подойдет.

Зато он быстрый на небольших данных, удобный и не имеет такого зверски медленного отклика как спарк или даск.

Зачем очередной синтаксис? Зачем из простого делать сложное?
Зачем из понятной конституции "выбрать поле из таблица" делать — таблица(~таблица.поле)[@#₽&&₽#34#&&@24]? Зачем?

Спасибо, давно искал!
SQL — это идеальный интерфейс, который существует и развивается почти 40 лет.
Опираясь на особенности конкретной базы данных, можно добиться идеальной производительности нужного запроса.
Картинки подтверждают элегантность синтаксиса SQL.
А ещё там в миллиард раз больше функционала, чем реализует большинство ORM.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий