Комментарии 4
Спасибо за пример, Андрей, нужно будет изучить эту библиотеку!
df.dropna(inplace = True) # :))
Простите, но Вам не кажется что Вы пытается сравнить два совершенно разных инструмента. Это всё равно что сравнить лопату для уборки снега и большую снегоуборочную машину. Конечно оба варианта дают результаты, но принцип работы разный. Спарк нужен для работы на кластере с распаралленнимы вычислениями это его основная фишка. Конечно можно работать со спарком на одной машине и это даже даст свой результат, но все таки во дворе у себя лучше убрать снег лопатой.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Pyspark. Анализ больших данных, когда Pandas не достаточно