Pull to refresh
18
0
Владимир Богатырев @vobo

Пользователь

Send message
Аббревиатура – это проблема, поскольку зачастую она специфична для предметной области

Думаю, почти любой небиблиотечный код специфичен для предметной области и это нормально, если человек с улицы его не понимает. Разворачивать все аббревиатуры тоже зло. get_knn_from_df — на мой взгляд, очень понятно, даже для меня (я не data scientist)
то, что называют Data Engineering
помимо машинного обучения, еще есть просто аналитика: ETL разные. python вполне годится. Можно и со Spark'ок
звучит как ad-hoc задача: сделать и выбросить
Хотелось красивого решения
— людям данные нужны, а не красивые решения.
В динамических языках можно платить за проверки (написанием большего числа тестов), только если они нужны. Полно случаев, когда вполне можно обойтись без них, написав код без траты времени на продумывание типов
Да, все это есть и даже в одном месте, но для начала этого слишком много. Я привел одни из самым юзабельных на мой взгляд, для старта

Information

Rating
Does not participate
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Date of birth
Registered
Activity