Pull to refresh

Comments 3

С DataScience есть одна интересна проблема: в основном люди понимают под DS что-то академичское — математика, статистика, алгоритмы и т.д. и прокачивают этот скил. Несомненно это хорошо, но если вы не собираетесь писать научные статьи, а применять DS и ML для бизнеса, то не нужно забывать и о бизнес-стороне. Иначе получается разрыв — знаний много, а практического применения мало. Яркий пример это сами данные, в dry Data Science обычно подразумевается что они просто есть, ну может немного грязные и с пробелами. А фактически бывает что данных нет и их получение затратнее построения самой модели.

Всем начинающим рекоммендую прекрасную книгу «Data Science for Business», by Foster Provost and Tom Fawcett

Your model is not what your data scientists create, it is what your engineers deploy ©
А что, R уже совсем не в почете что ли? Стистистика там явно сильнее реализована, с big data он и локально и через Spark работать может
UFO just landed and posted this here
Sign up to leave a comment.