Комментарии 11
Есть еще github.com/rasbt/python-machine-learning-book выглядит посерьезнее, но пока не читал.
p.s. scikit learn хорош если его использовать как black box, т.е. именно как инструмент, но код у него не читаемый, по крайней мере для меня.
У Scikit-learn документация отличная, исходники мне не приходилось прямо читать и править. Так что для начинающих — то что надо. Но API несложный, свой класс Estimator можно быстро написать.
А уж потом допиливать решения для продакшн — это другое дело. Возможно, тут скоро изменятся приоритеты — TensorFlow
Хотя согласен можно было и в документации DecicionTreeClassifier написать, что это CART.
Материалы нашего открытого курса по машинному обучению:
- Первичный анализ данных с Pandas
- Визуальный анализ данных c Python
- Классификация, деревья решений и метод ближайших соседей
- Линейные модели классификации и регрессии
- Композиции: бэггинг, случайный лес. Кривые валидации и обучения
- Построение и отбор признаков
- Обучение без учителя: PCA, кластеризация
- Обучаемся на гигабайтах c Vowpal Wabbit
Новый старт открытого курса OpenDataScience по машинному обучению – 6 сентября 2017 г.
Вас ждут статьи на Хабре (список выше), домашние задания, соревнования по анализу данных, а главное – активная жизнь на форуме (канал #mlcourse_open в slack OpenDataScience). Курс для начинающих, но требуются некоторые навыки программирования на Python и знания математики (подробней — в репозитории курса. Темы:
- Первичный анализ данных с Pandas
- Визуальный анализ данных c Python
- Классификация, деревья решений и метод ближайших соседей
- Линейные модели классификации и регрессии
- Композиции: бэггинг, случайный лес
- Построение и отбор признаков. Приложения в задачах обработки текста, изображений и геоданных
- Обучение без учителя: PCA, кластеризация
- Обучение на гигабайтах c Vowpal Wabbit
- Анализ временных рядов с помощью Python
- Градиентный бустинг
Если собираетесь проходить, заполните веб-форму и вступайте в сообщество (вся движуха будет там, укажите #mlcourse_open в вопросе, откуда узнали про ODS).
После этого курса (с 15 ноября) там же в канале #mlcourse_open будем вместе проходить стэнфордский курс cs231n “Convolutional Neural Networks for Visual Recognition”
Некоторые репозитории в помощь изучающим и преподающим Python и машинное обучение