Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
- Анализ Вконтакте на примере книжных предпочтений участников культурных сообществ
- Список ресурсов по Deep Learning — хороший список ссылок на различные полезные ресурсы по теме Deep Learning.
- Защита вашего онлайн-сервиса с помщью машинного обучения и больших данных
- Talking Machines — интересный сайт под названием «Talking Machines», на котором регулярно будут публиковаться интервью с известными экспертами в области машинного обучения.
- 7 лучших постов с блога «Beautiful Data» за 2014 год
- Прогнозы на рынок труда в области Big Data в 2015 году
- 5 тенденций Big Data, на которые стоит обратить внимание в 2015 году
- Прогнозы на 2015 в сфере Big Data от Big Data Analytics News
- 10 лучших статей за год с блога «Microsoft Technet Machine Learning»
- Лучшие материалы за год: NoSQL Zone
Теория и алгоритмы машинного обучения, примеры кода
- Руководство хакера по нейронным сетям. Глава 2: Машинное обучение. Обобщаем SVM до нейронной сети
- Руководство хакера по нейронным сетям. Глава 2: Машинное обучение. Более традиционный подход: Функции потерь
- Играем с генетическими алгоритмами
- Анализ тональности текста в Excel с помощью Azure Machine Learning и Power Query
- Ask a Data Scientist: Как стать Data Scientist — очередная статья с популярного портала insideBIGDATA из цикла «Ask a Data Scientist», в данном выпуске речь о том, как стать Data Scientist и какую деятельность подразумевает у профессия с таким названием.
- Краткое введение в Deep Learning
- Краткое введение в R — небольшая презентация по основам языка программирования R.
- Построение детектора языка с помощью Python и scikit-learn
- Шпаргалка по матричным операциям — хорошая шпаргалка по операциям с матрицами в MATLAB, Python, R и Julia.
- 11 видов переобучения (Overfitting) и советы по тому как их избегать
- Классификация методом логистической регрессии и оптимизации методом роя частиц — статья из свежего выпуска MSDN Magazine — интересный пример классификации методом логистической регрессии с использованием оптимизации одного из подвида метода роя частиц, а именно Multi-Swarm Optimization (MSO). Примеры кода представлены на языке программирования C#.
- Стохастический градиентный бустинг: выбор оптимального количества итераций
- Визуализация данных с помощью GAE Python, D3.js и Google BigQuery (часть 4)
- LambdaNet: библиотека AI на Haskell
- Работа с Pivot Table в Pandas
- Основы работы с изображениями в Python
Соревнования по машинному обучению
- Вариант решения для соревнования по прогнозированию временных рядов — автор блога Wiekvoet в данном посте описывает один из вариантов решения для соревнования по машинному обучению, посвященного анализу временных рядов от Rob J Hyndman.
- Интервью с победителями соревнования CIFAR-10 — еще одно интервью с участниками недавно завершившегося соревнования по машинному обучению CIFAR-10 на Kaggle, которое было посвящено вопросам распознавания изображений, в данном случае это интервью с победителями данного соревнования.
Онлайн-курсы, обучающие материалы и литература
- Список литературы по машинному обучению от Michael I. Jordan (Berkley)
- Обзор книги «Applied Predictive Analytics»
- Список рекомендуемой литературы по эконометрике — очередной список литературы по эконометрике, которые советует к прочтению профессор Dave Giles.
Видеоматериалы
- Демистификация нейронных сетей — cерия коротких обучающих видео по теме нейронных сетей.
- Несколько интересных видео по теме Deep Learning — в данном посте представлена небольшая подборка из нескольких интересных видеоматериалов по теме Deep Learning.
Data engineering
- Тенденции NoSQL в 2015 году от DataVersity
- 10 лучших статей за год по теме Hadoop с блога Hortonworks
Обзоры
- Еженедельный дайджест от DataScienceCentral (5 января)
- Лучшие материалы за неделю от KDnuggets.com (21 — 27 декабря)
- Еженедельный сборник лучших материалов от R1Soft (2 января)
- Лучшие ресурсы за неделю от Data Elixir (№16)
- Новости Data Mining от MyDataMine.com (30 декабря)
- Новости Big Data от MyDataMine.com (1 января)
- Наиболее интересные материалы от Freakonometrics №198
- Наиболее интересные материалы от Freakonometrics №199
- Наиболее интересные материалы от Freakonometrics №200
- Наиболее интересные материалы по High Scalability (2 января)
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №28 (22 — 28 декабря 2014)