
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
Пять наиболее важных событий в мире R по итогам 2014 г.
Как Deep Learning может в будущем быть использован в различных сферах жизнедеятельности
Список ресурсов по машинному обучению — отличный список ресурсов по машинному обучению разбитый на несколько тематических категорий (Deep Learning, Online Learning, Ensemble Methods, Kernel Machines, GPU Learning, NLP и др.)
Анонс Spark Packages — анонс Spark Packages: сборник различных библиотек с открытым исходным кодом для Apache Spark.
Интерактивная трехмерная визуализация различных наборов данных в браузере с помощью data-projector
Прогнозы на 2015 год: что случится с Big Data и Data Science? — еще один прогноз на наступающий год от популярного портала KDnuggets.com.
7 лучших ресурсов 2014 года по Big Data от SmartData Collective
8 предсказаний по теме Big Data на 2015 год от SmartData Collective
4 шага к успеху в области Big Data в 2015 году
10 лучших статей 2014 года по теме Data Science с блога Analytics Vidhya
Теория и алгоритмы машинного обучения, примеры кода
Руководство хакера по нейронным сетям. Глава 2: Машинное обучение. Бинарная классификация
Руководство хакера по нейронным сетям. Глава 2: Машинное обучение. Обучение сети на основе метода опорных векторов (SVM)
Обзор алгоритмов сжатия графов
InterSystems iKnow. Загружаем данные из Вконтакте
Линейная алгебра в машинном обучении — автор блога MachineLearningMastery рассказывает о том, какие аспекты линейной алгебры полезно знать для лучшего понимания алгоритмов машинного обучения.
Сбор и анализ данных бейсбольной статистики с помощью R
Деревья принятия решений: наращивание и отсечение ветвей
Использование метода опорных компонент (Principal Component Analysis) при работе с изображениями
Распознавание рукописных цифр с помощью R (часть 1)
Сравнение работы с Dataframe в Python, R и Julia
Пример создания предсказательных моделей с помощью библиотеки caret — пример использования популярной библиотеки caret для языка программирования R для создания предсказательных моделей.
Расширенная версия шпаргалки по scikit-learn
Набор для машинного обучения — большой полезный набор различных ссылок на материалы по машинному обучению (в том числе и на русском языке).
Визуализация данных с помощью GAE Python, D3.js и Google BigQuery (часть 1)
Визуализация данных с помощью GAE Python, D3.js и Google BigQuery (часть 2)
Визуализация данных с помощью GAE Python, D3.js и Google BigQuery (часть 3)
Пример использования Spark (часть 3): очистка и сортировка номеров Social Security
Пример кода: применение функции к каждой строке в data.frame
Соревнования по машинному обучению
Как подходить к решению проблем на Kaggle — набор простых советов от автора блога Analytics Vidhya, которые помогут стать успешным участником соревнований по машинному обучению на Kaggle.
Интервью с Yann LeCun: сверточные сети и CIFAR-10 — интересное интервью с Yann LeCunn (Director of AI Research, Professor at New York University), посвященное вопросам использования сверточных сетей и обсуждению недавно завершившегося соревнования по машинному обучению CIFAR-10 на Kaggle, которое было посвящено вопросам распознавания изображений.
Анализ данных Kaggle с помощью R — интересный анализ данных соревнований по машинному обучению на Kaggle, проведенный с помощью языка программирования R.
Онлайн-курсы, обучающие материалы и литература
Анонс нового онлайн-курса «Statistics and R for the Life Sciences» — интересный курс под названием «Statistics and R for the Life Sciences» от Harvard University анонсирован на edX.
Материалы курса «Convex Optimization» от Carnegie Mellon University
Набор лекций с курса «Principles of Distributed Computing» (ETH Zürich)
Видеоматериалы
Основные ловушки проектов машинного обучения — интересное выступление «Machine Learning Gremlins» Ben Hammer и комментарии от автора блога MachineLearningMastery.
Машинное обучение с помощью статистических и казуальных методов — ссылка на видео выступления «Statistical and causal approaches to machine learning» от Bernhard Scholkopf и комментарии автора блога MachineLearningMastery к нему.
Data engineering
Обзоры
Дайджест лучших ресурсов от DataScienceCentral (29 декабря)
Лучшие материалы за неделю от KDnuggets.com (14 — 20 декабря)
Еженедельный сборник лучших материалов от R1Soft (26 декабря)
Лучшие ресурсы за неделю от Data Elixir (№15)
Наиболее интересные материалы от Freakonometrics №195
Наиболее интересные материалы от Freakonometrics №196
Наиболее интересные материалы от Freakonometrics №197
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №27 (15 — 21 декабря 2014)