Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
- Как говорить на языке «Data Science»
- Бонд. Джеймс Бонд. Роботизированная подделка почерка для маркетологов и социальных инженеров
- Седьмая ежегодная Летняя школа Microsoft Research по машинному обучению и интеллекту — сотрудничество с ACM Europe
- Google хочет измерять важность сайтов по фактам, а не ссылкам
- Wargaming и «Яндекс» сотрудничают в области Big Data
- Кто собирается заработать на грядущем буме систем искусственного интеллекта?
- EBay выпустила инструмент с открытым программным кодом Pulsar для укрощения больших данных
- Лицензирование доступа к Big Data как средство монетизации Twitter
- Почему Apache Spark меняет Кремниевую долину
- Как стать специалистом в области машинного обучения — несколько полезных советов новичкам в области машинного обучения от автора блога MachineLearningMastery, которые помогут тем кто хочет построить карьеру в данной области, но не знает с чего начать.
- 8 причин популярности Apache Spark
- Три технологии, которые изменят интернет — несколько слов о популряных сейчас технологиях, основанных на использовании машинного обучения: распознавание речи, поиск изображений и анализ видео.
- Как PayPal использует Deep Learning для борьбы с мошенничеством
- IBM приобретает Deep Learning стартап AlchemyAPI
- Три ключевых шага для построения предсказательных приложений на основе машинного обучения
- Библиотека spragunr: Реализация алгоритма Deep Q-learning на базе библиотеки Theano
Теория и алгоритмы машинного обучения, примеры кода
- Поиск текстов, не соответствующих тематике и нахождение похожих статей
- Social Network Analysis: Spark GraphX
- Создание карты музыкальных композиций — интересный пример визуальной классификации музыкальных композиций с помощью машинного обучения и использования языка программирования Python.
- Факторный анализ
- R: Построение графиков с помощью встроенной функциональности визуализации — при упоминании темы визуализации с помощью языка программирования R часто говорят о библиотеке ggplot, но не стоит забывать о встроенных возможностях визуализации Base R Plots.
- Ловушки машинного обучения. Измерение эффективности модели (Часть 1) — обсуждение безусловно важной темы измерения эффективности работы вашей предсказательной модели.
- Тренировка модели методом градиентного спуска с использованием C#
- Обработка естественного языка с помощью глубинных нейронных сетей и библиотеки Torch
- Интерактивные визуализации с помощью D3.js, DC.js, Python и MongoDB
- Пример расчета PageRank с помощью Apache Hadoop
Онлайн-курсы, обучающие материалы и литература
- Онлайн-курс от Stanford University: Deep Learning for Natural Language Processing
- Онлайн-курс от MIT на edX: Introduction to Computational Thinking and Data Science
- Онлайн-курс от MIT на edX: The Analytics Edge
- Онлайн-курс на Coursera: Data Analysis and Statistical Inference
- Обзор книг «Time Series Databases» и «New look at Anomaly detection»
- Бесплатная онлайн-книга: Kalman and Bayesian Filters in Python
- Обзор бесплатной книги: The Data Analytics Handbook: Big Data Edition
Видеоматериалы, подкасты
Data engineering
- Использование Apache Storm для аналитики в реальном времени
- Использование MongoDb с Hadoop и Spark: Часть 2 — пример работы с Hive
Использование MongoDb с Hadoop и Spark: Часть 3 — пример работы со Spark и ключевые выводы
Обзоры
- Интересное из мира R (2-8 марта 2015 г.)
- Лучшие материалы за неделю от KDnuggets.com (22-28 февраля)
- Лучшие материалы за февраль от KDnuggets.com
- Еженедельный дайджест от DataScienceCentral (9 марта)
- Новости Data Science от MyDataMine.com (8 марта)
- Новости Big Data от MyDataMine.com (8 марта)
- Лучшие ресурсы за неделю от Data Elixir (№25)
- Еженедельный сборник лучших материалов от R1Soft (6 марта)
- Этот месяц в экосистеме Hadoop (февраль 2015)
- Новости экосистемы Hadoop от MyDataMine.com (3 марта)
- Наиболее интересные материалы по High Scalability (6 марта)
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №37 (23 февраля — 1 марта 2015)