Обзор наиболее интересных материалов по анализу данных и машинному обучению №27 (15 — 21 декабря 2014)
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
-
Корпорация IBM открыла доступ к Watson Analytics для всех -
Искусственный интеллект нам не угроза -
Начните использовать машинное обучение сегодня — хороший пост от автора блога MachineLearningMastery, который поможет новичкам достаточно быстро освоить базовые вещи из области машинного обучения и начать использование алгоритмов машинного обучения на практике. -
Компания Baidu аносировала прорыв в области распознавания речи и утверждает, что обошла в этом вопросе Google и Apple -
10 лучших Big Data стартапов в 2014 году -
5 Deep Learning стартапов, за которыми стоит следить в 2015 году -
IBM Watson Analytics против Microsoft Azure Machine Learning (часть 1) — сравнение двух аналитических систем от авторов блога KDnuggets.com. -
Data Mining (и Statistical Analysis) наиболее востребованные навыки по данным LinkedIn за 2014 год -
Наиболее востребованные навыки в Data Science и Data Mining — интересное исследование от авторов блога KDnuggets.com. -
Список инструментов по машинному обучению с открытым исходным кодом от KDnuggets.com -
Лучшие проекты по визуализации данных в 2014 году -
22 ключевых термина в области больших данных, которые должен понимать каждый -
Инфографика от IBM Big Data & Analytics Hub: четыре V в области больших данных -
Прогнозы на 2015 год в области Big Data от Big Data Analytics News -
Список ресурсов по R за 2014 год от Revolution Analytics -
Что каждая библиотека машинного обучения может позаимствовать у Vowpal Wabbit -
Основные тенденции машинного обучения в 2014 году на основе результатов прошедшей конференции «Neural Information Processing Systems (NIPS) 2014» -
Список полезных ресурсов по R от DZone.com -
Прогнозы на 2015 год в области Big Data -
6 прогнозов в сфере Big Data на 2015 год от Information Week -
Основные тендеции Data Science на 2015 год от Analytics Vidhya -
Анонс новой версии BabelNet — статья о выходе версии 3.0 популярного многоязыкового словаря и семантической сети BabelNet, в которой присутствует также и русский язык. -
Анонс Apache Spark 1.2 -
Htmlwidgets for R: библиотека для визуализациии данных в R с помощью JavaScript -
Научный подход к решению проблем анализа данных
Теория и алгоритмы машинного обучения, примеры кода
-
Руководство хакера по нейронным сетям. Схемы реальных значений. Шаблоны в «обратном» потоке. Пример «Один нейрон» -
Нефтяные ряды в R -
Сканеры безопасности: автоматическая валидация уязвимостей с помощью нечетких множеств и нейронных сетей -
Реализация линейной регрессии на Python -
Анализ тональности текста (Sentiment Analysis) с помощью kimono и MonkeyLearn -
Оптимизация использования памяти в R — полезная статья с популярного блога Yhat, посвященная оптимизации использования оперативной памяти в языке программирования R. -
Иерархическая кластеризация с помощью R (с использованием D3.js и Shiny) -
Ask a Data Scientist: Ensemble Methods — очередная статья с популярного портала insideBIGDATA из цикла «Ask a Data Scientist», в данном выпуске речь пойдет о таком понятии как Ensemble Methods.
Соревнования по машинному обучению
Онлайн-курсы, обучающие материалы и литература
-
Онлайн-курс Stepic: Основы статистики — курс знакомит слушателей с основными понятиями и методами математической статистики. -
Data Analyst Nanodegree от Udacity — краткий обзор программы Data Analyst Nanodegree от Udacity. -
Курс по визуализации данных с помощью D3.js — не так давно на сайте онлайн-обучения Udacity появился новый достаточно любопытный курс, созданный совместно с Zipfian Academy и посвященный теме визуализации данных и использованию популярной библиотеки визуализации D3.js. -
Список книг по практическому машинному обучению — хороший список книг по практического машинному обучению от автора блога MachineLearningMastery. -
14 лучших книг по Big Data в 2014 году -
Обзор книги «Introduction to Data Science with R» -
Обзор книги «Data Science at the Command Line»
Бесплатная электронная книга «Big Data Basics»
Бесплатная электронная книга «Big Data Analytics for Dummies»
Бесплатная электронная книга «Practical Machine Learning: Innovations in Recommendation»
Видеоматериалы
-
Видео докладов Badoo с конференции Highload 2014 -
Моделирование данных в NoSQL — в данном видео Jan Steemann (Senior Developer, triAGENS) расскажет о том, как правильно моделировать данные в NoSQL хранилищах и представит несколько наглядных практических примеров. -
Apache Cassandra для новичков — в данном посте представлено две видеолекции, которые помогут разобраться в базовых концепциях Apache Cassandra. -
IBM Watson в действии
Data engineering
-
Обработка данных NBA за 30 лет с помощью MongoDB Aggregation -
Краткое введение в экосистему Hadoop -
10 прогнозов по экосистеме Hadoop на 2015 год -
Почему 2015 будет годом NoSQL -
SparkOnHBase от Cloudera — статья про интересный проект от компании Cloudera под названием SparkOnHBase с примерами использования. -
16 NoSQL хранилищ, за которыми стоит следить — полезный список из 16 NoSQL хранилищ с небольшим описанием каждого с блога KDnuggets.com. -
Введение в NoSQL — неплохой краткий рассказ про NoSQL хранилища от автора блога Analytics Vidhya. -
Прогнозы на 2015 год в области хранилищ данных от DataVersity -
10 лучших постов с блога Cloudera в 2014 году
Обзоры
-
Интересное из мира R (15-21 декабря 2014 г.) -
Еженедельный дайджест от DataScienceCentral (22 декабря) -
Лучшие материалы за неделю от KDnuggets.com (7 — 14 декабря) -
Еженедельный сборник лучших материалов от R1Soft (19 декабря) -
Лучшие ресурсы за неделю от Data Elixir (№14) -
Наиболее интересные материалы от Freakonometrics №193 -
Наиболее интересные материалы от Freakonometrics №194 -
Наиболее интересные материалы по High Scalability (19 декабря)
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №26 (8 — 14 декабря 2014)