Обзор наиболее интересных материалов по анализу данных и машинному обучению №34 (2 — 8 февраля 2015)
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.
Общее
-
Машинное обучение в сфере онлайн знакомств -
Искусственный интеллект может смотреть видео и описывать то, что видит — любопытный пост с коротким видео о стартапе Clarify, который специализируется в области искусственного интеллекта и разрабатывает продукт, который может описывать то, что происходит в предложенных видеороликах, на основе использования алгоритмов Deep Learning. -
Четыре отличных визуализации данных -
6 советов, которые помогут стать отличным специалистом в области Data Science -
Один из создателей Google Brain рассказывает, почему он в данный момент работает над созданием китайских нейронных сетей — интересное интервью с Andrew Ng. -
Почему многие специалисты в области анализа данных выбирают Python? — интересный вопрос, заданный на Quora, и несколько полезных ответов. -
Data Science: Должен ли я изучать Python или R? -
Почему сейчас самое время изучать язык программирования R
Теория и алгоритмы машинного обучения, примеры кода
-
Пример Feature Engineering в машинном обучении -
Система автоматической оценки возраста по изображениям лиц -
Как работает алгоритм распознавания музыки Shazam -
Практический Data Science с помощью Python -
Серия уроков по машинному обучению и обработке естественного языка. Урок 1: Работа с текстом -
Понимание текста с нуля — публикация от Xiang Zhang и Yann LeCun на тему использования сверточных нейронных сетей для анализа текста. -
Пара слов о Shiny — небольшой пост, который расскажет о популярной библиотеке визуализации Shiny для языка программирования R и возможностях публикации своих Shiny-приложений на портале Shinyapps.io. -
Quickcheck: рандомизированное юнит-тестирование для R — короткий пост об интересной библиотеке юнит-тестирования для языка программирования R. -
Анализ данных с помощью Pandas — небольшой пример использования библиотеки Pandas, написанной для языка программирования Python, для анализа данных. -
Результат машинного обучения
Онлайн-курсы, обучающие материалы и литература
Видеоматериалы, подкасты
-
Partially Derivative: Эпизод 12: Partially Deflated — очередной эпизод популярного подкаста «Partially Derivative».
Data engineering
-
Google снова зафиксировал наибольшие квартальные траты на дата-центры -
Сможет ли Microsoft Cosmos составить конкуренцию Hadoop -
Использование Apache Crunch для обработки данных в Spotify — интересная статья, для тех кто использует MapReduce еще не готов использовать Apache Spark, но хочет получить схожие функции. -
Опубликован Apache Hive 1.0.0
Обзоры
-
Интересное из мира R (2-8 февраля 2015 г.) -
Интересное из мира R (26 января — 1 февраля 2015 г.) -
Лучшие материалы за январь от KDnuggets.com -
Лучшие материалы за неделю от KDnuggets.com (25 — 31 декабря) -
Дайджест лучших ресурсов от DataScienceCentral (5 февраля) -
Новости Data Science от MyDataMine.com (6 февраля) -
Новости Big Data от MyDataMine.com (3 февраля) -
Еженедельный сборник лучших материалов от R1Soft (6 февраля) -
Лучшие ресурсы за неделю от Data Elixir (№21) -
Этот месяц в экосистеме Hadoop (январь 2015) -
Наиболее интересные материалы по High Scalability (6 февраля)
Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №33 (26 января — 1 февраля 2015)