Обзор наиболее интересных материалов по анализу данных и машинному обучению №34 (2

Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.

Общее

Машинное обучение в сфере онлайн знакомств
Искусственный интеллект может смотреть видео и описывать то, что видит — любопытный пост с коротким видео о стартапе Clarify, который специализируется в области искусственного интеллекта и разрабатывает продукт, который может описывать то, что происходит в предложенных видеороликах, на основе использования алгоритмов Deep Learning.
Четыре отличных визуализации данных
6 советов, которые помогут стать отличным специалистом в области Data Science
Один из создателей Google Brain рассказывает, почему он в данный момент работает над созданием китайских нейронных сетей — интересное интервью с Andrew Ng.
Почему многие специалисты в области анализа данных выбирают Python? — интересный вопрос, заданный на Quora, и несколько полезных ответов.
Data Science: Должен ли я изучать Python или R?
Почему сейчас самое время изучать язык программирования R

Теория и алгоритмы машинного обучения, примеры кода

Пример Feature Engineering в машинном обучении
Система автоматической оценки возраста по изображениям лиц
Как работает алгоритм распознавания музыки Shazam
Практический Data Science с помощью Python
Серия уроков по машинному обучению и обработке естественного языка. Урок 1: Работа с текстом
Понимание текста с нуля — публикация от Xiang Zhang и Yann LeCun на тему использования сверточных нейронных сетей для анализа текста.
Пара слов о Shiny — небольшой пост, который расскажет о популярной библиотеке визуализации Shiny для языка программирования R и возможностях публикации своих Shiny-приложений на портале Shinyapps.io.
Quickcheck: рандомизированное юнит-тестирование для R — короткий пост об интересной библиотеке юнит-тестирования для языка программирования R.
Анализ данных с помощью Pandas — небольшой пример использования библиотеки Pandas, написанной для языка программирования Python, для анализа данных.
Результат машинного обучения

Онлайн-курсы, обучающие материалы и литература

Обзор книги: High-Performance Data Mining and Big Data Analytics

Видеоматериалы, подкасты

Partially Derivative: Эпизод 12: Partially Deflated — очередной эпизод популярного подкаста «Partially Derivative».

Data engineering

Google снова зафиксировал наибольшие квартальные траты на дата-центры
Сможет ли Microsoft Cosmos составить конкуренцию Hadoop
Использование Apache Crunch для обработки данных в Spotify — интересная статья, для тех кто использует MapReduce еще не готов использовать Apache Spark, но хочет получить схожие функции.
Опубликован Apache Hive 1.0.0

Обзоры

Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №33 (26 января — 1 февраля 2015)

Обзор наиболее интересных материалов по анализу данных и машинному обучению №34 (2 — 8 февраля 2015)

Общее

Теория и алгоритмы машинного обучения, примеры кода

Онлайн-курсы, обучающие материалы и литература

Видеоматериалы, подкасты

Data engineering

Обзоры

{{ titleHtml }}

{{ titleHtml }}