Где и как изучать машинное обучение?

  • Tutorial

Всем привет!


Ни для кого не секрет, что интерес к машинному обучению и искусственному интеллекту растет в лучшем случае по экспоненте. Тем временем мой Яндекс Диск превратился в огромную свалку пейперс, а закладки в Google Chrome превратились в список, длина которого стремится к бесконечности с каждым днем. Таким образом, дабы упростить жизнь себе и вам, решил структурировать информацию и дать множество ссылок на интересные ресурсы, которые изучал я и которые рекомендую изучать вам, если вы только вначале пути (буду пополнять список постоянно).

Путь для развития новичка я вижу примерно так:

Untitled_presentation

Попробуйте для начала начать с малого, если у вас нет за спиной 6 лет специалитета ВМК по методам прогнозирования, не стоит сразу скачивать архив лекций Е. Соколова или К. Воронцова, возможно статьи на Medium будут для вас оптимальнее. Также сложности могут возникнуть с понимаением алгоритмов, если вы плохо ориентируетесь в теории вероятностей, теории оптимизации и статистике, поэтому советую заглянуть на Ozon, в Московский Дом Книги и запастись курсами лекций по математике. Далее, ознакомившись с теорией будет проще применять знания в решении задач. Далее я приведу для вас список интересных ресурсов, которые я сам когда-то изучал. Желаю успехов :)

Новичку:


Лайфхак по быстрому выбору моделей от команды Sklearn

http://1.bp.blogspot.com/-ME24ePzpzIM/UQLWTwurfXI/AAAAAAAAANw/W3EETIroA80/s1600/drop_shadows_background.png"image"/

Data Science Glossary (англ.)

Crash-Course по базовым статьям по deep learning на Medium

Туториал TensorFlow

Python vs. R — различия (англ.)

Видеолекции открытого курса от Open Data Science на Хабре

Отличный ML CheatSheet (англ.)

Арифметика сверточных нейронных сетей от команды Theano (англ.)

Отличные видеоуроки по анализу данных и эконометрике на языке R

Наивный байессовский классификатор своими руками с Хабра

Хорошие объяснения того, как работает ROC-AUC
www.youtube.com/watch?v=21Igj5Pr6u4
www.youtube.com/watch?v=vtYDyGGeQyo

Machine Learning Basics (англ.)

Продолжающему:


GitHub Евгения Соколова с лекциями по Machine Learning в НИУ ВШЭ

Блог организации Open Data Science на Хабре (рекомендую)

Отбор и оценка моделей — основы (Себастьян Рашка, англ.)

Математические методы обучения по прецедентам (теория обучения машин), К. Воронцов (рекомендую)

Книга по natural language toolkit (nltk, англ.)

Машины опорных векторов на практике (англ.)

Keras.js — машинное обучение в браузере, можно потрогать руками работу алгоритмов машинного обучения, помогает при изучении

Алгоритмы Data Mining с использованием R — интерактивная книга по изучению машинного обучения на R

Преимущества и недостатки AUC и accuracy (англ.)

Нейронные сети для перенося стиля на фото (англ) (рекомендую)

Перенос стиля с помощью TensorFlow (англ.)

Ritchie Ng — собрание ресурсов по машинному обучению (англ.)

Обзор методов оптимизации градиентным спуском на практике (англ.)

Лекции по машинам опорных векторов от университета Utah (англ.)

Функции потерь для задачи классификации (англ.)
Поделиться публикацией
Комментарии 19
    0
    Спасибо. Пожалуй в закладки.
      +9
      Теперь вместо того, чтобы наполнять закладки курсами и статьями, мы будем наполнять их списками курсов и статей
      –2
      Неплохой и недорогой онлайн-курс для продолжающих есть на OTUS.
        +3
        40 000 это не дорого?
          0
          В зависимости от содержания, я проходил за 25 очень подробный очный курс, который состоял на половину из практики. Про OTUS не могу сказать, что он базовый. Тем не менее в вышке просят 300К, в нетологии 160К.
            0
            Недорого — я говорил сравнительно того, что вы перечислили (есть еще варианты). А поделитесь пож курсом за 25к.
              0
              А вот я там написал — Digital Technologies School, она прям совсем для новичков, но там препод из яндекса ведет, мне понравился
          0

          Уровень middle/senior за 3 месяца и 40к рублей — звучит как абсолютная чушь.

          0
          Недавно в телеграмм-канале addmeto рекомендовали один практический курс без полного погружения в теорию:
          Я как-то уже рассказывал, что считаю курс “practical deep learning for coders” лучшим в своем жанре. Так вот, вышла вторая его часть и она классная. Если вдруг вы хотите заниматься нейронными сетями, вы программист и почему-то еще не прошли этот курс — бегите, он бесплатный и правда отличный, без булшита. Да, конечно настоящим математикам этот курс не годится, он для тех кто как я — слегка программист, который хочет решать свои задачи course.fast.ai/part2.html

          Я бы с радостью его прошёл если бы в данный момент не занимался ещё более приближенными к практике вещами, о чём мне ещё предстоит написать статью в ближайший месяц.
          Возможно кто-то переведёт этот курс на русский для хабра.
            +2
            Ну тут я считаю спорный вопрос. Если говорить о курсах для типичный кодеров, которые не хотят погружаться в матан, то не знаю зачем они нужны такие курсы. Реальная теория нейронных сетей комплексная и непростая, поэтому если вы хотите решать реальные задачи и решать их эффективно, вы обязаны понимать математическую суть алгоритмов. Потому что такие мелочи, как например то, что деревья лучше работают с категориальными признаками вы мало где прочитаете, или то, что данные нужно предобрабатывать для нейронной сети. Поэтому если стоит задача написать простенький классификатор на чистых данных и забыть, да, а если есть желание заниматься сложными задачами — без теории не обойтись.
              +1
              Курс (fast.ai) на мой скромный взгляд очень хороший, думаю многим подойдет как старт изучения этой области.
              Но самое главное, что как раз с такими взглядами его автор и пытается бороться. С тем, что индустрия искуственно завышает порог вхождения в deep learning, что кажется без PhD и кучи прочитанных книг туда и смотреть не стоит, никаких практических задач без этого не решить. Если хотите прямую речь — вот, слова самих создателей www.fast.ai/2017/11/16/what-you-need (раздел The background you need: 1 year of coding).
              Курс наоборот идет сверху вниз. От большей абстракции к меньшей, к деталям реализации и (в меньшей степени) мат. аппарату который за ним стоит.
              Собственно немного про автора. Jeremy Howard — в течении нескольких лет был самым успешным участником соревнований kaggle (а потом кем-то вроде научного руководителя этого ресурса). Также у него несколько стартапов (как уже проданных, так все еще принадлежащих ему) в области машинного обучшения
              Еще раз уточню — это не значит, что не надо знать основы, теорию, мат.аппарат и его особенности, просто ИМХО (и по мнению авторов курса) намного легче это изучать начиная с практических задач и спускаясь вниз к пониманию внутренних процессов там.
              Про классическое машинное обучение (в смысле не нейронные сети) у него тоже курс есть, но про него не знаю, не смотрел.
              +2
              «Возможно кто-то переведёт этот курс на русский для хабра.» — имхо без английского в этой области ну совсем делать нечего.
              0
              Всюду пишут про курсы «для начинающих», которых наплодилось уже немерено, что в большинстве своем выглядит как всем известная книга про 21 день. А кто-нибудь может подсказать нормальные курсы «для продвинутых»? В которых не будет перетирания простейшей линейной алгебры, а что-то для повышения квалификации. Вроде DeepBayes.
                0
                Ну вот, а чем плох дипбайес? К тому же если вы его закончили, думаю вам больше нет смысла учиться, нужно делать свои исследования и над проектами работать можно :)
                0

                А есть ссылки или примеры готовых программ под конкретные задачи в виде платных/бесплатных решений, которые можно установить на свой рабочий пк/сервер и использовать дома/в организации?

                  0
                  Немного не понял вопрос, вы имеете в виду готовые решения типовых задач в анализе данных?
                  0
                  Генетический алгоритм и теорию граф не увидел. Тензорная математика, ну это наверно в линейной алгебре? И что нибудь связанное с пустотой.
                    0
                    Это для начинающих список, сюда еще надо теорию случайных процессов, выпуклые функции и так далее включить, не думаю что с нуля это можно осилить
                    0
                    Прошу прощения за небольшую поправку. Если вы имеете в виду главного керасовода и автора «deep learning in python», то он таки Francois Chollet

                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                    Самое читаемое