Математика для Data Scientist: необходимые разделы

    Математика — это краеугольный камень Data Science. Хотя некоторые теоремы, аксиомы и формулы кажутся слишком абстрактными и далекими от практики, на самом деле без них невозможно по-настоящему глубоко анализировать и систематизировать огромные массивы данных.

    Для специалиста Data Science важны следующие направления математики:

    • статистика;
    • теория вероятностей;
    • математический анализ;
    • линейная алгебра.

    В предыдущей статье «Data Science: книги для начального уровня» специалисты Plarium Krasnodar рекомендовали литературу по программированию на Python, а также по визуализации результатов и machine learning. В этой статье они предлагают подборку материалов и книг по математике, полезных в Data Science.



    Статистика и теория вероятностей


    Сложно переоценить важность знания статистики для Data Scientist любого уровня. Все классическое machine learning основано на statistical learning. Более того, на нем же основываются стандартные A/B-тесты.

    Источники для вдохновения:



    All of Statistics
    Larry Wasserman


    Как пишет сам автор: «This book is for people who want to learn probability and statistics quickly».

    В книге даются все основные положения теории вероятностей и статистики.



    Основы статистики (3 части)
    Образовательная платформа Stepik


    Курс по статистике для новичков. Охватывает все элементарные понятия.



    Statistics Fundamentals Succinctly Katharine
    Alexis Kormanik

    В предыдущей статье уже была рекомендована эта книга, но повторить будет не лишним. :-)

    В первых разделах приведены основные определения с иллюстрациями и комментариями, в последних раскрывается значимость T- и Z-тестов. Материалы изложены доступным языком, с минимально необходимым математическим аппаратом. Это руководство — отличное введение в статистику с точки зрения практики.



    Теория вероятностей и математическая статистика
    Н. Ш. Кремер


    Учебник ориентирован на экономистов, поэтому сложность и глубина понятий не шокирует новичка в Data Science. Подходит для изучения основ перед погружением в профильную литературу.



    Теория вероятностей и математическая статистика
    А. И. Кибзун, Е. Р. Горяинова, А. В. Наумов, А. Н. Сиротин


    Этот базовый курс дает более глубокие представления, чем предыдущий. Кроме
    теории включает практические задания и справочные материалы.



    Основные понятия теории вероятностей и математической статистики
    М. Я. Кельберт, Ю. М. Сухов


    Прекрасный вариант для тех, кто уже хорошо знаком с темой и хочет получить более глубокие знания.

    Математический анализ


    На первый взгляд это направление необходимо больше в стенах университетов, однако без него не удастся разобраться с backpropagation или качественно освоить курс по deep learning.

    Восполнив пробелы в статистике, самое время приступить к изучению материалов по этому разделу. А их превеликое множество.



    Calculus
    edX


    Курс от Массачусетского технологического института, состоящий из 3 частей:

    • Calculus 1A: Differentiation — курс о нахождении производной, ее геометрической интерпретации и физическом смысле.
    • Calculus 1B: Integration — курс о нахождении интеграла, его связи с производной и применении в инженерном проектировании, научном анализе, теории вероятностей и статистике.
    • Calculus 1C: Coordinate Systems & Infinite Series — курс об исчислении кривых, системах координат, приближении функций к полиномам и бесконечных рядах. Все это необходимо для построения математических моделей реального мира.



    Calculus One
    Образовательная платформа Coursera


    Курс ориентирован на новичков, но удобная подача материала поможет освежить память и бывалым Data Scientist.



    Khan Academy
    Образовательная платформа


    Разнообразные материалы, представленные на ресурсе, отлично подойдут для старта изучения математики, программирования и информатики.



    Calculus
    James Stewart


    Книга славится тщательно проработанным содержанием и довольно простым языком.



    Курс математического анализа
    Л. Д. Кудрявцев


    Для тех, кто хочет получить более фундаментальные знания о дифференциальных и интегральных исчислениях, теории рядов, функциональном и гармоническом анализе.

    Также можно обратить внимание на два курса от MIT:
    1. Single Variable Calculus — курс для самостоятельного изучения дифференцирования, интегральных исчислений и бесконечных рядов.
    2. Multivariable Calculus — еще один курс для самостоятельного изучения дифференцирования, а также интегрального и векторного исчислений функций нескольких переменных.

    Линейная алгебра


    Без этого раздела математики не получится разработать методы machine learning, смоделировать поведение различных объектов или оптимизировать процесс кластеризации и уменьшения размерности описания данных.



    Linear Algebra
    Georgi E. Shilov


    В учебнике изложен прекрасно проработанный материал. Книга подойдет для изучения вводного курса в линейную алгебру.



    Линейная алгебра
    В. А. Ильин, Э. Г. Позняк

    Этот учебник был написан на базе лекций преподавателей физического факультета МГУ. Все материалы изложены доступным языком и подойдут для глубокого изучения основных теорий линейной алгебры.

    И напоследок еще одна рекомендация — учебный курс Linear Algebra от MIT. Он раскрывает теорию матриц и положения линейной алгебры.
    • +12
    • 11,3k
    • 4
    Plarium
    151,00
    Разработчик мобильных и браузерных игр
    Поделиться публикацией

    Комментарии 4

      +1
      По математическому анализу мне понравился курс Бутузова В. Ф. на ютубе
        +1
        У кого как, а у меня любимый учебник по теории вероятностей — двухтомник Уильяма Феллера. (Введение в теорию вероятностей и ее приложения). Помню, будучи студентом третьего курса, случайно набрел на эту книжку в институтской библиотеке, взял (на всякий случай, а вдруг пригодится при подготовке к экзамену по терверу). Начал читать, и оценил, насколько она увлекательно написана! Довольно сложные вещи, но читается, просто как детектив.
        Потом, уже после окончания института, увидел знакомую обложку в букинистическом магазине, купил, даже не раздумывая.

        По мат анализу — трехтомник профессора из ЛГУ, Григория Михайловича Фихтенгольца, «Курс дифференциального и интегрального исчисления». (Широко известен в соответствующих кругах как «Толстый Фихтенгольц». Это чтобы не путали с другим учебником того же автора, двухтомником под названием «Тонкий Фихтенгольц»).
        На первых двух курсах института, этот учебник был моей настольной книгой. Могу ответственно заявить, что «Толстый Фихтенгольц» является произведением искусства.

          +1
          По статам ещё можно Casella & Berger порекомендовать.
          В линале нельзя не вспомнить Акслера, Linear algebra done right. Это вообще одно удовольствие!
            +1
            Дмитрий Константинович Фаддеев «Лекции по алгебре».

            Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

            Самое читаемое