Подборка ресурсов по математике, статистике и программированию для начинающих Дата Сайентистов. Ознакомьтесь с материалами, если вы планируете учиться на онлайн-курсах. Так вы опередите одногруппников, а заодно прокачаете полезный навык — изучать дополнительные материалы самостоятельно.
Большинство материалов из подборки — на английском языке. Поэтому в первую очередь нужно разобраться в технической лексике и научиться понимать сложные термины. Эти ресурсы помогут сориентироваться в технической литературе, если ваш уровень английского — средний или ниже среднего.
Cambridge Dictionary
В первую очередь научитесь быстро осваивать любые математические концепции. В этом поможет обучающий ролик How to Learn Mathematics Fast
Прокачайте математическое мышление и изучите:
Чтобы осознать универсальность математики, посмотрите серию семинаров Эдварда Френкела Mathematics: the language of nature.
Освежить в памяти базовые понятия математики помогут следующие ресурсы:
Курс «Теория вероятностей» на Coursera
Задание со звездочкой. Чтобы еще больше прокачать знания по матричной алгебре, пройдите сложный курс Linear Algebra от MIT.
Для обучения на курсе Нетологии Data Scientist, достаточно базовых знаний статистики. Их можно получить из раздела Statistics and probability в «Академии Хана». Ознакомиться с полным списком тем по статистике, которые будем рассматривать во время обучения, можно в подборке The 10 Statistical Techniques Data Scientists Need to Master. Для поступления разбираться в них детально не нужно, но лучше получить общее представление.
Курс Data Scientist в Нетологии
Задание со звездочкой. Дополнительно стоит пройти курс Statistics for Applications от MIT, но для этого нужно понимать:
Студенты курса Data Scientist пишут код на языке Python. Чтобы писать код во время обучения, достаточно освоить основные понятия языка: операторы, типы данных, переменные, циклы, функции, классы. Быстро разобраться в основах и попрактиковаться самостоятельно помогут следующие ресурсы:
Если вы хотите разобраться в Python подробнее и под руководством наставника, можете параллельно проходить курс «Python для анализа данных».
Чтобы мыслить в контексте данных, нужно разобраться, как устроены и работают базы реляционных данных. Для этого достаточно освоить основы SQL — пройти третью неделю курса по основам анализа данных для бизнеса от Колорадского университета в Боулдере. Отработать знания на практике можно в следующих заданиях:
Углубленные знания по базам данных можно получить на курсе «SQL для аналитика».
Технический английский
Большинство материалов из подборки — на английском языке. Поэтому в первую очередь нужно разобраться в технической лексике и научиться понимать сложные термины. Эти ресурсы помогут сориентироваться в технической литературе, если ваш уровень английского — средний или ниже среднего.
- Cambridge Dictionary — толковый словарь, который поможет понять смысл слов и выражений.
- Подборка аббревиатур, которые часто используют в Data Science, с расшифровкой.
- Словарь терминов Data Science и Machine Learning.
Cambridge Dictionary
Математика
В первую очередь научитесь быстро осваивать любые математические концепции. В этом поможет обучающий ролик How to Learn Mathematics Fast
Прокачайте математическое мышление и изучите:
- книгу Introduction to Mathematical Thinking Кейт Дэвлин;
- гайды How to Develop a Mindset for Math и Learning to Learn: Math Abstraction;
- тред на Quora How do math geniuses understand extremely hard math concepts so quickly?;
- публикацию Devlin's Angle What is conceptual understanding?
Чтобы осознать универсальность математики, посмотрите серию семинаров Эдварда Френкела Mathematics: the language of nature.
Дополнительная теория и практика по математике
Освежить в памяти базовые понятия математики помогут следующие ресурсы:
- по производным — урок Derivatives introduction от «Академии Хана»;
- по векторной алгебре — курс по линейной алгебре «Высшей школы экономики» от Coursera (седьмая неделя), уроки Vectors в «Академия Хана»;
- по матричной алгебре — курс по линейной алгебре «Высшей школы экономики» от Coursera (шестая неделя), уроки из раздела Matrices в «Академия Хана»;
- по тригонометрии — задания из раздела Trigonometry в «Академии Хана»;
- по теории вероятностей — курс по теории вероятности для начинающих от МФТИ на Coursera, задания из раздела Probability в «Академии Хана».
Курс «Теория вероятностей» на Coursera
Задание со звездочкой. Чтобы еще больше прокачать знания по матричной алгебре, пройдите сложный курс Linear Algebra от MIT.
Статистика
Для обучения на курсе Нетологии Data Scientist, достаточно базовых знаний статистики. Их можно получить из раздела Statistics and probability в «Академии Хана». Ознакомиться с полным списком тем по статистике, которые будем рассматривать во время обучения, можно в подборке The 10 Statistical Techniques Data Scientists Need to Master. Для поступления разбираться в них детально не нужно, но лучше получить общее представление.
Курс Data Scientist в Нетологии
Задание со звездочкой. Дополнительно стоит пройти курс Statistics for Applications от MIT, но для этого нужно понимать:
- что такое выборка и генеральная совокупность;
- меры центральной тенденции и изменчивости;
- сравнение средних.
Программирование
Студенты курса Data Scientist пишут код на языке Python. Чтобы писать код во время обучения, достаточно освоить основные понятия языка: операторы, типы данных, переменные, циклы, функции, классы. Быстро разобраться в основах и попрактиковаться самостоятельно помогут следующие ресурсы:
- руководство Beginner Python3 Tutorials на Udemy;
- руководство по базовым концепциям языка Learning Python: From Zero to Hero от FreeCodeCamp;
- курс с теорией и практическими заданиями Google's Python Class от Google;
- подборка задач от Pythontutor на русском и английском;
- обзор библиотеки Pandas, которую будем использовать для обработки и анализа данных в программе.
Если вы хотите разобраться в Python подробнее и под руководством наставника, можете параллельно проходить курс «Python для анализа данных».
Базы данных
Чтобы мыслить в контексте данных, нужно разобраться, как устроены и работают базы реляционных данных. Для этого достаточно освоить основы SQL — пройти третью неделю курса по основам анализа данных для бизнеса от Колорадского университета в Боулдере. Отработать знания на практике можно в следующих заданиях:
- SQL Exercises;
- SQL Movie-Rating Query Exercises;
- SQL Movie-Rating Query Exercises Extras;
- SQL Social-Network Query Exercises;
- SQL Social-Network Query Exercises Extras;
- SQL Movie-Rating Modification Exercises;
- SQL Social-Network Modification Exercises.
Углубленные знания по базам данных можно получить на курсе «SQL для аналитика».
Резюмируем: ключевые рекомендации
- Если вы планируете освоить профессию Data Scientist на курсах, прокачайте технический английский. Это понадобится для изучения дополнительных материалов и документации.
- Изучите или освежите в памяти основы математики, статистики, Python и SQL.
- Читайте гайды, смотрите обучающие лекции и выполняйте практические задания для закрепления информации.