Язык R для пользователей Excel (бесплатный видео курс)

    В связи с карантином многие сейчас львиную долю времени проводят дома, и это время можно, и даже нужно провести с пользой.


    В начале карантина я решил довести до ума некоторые проекты начатые несколько месяцев назад. Одним из таких проектов был видео курс "Язык R для пользователей Excel". Этим курсом я хотел снизить порог вхождения в R, и немного восполнить существующий дефицит обучающих материалов по данной теме на русском языке.


    Если всю работу с данными в компании, в котороый вы работаете принято по-прежнему вести в Excel, то предлагаю вам познакомится с более современным, и при этом совершенно бесплатным инструментом анализа данных.



    Содержание


    Если вы интересуетесь анализом данных возможно вам будут интересны мои telegram и youtube каналы. Большая часть контента которых посвящены языку R.


    1. Ссылки
    2. О курсе
    3. Для кого этот курс
    4. Программа курса
      4.1. Урок 1: Установка языка R и среды разработки RStudio
      4.2. Урок 2: Основные структуры данных в R
      4.3. Урок 3: Чтение данных из TSV, CSV, Excel файлов и Google Таблиц
      4.4. Урок 4: Фильтрация строк, выбор и переименование столбцов, пайпланы в R
      4.5. Урок 5: Добавление вычисляемых столбцов в таблицу на языке R
      4.6. Урок 6: Группировка и агрегация данных на языке R
      4.7. Урок 7: Вертикальное и горизонтальное объединение таблиц на языке R
      4.8. Урок 8: Оконные функции в R
      4.9. Урок 9: Вращение таблиц или аналог сводных таблиц в R
      4.10. Урок 10: Загрузка JSON файлов в R и преобразование списков в таблицы
      4.11. Урок 11: Быстрое построение графиков с помощью функции qplot()
      4.12. Урок 12: Построение графиков слой за слоем с помощью пакета ggplot2
      4.13. Урок 13: Изменение элементов графика и применение тем в ggplot2
    5. Заключение

    Ссылки



    О курсе


    Курс построен вокруг архитектуры tidyverse, и входящих в неё пакетов: readr, vroom, dplyr, tidyr, ggplot2. Конечно в R есть и другие хорошие пакеты выполняющие подобные операции, например data.table, но синтаксис tidyverse интуитивно понятен, его легко читать даже неподготовленному пользователю, поэтому я думаю, что начинать обучение языку R лучше именно с tidyverse.


    Курс проведёт вас через все операции анализа данных, от загрузки до визуализации готового результата.


    Почему именно язык R, а не Python? Потому, что R функциональный язык, пользователям Excel на него перейти легче, т.к. не надо вникать в традиционное объектно-ориентированное программирование.


    На данный момент запланировано 13 видео уроков длительностью от 5 до 20 минут каждый.


    Уроки будут открываться постепенно. Каждый понедельник я буду открывать доступ к новому уроку у себя на YouTube канале в отдельном плей листе.


    Для кого этот курс


    Думаю это понятно из названия, тем не менее опишу более подробно.


    Курс ориентирован на тех, кто в работе активно использует Microsoft Excel и там же реализует всю работу с данными. В общем, если вы открываете приложение Microsoft Excel хотя бы раз в неделю то курс вам подойдёт.


    Навыков программирования для прохождения курса от вас не требуется, т.к. курс ориентирован на начинающих.


    Но, возможно начиная с 4 урока найдётся материал интересный и для активных пользователей R, т.к. основной функционал таких пакетов как dplyr и tidyr будет рассмотрен достаточно подробно.


    Программа курса




    Урок 1: Установка языка R и среды разработки RStudio


    Дата публикации: 23 марта 2020


    Ссылки:



    Видео:



    Описание:
    Вступительный урок в ходе которого мы скачаем и установим необходимое программное обеспечение, и немного разберём возможности и интерфейс среды разработки RStudio.


    Тест
    Ссылка на тест для проверки знаний.




    Урок 2: Основные структуры данных в R


    Дата публикации: 30 марта 2020


    Ссылки:



    Видео:



    Описание:
    Этот урок поможет вам разобраться с тем, какие структуры данных есть в языке R. Мы подробно разберём векторы, дата фреймы и списки. Научимся их создавать и обращаться к их отдельным элементам.


    Тест
    Ссылка на тест для проверки знаний.




    Урок 3: Чтение данных из TSV, CSV, Excel файлов и Google Таблиц


    Дата публикации: 6 апреля 2020


    Ссылки:



    Видео:



    Описание:
    Работа с данными, не зависимо от инструмента, начинается с их добычи. В ходе урока используются пакеты vroom, readxl, googlesheets4 для загрузки данных в среду R из csv, tsv, Excel файлов и Google Таблиц.


    Тест
    Ссылка на тест для проверки знаний.




    Урок 4: Фильтрация строк, выбор и переименование столбцов, пайпланы в R


    Дата публикации: 13 апреля 2020


    Ссылки:



    Видео:



    Описание:
    Этот урок посвящён пакету dplyr. В нём мы разберёмся как фильтровать датафреймы, выбирать нужные столбцы и переименовывать их.


    Также узнаем что такое пайпланы и как они помогают делать ваш код на языке R более читабельным.


    Тест
    Ссылка на тест для проверки знаний.




    Урок 5: Добавление вычисляемых столбцов в таблицу на языке R


    Дата публикации: 20 апреля 2020


    Ссылки:



    Видео:



    Описание:
    В этом видео мы продолжаем знакомство с библиотекой tidyverse и пакетом dplyr.
    Разберём семейство функций mutate(), и научимся с их помощью добавлять в таблицу новые вычисляемые столбцы.


    Тест
    Ссылка на тест для проверки знаний.




    Урок 6: Группировка и агрегация данных на языке R


    Дата публикации: 27 апреля 2020


    Ссылки:



    Видео:



    Описание:
    Данный урок посвящён одной из основных операций анализа данных, группировке и агрегации. В ходе урока мы будем использовать пакет dplyr и функции group_by() и summarise().


    Мы рассмотрим всё семейство функций summarise(), т.е. summarise(), summarise_if() и summarise_at().


    Тест
    Ссылка на тест для проверки знаний.




    Урок 7: Вертикальное и горизонтальное объединение таблиц на языке R


    Дата публикации: 4 мая 2020


    Ссылки:



    Видео:



    Описание:
    Этот урок поможет вам разобраться с операциями вертикального и горизонтального объединения таблиц.


    Вертикальное объединение является аналогом операции UNION в языке запросов SQL.


    Горизонтальное объединение пользователям Excel более известно благодаря функции ВПР, в SQL такие операции осуществляются оператором JOIN.


    В ходе урока мы решим практическую задачу, в ходе которой будем использовать пакеты dplyr, readxl, tidyr и stringr.


    Основные функции которые мы рассмотрим:


    • bind_rows() — вертикальное объединение таблиц
    • left_join() — горизонтальное объединение таблиц
    • semi_join() — включающее объединение таблиц
    • anti_join() — исключающее объединение таблиц

    Тест
    Ссылка на тест для проверки знаний.




    Урок 8: Оконные функции в R


    Дата публикации: 11 мая 2020


    Ссылки:



    Видео:



    Описание:
    Оконные функции по смыслу похожи на агрегирующие, они также принимают на вход массив значений и проводят над ними арифметические операции, но в исходящем результате не изменяют количество строк.


    В этом уроке мы продолжаем изучать пакет dplyr, и функции group_by(), mutate(), а также новые cumsum(), lag(), lead() и arrange().


    Тест
    Ссылка на тест для проверки знаний.




    Урок 9: Вращение таблиц или аналог сводных таблиц в R


    Дата публикации: 18 мая 2020


    Ссылки:



    Видео:



    Описание:
    Большинство пользователей Excel используют сводные таблицы, это удобный инструмент с помощью которого вы можете в считанные секунды превратить массив сырых данных в читабельные отчёты.


    В этом уроке мы разберёмся с тем как вращать таблицы в R, и преобразовывать их из широко формата в длинный и наоборот.


    Большая часть урока посвящена пакету tidyr и функциям pivot_longer() и pivot_wider().


    Тест
    Ссылка на тест для проверки знаний.




    Урок 10: Загрузка JSON файлов в R и преобразование списков в таблицы


    Дата публикации: 25 мая 2020


    Ссылки:



    Видео:



    Описание:
    JSON и XML являются чрезвычайно популярными форматами хранения и обмена информацией, как правило, за счёт своей компактности.


    Но анализировать данные представленные в таких форматах сложно, поэтому их перед анализом необходимо привести к табличному виду, именно этому мы и научимся в данном видео.


    Урок посвящён пакету tidyr, входящему в ядро библиотеки tidyverse, и функциям unnest_longer(), unnest_wider() и hoist().


    Тест
    Ссылка на тест для проверки знаний.




    Урок 11: Быстрое построение графиков с помощью функции qplot()


    Дата публикации: 1 июня 2020


    Ссылки:



    Видео:



    Описание:
    Пакет ggplot2 является одним из наиболее популярных средств визуализации данных не только в R.


    В этом уроке мы научимся построению простейших графиков с помощью функции qplot(), и разберём все её аргументы.


    Тест
    Ссылка на тест для проверки знаний.




    Урок 12: Построение графиков слой за слоем с помощью пакета ggplot2


    Дата публикации: 8 июня 2020


    Ссылки:



    Видео:



    Описание:
    В уроке продемонстрирована вся мощь пакета ggplot2 и заложенной в него грамматики построения графиков слоями.


    Мы разберём основные геометрии которые присутствуют в пакете и научимся накладывать слои для построения графика.


    Тест
    Ссылка на тест для проверки знаний.




    Урок 13: Изменение элементов графика и применение тем в ggplot2


    Дата публикации: 15 июня 2020


    Ссылки:



    Описание:
    Заключительный урок курса посвящён приведению готовых графиков к корпоративному стилю, мы научимся применять готовые темы из пакетов ggthemes и ggthemr, и разберёмся со слоем theme().


    Видео:



    Тест
    Ссылка на тест для проверки знаний.




    Заключение


    Я старался подойти к формированию программы курса максимально лаконично, выделить только самую необходимую информацию которая понадобится вам для того, что бы сделать первые шаги в изучении такого мощного инструмента анализа данных как язык R.


    Курс не является исчерпывающим руководством по анализу данных с помощью языка R, но поможет вам разобраться со всеми необходимыми для этого приёмами.


    Пока программа курса рассчитана на 12 недель, каждую неделю, по понедельникам я буду открывать доступ к новым урокам, поэтому рекомендую подписаться на YouTube канал, что бы не пропустить публикацию нового урока.

    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама

    Комментарии 2

      0
      использует Micrisift Excel и там
        0

        Благодарю, уже исправил эту опечатку.

      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

      Самое читаемое