«Специалист по большим данным»: учебная программа от «Лаборатории новых профессий»

    Сегодня я рад презентовать на Хабре образовательную программу «Специалист по большим данным» — интенсивный трехмесячный курс «Лаборатории новых профессий» для разработчиков и экспертов по IT-инфраструктуре, которые хотят войти в быстро в растущую индустрию Big Data.



    Самая горячая профессия в IT
    Несколько слов о нас: «Лаборатория новых профессий» это образовательный проект Digital October. Мы исследуем рынок труда, находим перспективные быстро развивающиеся ниши в области IT и digital и разрабатываем учебные программы, нацеленные на сложившихся профессионалов, которые хотят сделать быстрый скачок в карьере вместе с растущей индустрией.

    Отрасль Big Data дает простор для такого скачка. После всплеска интереса к большим данным и волны первых разочарований, технология начинает находить применение в широком круге реальных проектов. К примеру, в декабре Яндекс объявил о запуске Yandex Data Factory, а на прошлой неделе очередной стартап в области Big Data получил $56 миллионов долларов инвестиций.

    Международные источники тоже оптимистичны: IDC называет большие данные одним из важнейших технологических трендов 2015, а авторитетный журнал Inc. включает Big Data в топ 6 важнейших технологических компетенций этого года. Рекрутинговый сервис Glassdoor и вовсе назвал Data Scientist самой горячей IT-профессией 2015 года.

    И самое главное: в России несмотря на кризис тоже огромный спрос на специалистов по Big Data — это мы узнали эмпирическим путем. Еще на начальных этапах подготовки программы к нам стали обращаться ведущие технологические компании в поиске сотрудников, специализирующихся на больших данных. Сейчас у нас есть шесть конкретных предложений от компаний (это банки, ритейл и мобильные операторы), готовых взять на борт наших выпускников. В общем, время для входа в отрасль самое благоприятное.


    Если рассматривать Big Data на кривой зрелости (hype cycle), о которой не так давно писал Хабр, сейчас технология находится на стадии «склона просвещения»

    Обучение через практику
    Итак, цель нашей программы — научить разработчиков и технических специалистов на практике решать важнейшие задачи, которыми занимаются специалисты по Big Data. Подобный подход отражается в структуре курса. Курс состоит из трех конкретных кейсов, каждый из которых занимает 1 месяц. Это:
    • Анализ социальных графов
    • Создание мультиклассных классификаторов на основе анализа веб-логов
    • Разработка рекомендательных систем

    С нашей точки зрения, это самые важные задачи в области анализа данных, и мы обеспечим студентам полное погружение в каждую тему.

    Преподают только представители индустрии
    Наши преподаватели — опытные практики, которые своими руками создают приложения на основе больших данных. Вести занятия на курсе в разное время будут Валерий Топинский (экc-Яндекс, ШАД), Константин Круглов (основатель Data-Centric Alliance), Киншук Мишра (Spotify) и другие люди из ведущих российских и международных компаний, использующих в работе Big Data. Индустрия меняется очень стремительно, и мы даем навыки и умения, актуальные прямо сейчас.

    Каждый слушатель также получит персонального тьютора, который будет регулярно отслеживать прогресс в выполнении лабораторных работ, смотреть код, помогать с поисками решений и давать обратную связь.


    СEO «Лаборатории новых профессий» Дмитрий Репин (справа) и директор образовательных программ Александр Турилин открывают занятие

    Kaggle, реальные массивы данных и мастер-классы
    Каждый из кейсов в нашей программе преподается в три этапа. Сначала студенты учатся видеть общие закономерности и разбирают хорошо проработанные задачи из Kaggle. Дальше выполняют самостоятельные проекты с реальными данными под руководством тьюторов. К примеру, в рамках второго кейса студенты попробуют оптимизировать алгоритмы показа рекламы в системе Data-Centric Alliance — а тот, кто добьется хороших результатов, не только получит одобрение преподавателей, но и сможет полностью отбить стоимость обучения.

    На первых двух этапах студентам даются практические навыки по полному циклу работы с большими данными. Это:
    • Развертывание Hadoop/HDFS/HBase
    • Предобработка и очистка данных
    • Построение модели предсказания
    • Выбор оптимального алгоритма машинного обучения
    • Калибровка модели

    Третья часть кейса позволяет познакомиться с готовыми инструментами и лучшими практиками. Спикеры из Яндекса, Сбертеха, Spotify, МТС, IBM, Cloudera будут проводить мастер-классы и рассказывать, как собирают, хранят и используют большие данные в их компаниях. В этом блоке студенты смогут оценить, насколько специфика данных в различных индустриях влияет на выбор инструментов и алгоритмов анализа.

    Собеседование после окончания курса
    Как было сказано выше, пока мы готовили курс к нам обратилось сразу несколько компаний в надежде найти специалистов по большим данным. Каждый студент, который успешно выполнит итоговые квалификационные задания (к слову, непростые), получит возможность пройти собеседование. Стратегические партнеры программы — Сбербанк-Технологии и Data-Centric Alliance, они готовы принять на работу большое количество квалифицированных людей. Мы будем внимательно следить за успехами и предпочтениями каждого студента, чтобы помочь найти работу, соответствующую его интересам и компетенции.



    Онлайн как оффлайн
    Еще одна приятная фишка — возможность учиться из любой точки мира, нисколько не теряя в качестве. Занятия проходят в центре Digital October три раза в неделю по вечерами, но в них можно принять участие и удаленно. Студенты, проходящие обучения в онлайне, ощущают себя полноценными участниками занятий благодаря профессиональной многокамерной съемке — в режиме видеоконференции можно задавать вопросы преподавателю и активно принимать участие в дискуссии. Также записи всех занятий доступны студентам в личном кабинете.

    Наши требования к студентам
    Сейчас в России есть несколько образовательных проектов для тех, кто хочет связать свою жизнь с большими данными — это “Школа анализа данных” Яндекса и магистерская программа “Системы больших данных” в Вышке — правда, они длятся по несколько лет и ориентированы на студентов и недавних выпускников.

    Мы же, напротив, ориентируемся на сложившихся профессионалов, которые хотят совмещать учебу с работой. Курс получился сложным и насыщенным, новичкам он не подойдет. Мы мы честно предупреждаем, что на программе «Специалист по большим данным» придется работать очень интенсивно — как в классе, так и за его пределами, и ждем подготовленных слушателей. Минимальные требования такие:
    • Хорошие рабочие знания по основам теории вероятностей и математической статистики
    • Опыт разработки приложений от 2-х лет
    • Также (очень желательно) знать основы теории машинного обучения.

    P.S. А еще мы подумали, что стоит дать пяти талантливым молодым разработчикам шанс поступить на программу бесплатно. Так родился конкурс Big Data Young Champion. Условия участия смотрите на нашей странице в Facebook.

    New Professions Lab

    94,00

    Обучение в области работы с данными с 2015 г.

    Поделиться публикацией
    Комментарии 14
      0
      А какие требования к будущим студентам подобных курсов?
        0
        Общие требования такие:
        • Хорошие рабочие знания по основам теории вероятностей и математической статистики
        • Опыт разработки приложений от 2-х лет
        • Также (очень желательно) знать основы теории машинного обучения.


        Нужно не боятся технологий и иметь соответствующий бэкграунд.
          0
          Написал письмо. Есть ограничения какие-то по языку программирования? И есть ли какая-то оценка баланса между прикладной и академической стороной курса?
          0
          Ограничений по языку программирования нет, в курсе баланс смещен в сторону практики — как на практике научится решать сходные задачи с использованием доступных инструментов.
            0
            Хорошие рабочие знания по основам теории вероятностей и математической статистики.

            Хотелось бы уточнить, какие разделы действительно необходимы и достаточно ли давно забытых знанией с первого курса университета?
              +1
              Вспомните фундаментальные понятия и ключевые свойства распределений, достаточно в рамках курса Udacity — www.udacity.com/course/st101
              +1
              Звучит как Бизнес Молодость
                0
                Не могли бы вы пояснить?
                  0
                  Возможно комментатор имеет ввиду, что пост написан в стиле постов модных ныне сообществ типа «Бизнес молодость» и прочих с их «Лендинги»,«CRM», «Мотивация».
                  «Будь крутым, с вас 5000, но можно 4500 если приведешь 3 друга»
                  Но в целом понятно откуда ценообразование, после просмотра тех людей, которые читают.
                  Отписался на получение стипендии :)
                +3
                Несколько замечаний:

                1) > Еще одна приятная фишка — возможность учиться из любой точки мира, нисколько не теряя в качестве.
                Некорректно — житель из таймзоны с разницей более 4 часов уже теряет в качестве — ему доступны только записи, но не рилтайм.

                2) Я правильно посчитал, что минимальная стоимость за человека — $2500?
                Выглядит как дороговато за 1 четверть / 6 пар в неделю. Особенно онлайн.

                3) > Андрей Себрант, директор по маркетингу Яндекс
                При всем уважении, а что маркетолог делает в качестве основных фигур курса для технических специалистов?

                  0
                  Некорректно — житель из таймзоны с разницей более 4 часов уже теряет в качестве — ему доступны только записи, но не рилтайм.

                  Не вижу никакой проблемы в том, чтобы послушать онлайн курсы с 23:00 до 2:00 (а не с 19:00 до 22:00), например. Уже несколько раз проходил онлайн курсы в подобном режиме и всё ок. Думаю, что +5 или +6 часов тоже нормально будет, а вот потом уже проблемы начнутся)
                    0
                    1) да есть ограничения, но соглашусь с коллегой ниже
                    2) да, все верно, но речь не в лекциях — а в практических занятиях и выполнении лабораторных работ вместе с тьютором
                    3) Андрей высказал свою оценку важности Big Data (и мы ему благодарны за это!), основные преподаватели — разработчики и аналитики, занимающиеся Data Science из России и США
                    0
                    Ваш проект skillfactory мертв?
                      0
                      Да, проект закрылся в августе.

                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                    Самое читаемое