Pull to refresh
0
New Professions Lab
Обучение в области работы с данными с 2015 г.

Учиться можно увлекательно, учиться можно эффективно

Reading time 4 min
Views 4K
Привет, Хабр! Поднимите руку те, кто уже подустал немного от этого шума, связанного с Big Data?

Мне тоже кажется, что эта тема всем слегка поднадоела уже. Каждую неделю по этой теме вываливается большое количество статей на Хабре, на Medium, на Facebook, на LinkedIn, на куче других тематических сайтов, которые присылают письма на почтовый ящик. Каждый желает поделиться своим опытом, своими мыслями, своими планами, делая этот поток информации невыносимым.

Но если вы согласны с этим, то зачем вы кликнули на этот пост? Что вы ждете от него?

Такова уж реальность, что вы вряд ли получите что-то по-настоящему ценное от среднестатистической статьи. Вспомните, когда такое случалось последний раз, когда вы зашли на какой-нибудь пост или какую-нибудь статью, прочитали ее и пошли сразу менять что-то в своей жизни? Такое случается, когда вы ищите что-то целенаправленно. У вас есть мотивация к этому. У вас что-то не работает, не получается, есть какая-то проблема, или есть какие-то сформулированные желания.

А когда вы поглощаете статьи, новости по определенной тематике просто так? Что это значит?

Может быть, здесь таятся не сформулированные для вас желания?

Может быть, вы ощущаете, что помимо шума что-то в этом есть?

Может быть, вы ощущаете, что за этим будущее, и вы хотите быть частью этого?

Может быть, вы хотите жить на переднем крае технологий, а не ждать, когда волна изменений сметет вас?

Если это так, то сформулируйте это для себя, наконец.

Если это так, то прекратите читать статьи про это “для общего развития”. Они вас никак не приближают к выполнению желания. Они не помогают вам стать ближе к вашей цели. Они просто дают мнимое ощущение движения.

Но если вы действительно этого хотите, вам нужно подходить к этому делу совершенно по-другому.

Наверное, у вас в голове сложилась картинка:

“Ага, мне нужно потратить пару лет на получение фундаментальных знаний: мат. анализ, линейная алгебра, мат. статистика, теория вероятностей, методы оптимизаций, теория алгоритмов и мн. др. После этого я буду готов потратить еще год, осваивая более прикладные вещи: дескриптивный анализ, предиктивный анализ, каузальный анализ, машинное обучение, дата майнинг и мн. др. И только после этого я буду готов решать реальные задачи.”

Воу, воу, полегче.

Такой способ имеет право на жизнь, но очень уж сложный и скучный. У него очень длинная цепь обратной связи. Мало, кто сможет путь осилить в таком виде. Только те, у кого сильно прокачена самодисциплина, те, у кого есть привычка заканчивать начатое, причем неважно насколько нравится этот процесс.

В своей образовательной программе мы подходим по-другому. Мы учим решать реальные задачи, мы учим прикладным вещам, мы даем теорию и фундаментальные знания ровно столько, сколько необходимо для решения реальных задач. И все это за 3 месяца. После этого вы можете изучать фундаментальные вещи сколько угодно. В интернете полно ресурсов для этого. Но они у вас лягут уже совершенно по-другому. Вы будете понимать, зачем это вам. В вашем мозгу будут устанавливаться связи с тем, что вы уже умеете на практике. Такой подход мы считаем эффективнее (и не только мы, андрагогика была придумана еще в 19-20 веке). Плюс вы очень быстро получаете обратную связь.

По итогам первой первой недели вы умеете разворачивать свой кластер из 4 машин и запускать на нем map-reduce job. Можете придти после этого на работу и сказать коллегам: “Я умею делать эту штуку”. Они будут завидовать.

На второй неделе вы учитесь фильтровать пользователей в логах посещений интернет-страниц и класть это в распределенную базу данных, плюс умеете выделять топ-350 url из этих же логов. Все это при помощи map-reduce на кластере.

По итогам третьей недели вы умеете классифицировать пользователей по логу посещений при помощи эвристических правил, а также находить релевантные домены для автомобилистов. Это означает, что на этих сайтах можно давать рекламу автомобилей! Используемая технология: map-reduce и hive.

На четвертой неделе вы учитесь прогнозировать отток клиентов банка. Для этого используются инструменты machine learning.

Пятая неделя. Вы умеете классифицировать отзывы к фильмам на позитивные и негативные, а также определять схожесть вакансий. Для этого вы используете машинное обучение и технологии работы с текстами.

По итогам шестой недели вы умеете определять пол и возраст человека исходя из его истории посещения сайтов, используя машинное обучение и map-reduce парадигму обработки данных.

На этом заканчивается наш первый модуль. Вы уже умеете решать с десяток реальных задач.

Второй модуль у нас посвящен рекомендательным системам.

Седьмая неделя. Вы умеете подбирать неперсонализированные рекомендации к фильмам: различного рода топы и рейтинги. Это вы делаете уже на другом инструменте работы с большими данными — Apache Spark.

По итогам восьмой недели вы умеете строить рекомендации онлайн-курсов, исходя из схожести их описаний. Инструмент: Spark.

На девятой неделе вы учитесь делать коллаборативные рекомендации. Это означает, что вы умеете предлагать пользователям те товары, которые покупают похожие на них люди. Либо другой вариант, когда вы предлагаете те товары, которые по каким-то причинам покупаются вместе, одними и теми же пользователями. Используете для решения этих задач опять же Spark.

Десятая неделя. Вы пытаетесь построить наилучшую рекомендательную систему фильмов, соревнуясь друг с другом в ее качестве. Используете для этого Spark.

По итогам одиннадцатой недели вы умеете делать real-time обработку твитов.

Двенадцатая неделя. Последняя лабораторная работа. Вы строите рекомендательную систему для интернет-магазина. У вас есть список товаров, к которым нужно что-то стоящее порекомендовать. Вы можете использовать здесь абсолютно любые подходы, которые уже изучили к этому времени.

Выпускной. Вы ходите с выпученными глазами, не понимая, как вам вообще удалось за такой короткий промежуток времени научиться решать такое количество реальных задач. После этого у вас в голове появляется четкая установка: “Для меня нет ничего невозможного. Я способен освоить любое новое дело.” И мы сознательно спроектировали программу, чтобы вы выходили с таким ощущением.

В общем, учиться можно увлекательно, учиться можно эффективно!

Среди наших выпускников (их уже около 200 человек) есть даже те люди, которые до нашей программы вообще не программировали, но по итогам программы смогли попасть в топ-5 лучших студентов.

Так что нет ничего невозможно, если вы действительно чего-то хотите! Вспомните, зачем вы решили прочитать эту статью.
Tags:
Hubs:
-3
Comments 7
Comments Comments 7

Articles

Information

Website
newprolab.com
Registered
Founded
Employees
Unknown
Location
Россия
Representative
Артем Пичугин