В прошлом году директор центра Big Data МТС Виктор Кантор вошел в рейтинг Forbes самых перспективных россиян до 30 лет. Специально для блога МТС руководитель образовательного проекта MTC — МТС.Teta Савва Демиденко побеседовал с Виктором о его пути в мир больших данных — от обучения в МФТИ до работы в МТС, о том, зачем специалисту преподавать, а также о нашем образовательном проекте.
Савва: Давай начнем с твоей учебы. Я знаю, что ты учился в МФТИ. Ты туда поступал целенаправленно?
Виктор: В МФТИ у меня училась двоюродная сестра. Я родом из небольшого города Губкина с населением в 70 000 жителей, расположенного возле железорудного карьера. Часто рассказываю каламбур, что после 18 лет всем жителям Губкина намекают, что пора задуматься о карьере, имея в виду этот карьер. Поэтому я очень хотел получить хорошее образование, чтобы разнообразить свой путь. Был пример сестры и ее мужа, у которых в жизни все хорошо сложилось, мне хотелось так же. Я успешно выступал на школьных олимпиадах и очень любил — и люблю по сей день — физику, поэтому пошел в МФТИ.
Савва: Сложно ли было поступать?
Виктор: Сложно, но я решил поступать в МФТИ в девятом классе и у меня было три года на подготовку. Очень помогло то, что мне в принципе нравилось учиться.
Савва: Начало обучения в вузе было спокойным?
В первом семестре было время, когда я несколько недель подряд спал по два часа, потому что ночами сидел в читальном зале. В родном городе у меня не было доступа к такому объему информации по математике и физике, а тут он внезапно появился и меня понесло.
В отличие от моего поколения, нынешние абитуриенты окончательно научились пользоваться интернетом. Я думал, что если старых крутых учителей советской закалки постепенно становится меньше, то меньше людей из нашего города будет поступать в МФТИ. И тут я узнаю, что в МФТИ поступил человек, когда-то участвовавший в выездной олимпиаде, которую я привозил в родной город. Я его спрашиваю: «А как ты попал в МФТИ, как это возможно?». И он мне говорит: «Я просто гуглил. Надо ЕГЭ решить? Я погуглил, научился решать все типы задач, сдал ЕГЭ и поступил в МФТИ». Это уже совершенно другой майндсет.
Савва: Чуть ранее ты сказал, что «привозил олимпиаду в свой город». Зачем тебе это?
Виктор: Мне просто хотелось, чтобы другие ребята из моего города тоже могли попасть в хороший вуз.
Савва: Есть мнение, что МФТИ входит в тройку лучших вузов и стоит рядом с ШАД (Школа анализа данных) и МГУ (Московский государственный университет). Это так?
Виктор: Это правда, но все же они немного разные.
Я считаю, что при современном уровне развития data science ee нужно начинать изучать в бакалавриате, а ШАД по своему позиционированию ближе к магистратуре. Этим я никоим образом не хочу принизить ШАД, он очень крутой, я там с удовольствием учился и преподавал, просто сейчас то, что раньше можно было рассказывать в магистратуре про data science, хорошо бы уже перетащить в бакалавриат. Выросли объемы накопленных знаний.
Мне кажется, в бакалавриате должны остаться какие-то фундаментальные вещи. Например, как устроены natural language processing и computer vision, какие в них есть подходы. А в магистратуре уже нужна практика, показывающая, как применить все это, чтобы в итоге получился какой-то клевый продукт.
Савва: Был ли у тебя любимый предмет в МФТИ?
Виктор: Да, теорфиз. Представь, что есть предмет про физику, в котором нет никаких ограничений на применяемый матаппарат, и ты при этом любишь математику.
Савва: Как ты думаешь, сильно ли комьюнити внутри МФТИ? Я слышал много историй, что люди дружат, помогают друг другу после выпуска. Я больше нигде такого не видел.
Виктор: Сообщество и правда есть, но я бы не сказал, что оно какое-то единое. Скорее, это множество небольших групп физтехов, которые пытаются поддерживать друг друга и сам Физтех. Есть различные фонды целевого капитала, пожертвования выпускников. Мы, кстати, с коллегами недавно скидывались на новый фонд, который должен обеспечить какие-то базовые потребности студентам: интернет, проезд в электричках и так далее.
Еще что касается коммьюнити — есть проблема сильной ассоциированности людей с хорошим местом, в которое они попали. Появляется мнение, что «все, кто учились на Физтехе — очень крутые». В итоге это выглядит довольно стремно. Физтех — действительно классное место, но это не значит, что любой выпускник автоматически становится крутым только потому, что он в этом сообществе. Как говорится, не место красит человека, а человек — место.
Савва: А что думаешь о Вышке (Высшая Школа Экономики)?
Виктор: Вышка очень крутая, мне она нравится. У них современный и деловой подход к образованию.
Есть места, где преподавание воспринимается как призвание: это нельзя никак оценивать, это своего рода искусство. Но образование — это услуга, и она должна оказываться качественно.
В Вышке это очень хорошо понимают. А еще там понимают, что для качественного оказания этой услуги нужно привлекать крутых экспертов, работа которых должна хорошо оплачиваться. И что не нужно сильно регулировать этот процесс, слишком его бюрократизировать: некоторая доля свободомыслия приводит к тому, что люди более творчески относятся к работе.
Савва: А что у тебя было после обучения?
Виктор: После — это не совсем правильная формулировка, потому что люди начинают работать еще в универе. Сначала мы с ребятами делали один стартап, потом другой, и все они были про data science и обработку текстов.
В МФТИ на моем факультете был предмет-акселератор, на котором нужно было сделать и запустить свой технологический стартап. Это было забавно, если учесть, что остальную учебную нагрузку с тебя не снимали.
Все эти стартапы, конечно, проваливались, кроме тех, чьи основатели занимались своим проектом, забив на учебу. И это на самом деле правильно, что люди смогли расставить приоритеты. Спустя годы я понял, что намного круче делать что-то, когда ты это умеешь. Поэтому не удивительно, что те студенческие поделки, как правило, ничем не заканчивались: мы всему только учились.
Для меня путь data science стартапа был тяжелым. Первые два года у меня ничего не выходило, потом начало немного получаться, но добираться до этого момента было очень больно. Передо мной стояли unsupervised задачи без какой-либо разметки, без возможности обучить алгоритм с учителем. А это означает, что решались они плохо.
После «университетского стартапа», который мы закрыли, я пошел работать C++ разработчиком в ABBYY. Стоит сказать, что я обожаю «плюсы», это потрясающий язык, но одно дело — решать на C++ учебные задачи или «прогать» алгоритм, и совсем другое — когда просто надо сделать первый класс, второй класс и то, как они будут друг с другом взаимодействовать. Творчества в этом, мягко говоря, немного, и я заскучал.
Потом меня захантили в отдел образовательных проектов ABBYY, в котором я отвечал за работу с кафедрами в МФТИ, кафедрами по компьютерной лингвистике, распознаванию изображений, но не кодил и не занимался data science. В это время я получил оффер от Яндекс Data Factory и практически ушел туда, но меня удержали, предложив: давай ты 50% времени будешь заниматься преподаванием и столько же — машинным обучением.
Савва: Это же идеальный расклад.
Виктор: Да, это было супер-идеально. Еще был забавный момент — примерно тогда же мне написали из Google с предложением пообщаться о работе. Я был молод и горяч, и радостно им ответил: «знаете, я не думаю, что Google в состоянии предложить мне что-нибудь столь же интересное, как компания ABBYY». Думаю, что я до сих пор в каких-нибудь черных списках, потому что больше за всю мою жизнь мне Google никогда не писал. Это было весело, в этом был свой шарм.
Но несмотря на контр-предложение от ABBYY, в моих задачах были определенные недостатки, а Яндекс был очень находчив в том, чтобы предлагать какие-то варианты, и в итоге я оказался в Яндекс Data Factory.
Не прошло и полгода, как меня «апнули» и дальше я занимался всякими рекомендательными системами, заказными проектами по машинному обучению, участием в различных коммерческих тендерах. Позже я перешел в Яндекс.Такси уже как Chief Data Scientist. Мы росли и много всего клевого сделали.
Поработав в Яндексе, я обратил внимание на сферу корпоративного образования. Занимался обучением, немного консультировал. Это был крутой опыт.
В какой-то момент я подумал, что, наверное, стоит немного посмотреть рынок труда, не отвечать на все предложения отказами. Так я познакомился с МТС Банком, которому нужно было обновить скоринговую модель, и Mail.ru, где была задача за два-три месяца запустить Академию больших данных.
С банком я начал работу на подряде, просто чтобы руками что-то сделать. К тому времени я уже давненько с таким не сталкивался и тосковал. Думал так: «неужели я уже стал совсем никчемным и ничего сделать не могу, надо поработать руками».
Савва: И как, руки помнят?
Виктор: Руки-то помнят, но я работал с тем, что оставили другие люди в наследство. Думаю, что те, кто хоть раз разбирал чужой код, поймут мои эмоции. Было тяжело, но очень поучительно. Саму скоринговую модель мои предшественники построили очень хорошо, она работала стабильно и практически не устаревала. Затем в какой-то момент появился большой МТС, и меня очень деликатно захантили. Но и Академию больших данных уже к тому времени успел запустить.
Савва: Чем именно ты сейчас занимаешься в МТС?
Виктор: Сейчас я отвечаю за все направление Big Data, официально моя должность называется директор центра Big Data. По смыслу это, наверное, CDO — человек, который отвечает за то, какие данные мы собираем, как ими распоряжаемся, монетизируем, и так далее.
У меня большая команда – больше 300 человек – из людей самых разных специальностей, не только data scientists. И у нас огромный пласт задач.
Если говорить про направления работы, то есть, конечно, телеком и те продукты экосистемы МТС, которые существуют уже давно. Еще есть финтех, геоаналитика, задачи для медиасервисов, и некоторые совсем смелые эксперименты из разряда автоматизации внешнего найма с помощью ML и тому подобные вещи. Они могут не быть какими-то супер-прибыльными, но мы верим в их потенциал: либо они усилят экосистему МТС, либо рынок вырастет и будет интересным и доходным.
Савва: Где найти столько умных людей, чтобы они этим занимались?
Виктор: С момента возникновения направления Big Data в МТС нанимали много умных людей из хороших вузов. Но так делать можно, когда ты хантишь джуна или начинающего мидла, когда ты хантишь сеньоров или лидов, тут уже нужно знать их поименно, отслеживать их текущее карьерное состояние, и как только есть возможность — приглашать. Это уже ручная работа.
Савва: То есть нужно создать какое-то коммьюнити, в котором бы люди были, и желательно поближе к МТС?
Виктор: Мне кажется, это спорный вопрос, потому что в современном мире людям сложно любить коммьюнити, которое ближе к какой-то одной компании. Все как-то за свободу, за открытость. Но все же такие коммьюнити должны появляться. Потому сейчас у всех компаний, где есть крутые специалисты, есть такие сообщества, и есть свои школы. И мне кажется, это хорошо, потому что дает больше возможностей для образования и больше перспектив развития.
Кстати, о перспективах и возможностях. МТС запустила новую программу долгосрочной мотивации участников продуктовых команд и наиболее эффективных сотрудников. Мотивируют работников с помощью реальных акций компании. В 2022 году в программе примут участие ИТ-эксперты и менеджеры цифровых продуктов МТС. Так вот, держатели акций получат приятный финансовый бонус к зарплате и еще один стимул создавать крутые продукты.
Савва: В МТС тоже появилась недавно своя школа, МТС.Тета, ты приложил к ней руку. Расскажешь про это?
Виктор: В Тете я отвечаю за направление data science. Оказываю посильную помощь с поиском преподавателей, составлением программы и пытаюсь понять, как вложить в обучение немножко нашей специфики.
Мне хотелось бы нести мысль, что у наших студентов есть возможность не просто что-то крутое сделать: нейронку обучить или классные алгоритмы прописать. С их помощью можно сделать что-то полезное для людей в осязаемом бизнесе, который развивается длительное время.
Савва: Ты читаешь студентам лекции?
Виктор: Конечно. Во-первых, мне интересно знакомиться со студентами, ведь для меня главное — это люди. Неважно, в обучении или в работе. Меня дико мотивируют люди, с которыми я работаю, мне хочется понять, чем они живут, что им интересно, почему они пришли сюда, чего им хочется в дальнейшем.
Во-вторых, я безумно люблю преподавать. Серьезно, я просто улетаю в какой-то космос, когда веду лекцию или семинар, в этот момент вообще все проблемы уходят куда-то в никуда.
У меня бывает такое, что после занятия я думаю: так, а что это я такой радостный? Вообще-то все довольно плохо, нужно вот здесь решать, здесь решать, а здесь вообще непонятно, что делать. Но потрясающее чувство окрыленности никуда невозможно деть — это просто фантастика.
Савва: Есть ли какая-то романтика в преподавании?
Виктор: Есть, и она для меня немножко другая, нежели любят люди рассказывать. Говорят обычно про то, что ты другим что-то даешь, влияешь на их судьбы.
Я лично вижу это как перекладывание ответственности, потому что вместо того, чтобы пользоваться знанием, которое у тебя есть, ты отдаешь его другим, как горячую картошку перекидываешь — давайте, разбирайтесь с этим знанием.
Долгое время я не мог для себя ответить на вопрос: ну как же так, это получается не совсем ответственно. Но дело в том, что машинное обучение действительно можно использовать в миллионе разных мест. Будем запускать мы корабли в космос, лечить рак или развивать еще что-то через 10 лет — даже не могу представить, что это может быть — везде может машинное обучение пригодиться. Когда ты сам работаешь в какой-то области, ты свое знание применяешь узко в одном месте. А когда ты этим знанием делишься, то в итоге используешь его в куче областей. Поэтому, когда ты читаешь лекцию, ты, может, на одну стопятьсотмиллионную запускаешь корабль в космос. И это прикольно.
Савва: Я знаю, что ты сделал свой курс по data science. Можешь чуть-чуть о нем рассказать?
Виктор: Изначально это все начиналось как спецкурс на физтехе, а я ассистировал человеку, который его запускал и, собственно, меня привел в data science. В какой-то момент ему уже стало некогда, я начал вести курс самостоятельно и дал ему название “Data Mining in Action” (DMIA).
Data Mining — это как раз интеллектуальный анализ данных, сейчас это слово не в моде, потому что появилось “Data Science”. Периодически в науке случаются ребрендинги, чтобы деньги по-прежнему выделялись на какие-то направления, а курс мы ребрендить не можем, потому что все уже запомнили как DMIA.
Курс просуществовал девять лет, потом у нас был перерыв на пандемию, и сейчас мы переосмысляем формат.
Когда курсом занимался только я один, это было достаточно «наколеночно». По-настоящему курс развился, когда ко мне присоединились другие ребята, которые начали вести отдельные направления, и когда ко мне присоединилась Эмели Драль, с которой мы вместе записывали специализацию по машинному обучению на Coursera. Вот она очень круто забустила наш курс, он в итоге стал самостоятельным и переехал в Москву, потому что у нас уже со всей Москвы люди ездили, а мы по-прежнему были в Долгопрудном (где находится физтех).
Савва: Эмели ведь поучаствовала в МТС-овской школе?
Виктор: Да, к счастью, у нас получилось ее уговорить совместными усилиями. Очень редко в одном преподавателе сочетаются и хороший практический опыт, и хороший опыт преподавания. Причем под хорошим практическим я подразумеваю опыт в разных ролях. Если учить студентов будет условный джун, он, конечно, научит и научит очень хорошим и полезным вещам, но это будет совсем не то же самое, нежели учить будет тимлид или опытный дата-сайентист, который еще помнит и может показать, как это все делается руками.
Если мы берем человека, который достаточно большой путь прошел, умеет работать и при этом еще круто преподает — то это просто бриллиант. В случае с Эмели как раз такая история, и я очень надеюсь, что слушатели это оценят. А если не оценят, то со временем поймут, насколько это круто. И я очень надеюсь, что у нас еще получится какое-то количество таких людей привести.
Савва: Какой курс ты можешь посоветовать?
Виктор: Посоветую нашу специализацию на Coursera, которую мы записывали — это если прямо сейчас. Но надо сказать, что у нас, как у преподавателей, есть некоторые обязательства по обновлению контента, и мы в обозримом будущем что-то обновим.
Я бы точно посоветовал специализацию Эндрю Ына по дип-лернингу. Многие говорят, что она недостаточно сильная, недостаточно техническая, но это говорят люди, которые привыкли, что к ним приходит лектор и сразу исписывает всю доску интегралами и тому подобным. Мне кажется, что в простом житейском смысле это очень хорошая специализация. Я точно могу посоветовать любые курсы, которые выйдут у нас в школе, потому что я буду следить за тем, чтобы там все было хорошо.
Савва: По поводу математической базы. Нужна она или нет?
Виктор: Я считаю, что с ней проще. При этом есть люди, которые не очень хорошо разбираются в математике, но хорошие разработчики. А есть люди, которые не очень хорошо разрабатывают, но хорошие математики. От последних часто толку на практике меньше. Ничего плохого не хочу сказать про математиков, они прекрасны, просто в реальности нужно сделать так, чтобы работало, а не так, чтобы это было красиво математически. При этом совместить практическую пользу с математической красотой вполне себе можно, просто нужно правильно приоритизировать цели.
Савва: Бытует такое мнение, что data scientists обычно плохо пишут свой код. Нужно как-то с этим работать?
Виктор: К сожалению, это правда и с этим нужно работать. Потому что чем менее у тебя самостоятельные отдельные боевые единицы, тем сложнее им в ситуации, когда где-то какие-то ресурсы простаивают. Вот, допустим, занят разработчик, нужно что-то допиливать другое срочно, а его ждет data scientist и не может минимально отрефакторить свой код, чтобы как-то можно было аккуратно это в продакшн дотащить. Это не очень хорошо.
Конечно, надо прокачиваться. Но нужно понимать, что когда мы инвестируем свое время во что-то, мы не инвестируем его во что-то другое. Поэтому если выбор стоит между чтением статьи про какой-нибудь особый экзотический вид нейронок, который почти не используется, и практикой в разработке — то лучше поучиться разрабатывать.
А если выбор между разработкой и тем, чтобы разобраться, какие метрики в этой бизнес-задаче имеет смысл использовать, как правильно задизайнить A/B-тест, какой есть опыт у других людей, то лучше дата-сайентист пусть этим занимается, чем прокачивает свои навыки разработки.
Савва: Может ли data scientist жить без английского языка?
Виктор: Может, но будет тяжело. И это актуально не только для Data scientist. Очень много крутых вещей в первую очередь выходит на английском языке. Если ты можешь с ними ознакомиться только тогда, когда они будут переведены на русский, — ты расписываешься в том, что тебе нормально, что ты будешь отставать в своем карьерном развитии на несколько лет.
Савва: Смотри, есть, например, джуниор дата-сайентист, потом миддл, потом лид. Есть ли у лида какие-то дальше пути роста, во что они обычно превращаются?
Виктор: Я как раз был лидом. Сейчас отвечаю за big data непосредственно в подчинении у президента компании, так что, как видишь, в целом карьерные треки могут быть достаточно длинными. Лид может стать chief data scientist, chief data scientist может стать директором по big data или, например, захотеть в более продуктовую историю двинуть. В частности, есть у нас дружественная компания YouDo, в которой chief product officer был chief data scientist.
Савва: Как ты думаешь, как вот эту гибкость воспитать в себе? Ты рождаешься с ней или какие-то дисциплины изучаешь?
Виктор: Она самым естественным образом воспитывается. В некотором смысле через боль, просто если тебе ее не хватает, то тебя никто не пускает дальше.
Как только ты видишь, что тебя чуть-чуть пропустили дальше, ты можешь понять, что, видимо, ты сделал что-то в правильном направлении, либо просто повезло. Но с течением времени все же статистика накапливается. Поэтому когда ты видишь, что есть какой-то карьерный затык — это повод задуматься — «а что я делаю не так?».
Савва: Спасибо, что ответил на наши вопросы!
Виктор: Спасибо и вам, очень приятно было пообщаться!
Видеоверсия полного интервью.
Савва: Давай начнем с твоей учебы. Я знаю, что ты учился в МФТИ. Ты туда поступал целенаправленно?
Виктор: В МФТИ у меня училась двоюродная сестра. Я родом из небольшого города Губкина с населением в 70 000 жителей, расположенного возле железорудного карьера. Часто рассказываю каламбур, что после 18 лет всем жителям Губкина намекают, что пора задуматься о карьере, имея в виду этот карьер. Поэтому я очень хотел получить хорошее образование, чтобы разнообразить свой путь. Был пример сестры и ее мужа, у которых в жизни все хорошо сложилось, мне хотелось так же. Я успешно выступал на школьных олимпиадах и очень любил — и люблю по сей день — физику, поэтому пошел в МФТИ.
Савва: Сложно ли было поступать?
Виктор: Сложно, но я решил поступать в МФТИ в девятом классе и у меня было три года на подготовку. Очень помогло то, что мне в принципе нравилось учиться.
Савва: Начало обучения в вузе было спокойным?
В первом семестре было время, когда я несколько недель подряд спал по два часа, потому что ночами сидел в читальном зале. В родном городе у меня не было доступа к такому объему информации по математике и физике, а тут он внезапно появился и меня понесло.
В отличие от моего поколения, нынешние абитуриенты окончательно научились пользоваться интернетом. Я думал, что если старых крутых учителей советской закалки постепенно становится меньше, то меньше людей из нашего города будет поступать в МФТИ. И тут я узнаю, что в МФТИ поступил человек, когда-то участвовавший в выездной олимпиаде, которую я привозил в родной город. Я его спрашиваю: «А как ты попал в МФТИ, как это возможно?». И он мне говорит: «Я просто гуглил. Надо ЕГЭ решить? Я погуглил, научился решать все типы задач, сдал ЕГЭ и поступил в МФТИ». Это уже совершенно другой майндсет.
Савва: Чуть ранее ты сказал, что «привозил олимпиаду в свой город». Зачем тебе это?
Виктор: Мне просто хотелось, чтобы другие ребята из моего города тоже могли попасть в хороший вуз.
Савва: Есть мнение, что МФТИ входит в тройку лучших вузов и стоит рядом с ШАД (Школа анализа данных) и МГУ (Московский государственный университет). Это так?
Виктор: Это правда, но все же они немного разные.
Я считаю, что при современном уровне развития data science ee нужно начинать изучать в бакалавриате, а ШАД по своему позиционированию ближе к магистратуре. Этим я никоим образом не хочу принизить ШАД, он очень крутой, я там с удовольствием учился и преподавал, просто сейчас то, что раньше можно было рассказывать в магистратуре про data science, хорошо бы уже перетащить в бакалавриат. Выросли объемы накопленных знаний.
Мне кажется, в бакалавриате должны остаться какие-то фундаментальные вещи. Например, как устроены natural language processing и computer vision, какие в них есть подходы. А в магистратуре уже нужна практика, показывающая, как применить все это, чтобы в итоге получился какой-то клевый продукт.
Савва: Был ли у тебя любимый предмет в МФТИ?
Виктор: Да, теорфиз. Представь, что есть предмет про физику, в котором нет никаких ограничений на применяемый матаппарат, и ты при этом любишь математику.
Савва: Как ты думаешь, сильно ли комьюнити внутри МФТИ? Я слышал много историй, что люди дружат, помогают друг другу после выпуска. Я больше нигде такого не видел.
Виктор: Сообщество и правда есть, но я бы не сказал, что оно какое-то единое. Скорее, это множество небольших групп физтехов, которые пытаются поддерживать друг друга и сам Физтех. Есть различные фонды целевого капитала, пожертвования выпускников. Мы, кстати, с коллегами недавно скидывались на новый фонд, который должен обеспечить какие-то базовые потребности студентам: интернет, проезд в электричках и так далее.
Еще что касается коммьюнити — есть проблема сильной ассоциированности людей с хорошим местом, в которое они попали. Появляется мнение, что «все, кто учились на Физтехе — очень крутые». В итоге это выглядит довольно стремно. Физтех — действительно классное место, но это не значит, что любой выпускник автоматически становится крутым только потому, что он в этом сообществе. Как говорится, не место красит человека, а человек — место.
Савва: А что думаешь о Вышке (Высшая Школа Экономики)?
Виктор: Вышка очень крутая, мне она нравится. У них современный и деловой подход к образованию.
Есть места, где преподавание воспринимается как призвание: это нельзя никак оценивать, это своего рода искусство. Но образование — это услуга, и она должна оказываться качественно.
В Вышке это очень хорошо понимают. А еще там понимают, что для качественного оказания этой услуги нужно привлекать крутых экспертов, работа которых должна хорошо оплачиваться. И что не нужно сильно регулировать этот процесс, слишком его бюрократизировать: некоторая доля свободомыслия приводит к тому, что люди более творчески относятся к работе.
Савва: А что у тебя было после обучения?
Виктор: После — это не совсем правильная формулировка, потому что люди начинают работать еще в универе. Сначала мы с ребятами делали один стартап, потом другой, и все они были про data science и обработку текстов.
В МФТИ на моем факультете был предмет-акселератор, на котором нужно было сделать и запустить свой технологический стартап. Это было забавно, если учесть, что остальную учебную нагрузку с тебя не снимали.
Все эти стартапы, конечно, проваливались, кроме тех, чьи основатели занимались своим проектом, забив на учебу. И это на самом деле правильно, что люди смогли расставить приоритеты. Спустя годы я понял, что намного круче делать что-то, когда ты это умеешь. Поэтому не удивительно, что те студенческие поделки, как правило, ничем не заканчивались: мы всему только учились.
Для меня путь data science стартапа был тяжелым. Первые два года у меня ничего не выходило, потом начало немного получаться, но добираться до этого момента было очень больно. Передо мной стояли unsupervised задачи без какой-либо разметки, без возможности обучить алгоритм с учителем. А это означает, что решались они плохо.
После «университетского стартапа», который мы закрыли, я пошел работать C++ разработчиком в ABBYY. Стоит сказать, что я обожаю «плюсы», это потрясающий язык, но одно дело — решать на C++ учебные задачи или «прогать» алгоритм, и совсем другое — когда просто надо сделать первый класс, второй класс и то, как они будут друг с другом взаимодействовать. Творчества в этом, мягко говоря, немного, и я заскучал.
Потом меня захантили в отдел образовательных проектов ABBYY, в котором я отвечал за работу с кафедрами в МФТИ, кафедрами по компьютерной лингвистике, распознаванию изображений, но не кодил и не занимался data science. В это время я получил оффер от Яндекс Data Factory и практически ушел туда, но меня удержали, предложив: давай ты 50% времени будешь заниматься преподаванием и столько же — машинным обучением.
Савва: Это же идеальный расклад.
Виктор: Да, это было супер-идеально. Еще был забавный момент — примерно тогда же мне написали из Google с предложением пообщаться о работе. Я был молод и горяч, и радостно им ответил: «знаете, я не думаю, что Google в состоянии предложить мне что-нибудь столь же интересное, как компания ABBYY». Думаю, что я до сих пор в каких-нибудь черных списках, потому что больше за всю мою жизнь мне Google никогда не писал. Это было весело, в этом был свой шарм.
Но несмотря на контр-предложение от ABBYY, в моих задачах были определенные недостатки, а Яндекс был очень находчив в том, чтобы предлагать какие-то варианты, и в итоге я оказался в Яндекс Data Factory.
Не прошло и полгода, как меня «апнули» и дальше я занимался всякими рекомендательными системами, заказными проектами по машинному обучению, участием в различных коммерческих тендерах. Позже я перешел в Яндекс.Такси уже как Chief Data Scientist. Мы росли и много всего клевого сделали.
Поработав в Яндексе, я обратил внимание на сферу корпоративного образования. Занимался обучением, немного консультировал. Это был крутой опыт.
В какой-то момент я подумал, что, наверное, стоит немного посмотреть рынок труда, не отвечать на все предложения отказами. Так я познакомился с МТС Банком, которому нужно было обновить скоринговую модель, и Mail.ru, где была задача за два-три месяца запустить Академию больших данных.
С банком я начал работу на подряде, просто чтобы руками что-то сделать. К тому времени я уже давненько с таким не сталкивался и тосковал. Думал так: «неужели я уже стал совсем никчемным и ничего сделать не могу, надо поработать руками».
Савва: И как, руки помнят?
Виктор: Руки-то помнят, но я работал с тем, что оставили другие люди в наследство. Думаю, что те, кто хоть раз разбирал чужой код, поймут мои эмоции. Было тяжело, но очень поучительно. Саму скоринговую модель мои предшественники построили очень хорошо, она работала стабильно и практически не устаревала. Затем в какой-то момент появился большой МТС, и меня очень деликатно захантили. Но и Академию больших данных уже к тому времени успел запустить.
Савва: Чем именно ты сейчас занимаешься в МТС?
Виктор: Сейчас я отвечаю за все направление Big Data, официально моя должность называется директор центра Big Data. По смыслу это, наверное, CDO — человек, который отвечает за то, какие данные мы собираем, как ими распоряжаемся, монетизируем, и так далее.
У меня большая команда – больше 300 человек – из людей самых разных специальностей, не только data scientists. И у нас огромный пласт задач.
Если говорить про направления работы, то есть, конечно, телеком и те продукты экосистемы МТС, которые существуют уже давно. Еще есть финтех, геоаналитика, задачи для медиасервисов, и некоторые совсем смелые эксперименты из разряда автоматизации внешнего найма с помощью ML и тому подобные вещи. Они могут не быть какими-то супер-прибыльными, но мы верим в их потенциал: либо они усилят экосистему МТС, либо рынок вырастет и будет интересным и доходным.
Савва: Где найти столько умных людей, чтобы они этим занимались?
Виктор: С момента возникновения направления Big Data в МТС нанимали много умных людей из хороших вузов. Но так делать можно, когда ты хантишь джуна или начинающего мидла, когда ты хантишь сеньоров или лидов, тут уже нужно знать их поименно, отслеживать их текущее карьерное состояние, и как только есть возможность — приглашать. Это уже ручная работа.
Савва: То есть нужно создать какое-то коммьюнити, в котором бы люди были, и желательно поближе к МТС?
Виктор: Мне кажется, это спорный вопрос, потому что в современном мире людям сложно любить коммьюнити, которое ближе к какой-то одной компании. Все как-то за свободу, за открытость. Но все же такие коммьюнити должны появляться. Потому сейчас у всех компаний, где есть крутые специалисты, есть такие сообщества, и есть свои школы. И мне кажется, это хорошо, потому что дает больше возможностей для образования и больше перспектив развития.
Кстати, о перспективах и возможностях. МТС запустила новую программу долгосрочной мотивации участников продуктовых команд и наиболее эффективных сотрудников. Мотивируют работников с помощью реальных акций компании. В 2022 году в программе примут участие ИТ-эксперты и менеджеры цифровых продуктов МТС. Так вот, держатели акций получат приятный финансовый бонус к зарплате и еще один стимул создавать крутые продукты.
Савва: В МТС тоже появилась недавно своя школа, МТС.Тета, ты приложил к ней руку. Расскажешь про это?
Виктор: В Тете я отвечаю за направление data science. Оказываю посильную помощь с поиском преподавателей, составлением программы и пытаюсь понять, как вложить в обучение немножко нашей специфики.
Мне хотелось бы нести мысль, что у наших студентов есть возможность не просто что-то крутое сделать: нейронку обучить или классные алгоритмы прописать. С их помощью можно сделать что-то полезное для людей в осязаемом бизнесе, который развивается длительное время.
Савва: Ты читаешь студентам лекции?
Виктор: Конечно. Во-первых, мне интересно знакомиться со студентами, ведь для меня главное — это люди. Неважно, в обучении или в работе. Меня дико мотивируют люди, с которыми я работаю, мне хочется понять, чем они живут, что им интересно, почему они пришли сюда, чего им хочется в дальнейшем.
Во-вторых, я безумно люблю преподавать. Серьезно, я просто улетаю в какой-то космос, когда веду лекцию или семинар, в этот момент вообще все проблемы уходят куда-то в никуда.
У меня бывает такое, что после занятия я думаю: так, а что это я такой радостный? Вообще-то все довольно плохо, нужно вот здесь решать, здесь решать, а здесь вообще непонятно, что делать. Но потрясающее чувство окрыленности никуда невозможно деть — это просто фантастика.
Савва: Есть ли какая-то романтика в преподавании?
Виктор: Есть, и она для меня немножко другая, нежели любят люди рассказывать. Говорят обычно про то, что ты другим что-то даешь, влияешь на их судьбы.
Я лично вижу это как перекладывание ответственности, потому что вместо того, чтобы пользоваться знанием, которое у тебя есть, ты отдаешь его другим, как горячую картошку перекидываешь — давайте, разбирайтесь с этим знанием.
Долгое время я не мог для себя ответить на вопрос: ну как же так, это получается не совсем ответственно. Но дело в том, что машинное обучение действительно можно использовать в миллионе разных мест. Будем запускать мы корабли в космос, лечить рак или развивать еще что-то через 10 лет — даже не могу представить, что это может быть — везде может машинное обучение пригодиться. Когда ты сам работаешь в какой-то области, ты свое знание применяешь узко в одном месте. А когда ты этим знанием делишься, то в итоге используешь его в куче областей. Поэтому, когда ты читаешь лекцию, ты, может, на одну стопятьсотмиллионную запускаешь корабль в космос. И это прикольно.
Савва: Я знаю, что ты сделал свой курс по data science. Можешь чуть-чуть о нем рассказать?
Виктор: Изначально это все начиналось как спецкурс на физтехе, а я ассистировал человеку, который его запускал и, собственно, меня привел в data science. В какой-то момент ему уже стало некогда, я начал вести курс самостоятельно и дал ему название “Data Mining in Action” (DMIA).
Data Mining — это как раз интеллектуальный анализ данных, сейчас это слово не в моде, потому что появилось “Data Science”. Периодически в науке случаются ребрендинги, чтобы деньги по-прежнему выделялись на какие-то направления, а курс мы ребрендить не можем, потому что все уже запомнили как DMIA.
Курс просуществовал девять лет, потом у нас был перерыв на пандемию, и сейчас мы переосмысляем формат.
Когда курсом занимался только я один, это было достаточно «наколеночно». По-настоящему курс развился, когда ко мне присоединились другие ребята, которые начали вести отдельные направления, и когда ко мне присоединилась Эмели Драль, с которой мы вместе записывали специализацию по машинному обучению на Coursera. Вот она очень круто забустила наш курс, он в итоге стал самостоятельным и переехал в Москву, потому что у нас уже со всей Москвы люди ездили, а мы по-прежнему были в Долгопрудном (где находится физтех).
Савва: Эмели ведь поучаствовала в МТС-овской школе?
Виктор: Да, к счастью, у нас получилось ее уговорить совместными усилиями. Очень редко в одном преподавателе сочетаются и хороший практический опыт, и хороший опыт преподавания. Причем под хорошим практическим я подразумеваю опыт в разных ролях. Если учить студентов будет условный джун, он, конечно, научит и научит очень хорошим и полезным вещам, но это будет совсем не то же самое, нежели учить будет тимлид или опытный дата-сайентист, который еще помнит и может показать, как это все делается руками.
Если мы берем человека, который достаточно большой путь прошел, умеет работать и при этом еще круто преподает — то это просто бриллиант. В случае с Эмели как раз такая история, и я очень надеюсь, что слушатели это оценят. А если не оценят, то со временем поймут, насколько это круто. И я очень надеюсь, что у нас еще получится какое-то количество таких людей привести.
Савва: Какой курс ты можешь посоветовать?
Виктор: Посоветую нашу специализацию на Coursera, которую мы записывали — это если прямо сейчас. Но надо сказать, что у нас, как у преподавателей, есть некоторые обязательства по обновлению контента, и мы в обозримом будущем что-то обновим.
Я бы точно посоветовал специализацию Эндрю Ына по дип-лернингу. Многие говорят, что она недостаточно сильная, недостаточно техническая, но это говорят люди, которые привыкли, что к ним приходит лектор и сразу исписывает всю доску интегралами и тому подобным. Мне кажется, что в простом житейском смысле это очень хорошая специализация. Я точно могу посоветовать любые курсы, которые выйдут у нас в школе, потому что я буду следить за тем, чтобы там все было хорошо.
Савва: По поводу математической базы. Нужна она или нет?
Виктор: Я считаю, что с ней проще. При этом есть люди, которые не очень хорошо разбираются в математике, но хорошие разработчики. А есть люди, которые не очень хорошо разрабатывают, но хорошие математики. От последних часто толку на практике меньше. Ничего плохого не хочу сказать про математиков, они прекрасны, просто в реальности нужно сделать так, чтобы работало, а не так, чтобы это было красиво математически. При этом совместить практическую пользу с математической красотой вполне себе можно, просто нужно правильно приоритизировать цели.
Савва: Бытует такое мнение, что data scientists обычно плохо пишут свой код. Нужно как-то с этим работать?
Виктор: К сожалению, это правда и с этим нужно работать. Потому что чем менее у тебя самостоятельные отдельные боевые единицы, тем сложнее им в ситуации, когда где-то какие-то ресурсы простаивают. Вот, допустим, занят разработчик, нужно что-то допиливать другое срочно, а его ждет data scientist и не может минимально отрефакторить свой код, чтобы как-то можно было аккуратно это в продакшн дотащить. Это не очень хорошо.
Конечно, надо прокачиваться. Но нужно понимать, что когда мы инвестируем свое время во что-то, мы не инвестируем его во что-то другое. Поэтому если выбор стоит между чтением статьи про какой-нибудь особый экзотический вид нейронок, который почти не используется, и практикой в разработке — то лучше поучиться разрабатывать.
А если выбор между разработкой и тем, чтобы разобраться, какие метрики в этой бизнес-задаче имеет смысл использовать, как правильно задизайнить A/B-тест, какой есть опыт у других людей, то лучше дата-сайентист пусть этим занимается, чем прокачивает свои навыки разработки.
Савва: Может ли data scientist жить без английского языка?
Виктор: Может, но будет тяжело. И это актуально не только для Data scientist. Очень много крутых вещей в первую очередь выходит на английском языке. Если ты можешь с ними ознакомиться только тогда, когда они будут переведены на русский, — ты расписываешься в том, что тебе нормально, что ты будешь отставать в своем карьерном развитии на несколько лет.
Савва: Смотри, есть, например, джуниор дата-сайентист, потом миддл, потом лид. Есть ли у лида какие-то дальше пути роста, во что они обычно превращаются?
Виктор: Я как раз был лидом. Сейчас отвечаю за big data непосредственно в подчинении у президента компании, так что, как видишь, в целом карьерные треки могут быть достаточно длинными. Лид может стать chief data scientist, chief data scientist может стать директором по big data или, например, захотеть в более продуктовую историю двинуть. В частности, есть у нас дружественная компания YouDo, в которой chief product officer был chief data scientist.
Савва: Как ты думаешь, как вот эту гибкость воспитать в себе? Ты рождаешься с ней или какие-то дисциплины изучаешь?
Виктор: Она самым естественным образом воспитывается. В некотором смысле через боль, просто если тебе ее не хватает, то тебя никто не пускает дальше.
Как только ты видишь, что тебя чуть-чуть пропустили дальше, ты можешь понять, что, видимо, ты сделал что-то в правильном направлении, либо просто повезло. Но с течением времени все же статистика накапливается. Поэтому когда ты видишь, что есть какой-то карьерный затык — это повод задуматься — «а что я делаю не так?».
Савва: Спасибо, что ответил на наши вопросы!
Виктор: Спасибо и вам, очень приятно было пообщаться!
Видеоверсия полного интервью.