«Мне кажется, идеи команды – самое важное при разработке продукта»
Хабр, привет! Мы продолжаем серию интервью с выпускниками Newprolab, в которой они рассказывают о своей истории перехода в data science. Истории разные и будут интересны тем, кто задумывается о смене карьерной траектории или о том, как новые знания могут помочь решать в том числе текущие задачи. Недавно встретились с Яной Чаруйской, Product Owner в МТС. Яна рассказала, как она пришла в большие данные, как профессионально росла, вспомнила о своем любимом проекте, подарившем ей помимо знаний и опыта, еще и друзей. Рассказала о рабочей атмосфере в МТС, о проектах, которые делает ее команда, о своей мечте, планах на будущее и пр.
— Яна, расскажи немного о себе и своем бэкграунде.
— Меня зовут Яна Чаруйская, я Product Owner в МТС. Интересуюсь областью Big Data и занимаюсь ею уже порядка двух лет. Если вкратце про мою историю: я закончила ВШЭ по направлению «Бизнес-информатика», училась 6 лет, затем год училась на психолога. Четыре года я проработала в IT-консалтинге, три из них занималась хранилищами данных, витринами данных, построением управленческой отчетности в основном для крупных банков. Последний год в консалтинге занималась машинным обучением и предиктивной аналитикой. Сейчас я работаю в МТС менеджером по продукту, у меня команда из 6 человек, и она растет, в ближайшее время нанимаю еще 7. В целом, компания тоже расширяется, сейчас в МТС более 150 Big Data специалистов и еще открыто множество вакансий (планируем увеличить штат практически в 2 раза!). Мы с командой разрабатываем несколько продуктов одновременно, в настоящий момент они на разных стадиях реализации: есть продукты, которые находятся в стадии R&D, какие-то — в стадии продуктивизации.
— Почему и в какой момент ты решила связать свою работу с большими данными?
— В какой-то момент это стало модно и интересно, а для меня это была сложная и непонятная область. Я, конечно, проходила в университете язык программирования C# и немножко понимала его теоретические основы, но никогда не программировала сама. После того, как устроилась работать в IT-консалтинг, много писала скриптов на SQL. Но что такое Python, нейронные сети, что такое писать программы на каком-то языке программирования или строить предиктивные модели – всё это для меня было странным набором слов, в котором очень хотелось разобраться. Это было для меня вызовом, и я захотела попробовать. Всё началось с того, что я нашла в интернете какие-то сайты по Python, начала тренироваться и решать простые задачки. Порешала, вроде как-то получается, но чего-то не хватало. Нашла себе репетитора по Python, с которым мы писали код для решения произвольной системы линейных уравнений методом Гаусса. Я помню, эту задачку мы решали где-то месяц; у меня, правда, плохо получалось, возможно, преподаватель был не очень, не знаю, но я ее, в итоге, решила самостоятельно.
После неудачного опыта занятий с репетитором я стала рассматривать варианты с посещением курсов, в интернете нашла программу «Специалист по большим данным», очень обрадовалась, что это как раз то, что мне было нужно: целых три месяца заниматься машинным обучением и отличная возможность познакомиться с большим количеством систем для развертывания больших данных. Для меня онлайн-обучение – это точно не самый подходящий вариант, мне важно не сидеть дома одной за компьютером, а находиться в обществе людей, которые занимаются одной задачей, какой-то должен быть элемент конкуренции обязательно, чтобы ты мог сделать лучше, чем твой коллега. Поэтому я выбрала для себя Newprolab и ни капельки об этом не жалею.
На тот момент я занималась разработкой хранилища данных, для меня это уже было немножко скучновато, захотелось перейти в новую сферу, но руководитель сказал, что в тот момент такой возможности не было, однако, предложил мне полностью закрывать аналитику в крупном банке. Во время прохождения программы я поняла, что все-таки хочу заниматься машинным обучением, походила на собеседования, поискала работу, мне сделали два оффера. Прихожу с ними к руководителю и говорю, что я ухожу, потому что хочу заниматься Data Science. Тогда только он мне предоставил такую возможность внутри компании. Одним из условий перехода в другую область был отказ от своей команды аналитиков. Я осталась одна, это было тяжело. По большей части я занималась пресейлами, то есть, чтобы сделать модель, нужно было сначала найти клиента, продать эту модель, сделать ее, защитить и получить за это деньги. Но это какие-то разовые активности, команду под это не наберешь, экспертизы было не очень много. Продукты в основном были коммерческие, мы практически не использовали open source решения, поэтому ни Python, ни Spark мне не были нужны, модели строили в основном с помощью коммерческих решений для построения классических моделей отклика. В связи с тем, что мне хотелось получить больше экспертизы в области Data Science, создавать интересные продукты и работать в большой команде специалистов, я приняла решение снова искать работу.
— Мы еще поговорим, чем тебя завлекли в МТС. Скажи, чем можно и нужно удерживать хороших специалистов и стоит ли это вообще делать?
— Конечно, стоит, а еще лучше не удерживать, а создать все условия для того, чтобы
им хотелось остаться! Хороших специалистов на рынке больших данных не очень много, поэтому я много времени уделяю поддержанию дружественной атмосферы внутри команды. Мы много общаемся, делимся идеями, впечатлениями. А еще совместно ходим на конференции и играем в интеллектуальные игры (например, “Что? Где? Когда?”). Я стараюсь всем ребятам давать интересные задачки и слежу за их загрузкой, чтобы не было переработок.
— А с какими трудностями ты столкнулась в профессиональном плане в самом начале, какие вызовы приходилось преодолевать?
— Самым большим вызовом был язык программирования, потому что я больше математик, а в программировании другая логика: присваивание переменных, построение классов, наследование, полиморфизм и прочее. То, что программирование — не мое, я решила для себя еще в ВШЭ. Одной из самых больших трудностей было преодолеть психологический барьер, что я тоже могу писать код, и это не является для меня проблемой. В целом, трудностей было не очень много, было много вопросов. Хорошо, что у меня оказалось очень много друзей, которые на все эти вопросы отвечали: и мои одногруппники в Newprolab, и будущие друзья, с которыми я познакомилась на различных конференциях по Data Science и Big Data. А еще Open Data Science в Slack, где можно задать любой вопрос, и Data Science завтраки, на которые можно прийти и обсудить любую проблему. В общем, мне кажется, трудности если и есть, то легко преодолимы, потому что Data Science сейчас активно развивается, а ребята очень открытые и готовы помогать.
Я много общаюсь с людьми, в том числе с новичками в области Data Science, которые сомневаются, идти в сферу или нет. Уже всю жизнь работают в какой-то области, им интересна Data Science, но они сомневаются, стоит ли что-то менять, боятся. Я считаю, что, если хочется поменять свою жизнь и идти к своей мечте, то это вполне реально. Я начинала с промоутера, работала в Ашанах, рекламировала йогурты, потом стала репетитором по математике, занималась три года (а, может, и больше) репетиторством, но понимала, что это какой-то доход приносит, но не постоянно. Пошла работать в лизинговую компанию экономистом, там не было никакого IT, там был Excel в лучшем случае, макросы мы тоже не писали, работа была для меня скучной, и я очень переживала, что деградирую. Попробовала себя найти в другой области (собственно, более связанной с моим образованием) – ушла в консалтинг, занималась хранилищами. Потом хранилища надоели, и я опять встала перед выбором, куда дальше идти. Такими вот постепенным шажками, связанными с изменениями в своей профессиональной деятельности, я пришла в Big Data, о чем совсем не жалею. Я готова была тратить свои ресурсы, свое время, чтобы в этой области разобраться. Я думаю, что, если есть мотивация, то можно легко преодолеть все преграды и добиться того, что ты хочешь. Еще раз повторюсь, не нужно бояться.
— Отличная жизненная позиция и твоя история — прекрасный пример того, что при желании все возможно. Возвращаясь к тем, кто хочет перейти в Data Science, как ты думаешь, помимо страха, что еще может останавливать? Ты много общаешься с людьми, может, они с тобой делились.
— Основное – «у меня нет опыта, я не готов, я ничего не знаю». Вот по своему опыту сразу скажу: я пошла на курсы Newprolab, проучилась там две недели и у меня уже было два оффера в сфере Data Science на хорошие зарплаты. Два оффера, а я еще училась! Я в этой сфере даже не работала, поучила только чуть-чуть Python и прямо вот только-только начала ходить на курсы. Я приходила к работодателю и говорила, что учусь сейчас на программе, 8 июня закончу, я замотивирована развиваться в этой сфере, у меня есть релевантный опыт в хранилищах данных. Компании готовы были меня брать. Сейчас рынок очень узкий, data scientist’ов очень мало, поэтому компании обычно берут людей на вырост. Если они видят в тебе потенциал, они готовы его развивать.
Есть ведь очень много различных ресурсов по обучению: Coursera, EdX, Udacity, чтобы прокачать свои знания. Даже если ты не знаешь статистику, не знаешь линейную алгебру, математику, язык программирования, вообще ничего не знаешь, под каждое твое незнание есть определенный курс, который можно прослушать достаточно быстро и быстро во всем разобраться, тут главное желание и стремление. И нет такого, что «у меня нет опыта», главное – мотивация, ресурсы и энергия. И я думаю, время найдется, если вам этого хочется.
По Data Science сейчас очень много онлайн курсов развелось, везде мне контекстная реклама выскакивает то на одни курсы, то на другие. И стоимость их немаленькая, а компанию-поставщика курсов вижу и слышу в первый раз. В общем, это, конечно, хайп, и я думаю, что есть много некачественных курсов, которые практически ничего не дают.
— Из твоих наблюдений: каких soft и hard skills зачастую не хватает как начинающим, так и опытным data scientist-ам, чтобы стать действительно высококлассными специалистами? На что надо обратить внимание?
— Очень часто не хватает практических навыков реализации моделей в масштабах компании, важно понимание предметной области и правильная приоретизация работ. Не стоит тратить много времени на задачу, результаты решения которой не принесут положительного эффекта для деятельности компании. Data scientist-ам также желательно развивать свои коммуникативные навыки для презентации результатов своих продуктов как внутри для коллег, так и вовне. Что касается hard skills, то хотелось бы, чтобы кандидаты лучше разбирались в терминологии, понимали математические основы построения моделей и знали кейсы использования моделей для различных типов задач машинного обучения. А еще очень важна креативность и воображение для разработки новых подходов к решению проблемы (будь то добавление метрик в витрину данных, изменение ее структуры определенным образом или использование другого класса моделей).
— Расскажи подробнее про проекты в области Data Science, которые ты делала.
— Сначала вкратце расскажу, чем в занималась в консалтинге. У нас были проекты в различных сферах, отдел был не очень большой, и мы занимались разнопрофильными задачками. Первая моя задачка была связана с моделью отклика на кредитный продукт в крупном российском банке. Модель была успешна, она дала положительный результат, делала я ее с помощью коммерческого решения; благодаря реализации этой модели, я смогла пройти весь комплекс работ по согласованию бизнес-требований, построению и продуктивизации модели, а также оценки ее качества и постановки на регламент. Поскольку моя прошлая компания специализируется по большей части на банковской сфере, мы, в основном, строили модели для банков, но пробовали также и другие сферы (например, страхование и ритейл). К тому моменту я не только в качестве data scientist’а участвовала в этих проектах, но и в качестве менеджера. Мне кажется, что предметной областью можно не ограничиваться, в любой предметной области можно достаточно быстро разобраться. Я очень рада, что IT-консалтинг мне дал такую гибкость.
— Может быть, есть какой-то проект или несколько проектов, о которых тебе особенно приятно вспоминать?
— Да, есть такой – мой самый первый проект в крупном российском банке, у нас была очень дружная команда, мы строили хранилище данных с нуля, занимались его развитием, поддерживали, строили отчетность на нем. Это был очень крутой продукт. Очень много опыта приобрели, у нас сформировалась отличная команда. Нас уже давно разбросало по разным компаниям, но мы всё равно активно поддерживаем отношения. В этом банке мы нашли себя, наверное.
— Хорошо. Перейдем к МТС. Почему именно они? Чем таким интересным предложили заниматься? Какие сейчас перед тобой и твоей командой стоят задачи?
— Во-первых, меня в МТС привлекли огромная команда Big Data, куча специалистов, с которыми можно в любой момент проконсультироваться, чего не было в IT-консалтинге, а мне этого жутко не хватало. У нас был очень опытный руководитель и несколько data scientist-ов, понятно, что их опыта было недостаточно для того, чтобы решать любые задачи. Грубо говоря, у нас был стандартный набор задач, который мы делали, и мы старались не отклоняться от этого набора задач, потому что у нас не было экспертизы. Я очень рада, что выбрала МТС, у нас сейчас больше 150 человек и мы еще хотим вырасти на 70% до конца года. Это очень здорово, я люблю общаться и делиться опытом, думаю, что новая кровь точно не повредит.
Во-вторых, здесь широкий стек технологий, мы используем Open Source: Python, Spark, Hive, Kafka – все популярные словечки в области Big Data. У нас даже есть коммерческое решение, но мы к нему не притрагиваемся и моделей там не строим. Очень здорово, что мне удалось познакомиться с этим стеком на программе Newprolab и закрепить свои знания впоследствии в МТС.
Плюс, конечно, интересные задачи, интересные продукты. Заказчики в основном внутренние, но некоторые продукты выводим вовне. У нашей команды несколько направлений: стратегическое, оно завязано на реализацию моделей, которые не обязательно на текущий момент принесут нам деньги; есть коммерческие проекты, которые в этом году должны показать финансовый результат. Я работаю в R&D-команде, мы занимаемся реализацией продуктов, которые в будущем помогут МТС стать лучше.
У меня и моей команды сейчас три продукта. Первый – это оценка качества обслуживания наших абонентов в различных точках контакта, в том числе прогнозирование NPS (индекс лояльности клиента – прим. автора) на уровне каждого абонента. У нас есть опросы, которые мы проводим ежемесячно по всем нашим абонентам для того, чтобы понять, готовы ли они рекомендовать бренд МТС или нет. 0 – не готовы никому рекомендовать, 10 – готовы и активно это делают. Мы собираем эти оценки и прогнозируем оценку, которую абонент бы нам поставил, если бы прошел опрос, а также видим причины, которые могли на эту оценку повлиять; можем оперативно помочь их исправить. Это первый продукт.
Второй продукт связан с голосовой аналитикой. Здесь пока только R&D, одна из задач голосовой аналитики – распознавание речи в текст по звонкам в контактный центр для того, чтобы анализировать и автоматически классифицировать обращения. На текущий момент это выполняет операционист, и тематика сообщений не всегда может быть достаточно точной.
Про третий продукт, возможно, расскажу попозже на какой-нибудь Big Data конференции.
Команда очень классная, мы стараемся поддерживать домашнюю рабочую атмосферу, чтобы всем было комфортно. Я стараюсь выслушать каждого члена команды, все делятся своими идеями. Мне кажется, идеи команды – самое важное при разработке продукта. В общем, самые сумасшедшие идеи мы тоже пытаемся реализовать.
— Приведи пример сумасшедших идей.
— Мне кажется, у нас продукт по голосу так начался. Мы делали NPS, анализировали оценки наших абонентов, и тут кто-то спросил: «А почему мы не можем анализировать голосовые обращения в колл-центр?» Действительно, а почему нет? Мы же предупреждаем наших абонентов о том, что мы можем записывать и анализировать. Мы сами их не слушаем, но благодаря машинной обработке можем вытащить оттуда тематики обращений для улучшения качества обслуживания абонентов.
Какие-то конкретные примеры мне сложно привести — любые рабочие моменты, когда ребята хотят что-то потестировать, что-то попробовать реализовать, где-то соптимизировать. Мы в том числе пробуем различные решения, к нам приходят много поставщиков, предлагают новейшие технологии. Мы проводим с ними пилоты, смотрим на результаты.
— Ты точно помимо МТС рассматривала еще какие-то варианты. Что для тебя критически важно при выборе работодателя?
— Мне важна открытость компании; нравится, что я могу проконсультироваться со своими коллегами, со своим руководителем, поделиться своими страхами, я знаю, что он поймет и сможет дать дельные советы. Мне важна и репутация компании. Я готова, конечно, пойти в стартап, если у них есть интересная идея, но, в целом, репутация компании мне важна. Мне нравится работать в МТС, мы самый крупный оператор в России. Я думаю, что возможности для развития тоже важны, и МТС поощряет участие в различных конференциях как в качестве докладчика, так и слушателя. У нас есть внутренние курсы, это очень здорово, потому что на прошлом месте работы мне этого немножко не хватало.
Мне важен гибкий график работы и минимум бюрократии. В МТС у нас бюрократии практически нет, мы не пишем тонны бумаги, у нас вся документация ведется через Confluence и Jira. Мы понимаем, что на этапе продуктивизации нам придется написать какое-то ТЗ, но, в целом, с документацией у нас всё хорошо и с процессом согласования тоже. Еще я люблю комфорт, мне важна удобная одежда, чтобы не приходилось ходить в пиджаке и тесных туфлях.
— На «Специалисте по большим данным» ты заняла первое место по итогам программы, а на «Deep Learning» – третье за проект. Вопрос: это твоя усидчивость/ возможно, комплекс отличницы, я не знаю, есть ли он у тебя/ серьезный подход к обучению/ просто случайность?
— Возможно, это все вместе. У меня была цель, и я к ней шла. Очень хотела погрузиться в машинное обучение как можно скорее; курс, конечно, совмещать с работой было тяжело, особенно делать лабораторные работы и курсовые проекты, ходить на каждое занятие вовремя, чтобы написать тест и получить еще небольшую прибавку к баллам. Наверное, у меня есть небольшой комплекс отличницы, но, если что-то не получается, я из-за этого не переживаю. Когда я делаю работу, стараюсь делать ее хорошо, но если не получается, не расстраиваюсь (по крайней мере, я сделала все возможное). Я думаю, что также помогли серьезные намерения и немного везения, потому что у нас была очень классная и отзывчивая группа, а еще шикарный координатор на программе, который отвечал на все мои вопросы и давал подсказки. Не писал прямо, что надо было сделать, но грамотно направлял меня в нужную сторону. Я помню, у нас один раз даже перенесли дедлайн, потому что мы не успевали, и это помогло нам сдать очередную лабораторку, которую, мы уже думали, никто не сдаст (она была самой сложной).
А с «Deep Learning», наверное, просто повезло. У нас всего недельный курс был, в пятницу было предпоследнее занятие, а в субботу — завершающее. И в эту пятницу на лекции я просто решила попробовать одну из предобученных сеток, одну из самых новых. Я посмотрела сравнительный анализ имеющихся в Keras обученных сеток, выбрала лучшую и немного поэкспериментировала с ней. Пока все учились, я запустила Xception, которая дала максимальный результат, и заставила двух наших мальчиков всю ночь пытаться этот результат побить. Были какие-то проблемы с установкой этой сеточки, но они быстро решались, а мальчики посчитали, что она просто не работает на том Python, на котором мы обучались. Но у меня получилось, а ребята всю ночь пытались мой результат перебить, поэтому я на третьем месте, а не на первом. Зато я выспалась и пришла на вручение сертификатов в хорошем настроении.
— Какие у тебя вообще мысли и планы на будущее? Чему ты хочешь дальше учиться? Каких навыков и знаний тебе не хватает?
— Я сейчас Product Owner, и мне хочется в эту сторону дальше развиваться. Во-первых, я хочу прокачать навык публичных выступлений на большую аудиторию. Я чувствую, что волнуюсь, когда все смотрят на меня, и текст забываю, поэтому мне хочется этот навык прокачать в первую очередь. Я выступала в августе на конференции МТС в Сочи. Это было первое мое выступление перед такой большой аудиторией. Я написала текст, учила его, вышла выступать с бумажками, что-то читала оттуда, что-то рассказывала, очень волновалась. У меня в одной руке был микрофон, в другой презентер и бумажки. В итоге, бумажки выпали, презентацию случайно выключила. Было немного неловко, но все посмеялись вместе со мной.
Во-вторых, я планирую развивать менеджерские способности в области управления людьми. Нет никаких сомнений, что в этой области всегда есть чему поучиться.
В Newprolab я успела пройти три курса: «Data Engineer», «Deep Learning», «Специалист по большим данным». В том числе еще благодаря опыту работы аналитиком, я теперь знаю, чем у меня каждый человек занимается в команде; могу корректно задачи ставить; понимаю, через сколько задачи будут сделаны. Это большой плюс, я уверена, что мы добьемся хороших результатов.
— Традиционно вопрос про команды, отдельных людей в индустрии Big Data / Data Science не только в России, но и в мире. Есть ли люди, которые тебя вдохновляют, за чьими работами ты следишь?
— Мне сложно сказать. Мне кажется, у меня определенный склад ума, характера, я более практичный человек: есть задача, я пытаюсь ее решить. Если у меня есть вопросы по реализации моего продукта, то я нахожу статьи в интернете или на arxiv.org и делюсь с командой самыми интересными. Еще хожу на Data Science завтраки для обмена опытом, слушаю конференции и курсы, много читаю профессиональной литературы. Конкретного человека, которого я фоловлю, или за чьими обновлениями постоянно слежу, нет, но есть темы, которые мне интересны, я готова их обсуждать, у меня есть много знакомых в этой области, с кем я могу обсудить текущие проблемы и задать вопросы: это и одногруппники в Newprolab, и люди, с которыми я на конференциях познакомилась, и на работе можно тоже пообщаться, у нас же большая команда data scientist’ов и data engineer’ов.
— Есть у тебя какая-то профессиональная мечта?
— Я уже лет пять интересуюсь психологией, специализированные курсы закончила, в психологических группах занималась и индивидуальную терапию проходила. Мне интересна область на стыке психологии и машинного обучения. Возможно, в будущем, когда будет время, у меня получится создать какой-нибудь продукт, который поможет людям разбираться лучше в своих эмоциях и предоставит своевременную консультацию для принятия верного решения. В общем, мне было бы интересно в будущем сделать модель, которая бы на основе психологии человека помогала людям в повседневной жизни. Не знаю, насколько это реалистично, но я бы очень хотела этим заняться.
— Отлично. Ты уже назвала один ресурс, может быть есть еще какие-то интересные профильные блоги, телеграмм-каналы, которые ты почитываешь на досуге?
— Я сижу в чатиках Data Science в телеграмме, но там очень много новичков и глубокие темы не поднимаются. Есть канал ODS в телеграмме, там можно все новости прочитать, как и в Slack. Я подписана на некоторые каналы и новостные ленты, которые ведут мои знакомые – Гриша Сапунов, Коля Марков, Петя Ермаков и еще несколько других. А так особо не слежу за каналами. Если мне нужно что-то, я ищу в github, stackoverflow, на arxiv.org.