Хабр, привет! Мы продолжаем серию интервью с выпускниками Newprolab, в которой они рассказывают о своей истории перехода в область работы с большими данными. Истории разные и будут интересны тем, кто задумывается о смене карьерной траектории или о том, как новые знания могут помочь решать в том числе текущие задачи. Знакомьтесь — Олег Хомюк, Head of R&D в Lamoda.
Олег рассказал про свой карьерный путь, ценности, почему выбрал Lamoda, а не компанию в Долине, про текущие проекты, свою команду, про самый успешный и самый неудачный проекты, про отношение к data science и многое другое.
— Олег, как складывался твой профессиональный путь до Head of R&D в Lamoda?
— Мне кажется, любой профессиональный путь – это следствие нескольких причин и иногда случайностей. Среди этих причин можно выделить несколько основных: особенности мышления, жизненные ценности и в целом, как человек понимает, что такое успех. Это понимание успеха и есть тот самый вектор, который мы используем как компас, выбирая профессиональный путь.
В этом смысле у меня все складывалось совсем просто: в школе явно проявлялись способности к точным наукам, постоянно участвовал в олимпиадах, даже удалось в 9-м классе занять 3-е место на областной олимпиаде по математике среди школьников. Да и в целом всегда было очень интересно решать головоломки, закономерности искать, задачи на смекалку до сих пор люблю.
В университете мне тоже нравилось учиться: я закончил МГТУ им. Н.Э. Баумана с красным дипломом по специализации «Оптико-электронное приборостроение», нас учили проектировать достаточно сложную, с точки зрения физики и микроэлектроники, технику: тепловизоры, цифровые фотоаппараты, телескопы, даже снайперские прицелы, системы самонаведения и приборы ночного видения. Надо сказать, что это безумно интересная профессия, да и преподавательский состав у нас был звездный. Такая настоящая инженерия на стыке нескольких областей знания. Иногда немного жаль, что не сложилось поработать по этой теме.
— А почему не сложилось?
— На последних курсах немного разочаровался в том, чем занимаюсь. Оказалось, что спрос на профессию в стране невысокий, всё очень локально, лучшие из лучших инженеры работают в основном в институтских лабораториях, редкие заводы способны воплотить в жизнь проекты инженеров, оборудование устаревшее, ну и так далее. Были, конечно, некоторые успехи, но размах не тот, который я себе представлял в начале учебы. К этому фактору добавились низкие ставки для научных сотрудников, можно было заниматься частным извозом и зарабатывать больше. Были, конечно, еще варианты заработать, работая не совсем официально на японские компании, естественно без прав на интеллектуальную собственность.
В какой-то момент друзья позвали работать в довольно крупный подмосковный провайдер интернета, и я согласился. Был вполне готов учиться новому, техническое образование дает много простора в этом смысле.
Там я приобрел новые технические навыки, познакомился с темой управления качеством и в общем коснулся мировых практик в этом отношении. Есть такой стандарт управления качеством, даже серия стандартов ISO 9000, которые предлагают некоторые практики по организации процессов на предприятии, беря за аксиому связь между качеством конечной продукции и тем, насколько хорошо компания внутри управляет своими процессам. Основная идея в том, что, если вы все делаете в рамках стандарта, то качество вашей продукции постоянно улучшается, потому что вы измеряете, думаете, планируете, делаете и снова измеряете каждый процесс, который может влиять на это качество. У этой циклической деятельности по постоянному улучшению есть даже название — цикл Деминга. Меня как-то захватила эта тема, вроде менеджмент, но уж очень математичный.
В итоге я там проработал около 2 лет, разными вещами занимался, в том числе руководил небольшим отделом, процессы строил, много с отделом качества общались.
Дальше был Яндекс. В какой-то момент увидел, что они нанимают проджект менеджеров в отдел качества поиска. Сама вакансия не так зацепила, больше заинтересовало тестовое задание: опишите существующую проблему поиска Яндекса и придумайте, как ее решать. Ну, и триггер в голове на слово “качество” сработал, наверно. Я часов 10 подряд работал над заданием, получилось на несколько страниц. В итоге, со мной связались, позвали на интервью и сделали оффер, который я с радостью принял.
Пока я в Яндексе работал, конкретно для меня вообще все на свои места встало, я увидел, как большие данные, математика, алгоритмы, фокус на пользователе, его потребностях работают вместе как единый механизм и позволяют создавать прорывные продукты с одной стороны, и зарабатывать деньги с другой. Мне кажется, я из Яндекса унес это сформировавшееся желание делать продукты на основе данных и заниматься машинным обучением. С тех пор начал активно развиваться в этом направлении.
— Шел 2011 год, тема больших данных еще не сильно была популярна, особо не было программ. Где ты все изучал, читал?
— Контента доступного было конечно маловато, а мы были все такие жадные до знаний. Но Coursera уже была и, кстати, ШАД тоже. Я слушал лекции Воронцова по 15 раз и ничего не понимал. Многие через это проходили, интересная была эпоха.
В общем от темы информационного поиска начал отходить понемногу, нравилось работать с данными, привлекала новая область, связанная с машинным обучением, и в 2012 году я покинул компанию.
— А что после Яндекса?
После Яндекса был «Консультант Плюс». Уже более осознанно выбрал направление, связанное с анализом данных. Как раз данные пользовательских действий только начинали масштабно собирать, так что я влился в эту деятельность, начал делать проекты.
В общем, это было интересное время, вот сейчас есть множество доступных библиотек для машинного обучения, например, xgboost, а мы писали свой градиентный бустинг на деревьях на С++, сейчас, конечно, такое себе не каждая команда может позволить, да и незачем — все уже есть реализованное. Такая история.
— Своими силами писал или у тебя уже была команда?
— Команда уже была, да, к тому же из талантов. На втором году моей работы в «Консультант Плюс» к нам присоединился талантливый студент ВМК, который за пару месяцев написал свою реализацию бустинга и начал обучать модели.
К тому времени мы уже были нацелены на формирование целой команды data scientist’ов, чувствовали, что в данных есть много новых возможностей. Тогда очень удачно подвернулась возможность взять в команду двух выпускников ШАДа, которые знали, наверное, на голову больше, чем я, и разработчиков для построения хранилищ. Все попробовали, работали в основном на Hadoop кластере, хоть по современным меркам данных было не очень много.
В пике нас, наверное, человек 9 всего было, решали хорошие задачи. Например, искали всплески пользовательского интереса к разным тематикам, это помогало авторам более оптимально подходить к выбору тем, по которым есть смысл написать новый материал.
После этого я работал в компании Ezhome, это стартап в Пало-Альто. Туда меня, кстати, порекомендовал Митя Катаев, с которым вместе учились на программе «Специалист по большим данным». Его знакомый, Кирилл Клоков, работая в Ezhome директором по развитию, как раз искал data scientist-а в команду. Основная идея компании — создание Uber-experience для домашних сервисов; как отправная точка был выбран сервис ухода за придомовой территорией — начиная от стрижки газонов, заканчивая уборкой, высаживанием растений и деревьев. В итоге начал работать там как Data Scientist, очень хотелось попробовать свои силы в стартапе, да и руками поработать хотелось. У меня периодически возникает этот аналитический зуд, хочется самому что-то содержательное сделать, хоть я довольно давно в основном сфокусирован на организационных процессах. Раньше я надеялся, что когда-нибудь зуд утихнет, но нет, по сей день пытаюсь “сидеть на двух стульях”, то есть развиваться и как менеджер, и как специалист.
— Даже сейчас?
— Даже сейчас. Хотя в данный момент, конечно, на многое не хватает времени: большая команда, много управленческих задач, оттягиваюсь на выходных, благо сейчас для этого есть масса возможностей — kaggle, например. Хочется самому руками тоже что-то делать, но у меня в команде есть ребята, которые каждый в своей области явно получше меня. Но, на мой взгляд, для эффективного управления проектами в области анализа данных и у менеджера должны быть hard skills. Я постоянно учусь. Вот сейчас, например, решил пройти специализацию по программированию, просто чтобы не забывать, что к чему.
— Возвращаясь к Ezhome: зачем им нужен был data scientist? Какие задачи стояли перед тобой?
— Это хороший вопрос. В самом начале я спрашивал, какой результат ожидают от меня. Ответ был в духе: «мы сами пока точно не понимаем, давайте пробовать». Но быстро нашлась хорошая задача: на тот момент существовал bottleneck в привлечении новых клиентов, потому что каждую новую заявку обрабатывал человек, обмерял участок по снимку со спутника, пытался понять, сколько должно стоить обслуживание такого участка. Была экспертная линейная модель, которая занималась этой оценкой. Понятно, что качество прогноза хотелось улучшать, а как учесть большее число параметров экспертно, уже не определишь. Вот тут как раз и пригодилось машинное обучение. Мы стали прогнозировать время, которое будет тратить садовник, используя параметры участка. Параметры участков брали из открытых источников, а “учителя” — из исторических данных. Тогда уже была небольшая база активных клиентов на подписке на еженедельном обслуживании.
В итоге, задача выстрелила, для большинства входящих обращений были доступны данные, возможно было формировать индивидуальные цены на лету. Классическая автоматизация — роботы работают, люди отдыхают. Тогда меня пригласили приехать в головной офис в Долину на некоторое время, где-то на полтора месяца.
До этого я работал удаленно, там практически вся команда удалённая была: США, Индия, Греция, Польша, Россия. Команда была очень крутая, работать было одно удовольствие. Много классных задач удалось сделать, в итоге мне предложили позицию тимлида аналитики. Мы сделали некоторые улучшения в инфраструктуре, что позволило нам увеличить в разы количество проектов, которые мы делали. Потом предложили объединиться с другой командой, которая занималась разработкой программного обеспечения для построения маршрутов для работников: 5 тысяч клиентов, 150 садовников, как можно их объехать оптимальным образом. Это было очень увлекательно, мне и сейчас кажется, что задачи, которые больше про computer science, чем про data, тоже очень интересные.
— Параллельно с Lamoda ты рассматривал несколько предложений, почему все же выбор был сделан в пользу Lamoda? Что для тебя было критично?
— Да, предложений было несколько. Что меня зацепило в Lamoda? Четкая стратегия, понятные ожидания от меня, доверие и реалистичный ресурсный план в финансах, то есть передо мной очертили понятную задачу: «мы сейчас находимся вот тут, нам надо сюда, хотим развивать R&D, готовы проинвестировать Х, ожидаем такого-то экономического эффекта». Все. Никаких рассуждений о том, как космические корабли будут бороздить просторы вселенной или что всех заменят роботы. Плюс честный рассказ о том, как обстоят дела у компании. Все было прозрачно, четко и это, в общем-то, подкупило, потому что было полное ощущение, что я прихожу в команду людей, которые действительно ориентированы на результат и понимают, чего хотят. Кроме того, мне дали карт-бланш на развитие этого направления. Для меня это был какой-то персональный челлендж, у меня никогда не было возможности собрать такую большую команду. Сейчас 17 человек, и мы все еще растем.
— Это уже не первая компания, где ты выстраиваешь с нуля департамент R&D, собираешь команду. Какие первые 5 шагов ты предпринимаешь, приходя в компанию?
— R&D отдел был в Lamoda и до меня, за 7 лет даже несколько команд и руководителей сменилось. Кроме того, мы где-то половину текущей команды собрали внутри. Так что не совсем с нуля.
Первые пять шагов в новой компании? Алгоритм, я думаю, не специфичен для R&D, он, в принципе, такой может быть, если приходить в новую компанию на хоть какую-нибудь руководящую должность.
Первое – нужно разобраться с текущей стратегией компании, понять, какие перед компанией стоят цели, по каким KPI будут измеряться достижения.
Второе – описать, как именно с учетом своей компетенции или роли в компании можно на эти KPI влиять, должен быть какой-то набор доступных инструментов и идей. Описать потребности бизнеса и target state, то есть к чему мы вообще хотим прийти, а потом оценить доступный инструментарий. Машинное обучение — только один из них, и не для каждой задачи оптимальный.
Третий пункт – нужно провести аудит текущего состояния – люди, компетенции, процессы, данные, продукты, инфраструктура, особенно инфраструктура.
В общем, только на 4-ом шаге после аудита текущего состояния становится возможным описать дальнейшую стратегию перехода из текущего состояния в целевое. По сути — большая работа, включающая множество консультаций с заинтересованными лицами, stakeholder’ами, по итогам которых нужно выработать несколько возможных сценариев развития. В моей практике полезно было делать минимум 3 — консервативный, реалистичный и агрессивный в смысле ресурсозатрат. Дальше все полегче: после выбора стратегии делаем дорожную карту, уточняем оценку по ресурсам и приступаем к работе.
— Что для тебя data science?
— Data Science — это мой любимый инструмент. Это чрезвычайно захватывающая область, она как математика и физика, еще один способ познавать мир вокруг себя. Я это впервые особенно четко прочувствовал в Яндексе, когда мы занимались анализом поисковых запросов, понимали, какие у пользователей потребности, как они их решают, что вообще в мире происходит. То есть можно смотреть на мир через маленькую щелочку тех данных, с которыми работаешь. Это интересно и, на мой взгляд, ничем не отличается от других способов познания, просто другой “канал”, считайте, что это 7-ое чувство. То же самое было и в «Консультант Плюсе»: мы смотрели, какие пользователи решают проблемы, когда ищут судебные решения, то есть что конкретно волнует людей, какие у них споры, которые необходимо разрешать в судебном порядке. Если говорить про данные, которые мы в Lamoda анализируем, то это не менее захватывающе. Особенно когда узнаешь, что блузки и юбки покупаются скорее разных цветов, чем одинаковых. Любопытное наблюдение, с которым можно идти дальше по жизни. Много чего можно узнать про мир вокруг себя через данные. Поэтому я говорю, что это мой любимый инструмент. И вот он, с одной стороны, инструмент познавательный, а с другой стороны, инструмент деятельный, с помощью него можно что-то новое создавать.
— Если брать бизнес, то какую роль в бизнесе ты отводишь данным?
— Здесь самое главное не поддаваться хайпу. Если говорить о бизнесе, то данные, безусловно, должны работать. Результаты анализа данных должны приносить прибыль или сокращать издержки. Если они этого не делают, то что-то где-то пошло не так. В то же время data-driven культуру не надо понимать буквально, мы вполне можем принимать решения, не опираясь на данные, это нормально. Более того, в некоторых случаях только так и надо поступать.
— Расскажи, какие проекты вы делаете в Lamoda? Какой самый успешный проект, реализованный вашей командой?
— Наверное, первое, что стоит упомянуть – это платформа для A/B тестирования — по сути сервис, который разбивает пользователей на группы и управляет включением, выключением экспериментальных фичей. Почему это важно для нас? Потому что вообще сама эта область, связанная с машинным обучением, не может существовать без постоянного тестирования разных гипотез и идей. Мы не можем заранее знать, что нашим пользователям понравится больше или меньше. Любую новую идею нужно обязательно тестировать. Amazon приводит интересную статистику, они говорят, что 70% идей, которые они тестируют, проигрывают тест. К этому нужно спокойно относиться, даже если показатель будет выше. Это означает, что для того, чтобы релизить 5 успешных проектов в квартал, необходимо делать ±17. Поэтому надежная платформа для проведения контролируемых экспериментов – это базис, без которого совершенно невозможно двигаться вперед в плане развития продуктов. Учитывая наши амбициозные планы, было необходимо сделать некоторый апгрейд этой системе. До меня была сделана первая версия, мы ее значительно обновили: теперь можно запускать больше экспериментов одновременно, раньше были некоторые ограничения в этом смысле.
— А какие еще направления?
— Поиск, и здесь есть отличия от крупных игроков как Яндекс и Google, потому что мы можем очень хорошо проработать свою предметную область, она по сравнению с “универсальным поиском в интернете” довольно узкая. Невозможно сделать онтологию всего, описать все взаимосвязи, но в маленькой конкретной области можно делать очень хорошие решения, которые будут работать. Мы делаем свою лингвистику для поисковой системы, которая могла бы учитывать некоторые неявные взаимосвязи между разными сущностями. Например, есть некоторые бренды, которые объединены в группы, и формально, если ты ищешь вещь одного бренда, тебе можно показать вещь этого же бренда, просто другой торговой марки. Как пример, Tommy Hilfiger и Tommy Jeans, на самом деле это один бренд. Или понимать, что шпилька — это тоже формально каблук, а лоферы — это вообще-то туфли. В общем, мы хотим очень хорошо проработать свою предметную область, поэтому наш поиск будет в том числе развиваться за счет экспертных знаний сотрудников Lamoda.
Безусловно, один из ярких примеров проектов, которым мы занимаемся, — ранжирование товаров в каталоге. Это то самое ранжирование по популярности. Мы стараемся сделать так, чтобы пользователь, который приходит на сайт, как можно скорее нашел то, что ему понравится.
Еще есть проекты с рекомендательными системами, оптимизацией ценообразования, персонализацией, да много всего.
— Олег, расскажи про свой самый успешный проект.
— Самым успешным проектом является сейчас как раз внедрение нового ранжирования в каталоге. Оно стало чуть более умным, начало учитывать больше интересных данных. Мы, например, для унисекс товаров решили проблему контекста, то есть в контексте мужского каталога бутсы хорошо продающийся товар, а в контексте женского — не очень. По поведению пользователей выходит, что это скорее мужская обувь, хоть формально и унисекс. Много таких нюансов, которые хочется учесть. Так что мы не останавливаемся, тестируем новые гипотезы, стараемся активно сотрудничать с коммерческим департаментом и так далее.
— Как вы работаете над проектами? Как отбираете? Как долго выводите в продакшен?
— Статистики мало пока собрали на эту тему, но вообще у нас работа строится таким образом: несмотря на то, что организация уже достаточно большая, проектов больше, чем людей, поэтому мы под каждое направление собираем микро-команду. Например, у меня есть отдельная микро-команда, которая занимается рекомендательными системами. Те же самые люди могут быть задействованы и в других проектах, это нормально. Все решается в основном в рамках микро-команды, проводятся регулярные встречи и брейнштормы, планирование и ретроспективы, а также внутренние митапы и демо. Без демо никуда.
В текущем году на проект от стадии идеи до релиза уходит 4-6 недель. Но понятно, что такие проекты не все. Некоторые требуют гораздо больших ресурсных вложений, особенно если нужно вкладываться в архитектуру или делать что-то совсем новое или долго и дорого интегрироваться с другими системами. Максимальный срок составляет порядка нескольких месяцев. Если нужно улучшить что-то уже работающее, то это можно сделать достаточно быстро, если построить с нуля – это другая работа.
— Ты упомянул Amazon с их 70% провалившихся экспериментов, а какой процент в Lamoda?
— Я бы их лучше называл неудачными, чем провалившимися. Такие у нас, конечно, есть. Но мы считаем, что из любого эксперимента есть только два пути – это либо success, либо learning. Провалом мы неудачные эксперименты не называем. Настоящий провал — это когда из не принесшего экономического эффекта проекта мы не вынесли никаких уроков. Если новая идея проиграла текущей или хотя бы не выиграла, это значит нужно досконально разобраться почему так произошло, переосмыслить задачу и, возможно, сделать еще одну итерацию. Точно нужно какое-то знание вынести.
— Можешь рассказать о проекте в твоей карьере, который не взлетел? О самом большом разочаровании и learning’e, который ты вынес.
— Да, таких даже несколько наберется. К примеру, очень хотелось внедрить машинное обучение в поисковое ранжирование в одной из компаний. На этот проект мы потратили много времени, а по итогу оказалось, что ресурсов на внедрение такого решения просто нет, и проект пришлось закрыть. Для меня, как для менеджера, это был очень хороший learning, жалко, что дорогой. Определять границы допустимого (что мы сможем сделать, какие у нас есть ресурсы) нужно на старте, до того, как написана хотя бы строчка кода, иначе может получиться похожая ситуация. Причем команда проделала серьезную работу, и при моделировании на стенде даже хорошее качество получалось, но для внедрения требовались архитектурные изменения в приложении, и ради одного поиска компания на это не пошла.
— Что для тебя значит команда? Ты за год более, чем вдвое, увеличил команду, и вы продолжаете расти. Как ты подбираешь людей, что для тебя важно?
— Я считаю одним из своих главных достижений года работы в этой компании то, что у нас действительно отличная атмосфера в коллективе: она дружеская, основана на взаимной поддержке и уважении, при расширении команды это важно сохранить. Поэтому кроме профессиональных качеств мы, в том числе, пытаемся понять на собеседовании, сработаемся мы с человеком или нет. Все успешные кандидаты знакомятся с командой, это важно, к мнению команды я прислушиваюсь.
— Половина твоей команды, как и ты сам, либо проходили программы у нас в Newprolab до прихода в Lamoda, либо ты их направлял на учебу. Это случайность или ты подбирал людей из сообщества выпускников, из тех, с кем ты учился, пересекался на наших мероприятиях?
— Я бы хотел сказать, что я, конечно, подбирал, но я думаю, что это совпадения, хотя случайности неслучайны. Хочется привести здесь цитату Гриши Сапунова (преподаватель Newprolab — прим. ред.), что корреляция не означает каузацию, то есть не гарантирует наличие причинно-следственных связей. Теперь от лирики к проблематике. Мне кажется, что всех выпускников Newprolab объединяют качества, которые и мне в том числе кажутся полезными в команде. Есть какая-то третья причина, которая влияет на, условно, привлекательность программы для слушателя и кандидата для меня. Например, жадность до информации и высокий уровень внутренней мотивации. Трехмесячный курс с нагрузкой 3 лекции по три часа в неделю и 10 часов самостоятельной работы требует от человека быть определенного склада характера, и именно этим мне очень нравится атмосфера, которая у вас появляется на курсах. Потому что это достаточно сильно похоже на нормальный рабочий процесс. И люди, которые выдерживают эту нагрузку, заранее имеют фору перед теми, кто условно к такому режиму не готов, в общем, есть разница.
— Многие могут тебе здесь возразить, что получить сертификат на онлайн программах сложнее, там нужна мотивация, может, и повыше, никто тебя не подпинывает, спросить зачастую не у кого, сам разбираешься во всем.
— Так мы же команда, у нас нет цели, чтобы человек ушел в себя на 4 месяца, например, как в специализации на Coursera, и работал сам с собой, у нас есть задача работать в коллективе. Мы и на программе помогали друг другу, у нас были чаты, мы общались, все делились друг с другом своими решениями. Это очень похоже на рабочий процесс, мы так же работаем, у нас каждый делает свою часть, за которую взял ответственность, но при этом все друг с другом советуются, общаются постоянно, это и есть командная работа.
— Вы с Петей Ермаковым преподаете на «Специалисте по большим данным», другие члены твоей команды тоже преподают, выступают на конференциях. Зачем это нужно, что это конкретно тебе дает?
— Лично для меня выступление – это способ пообщаться с сообществом и донести какие-то свои мысли широкой аудитории. Мне кажется, что это полезно, потому что все равно мы все немножко по-разному понимаем то, чем занимаемся. И какую-то собственную индивидуальность показать, и найти единомышленников очень полезно. Если говорить о преподавании, для меня это достаточно новый опыт. Что меня мотивирует это делать? Я вижу в этом социальную ответственность: научился что-то делать сам, научи другого. Мне кажется, как раз так и должно быть. Безусловно, это навеяно, в том числе, и наличием некоторых проблем в системе образования, потому что зачастую люди, которые преподают, не являются практикующими специалистами в этой области. Поэтому кажется, что это необходимо. И мне это тоже нужно, потому что, если я буду делиться своими знаниями, я тем самым хоть на малую долю, но все-таки буду подстегивать сообщество и индустрию развивать. Мне же потом с этими людьми работать, на рынке сейчас явный недостаток экспертизы, надо помогать людям.
— Полтора года ты работал в американском стартапе, жил в Сан-Франциско. Почему не продолжил строить карьеру там, в Штатах? Почему ты выбрал остаться здесь?
— Сейчас довольно странно прозвучит, но не делаю большого различия между «там» и «здесь», то есть для меня территориальная локация не так принципиальна, я вообще не очень понимаю людей, которые говорят, что надо обязательно куда-то уехать. Когда я ехал в Долину, ожидал некоторого вау-эффекта от опыта и уровня специалистов, которые там работают. Я этого не увидел. Честно могу сказать, что в Москве можно собрать команду инженеров, которая ни в чем не будет уступать абстрактной команде стартапа в Долине, и это тоже нормально. Я шел за проектом, Lamoda была интереснее. Если будет в моей карьере предложение о каком-то очень интересном проекте в Штатах, я не исключаю возможности поучаствовать.
— Какие профильные блоги, тг каналы ты читаешь на досуге?
— Я читаю Slack ODS, статьи на Хабре, видео смотрю со всяких митапов, субботние тренировки по машинному обучению от Яндекса. Да в принципе, наверное, все, это такой сухпай, мне просто не хватает времени, я очень много работаю, а еще есть личная жизнь.
— Ты в самом начале говорил про ценности, про личный и общественный успех, про особенности мышления. Можешь рассказать, что для тебя важно, какие у тебя ценности и что для тебя личный успех и успех общественный?
— Если вкратце, то мне видится это таким образом: для меня ценна общественная, социальная значимость. Я думаю, что, если бы я не стал заниматься data science, я бы занялся медициной. И, возможно, когда-нибудь я смогу совместить эти два гештальта.
— Один ты уже закрываешь, мне кажется, прекрасно.
— Кажется, что так. Но история про анализ медицинских данных очень привлекает. Ничего ценнее, чем человеческая жизнь, нет. Мне кажется, что, если когда-нибудь мне удастся сделать в этом направлении какой-то маленький шаг вперед, это будет очень здорово. Сейчас масштабная применимость машинного обучения в медицине пока под вопросом — медицинские данные разрозненные, неструктурированные, нет единых стандартов, они засекречены, с ними много проблем. Кроме того нужно получать кучу аккредитаций, чтобы сделать какие-то мало-мальски хорошие продукты. И, я думаю, будет классно подготовиться к той эпохе, когда в этом контексте все нормализуется, набраться опыта, навыков и, может, когда-нибудь я этим тоже позанимаюсь, идея об этом периодически всплывает в моей голове.
Если говорить про личный успех, довольные пользователи и прибыль для бизнеса — вот, наверное, два мерила успеха, которые значимы. Еще в рамках личного успеха, мне кажется, нужно расходовать свой ресурс с максимальной пользой. Я здесь вот что имею в виду: куда бы я ни приходил, я всегда стараюсь занять ту ролевую позицию, в которой я могу принести максимум пользы, пытаюсь увидеть узкие места и зоны роста. Ezhome — хороший пример: я пришел туда как data scientist, потому что мне было интересно делать руками что-то, потом я увидел, что могу с большей отдачей потрудиться и над другими задачами. Есть люди, которые заранее сильно сфокусированы на чем-то конкретном. Я в этом плане чуть более открыт к новому, если так надо для общего блага. Я в принципе фанат оптимизации, что бы это ни значило.
Наверно поэтому я так люблю свою работу, она позволяет мне использовать свои сильные стороны для достижения целей, которые ценны как компании, так и лично мне.
Олег рассказал про свой карьерный путь, ценности, почему выбрал Lamoda, а не компанию в Долине, про текущие проекты, свою команду, про самый успешный и самый неудачный проекты, про отношение к data science и многое другое.
— Олег, как складывался твой профессиональный путь до Head of R&D в Lamoda?
— Мне кажется, любой профессиональный путь – это следствие нескольких причин и иногда случайностей. Среди этих причин можно выделить несколько основных: особенности мышления, жизненные ценности и в целом, как человек понимает, что такое успех. Это понимание успеха и есть тот самый вектор, который мы используем как компас, выбирая профессиональный путь.
В этом смысле у меня все складывалось совсем просто: в школе явно проявлялись способности к точным наукам, постоянно участвовал в олимпиадах, даже удалось в 9-м классе занять 3-е место на областной олимпиаде по математике среди школьников. Да и в целом всегда было очень интересно решать головоломки, закономерности искать, задачи на смекалку до сих пор люблю.
В университете мне тоже нравилось учиться: я закончил МГТУ им. Н.Э. Баумана с красным дипломом по специализации «Оптико-электронное приборостроение», нас учили проектировать достаточно сложную, с точки зрения физики и микроэлектроники, технику: тепловизоры, цифровые фотоаппараты, телескопы, даже снайперские прицелы, системы самонаведения и приборы ночного видения. Надо сказать, что это безумно интересная профессия, да и преподавательский состав у нас был звездный. Такая настоящая инженерия на стыке нескольких областей знания. Иногда немного жаль, что не сложилось поработать по этой теме.
— А почему не сложилось?
— На последних курсах немного разочаровался в том, чем занимаюсь. Оказалось, что спрос на профессию в стране невысокий, всё очень локально, лучшие из лучших инженеры работают в основном в институтских лабораториях, редкие заводы способны воплотить в жизнь проекты инженеров, оборудование устаревшее, ну и так далее. Были, конечно, некоторые успехи, но размах не тот, который я себе представлял в начале учебы. К этому фактору добавились низкие ставки для научных сотрудников, можно было заниматься частным извозом и зарабатывать больше. Были, конечно, еще варианты заработать, работая не совсем официально на японские компании, естественно без прав на интеллектуальную собственность.
В какой-то момент друзья позвали работать в довольно крупный подмосковный провайдер интернета, и я согласился. Был вполне готов учиться новому, техническое образование дает много простора в этом смысле.
Там я приобрел новые технические навыки, познакомился с темой управления качеством и в общем коснулся мировых практик в этом отношении. Есть такой стандарт управления качеством, даже серия стандартов ISO 9000, которые предлагают некоторые практики по организации процессов на предприятии, беря за аксиому связь между качеством конечной продукции и тем, насколько хорошо компания внутри управляет своими процессам. Основная идея в том, что, если вы все делаете в рамках стандарта, то качество вашей продукции постоянно улучшается, потому что вы измеряете, думаете, планируете, делаете и снова измеряете каждый процесс, который может влиять на это качество. У этой циклической деятельности по постоянному улучшению есть даже название — цикл Деминга. Меня как-то захватила эта тема, вроде менеджмент, но уж очень математичный.
В итоге я там проработал около 2 лет, разными вещами занимался, в том числе руководил небольшим отделом, процессы строил, много с отделом качества общались.
Дальше был Яндекс. В какой-то момент увидел, что они нанимают проджект менеджеров в отдел качества поиска. Сама вакансия не так зацепила, больше заинтересовало тестовое задание: опишите существующую проблему поиска Яндекса и придумайте, как ее решать. Ну, и триггер в голове на слово “качество” сработал, наверно. Я часов 10 подряд работал над заданием, получилось на несколько страниц. В итоге, со мной связались, позвали на интервью и сделали оффер, который я с радостью принял.
Пока я в Яндексе работал, конкретно для меня вообще все на свои места встало, я увидел, как большие данные, математика, алгоритмы, фокус на пользователе, его потребностях работают вместе как единый механизм и позволяют создавать прорывные продукты с одной стороны, и зарабатывать деньги с другой. Мне кажется, я из Яндекса унес это сформировавшееся желание делать продукты на основе данных и заниматься машинным обучением. С тех пор начал активно развиваться в этом направлении.
— Шел 2011 год, тема больших данных еще не сильно была популярна, особо не было программ. Где ты все изучал, читал?
— Контента доступного было конечно маловато, а мы были все такие жадные до знаний. Но Coursera уже была и, кстати, ШАД тоже. Я слушал лекции Воронцова по 15 раз и ничего не понимал. Многие через это проходили, интересная была эпоха.
В общем от темы информационного поиска начал отходить понемногу, нравилось работать с данными, привлекала новая область, связанная с машинным обучением, и в 2012 году я покинул компанию.
— А что после Яндекса?
После Яндекса был «Консультант Плюс». Уже более осознанно выбрал направление, связанное с анализом данных. Как раз данные пользовательских действий только начинали масштабно собирать, так что я влился в эту деятельность, начал делать проекты.
В общем, это было интересное время, вот сейчас есть множество доступных библиотек для машинного обучения, например, xgboost, а мы писали свой градиентный бустинг на деревьях на С++, сейчас, конечно, такое себе не каждая команда может позволить, да и незачем — все уже есть реализованное. Такая история.
— Своими силами писал или у тебя уже была команда?
— Команда уже была, да, к тому же из талантов. На втором году моей работы в «Консультант Плюс» к нам присоединился талантливый студент ВМК, который за пару месяцев написал свою реализацию бустинга и начал обучать модели.
К тому времени мы уже были нацелены на формирование целой команды data scientist’ов, чувствовали, что в данных есть много новых возможностей. Тогда очень удачно подвернулась возможность взять в команду двух выпускников ШАДа, которые знали, наверное, на голову больше, чем я, и разработчиков для построения хранилищ. Все попробовали, работали в основном на Hadoop кластере, хоть по современным меркам данных было не очень много.
В пике нас, наверное, человек 9 всего было, решали хорошие задачи. Например, искали всплески пользовательского интереса к разным тематикам, это помогало авторам более оптимально подходить к выбору тем, по которым есть смысл написать новый материал.
После этого я работал в компании Ezhome, это стартап в Пало-Альто. Туда меня, кстати, порекомендовал Митя Катаев, с которым вместе учились на программе «Специалист по большим данным». Его знакомый, Кирилл Клоков, работая в Ezhome директором по развитию, как раз искал data scientist-а в команду. Основная идея компании — создание Uber-experience для домашних сервисов; как отправная точка был выбран сервис ухода за придомовой территорией — начиная от стрижки газонов, заканчивая уборкой, высаживанием растений и деревьев. В итоге начал работать там как Data Scientist, очень хотелось попробовать свои силы в стартапе, да и руками поработать хотелось. У меня периодически возникает этот аналитический зуд, хочется самому что-то содержательное сделать, хоть я довольно давно в основном сфокусирован на организационных процессах. Раньше я надеялся, что когда-нибудь зуд утихнет, но нет, по сей день пытаюсь “сидеть на двух стульях”, то есть развиваться и как менеджер, и как специалист.
— Даже сейчас?
— Даже сейчас. Хотя в данный момент, конечно, на многое не хватает времени: большая команда, много управленческих задач, оттягиваюсь на выходных, благо сейчас для этого есть масса возможностей — kaggle, например. Хочется самому руками тоже что-то делать, но у меня в команде есть ребята, которые каждый в своей области явно получше меня. Но, на мой взгляд, для эффективного управления проектами в области анализа данных и у менеджера должны быть hard skills. Я постоянно учусь. Вот сейчас, например, решил пройти специализацию по программированию, просто чтобы не забывать, что к чему.
— Возвращаясь к Ezhome: зачем им нужен был data scientist? Какие задачи стояли перед тобой?
— Это хороший вопрос. В самом начале я спрашивал, какой результат ожидают от меня. Ответ был в духе: «мы сами пока точно не понимаем, давайте пробовать». Но быстро нашлась хорошая задача: на тот момент существовал bottleneck в привлечении новых клиентов, потому что каждую новую заявку обрабатывал человек, обмерял участок по снимку со спутника, пытался понять, сколько должно стоить обслуживание такого участка. Была экспертная линейная модель, которая занималась этой оценкой. Понятно, что качество прогноза хотелось улучшать, а как учесть большее число параметров экспертно, уже не определишь. Вот тут как раз и пригодилось машинное обучение. Мы стали прогнозировать время, которое будет тратить садовник, используя параметры участка. Параметры участков брали из открытых источников, а “учителя” — из исторических данных. Тогда уже была небольшая база активных клиентов на подписке на еженедельном обслуживании.
В итоге, задача выстрелила, для большинства входящих обращений были доступны данные, возможно было формировать индивидуальные цены на лету. Классическая автоматизация — роботы работают, люди отдыхают. Тогда меня пригласили приехать в головной офис в Долину на некоторое время, где-то на полтора месяца.
До этого я работал удаленно, там практически вся команда удалённая была: США, Индия, Греция, Польша, Россия. Команда была очень крутая, работать было одно удовольствие. Много классных задач удалось сделать, в итоге мне предложили позицию тимлида аналитики. Мы сделали некоторые улучшения в инфраструктуре, что позволило нам увеличить в разы количество проектов, которые мы делали. Потом предложили объединиться с другой командой, которая занималась разработкой программного обеспечения для построения маршрутов для работников: 5 тысяч клиентов, 150 садовников, как можно их объехать оптимальным образом. Это было очень увлекательно, мне и сейчас кажется, что задачи, которые больше про computer science, чем про data, тоже очень интересные.
— Параллельно с Lamoda ты рассматривал несколько предложений, почему все же выбор был сделан в пользу Lamoda? Что для тебя было критично?
— Да, предложений было несколько. Что меня зацепило в Lamoda? Четкая стратегия, понятные ожидания от меня, доверие и реалистичный ресурсный план в финансах, то есть передо мной очертили понятную задачу: «мы сейчас находимся вот тут, нам надо сюда, хотим развивать R&D, готовы проинвестировать Х, ожидаем такого-то экономического эффекта». Все. Никаких рассуждений о том, как космические корабли будут бороздить просторы вселенной или что всех заменят роботы. Плюс честный рассказ о том, как обстоят дела у компании. Все было прозрачно, четко и это, в общем-то, подкупило, потому что было полное ощущение, что я прихожу в команду людей, которые действительно ориентированы на результат и понимают, чего хотят. Кроме того, мне дали карт-бланш на развитие этого направления. Для меня это был какой-то персональный челлендж, у меня никогда не было возможности собрать такую большую команду. Сейчас 17 человек, и мы все еще растем.
— Это уже не первая компания, где ты выстраиваешь с нуля департамент R&D, собираешь команду. Какие первые 5 шагов ты предпринимаешь, приходя в компанию?
— R&D отдел был в Lamoda и до меня, за 7 лет даже несколько команд и руководителей сменилось. Кроме того, мы где-то половину текущей команды собрали внутри. Так что не совсем с нуля.
Первые пять шагов в новой компании? Алгоритм, я думаю, не специфичен для R&D, он, в принципе, такой может быть, если приходить в новую компанию на хоть какую-нибудь руководящую должность.
Первое – нужно разобраться с текущей стратегией компании, понять, какие перед компанией стоят цели, по каким KPI будут измеряться достижения.
Второе – описать, как именно с учетом своей компетенции или роли в компании можно на эти KPI влиять, должен быть какой-то набор доступных инструментов и идей. Описать потребности бизнеса и target state, то есть к чему мы вообще хотим прийти, а потом оценить доступный инструментарий. Машинное обучение — только один из них, и не для каждой задачи оптимальный.
Третий пункт – нужно провести аудит текущего состояния – люди, компетенции, процессы, данные, продукты, инфраструктура, особенно инфраструктура.
В общем, только на 4-ом шаге после аудита текущего состояния становится возможным описать дальнейшую стратегию перехода из текущего состояния в целевое. По сути — большая работа, включающая множество консультаций с заинтересованными лицами, stakeholder’ами, по итогам которых нужно выработать несколько возможных сценариев развития. В моей практике полезно было делать минимум 3 — консервативный, реалистичный и агрессивный в смысле ресурсозатрат. Дальше все полегче: после выбора стратегии делаем дорожную карту, уточняем оценку по ресурсам и приступаем к работе.
— Что для тебя data science?
— Data Science — это мой любимый инструмент. Это чрезвычайно захватывающая область, она как математика и физика, еще один способ познавать мир вокруг себя. Я это впервые особенно четко прочувствовал в Яндексе, когда мы занимались анализом поисковых запросов, понимали, какие у пользователей потребности, как они их решают, что вообще в мире происходит. То есть можно смотреть на мир через маленькую щелочку тех данных, с которыми работаешь. Это интересно и, на мой взгляд, ничем не отличается от других способов познания, просто другой “канал”, считайте, что это 7-ое чувство. То же самое было и в «Консультант Плюсе»: мы смотрели, какие пользователи решают проблемы, когда ищут судебные решения, то есть что конкретно волнует людей, какие у них споры, которые необходимо разрешать в судебном порядке. Если говорить про данные, которые мы в Lamoda анализируем, то это не менее захватывающе. Особенно когда узнаешь, что блузки и юбки покупаются скорее разных цветов, чем одинаковых. Любопытное наблюдение, с которым можно идти дальше по жизни. Много чего можно узнать про мир вокруг себя через данные. Поэтому я говорю, что это мой любимый инструмент. И вот он, с одной стороны, инструмент познавательный, а с другой стороны, инструмент деятельный, с помощью него можно что-то новое создавать.
— Если брать бизнес, то какую роль в бизнесе ты отводишь данным?
— Здесь самое главное не поддаваться хайпу. Если говорить о бизнесе, то данные, безусловно, должны работать. Результаты анализа данных должны приносить прибыль или сокращать издержки. Если они этого не делают, то что-то где-то пошло не так. В то же время data-driven культуру не надо понимать буквально, мы вполне можем принимать решения, не опираясь на данные, это нормально. Более того, в некоторых случаях только так и надо поступать.
— Расскажи, какие проекты вы делаете в Lamoda? Какой самый успешный проект, реализованный вашей командой?
— Наверное, первое, что стоит упомянуть – это платформа для A/B тестирования — по сути сервис, который разбивает пользователей на группы и управляет включением, выключением экспериментальных фичей. Почему это важно для нас? Потому что вообще сама эта область, связанная с машинным обучением, не может существовать без постоянного тестирования разных гипотез и идей. Мы не можем заранее знать, что нашим пользователям понравится больше или меньше. Любую новую идею нужно обязательно тестировать. Amazon приводит интересную статистику, они говорят, что 70% идей, которые они тестируют, проигрывают тест. К этому нужно спокойно относиться, даже если показатель будет выше. Это означает, что для того, чтобы релизить 5 успешных проектов в квартал, необходимо делать ±17. Поэтому надежная платформа для проведения контролируемых экспериментов – это базис, без которого совершенно невозможно двигаться вперед в плане развития продуктов. Учитывая наши амбициозные планы, было необходимо сделать некоторый апгрейд этой системе. До меня была сделана первая версия, мы ее значительно обновили: теперь можно запускать больше экспериментов одновременно, раньше были некоторые ограничения в этом смысле.
— А какие еще направления?
— Поиск, и здесь есть отличия от крупных игроков как Яндекс и Google, потому что мы можем очень хорошо проработать свою предметную область, она по сравнению с “универсальным поиском в интернете” довольно узкая. Невозможно сделать онтологию всего, описать все взаимосвязи, но в маленькой конкретной области можно делать очень хорошие решения, которые будут работать. Мы делаем свою лингвистику для поисковой системы, которая могла бы учитывать некоторые неявные взаимосвязи между разными сущностями. Например, есть некоторые бренды, которые объединены в группы, и формально, если ты ищешь вещь одного бренда, тебе можно показать вещь этого же бренда, просто другой торговой марки. Как пример, Tommy Hilfiger и Tommy Jeans, на самом деле это один бренд. Или понимать, что шпилька — это тоже формально каблук, а лоферы — это вообще-то туфли. В общем, мы хотим очень хорошо проработать свою предметную область, поэтому наш поиск будет в том числе развиваться за счет экспертных знаний сотрудников Lamoda.
Безусловно, один из ярких примеров проектов, которым мы занимаемся, — ранжирование товаров в каталоге. Это то самое ранжирование по популярности. Мы стараемся сделать так, чтобы пользователь, который приходит на сайт, как можно скорее нашел то, что ему понравится.
Еще есть проекты с рекомендательными системами, оптимизацией ценообразования, персонализацией, да много всего.
— Олег, расскажи про свой самый успешный проект.
— Самым успешным проектом является сейчас как раз внедрение нового ранжирования в каталоге. Оно стало чуть более умным, начало учитывать больше интересных данных. Мы, например, для унисекс товаров решили проблему контекста, то есть в контексте мужского каталога бутсы хорошо продающийся товар, а в контексте женского — не очень. По поведению пользователей выходит, что это скорее мужская обувь, хоть формально и унисекс. Много таких нюансов, которые хочется учесть. Так что мы не останавливаемся, тестируем новые гипотезы, стараемся активно сотрудничать с коммерческим департаментом и так далее.
— Как вы работаете над проектами? Как отбираете? Как долго выводите в продакшен?
— Статистики мало пока собрали на эту тему, но вообще у нас работа строится таким образом: несмотря на то, что организация уже достаточно большая, проектов больше, чем людей, поэтому мы под каждое направление собираем микро-команду. Например, у меня есть отдельная микро-команда, которая занимается рекомендательными системами. Те же самые люди могут быть задействованы и в других проектах, это нормально. Все решается в основном в рамках микро-команды, проводятся регулярные встречи и брейнштормы, планирование и ретроспективы, а также внутренние митапы и демо. Без демо никуда.
В текущем году на проект от стадии идеи до релиза уходит 4-6 недель. Но понятно, что такие проекты не все. Некоторые требуют гораздо больших ресурсных вложений, особенно если нужно вкладываться в архитектуру или делать что-то совсем новое или долго и дорого интегрироваться с другими системами. Максимальный срок составляет порядка нескольких месяцев. Если нужно улучшить что-то уже работающее, то это можно сделать достаточно быстро, если построить с нуля – это другая работа.
— Ты упомянул Amazon с их 70% провалившихся экспериментов, а какой процент в Lamoda?
— Я бы их лучше называл неудачными, чем провалившимися. Такие у нас, конечно, есть. Но мы считаем, что из любого эксперимента есть только два пути – это либо success, либо learning. Провалом мы неудачные эксперименты не называем. Настоящий провал — это когда из не принесшего экономического эффекта проекта мы не вынесли никаких уроков. Если новая идея проиграла текущей или хотя бы не выиграла, это значит нужно досконально разобраться почему так произошло, переосмыслить задачу и, возможно, сделать еще одну итерацию. Точно нужно какое-то знание вынести.
— Можешь рассказать о проекте в твоей карьере, который не взлетел? О самом большом разочаровании и learning’e, который ты вынес.
— Да, таких даже несколько наберется. К примеру, очень хотелось внедрить машинное обучение в поисковое ранжирование в одной из компаний. На этот проект мы потратили много времени, а по итогу оказалось, что ресурсов на внедрение такого решения просто нет, и проект пришлось закрыть. Для меня, как для менеджера, это был очень хороший learning, жалко, что дорогой. Определять границы допустимого (что мы сможем сделать, какие у нас есть ресурсы) нужно на старте, до того, как написана хотя бы строчка кода, иначе может получиться похожая ситуация. Причем команда проделала серьезную работу, и при моделировании на стенде даже хорошее качество получалось, но для внедрения требовались архитектурные изменения в приложении, и ради одного поиска компания на это не пошла.
— Что для тебя значит команда? Ты за год более, чем вдвое, увеличил команду, и вы продолжаете расти. Как ты подбираешь людей, что для тебя важно?
— Я считаю одним из своих главных достижений года работы в этой компании то, что у нас действительно отличная атмосфера в коллективе: она дружеская, основана на взаимной поддержке и уважении, при расширении команды это важно сохранить. Поэтому кроме профессиональных качеств мы, в том числе, пытаемся понять на собеседовании, сработаемся мы с человеком или нет. Все успешные кандидаты знакомятся с командой, это важно, к мнению команды я прислушиваюсь.
— Половина твоей команды, как и ты сам, либо проходили программы у нас в Newprolab до прихода в Lamoda, либо ты их направлял на учебу. Это случайность или ты подбирал людей из сообщества выпускников, из тех, с кем ты учился, пересекался на наших мероприятиях?
— Я бы хотел сказать, что я, конечно, подбирал, но я думаю, что это совпадения, хотя случайности неслучайны. Хочется привести здесь цитату Гриши Сапунова (преподаватель Newprolab — прим. ред.), что корреляция не означает каузацию, то есть не гарантирует наличие причинно-следственных связей. Теперь от лирики к проблематике. Мне кажется, что всех выпускников Newprolab объединяют качества, которые и мне в том числе кажутся полезными в команде. Есть какая-то третья причина, которая влияет на, условно, привлекательность программы для слушателя и кандидата для меня. Например, жадность до информации и высокий уровень внутренней мотивации. Трехмесячный курс с нагрузкой 3 лекции по три часа в неделю и 10 часов самостоятельной работы требует от человека быть определенного склада характера, и именно этим мне очень нравится атмосфера, которая у вас появляется на курсах. Потому что это достаточно сильно похоже на нормальный рабочий процесс. И люди, которые выдерживают эту нагрузку, заранее имеют фору перед теми, кто условно к такому режиму не готов, в общем, есть разница.
— Многие могут тебе здесь возразить, что получить сертификат на онлайн программах сложнее, там нужна мотивация, может, и повыше, никто тебя не подпинывает, спросить зачастую не у кого, сам разбираешься во всем.
— Так мы же команда, у нас нет цели, чтобы человек ушел в себя на 4 месяца, например, как в специализации на Coursera, и работал сам с собой, у нас есть задача работать в коллективе. Мы и на программе помогали друг другу, у нас были чаты, мы общались, все делились друг с другом своими решениями. Это очень похоже на рабочий процесс, мы так же работаем, у нас каждый делает свою часть, за которую взял ответственность, но при этом все друг с другом советуются, общаются постоянно, это и есть командная работа.
— Вы с Петей Ермаковым преподаете на «Специалисте по большим данным», другие члены твоей команды тоже преподают, выступают на конференциях. Зачем это нужно, что это конкретно тебе дает?
— Лично для меня выступление – это способ пообщаться с сообществом и донести какие-то свои мысли широкой аудитории. Мне кажется, что это полезно, потому что все равно мы все немножко по-разному понимаем то, чем занимаемся. И какую-то собственную индивидуальность показать, и найти единомышленников очень полезно. Если говорить о преподавании, для меня это достаточно новый опыт. Что меня мотивирует это делать? Я вижу в этом социальную ответственность: научился что-то делать сам, научи другого. Мне кажется, как раз так и должно быть. Безусловно, это навеяно, в том числе, и наличием некоторых проблем в системе образования, потому что зачастую люди, которые преподают, не являются практикующими специалистами в этой области. Поэтому кажется, что это необходимо. И мне это тоже нужно, потому что, если я буду делиться своими знаниями, я тем самым хоть на малую долю, но все-таки буду подстегивать сообщество и индустрию развивать. Мне же потом с этими людьми работать, на рынке сейчас явный недостаток экспертизы, надо помогать людям.
— Полтора года ты работал в американском стартапе, жил в Сан-Франциско. Почему не продолжил строить карьеру там, в Штатах? Почему ты выбрал остаться здесь?
— Сейчас довольно странно прозвучит, но не делаю большого различия между «там» и «здесь», то есть для меня территориальная локация не так принципиальна, я вообще не очень понимаю людей, которые говорят, что надо обязательно куда-то уехать. Когда я ехал в Долину, ожидал некоторого вау-эффекта от опыта и уровня специалистов, которые там работают. Я этого не увидел. Честно могу сказать, что в Москве можно собрать команду инженеров, которая ни в чем не будет уступать абстрактной команде стартапа в Долине, и это тоже нормально. Я шел за проектом, Lamoda была интереснее. Если будет в моей карьере предложение о каком-то очень интересном проекте в Штатах, я не исключаю возможности поучаствовать.
— Какие профильные блоги, тг каналы ты читаешь на досуге?
— Я читаю Slack ODS, статьи на Хабре, видео смотрю со всяких митапов, субботние тренировки по машинному обучению от Яндекса. Да в принципе, наверное, все, это такой сухпай, мне просто не хватает времени, я очень много работаю, а еще есть личная жизнь.
— Ты в самом начале говорил про ценности, про личный и общественный успех, про особенности мышления. Можешь рассказать, что для тебя важно, какие у тебя ценности и что для тебя личный успех и успех общественный?
— Если вкратце, то мне видится это таким образом: для меня ценна общественная, социальная значимость. Я думаю, что, если бы я не стал заниматься data science, я бы занялся медициной. И, возможно, когда-нибудь я смогу совместить эти два гештальта.
— Один ты уже закрываешь, мне кажется, прекрасно.
— Кажется, что так. Но история про анализ медицинских данных очень привлекает. Ничего ценнее, чем человеческая жизнь, нет. Мне кажется, что, если когда-нибудь мне удастся сделать в этом направлении какой-то маленький шаг вперед, это будет очень здорово. Сейчас масштабная применимость машинного обучения в медицине пока под вопросом — медицинские данные разрозненные, неструктурированные, нет единых стандартов, они засекречены, с ними много проблем. Кроме того нужно получать кучу аккредитаций, чтобы сделать какие-то мало-мальски хорошие продукты. И, я думаю, будет классно подготовиться к той эпохе, когда в этом контексте все нормализуется, набраться опыта, навыков и, может, когда-нибудь я этим тоже позанимаюсь, идея об этом периодически всплывает в моей голове.
Если говорить про личный успех, довольные пользователи и прибыль для бизнеса — вот, наверное, два мерила успеха, которые значимы. Еще в рамках личного успеха, мне кажется, нужно расходовать свой ресурс с максимальной пользой. Я здесь вот что имею в виду: куда бы я ни приходил, я всегда стараюсь занять ту ролевую позицию, в которой я могу принести максимум пользы, пытаюсь увидеть узкие места и зоны роста. Ezhome — хороший пример: я пришел туда как data scientist, потому что мне было интересно делать руками что-то, потом я увидел, что могу с большей отдачей потрудиться и над другими задачами. Есть люди, которые заранее сильно сфокусированы на чем-то конкретном. Я в этом плане чуть более открыт к новому, если так надо для общего блага. Я в принципе фанат оптимизации, что бы это ни значило.
Наверно поэтому я так люблю свою работу, она позволяет мне использовать свои сильные стороны для достижения целей, которые ценны как компании, так и лично мне.