
Подходит к концу десятилетие, и без преувеличения можно сказать, что одной из основных тенденций этих десяти лет стало повсеместное внедрение анализа данных. От проектирования самолётов до выплавки стали, от вызова такси до умных чайников и говорящих колонок. Рекомендательные системы, компьютерное зрение, обработка естественного языка, машинное обучение, оптическое распознавание символов, нейронные сети, искусственный интеллект, все эти направления деятельности прочно закрепились в мире информационных технологий и нет ни малейшего повода полагать, что в ближайшее время что-то изменится. Общественность ждёт, что Data Science придет во все большее количество сфер жизни человека, автомобили станут беспилотными, а границы государств будут охранять огромные боевые человекоподобные роботы.
Какой была индустрия раньше, что она представляет сейчас и какие сюрпризы нас ждут в будущем. Ответы на все эти вопросы вы сможете получить 16 декабря на ок.tech: Data Толк #4. В предверии мероприятия мы поговорили со спикерами о прошлом настоящем и будущем Data Science. Под катом вас ждут мини-интервью.
Зарегистрироваться на мероприятие.
Расскажи чем ты занимался до Data Sceince?
Артур Кузин
До погружения в Data Scientce я был научным сотрудником и занимался экспериментальной физикой в области микро и нанометрологий.
Дмитрий Бугайченко
До перехода в Data Science 8 лет отработал в аутсорсинге над самыми разными проектами – от разработки драйвера для источника бесперебойного питания до проектирования больших распределенных ERP систем. Кроме того, вел собственный исследовательский проект в области формальной спецификации и верификации. С удивлением обнаружил, что многие приемы из этих областей с успехом могут применяться и в DS.
Андрей Якушев
До текущей работы в ВКонтакте, я занимался прикладными исследованиями в аспирантуре ИТМО в области BigData и той же самой DS, работал в интернет компании над «стандартными» веб-сервисами и успел немного поработать по направлению вычислительной геометрии. Все эти направления работы дали хороший опыт и навыки, чтобы сейчас делать сложный DS.
А чем занимаешься сейчас?
Артур Кузин
Руковожу командной, которая разрабатывает решения на базе компьютерного зрения для X5 Retail Group.
Дмитрий Бугайченко
В данный конкретный момент пытаюсь разобраться в устройстве большой и сложной системы и определить каким образом в её рамках можно организовать платформу для разработки рекомендательных сервисов.
Андрей Якушев
Сейчас я выполняю обязанности руководителя команды, которая развивает ленты новостей в ВК и различные рекомендательные системы. На работе я предлагаю гипотезы по улучшнию ML, алгоритмов, технологий и продуктов в ВК, предлагаю варианты решений, но саму работу и проработку большого числа деталей и нюансов делают уже непосредственно ребята из команды.
Так же слежу за методологией и правильностью выводов при ответе на сложные и, по сути, исследовательские вопросы о том как сделать эти продукты ВК лучше.
Как изменилась твоя работа за последние несколько лет? Куда сместился фокус?
Артур Кузин
За последние несколько лет я плавное перекатываюсь в менеджера. И если раньше меня интересовали модельки и архитектуры, то сейчас вызывает интерес законченные пайплайны и решения.
Дмитрий Бугайченко
Все больше приходится работать с людьми и их интересами – понять с какими проблемами столкнулся человек и как эти проблемы можно решить.
Андрей Якушев
Фокус дрейфовал от непосредственно обучения моделей и создания full-stack работающих систем, до проработки архитектуры, тимлидовских и продуктовых задач.
Самая крутая штука, которая тебя поразила в Data Science за последний год? 5 лет?
Артур Кузин
AlphaGo / AlphaStar. Мы живём в удивительное время!
Дмитрий Бугайченко
Понравился набор статей с осознанной рефлексией по нейросетям – сколько энергии на них сжигается, сколько статей с невоспроизводимыми результатами, как часто более простые методы по-прежнему дают хороший результат. В более долговременной перспективе завораживают успехи reinforcement learning. В этом году успехи AI в StarCraft – с интересом смотрю стримы по этой игре, успеха там AI добиться куда сложнее чем в традиционных шахматах и го.
Андрей Якушев
Удивили успехи AlphaStar, нарастающий антихайп к нейронкам (как мне кажется по моему информационному окружению) – думаю, что там еще очень много всего интересного будет.
Из близких ко мне направлений и более старых вещей удивили успехи, практичность и универсальность моделей word2vec и ее вариаций.
В целом всегда поражало развитие по спирали в областях научного знания – возвращение и улучшение идей, над которыми уже работали десятки лет назад.
В какой прикладной области случатся ближайшие прорывы?
Артур Кузин
Сложно сказать, где будут новые научные порывы. С точки зрения применения кажется, что звук и RL пока получали недостаточно внимания.
Дмитрий Бугайченко
Думаю, что ближайшие прорывы будут связанные скорее с изменениями в обществе вызванными развитием основанных на данных и AI систем.
Андрей Якушев
В областях, связанных с доставкой интересной и релевантной информации до каждого человека, который выходит в интернет. Хочется верить, что уже скоро DS придет в медицину и поменяет всю нашу жизнь.
Как ты думаешь, в какой области жизни Data Science станет незаменим в ближайшие 10 лет?
Артур Кузин
Мне кажется, Data Science незаметно проникнет во все аспекты нашей жизни и процессы в обществе станут без этого невозможны.
Дмитрий Бугайченко
А в каких еще не стал?
Андрей Якушев
Во всех областях с достаточно большим числом элементов и где уже начинают работать статистические закономерности.
Скажи, пожалуйста, что нужно начать делать сейчас, чтобы быть востребованным дата саентистом и через 10 лет.
Артур Кузин
Нужно подумать и честно ответить себе: можно ли мою работу автоматизировать? Если ответ – «да», то вы в опасности. В остальном кажется, что нужно просто найти то, что приносит удовольствие. В противном случае не выйдет уделять достаточно времени работе, чтобы стать профессионалом.
Дмитрий Бугайченко
Организовать свой стартап. На самом деле, думаю, что в область Data Science тоже придет тот самый, рождающийся здесь же, AI и все радикально перекроит. В этом плане адаптироваться будет проще людям с широким кругозором и интересами.
Андрей Якушев
Предположу что любой разработчик сможет делать базовый fit+predict так, чтобы это давало 80% результата в задаче. DS станет рутиной, так же как и создание стандартных сайтов визиток. Если хочется быть востребованным, то надо будет либо делать чертовски хороший fit+predict, либо совмещать в себе и другие роли — разработчика, аналитика, менеджера,…
Ребята, большое спасибо, что нашли время ответить на вопросы!
Мы ждем всех, кто хочет пообщаться с экспертами в области Data Science 16 декабря в свой московский офис.
Приходите, будет полезно и интересно!
Зарегистрироваться на мероприятие.