Эти люди создают искусственный интеллект — 4 истории специалистов по ИИ и ML / Хабр

Четыре опытных специалиста о том, как занялись искусственным интеллектом, с какими сложностями столкнулись и какие задачи решают.

«Поначалу всегда было страшно, но я ни разу не пожалел»

Григорий Сапунов, CTO, Intento

Сооснователь и технический директор в стартапе, отвечает за технологическое развитие, архитектуру решений и оценку их качества, применение AI и другие технические вопросы, занимается управлением, разработкой и наймом сотрудников.

Начало пути. Сложно сказать, что именно привело меня в профессию: еще с детства мне было интересно программирование. Параллельно я интересовался психологией, биологией, математикой, радиоэлектроникой, читал журналы «Юный техник» и «Юный натуралист».

Долгое время все, что связано с искусственным интеллектом, было для меня скорее хобби, чем профессией. В какой-то момент я понял, что эти темы составляют и заметную часть моих рабочих задач. Можно сопоставить это с моим приходом в Яндекс в 2007 году.

Первые трудности. В моем случае переход был постепенным: моя профессиональная деятельность началась с разного рода ИТ-проектов, а первым «коммерческим» проектом стала поисковая система для «Московской коллекции рефератов», написанная на Perl. Не всегда удавалось разобраться в новых темах с первого раза, приходилось перечитывать по несколько разных книг, чтобы что-то понять, а также много экспериментировать.

Я неоднократно ввязывался в совершенно новые проекты, где на старте у меня полностью отсутствовали нужные знания — приходилось осваивать по ходу дела. Поначалу всегда было страшно, но я ни разу не пожалел.

Чтобы разобраться, как все работает, практически всегда я начинал программировать с самого низкого уровня. Так было и с алгоритмом рисования линии Брезенхема, затенением по Фонгу или Гуро — когда изучал компьютерную графику, и с созданием простой нейросети, реализацией метода опорных векторов или генетического алгоритма— когда глубже погружался в ИИ. Потом я долго перебарывал себя: не хотел пользоваться готовыми библиотеками и старался написать все свое с нуля.

Профессиональные задачи. Искусственный интеллект стал довольно универсальной технологией. За последние несколько лет с помощью ML или Software Engineering я вместе с коллегами делал очень разные задачи:

распознавание изображений: дорожных знаков с видеокамеры смартфона или товаров на полке магазина;
структуризацию новостного потока: кластеризацию новостей по общим темам, аннотирование получившихся кластеров и выделение важных фактов, ранжирование потока по важности и т.п.;
прогнозирование в образовании: кто из студентов бросит онлайн-курс в ближайшее время;
realtime-аналитику по колл-центру: определение темы телефонного разговора и эмоций людей;
анализ геномных данных: для определения структуры хроматина;
работу с текстами: нахождение соответствующих друг другу предложений между параллельными текстами на двух разных языках;
и многое другое :–)

Сейчас я определяю слабые и сильные стороны моделей и сервисов на базе искусственного интеллекта. Это помогает выбрать, какие из них подходят под конкретную бизнес-задачу.

Планы на будущее. Что планирую делать дальше? Буду применять свои наработанные навыки в сферах медицины и биологии, изучать «психологию» естественных и искусственных сложных систем, пытаться создать ИИ-ученого или, как минимум, ассистента, чтобы повысить свою эффективность. Планирую также освоить несколько новых для себя языков программирования: Rust, Swift, Kotlin, Julia или Elixir. А также попробую сделать больше «железных» проектов с искусственным интеллектом на базе Jetson Nano, Google Edge TPU или с FPGA.

Дмитрий Коробченко, Deep Learning R&D Engineer and Manager, NVIDIA

Руководитель R&D группы, занимается обработкой изображений: применением нейросетей для обработки изображений, компьютерной графики, анимации и физической симуляции.

Начало пути. Во время учебы в университете я увлекался компьютерным зрением и поэтому решил вступить в Лабораторию компьютерной графики и мультимедиа на факультете вычислительной математики и кибернетики МГУ.

Работая в Samsung после университета, я вернулся к компьютерному зрению: одним из первых моих проектов стал анализ медицинских изображений с применением сверточных нейронных сетей. А когда в 2012 году нейронные сети активно распространились и на другие области, спектр моих проектов значительно расширился.

Профессиональные задачи. Будучи Deep Learning R&D Engineer, я занимаюсь как исследованиями, так и разработкой: от создания новых алгоритмов и проведения различных экспериментов до реализации конечных продуктов с последующей оптимизацией. Кроме того, последние несколько лет я выступаю с мастер-классами и являюсь преподавателем на курсах по машинному обучению и нейронным сетям в различных школах дополнительного образования.

Сейчас большинство моих задач связаны со сложными типами данных — изображениями, звуками, полигональными моделями, тензорные данными и т.д. В том числе я продолжаю заниматься компьютерным зрением: классификацией изображений, детектированием объектов, семантической сегментацией; создаю нейросетевые фреймворки.

Планы на будущее. В моих ближайших планах усилить R&D группу, специализирующуюся на нейронных сетях в московском офисе NVIDIA, а также продолжить развиваться в образовательной сфере в области искусственного интеллекта: делать контент для лекций, курсов и личного YouTube-канала.

«На заре 2000-х термина Data Scientist не существовало, но по сути я занималась именно этим»

Анна Костикова, Director Data Science and Bioinformatics в Novartis

Руководит командой, в задачи которой входит создание персонализированной медицины при разработке новых лекарств. Суть работы группы заключается в том, что лекарства разрабатываются и подбираются на основе анализа цифровой информации о ДНК, белках и клинических данных пациентов. Для этого Анна и ее команда используют машинное обучение, биоинформатику и статистику.

Начало пути. На заре 2000-х термина Data Scientist не существовало, но по сути я занималась именно этим. Например, в университете я нашла подработку, где должна была собрать данные для базы данных, придумать структуру и сделать так, чтобы с базой можно было работать. Все это я делала в MS Access на компьютере с 512 Мб оперативный памяти и 1 Гб места на жестком диске :–)

На третьем курсе я устроилась на стажировку в некоммерческую компанию, где занимались анализом космических снимков. Именно тогда я впервые попробовала применить нейронные сети, классификацию без обучения и с ним, fuzzy logic и т.д. Тогда компьютеры с 4 гигабайтами оперативной памяти были сравнимы чуду, и мы не выключали их на выходные — чтобы они «досчитывали», пока мы отдыхали.

Первые трудности. Впервые работа с официальным «титулом» Data Scientist появилась у меня в 2014 году. Тогда я устроилась в Booking.com и узнала, каково работать в этой сфере в промышленных масштабах: с выборками данных в миллиарды строк.

В любой области первые два года самые сложные: вся терминология для тебя новая, непонятно, что важно, а что нет.

Обучение новому — это всегда сигмоидная функция: надо преодолеть первое плато, когда кажется, что ты никогда не разберешься. Например, в аспирантуре в Швейцарии мне нужно было научиться анализировать геномные данные и написать скрипт на Perl для масштабного анализа. На тот момент я ничего из этого не знала, но как-то выкрутилась. Главное — не бояться и пробовать.

Профессиональные задачи. В моей практике было очень много разных задач: от анализа космических снимков для WWF до оптимизации процесса пивоварения в Heineken, от предсказания поведения пользователей в интернете для Booking.com до предсказания работы лекарств в Novartis.

Сейчас я работаю директором по анализу данных и биоинформатики в Novartis. Еще у меня своя компания в области диагностики рака. Я бы очень хотела максимально использовать Data Science и машинное обучение для здравоохранения и медицины — от разработки лекарств до диагностики. Я верю, что следующие 20–50 лет львиная доля усилий аналитиков во всем мире будет направлена на решение именно биомедицинских задач, изменение качества жизни человечества, а не только на оптимизацию в интернете и на производстве.

«Тогда я был уверен, что уже знаю все, хотя еще вообще ничего не знал»

Никита Семенов, NLP team lead, центр искусственного интеллекта МТС

Руководит командами NLP и занимается всем, что связано с обработкой и пониманием естественного языка.

Начало пути. Еще на первых курсах института я начал факультативно изучать машинное обучение: учился по специальности «Компьютерная безопасность», но постепенно понял, что не хотел бы связать с ней свою жизнь. Мой научный руководитель закончил Миланский политех по программе Computer Science, и с ним мы начали развивать факультативный курс по машинному обучению. Подобного термина тогда не существовало, и во всем мире говорили только об элементах статического обучения, которые мы и изучали. К сожалению, в России до сих пор нет подобных программ по Computer Science.

Найти работу после вуза именно по профилю машинного обучения было крайне сложно — сфера только зарождалась. Поэтому я вышел в небольшой стартап, который занимался автоматизацией ставок на сайтах контекстной рекламы по типу Google AdWords. Моей первой задачей было разработать механизм исходя из статистики и предиктивной способности цели таким образом, чтобы мы всегда занимали не первую ставку, а вторую или третью — эти строки тоже показывают в топе выдачи, но они значительно дешевле. Тогда я был уверен, что уже знаю все, хотя еще вообще ничего не знал.

Первые трудности. Для меня большую трудность составляли soft-скиллы: нужно было объяснить, чем я занимаюсь, что это все значит, как и что интерпретировать, и какой будет эффект, людям, которые вообще ничего не понимали в моей сфере. Тогда процессы взаимного обучения еще не были мейнстримом, поэтому взаимодействовать с командой было очень сложно. Я постоянно практиковался: пробовал доносить свои мысли и объяснять команде даже самые простые метрики. Думаю, если бы сейчас я только начинал свою карьеру, то не смог бы так сильно прокачаться в общении — подобные вопросы уже практически никто не задает.

С hard-скиллами проблем не было: тогда мои задачи опирались на статистическое обучение и математику, в которых я хорошо разбирался. Несмотря на это, я все равно читал книги: в Data Sience нужно постоянно развиваться, чтобы разбираться в инструментах и трендах. Вообще, весь мой опыт работы — это один большой челлендж. Каждое место требовало новых инструментов и знаний, поэтому развиваться самостоятельно приходилось всегда.

После работы в стартапе была компания, где я стал первым Data Scientist и R&D: помогал настраивать первые инструменты аналитики, занимался компьютерным зрением и построением предиктивных моделей на основе данных с космических спутников.

Профессиональные задачи. В МТС я пришел на позицию Senior computer vision engineer, а потом дорос до тимлида двух команд. Мне особенно важно прокачивать soft-скиллы, ведь тимлид — это играющий тренер. Если говорить о задачах, то здесь я занимаюсь всем, что связано с обработкой и пониманием естественного языка. Сейчас это уже своеобразный тренд, который задает новые тренды, направленные на упрощение жизни человека в будущем.

Со временем я понял, что предметная область не так сильно влияет на область твоих знаний. В моем случае предметная область всегда затрагивает то, как обработать и применить данные к какому-либо решению. А подходы всегда остаются одинаковыми. И когда в предметной области специалисты придумывают инновационное решение, например, в компьютерном знании, со временем оно перетекает в другие области. В связи с этим грань между областями постепенно стирается, а подходы и базы становятся похожи.

Главная проблема нашей сферы заключается в том, что она развивается очень неравномерно. Приведу пример: в Data Science долгое время все может быть спокойно, а потом кто-то резко придумывает решение, и через короткое время эти прорывные вещи становятся стандартом для всех. В плане работы это и хорошо, и плохо одновременно: с одной стороны, ты постоянно прокачиваешь скиллы и «бежишь» в 10 раз быстрее, чем остальные, с другой стороны, твой профиль работы постоянно меняется.

Планы на будущее. Пока у меня нет понимания, в каких сферах я хочу развиваться дальше. Мне хочется еще больше погрузиться в то, чем я занимаюсь сейчас.

От редакции Нетологии

Большинство опытных специалистов в ИИ пришли в профессию одним из двух способов:

перешли из другой сферы деятельности, профессии;
работали по другим специальностям в ИТ, и в какой-то момент погрузились в задачи, связанные с искусственным интеллектом и анализом данных.

В любом случае, даже опытные специалисты непрерывно учатся новому, изучают полезные ресурсы и статьи, проходят курсы повышения квалификации.

Несмотря на то, что российские университеты еще не внедрили соответствующие образовательные программы, сейчас стать Data Scientist проще, чем во времена героев нашей статьи.

Если вам интересна сфера искусственного интеллекта, машинного обучения и аналитики — приглашаем изучить программы наших курсов «Deep Learning» и «Машинное обучение».

Эти люди создают искусственный интеллект — 4 истории специалистов по ИИ и ML