Как стать автором
Обновить
0
New Professions Lab
Обучение в области работы с данными с 2015 г.

«Держите руку на пульсе и глядите по сторонам» – интервью об ИИ с со-основателем Intento Григорием Сапуновым

Время на прочтение 9 мин
Количество просмотров 10K
На днях мы решили пообщаться с нашим главным преподавателем на программе Deep Learning, Григорием Сапуновым, и обсудить с ним актуальные вопросы, связанные со сферой искусственного интеллекта (ИИ). Григорий несколько лет назад был руководителем разработки Яндекс.Новостей. В настоящий момент является CTO и сооснователем компании Intento. Уже 15 лет как занимается анализом данных, искусственным интеллектом и машинным обучением, с 2011 года занимается Deep Learning, участвовал в проектах RoadAR (нейросетевое распознавание объектов на дороге), Icon8 (нейросетевые фильтры) и др.

image

— Давно хотелось предметно пообщаться с тобой по теме искусственного интеллекта. Ты давно в этой теме, хорошо разбираешься и следишь за ней, консультируешь n-ое количество стартапов… Что тебя вообще изначально привлекло в этой теме?

— Я всегда был неравнодушен к кросс-дисциплинарным темам, особенно на стыке таких интересных для меня областей как программирование, биология, математика, науки о мозге, психология, лингвистика, философия. Искусственный интеллект как раз находится на пересечении всех этих направлений. Здесь есть много сложных вызовов, есть постоянное ощущение, что ты находишься на подступах к неизведанному, и при всей уже довольно долгой истории этого направления всё равно по факту ты регулярно оказываешься в местах, куда до тебя мало кто захаживал. Это безумно интересно.

— Ты начал увлекаться этим, когда еще это не стало модным. С чем ты связываешь бум, который мы сейчас переживаем с развитием ИИ? И есть ли он на самом деле? Может быть, это очередная шумиха с завышенными ожиданиями?

— Как обычно здесь есть и конструктивная история, и неконструктивная.

Конструктивная часть в том, что в последние годы случился прорыв в работе с нейросетями. Парадокс в том, что многие из имеющих отношение к этому прорыву идей, алгоритмов и методов были разработаны уже давно и не являются какой-то особой новизной. Около пяти лет назад удачно сошлись вместе в одной точке рост вычислительных возможностей и появление больших датасетов. И тут выяснилось, что старые алгоритмы в общем-то неплохо работают, а раньше просто не хватало ресурсов, чтобы их как следует обучить. С тех пор уже и концептуально новых вещей появилось немало, и по нескольким областям (например, распознаванию речи и компьютерному зрению) deep learning успешно прошёл и вытеснил традиционные методы. Большинство книг по ИИ старше пяти лет уже опасно читать, потому что они устарели. Например, они постоянно эксплуатируют пример задачи, которую не способен решить компьютер, но может решить трёхлетний ребёнок — отличить кошку от собаки. Это уже давно (несколько лет как) неправда. Компьютер отлично распознаёт изображения, причём делает это с качеством выше человека. Или ещё совсем недавно (год-два назад) считалось, что игра го останется неприступной ещё лет двадцать. Весной 2016 года стало ясно, что это уже не так. Мало кто ожидал. То есть в этом месте бум полностью оправдан.

Более того, есть чувство, что в данный момент фантазия не поспевает за технологиями. Текущие наработки весьма универсальны, могут быть применены для очень разных задач, и о множестве таких применений ещё просто никто не додумался. Либо додумался, но ещё не посвятил этому нужное количество времени. У меня есть свой шорт-лист подобных задач, вот жду когда сам доберусь до них, либо кто-то сделает :)

Хайп с завышенными ожиданиями, к сожалению, тоже присутствует. И на примере истории ИИ мы уже знаем, что всё повторяется и к чему это приводит. Ещё на заре зарождения области ИИ в 1956 году один из основоположников области (Джон Маккарти) заявлял, что серьёзный прогресс может быть достигнут за одно лето, а чуть позже в 1965-м не менее крутой человек (Герберт Саймон) заявлял, что в течение 20 лет машины смогут делать всё то, что умеет человек. И эти завышенные ожидания уже приводили к “зимам искусственного интеллекта”, когда все разочаровывались отсутствием обещанных результатов и прикрывали финансирование ИИ проектов. Есть риск ещё одной зимы и сейчас. Потому что наряду с имеющимися успехами есть ещё масса нерешённых вопросов, которые остаются за скобками в восторженных публикациях прессы. Но как обычно, хочется верить, что в этот раз всё будет по-другому :)

— Многие сейчас опасаются, что ИИ уничтожит массу профессий. Какие задачи все-таки ИИ может решать сейчас на высоком уровне? И кому в итоге стоит опасаться конкуренции со стороны ИИ?

— Различные международные исследовательские группы и медиа уже регулярно выпускают списки профессий, ранжированных по риску быть заменёнными компьютерами. Некоторые из этих списков выглядят странно, некоторые довольно правдоподобно. Вы сами можете спокойно найти несколько таких в Интернете.

ИИ уже сейчас может заменить или сильно потеснить людей в куче тех мест, где люди нужны были лишь для распознавания визуальных или голосовых образов. Либо там, где люди вынуждены перелопачивать огромные массивы информации (это более родная среда для компьютеров).

Я думаю, трагизм и комизм ситуации будут в том, что в первую очередь ИИ вымоет множество людей из этой же самой области и более широко из ИТ. В данный момент есть большое число data scientist’ов, занимающихся лишь применением готовых рецептов и перебором параметров для моделей. Это тупая нетворческая работа должна и будет автоматизирована и разные компании уже этим занимаются (см. например, FBLearner Flow). В программировании также есть огромное число нудных и скучных занятий, которые давно уже пора автоматизировать (см. замечательные слова Сассмана, одного из авторов SICP: «Программирование сегодня больше напоминает науку: вы берете часть библиотеки и «тыкаете» в нее — смотрите на то, что она делает. Затем вы спрашиваете себя, «Могу ли я настроить это так, чтобы оно делало то, что мне нужно?». Подход «анализ через синтез», используемый в SICP, когда вы строите большую систему из простых, маленьких частей, стал неактуальным. Сегодня мы программируем «методом тыка», habrahabr.ru/post/282986). Мы, кстати, в текущем проекте Intento целимся в автоматизацию одной из таких программистских областей. Следите за анонсами :)

— А если пофантазировать на 5-10 лет? Вопрос может быть насущным для тех, кто сейчас только поступает в ВУЗ.

— В первую очередь везде уйдут посредственности. Посредственные учителя, посредственные программисты, посредственные переводчики, посредственные юристы. Если чему-то учитесь, становитесь лучшим. Ну и не чурайтесь новых технологий. Сила всё-таки не в замене человека на ИИ, а в дополнении его ИИ. Те, кто будут постоянно совершенствоваться и смогут удачно дополнить себя информационными технологиями нового века, в проигрыше никогда не останутся.

Какие-то профессии безусловно уйдут в небытие, но даже если вы сейчас учитесь на одну из таких профессий, держите руку на пульсе и глядите по сторонам. Часть профессий уйдёт, но сколько появится новых, о которых мы ещё не догадываемся? Когда из повседневной жизни исчезли лошади, возникло целое море новых профессий вокруг автомобилей и транспорта. Про эти новые профессии ещё можно было догадаться по аналогии, но когда появились компьютеры, возникли профессии, о многих из которых заранее даже подумать было нельзя. Если вы всегда открыты новому, то без проблем найдёте себе место в этом новом мире.

— Сейчас, говоря “искусственный интеллект”, мы почти сразу же подразумеваем или выстраиваем ассоциацию “deep learning”. Насколько это вообще оправдано? Что еще может быть зашито внутри ИИ, кроме глубоких нейронных сетей?

— Deep learning (DL) вытеснил в медийном поле все остальные методы ИИ и практически стал синонимом ИИ. Но это, конечно, неправда. Есть огромное число методов за пределами DL. Есть, например, эволюционные вычисления и методы swarm intelligence, способные находить решения очень сложных задач оптимизации (часто NP-сложных). Есть символьные методы представления знаний и логического вывода, которые очень сильны в области автоматических рассуждений и могут, например, объяснить как получен тот или иной вывод. DL в данный момент этого практически не умеет (недавняя свежая публикация DeepMind про Differentiable neural computers приоткрывает дорогу для DL в этом направлении). Есть интересное направление под названием Probabilistic Programming. Откройте любую вменяемую книгу про ИИ, там в оглавлении огромное количество разных методов.

Могу посоветовать сравнительно недавнюю мою презентацию про современное состояние ИИ, которую я делал для школьников в рамках проекта GoTo School. Она далеко не полна, но там есть много примеров успеха отличных от DL подходов.

— Почему вообще, на твой взгляд, deep learning хорош в решении многих задач, которые выполняет человек? Может ли быть что-то придумано в альтернативу?

— Это на самом деле трудный вопрос: почему DL работает, и почему он работает так эффективно. Параллельный вопрос на самом деле — почему мозг человека способен хорошо решать эти же задачи. Учёные пытаются объяснить это с помощью физики.

Видимо, есть какая-то общность принципов, хоть искусственные нейросети и довольно далеки от биологических.

Комплементарный интересный вопрос, какие задачи плохо выполняет человек и способна хорошо выполнять машина (возможно, какой-то новой архитектуры). Кроме очевидных быстрого счёта и хранения больших массивов данных. Мне в этом смысле очень нравятся слова Хэмминга: “Just as there are odors that dogs can smell and we cannot, as well as sounds that dogs can hear and we cannot, so too there are wavelengths of light we cannot see and flavors we cannot taste. Why then, given our brains wired the way they are, does the remark «Perhaps there are thoughts we cannot think,» surprise you? Evolution, so far, may possibly have blocked us from being able to think in some directions; there could be unthinkable thoughts.” Это то место, где ИИ потенциально может совершить для нас революцию.

При этом надо помнить, что есть ещё много других задач, для которых DL не подходит, а подходят другие методы. См. например, символьные методы, о которых я говорил ранее.

— По твоим ощущениям, рынок сейчас испытывает дефицит специалистов, которые способны заниматься обучением глубоких нейронных сетей? Какой тренд вообще ты ожидаешь?

— Запрос на специалистов сильно больше, чем их есть в наличии. Я это вижу по количеству обращений, динамике открытых вакансий, а также по наличию непаханных полей, где DL явно должен произвести переворот, как он сделал это в обработке звука и изображений.

Из трендов я таки ожидаю скорое вымывание “поверхностных” data scientist’ов. Если вы решили войти в эту область, не останавливайтесь после первых успехов, копайте дальше. Это та область, в которой надо постоянно учиться. Если вам это некомфортно, DL/ML/AI не для вас. Впрочем, что вы тогда делаете в ИТ?

— Я так понимаю, что это одна из причин, по которой стоит пойти на нашу образовательную программу по deep learning. Расскажи чуть подробнее о ней — как ты ее видишь? В чем ее польза?

— Область огромна, стать специалистом нельзя ни за два дня, ни за три месяца. Я вижу свою цель в том, чтобы дать участникам базовое понимание области DL, терминологию и интуицию, которая стоит за основными методами, а также фреймворк для ориентирования в этой области, который они смогут в дальнейшем осмысленно заполнять, исходя из своих интересов.

Другая цель, снять страх перед новой областью и предложить лёгкое вхождение в неё, научить быстрым практическим вещам и показать, как можно строить работающие решения из практически готовых компонентов, либо собирать свои с помощью мощных доступных библиотек.

Хотя курс и очень насыщенный, а количество материала огромно, я хотел не растягивать этот курс на месяцы, а сделать его компактным, чтобы даже сильно занятые люди могли его себе позволить. Время — это очень важный ресурс, который я стремлюсь оптимизировать.

— Какие требования к человеку, который собирается пойти на нее?

— Интерес к области, желание разобраться, способность выделить время на это, а также базовое умение программировать на python, базовое знание линейной алгебры (векторы, матрицы) и матанализа (полезно дружить с производными, если хотите глубже понять суть процессов, но научиться работать c DL можно и без этого, сейчас все современные фреймворки умеют самостоятельно делать дифференцирование для всех типов слоёв и уже давно не надо программировать это вручную). Знакомство с областью машинного обучения также нужно (мы не будем заново рассказывать основы машинного обучения, например, не будем заново подробно разбирать, что такое логистическая регрессия, а ограничимся небольшим напоминанием важных моментов).

— По мне так звучит все очень интересно. Последний вопрос — наверное, классический для этой темы. Грозит ли нам восстание машин? Сообщество как-то придерживается разных точек зрений. Одни считают, что машины могут стать умнее нас, но не будут нам угрожать. Другие, в том числе известные технологические компании, обеспокоены и хотят как-то предотвратить возможные угрозы.

— Меня больше беспокоит не восстание машин, а человеческая глупость, жадность, недальновидность, недоговороспособность и прочее, что приводит к перманентным войнам и конфликтам. По меркам эволюции с появления цивилизации прошло слишком мало времени, мы все ещё пещерные люди. Я надеюсь, компьютеры смогут немного скомпенсировать эти наши слабые стороны. Я верю в дополненный интеллект.

Машина умнее человека рано или поздно появится. Прочитает она и этот текст со всеми комментариями :) Такая машина безусловно изменит наш мир и я не могу предсказать, ни как она себя поведёт, ни к чему это приведёт. Это риски. Но мы здесь не безучастные игроки, от нас что-то зависит. К этому моменту надо подготовиться.

Но ещё раньше есть куча других рисков от того, что мы сильно завязываемся на новые технологии, не успевая их как следует осознавать. Мы создаём сложные системы (которым может быть очень далеко до ИИ), про которые мы не понимаем как они работают. Мы плохо продумываем риски внедряемых технологий. Мы, наконец, просто используем новые технологии как инструменты своих чёрных дел.

Но кроме рисков я бы рассмотрел и потенциальные выигрыши. Например, в биологии, где копятся огромные массивы данных, которые невозможно объять ни умной головой одного суперэксперта, ни даже группой экспертов. Потенциал использования этих данных огромен — это лучшее понимание всех аспектов работы живой клетки, излечение от многих болезней и радикальное продление человеческой жизни, это более глубокое понимание принципов работы мозга. В любой другой науке также есть множество проблем и нерешённых задач, которые мог бы помочь решить ИИ, от физики до истории. Можно было бы радикально изменить образование, на порядки повысив его эффективность и переведя на совершенно новый уровень. ИИ мог бы помочь решить одну из самых страшных “невидимых” трагедий — нераскрытый потенциал каждого человека.
Теги:
Хабы:
+18
Комментарии 0
Комментарии Комментировать

Публикации

Информация

Сайт
newprolab.com
Дата регистрации
Дата основания
Численность
Неизвестно
Местоположение
Россия
Представитель
Артем Пичугин

Истории