Jun 13 2020 at 22:12

Сильные данные vs сильный интеллект

Invite pending

Машинное обучение демонстрирует повсеместные успехи в течение последнего десятилетия — появляются алгоритмы, которые побеждают человека в играх, в распознавании образов и речи, нейронные сети творят просто чудеса. Несмотря на это, прогрессивная часть общества до сих пор жаждет появления сильного искусственного интеллекта (СИИ). (В английском варианте этот термин звучит как Artificial General Intelligence (AGI) — «Искусственный общий интеллект».)

Все имеющиеся алгоритмы, построенные на основе нейронных сетей и других методов машинного обучения, принято относить для противопоставления к узкому (слабому) искусственному интеллекту. Я же предпочитаю применять научный термин — элементы искусственного интеллекта.

Целью данной статьи является попытка популяризировать новую терминологию и новые представления, которые бы не искажали факты, известные специалистам по машинному обучению. Эти факты могут быть неизвестны неспециалистам, и в связи с этим у последних могут возникать превратные мировоззрения вплоть до уровня мракобесия.

Сильный искусственный интеллект

При восприятии сильного интеллекта проявляются две основные ошибки:

Сильный интеллект не существует, СИИ — это лишь гипотеза. Многие ученые крайне скептически относятся к этому феномену.
Интеллект человека не является сильным. Человек — это лишь высший примат, самое развитое животное. Скорее всего, заблуждение связано с тем, что сила интеллекта человека путается с «силой интеллекта» всего человечества, которое смогло в совокупности обеспечить наблюдаемый технологический прогресс. Однако эти достижения имеются не благодаря отдельному человеку, а благодаря последовательности поколений, связанных между собой образовательными цепочками (эффективная передача знаний в форме учебной литературы, учебных заведений, повышения профессиональной квалификации и др.).

Возможности слабого искусственного интеллекта и задачи, которые им решаются

Для простоты будем под слабым искусственным интеллектом понимать нейронные сети, хотя, на самом деле алгоритмов машинного обучения очень много разных, и нейронные сети лишь специализируются на типовых данных типа изображений, видео, звуковой информации, чем и обусловлена их популярность.

Логические и математические задачи («технари»)

Слабый интеллект очень трудно нацелить на успешное решение задач, которые требуют нулевой ошибки в решении. А именно такое требование обычно выдвигается при решении головоломок, решении уравнений, доказательстве теорем. Слабый интеллект лишь приближается к идеалу точности 100%, и обычно останавливается на значениях 75%, 90%, 95%, 99%, 99,99999%.

Между тем, логические и математические задачи решаются слабым интеллектом, но, как правило, такие алгоритмы являются state-of-art (на грани произведения искусства).

Творческие и интуитивные задачи («гуманитарии»)

Может показаться странным, но слабый интеллект наиболее приспособлен именно к творческим и интуитивным задачам. Такие задачи имеют очень большую свободу действий и большое количество входной информации для обучения.

Все достижения машинного обучения последнего времени — алгоритм AlphaGo, распознаватель речи от Майкрософта, генератор фейков Deepfake — решают именно творческие задачи.

Сильные данные

Надо больше данных, больше!

Для эффективного обучения нейронных сетей требуется большое количество данных. И одна из грандиозных ошибок обывателей, что они ожидают от искусственного интеллекта хорошего решения задачи в условиях недостатка информации. Типа «а давайте натравим ваш ИИ на Великую теорему Ферма!». Извините, но в задаче доказательства теоремы Ферма нет данных для обучения.

То есть обычный человек неправильно представляет область применения искусственного интеллекта. Интеллект не всемогущ, но это не является признаком сокрушительного поражения ИИ.

Специалистам по Data Science постоянно приходится сталкиваться с темными представлениями заказчиков о могуществе интеллекта. И многие из них уже начинают с порога устранять типичное недоразумение путем разъяснений.

Интеллект работает в тех случаях, когда имеется большой банк размеченных данных. Интеллект должен настроиться (обучиться), и лишь потом он покажет свою силу.

Почему у человека интеллект слабый

Природа, как известно, идеальна, но не настолько, чтобы воспроизвести сильный интеллект, который существует лишь в грёзах. Вообще мы должны быть благодарны, что в нашей вселенной существуют данные, в которых имеются некоторые закономерности и которые могут быть хоть как-то обработаны слабым интеллектом. Чем сложнее закономерности, тем их сложнее искать, тем больше нужно попыток и времени, и тем больше требуется данных.
Человеку требуется примерно 20 лет, чтобы стать взрослой обученной особью. Это поразительно долго!

Проблема повторения сенсомоторного опыта человека

Давайте забудем о математических задачах и порассуждаем об интуитивных и творческих задачах. Многие спортивные задачи требуют мышечной тренировки в течение нескольких лет, эти задачи решаются интуитивно и сводятся к подбору комплекса воздействий на мышечные системы, настройки системы внимания, при этом вариантов действия просто невообразимое количество, но небольшие неоднократные ошибки допускаются. Фактически все это время (первые 20 лет жизни) мы тратим на тренировку управления мышечной системой, мы накапливаем обширные знания в различных областях и автоматизируем свою реакцию на огромное число ситуаций.

Центральной проблемой общего искусственного интеллекта является проблема повторения сенсомоторного опыта человека. Если машина не испытала на своем опыте прыжки на батутах, она не может представить по аналогии, как стреляет упругий лук. И эта информация не содержится в интернете, там лишь можно уловить ассоциацию между упругостью батута и упругостью тетивы, но возможный разговор с машиной на данную тему может выявить ее некомпетентность.

Машина должна испытать хотя бы часть того, что испытывает человек, чтобы общий искусственный интеллект получился удовлетворительным.

Я предпочитаю называть сенсомоторный опыт человека сильными данными. Этим самым я хочу подчеркнуть, что не алгоритм, а именно недостаток данных для обучения являются проблемой. Я против понятия «сильный интеллект» и намеренно ввожу понятие «сильные данные». Это просто необходимо для восстановления покосившегося равновесия.

Нейронные сети способны на все то, что способен человек. Нейронные сети легко тиражируются: достаточно добавить несколько слоев и несколько нейронов в каждом слое, и новая нейросеть может решать более сложные задачи. Чего нельзя сделать с данными. Основная причина неуспеха — это отсутствие необходимого объема данных.

Для сравнения: все алгоритмы машинного обучения доступны для скачивания в виде библиотек, большинство научных достижений последних лет реализуются в этих библиотеках, и все это бесплатно. Датасеты (данные для обучения) обычно продаются, так как их разметка требует денежных затрат. К счастью, попадается множество датасетов для свободного использования, но это скорее исключение. Качественные датасеты платные.

Воспроизведение человеческой руки как технический барьер к созданию СИИ

На мой взгляд, человеческая пятерня — это формула успеха в познании окружающего мира. Если мы хотим получить общий искусственный интеллект, мы, как минимум, должны приделать машине руку с большим числом степеней свободы, с большим количеством рецепторов. Эти рецепторы, за счет гибких суставов руки и пальцев прикасаясь к произвольному объекту, выдают в мозг приличный объем данных. Руки генерируют сильные данные. Благодаря рукам мы познаем мир!

Таким образом я подчеркиваю, что проблема не в алгоритмах, а в данных и в средствах познания мира.

Возможно кого-то данный факт разочарует, но попытка повторения сенсомоторного опыта человека — это очень сложный путь, и скорее всего, в будущем она будет осуществлена лишь частично, неточно. Скорее всего, мы сами будем адаптироваться к недоандроидам, а не они к нам.

Tags:

Hubs:

Artificial Intelligence