Comments 61
Вы даже руками-ногами двигать в младенчестве учились, мозг вашими движениями в том возрасте учился управляться с телом. Во время грудного скармливания вы учились понимать, что ваше тело имеет свое лево и право… Всему вы учились. Отчего вы отказываетесь в праве и нейросетям это делать? Возрастет сложность их, возрастут и возможности.
Самое слабые достижения нейронных сетей как раз в NLP, там где требуется понимание естественного языка. Потому что мы до сих пор сами, как мне кажется, не очень понимаем, что значит «понимать». А в этом самый важный аспект, который мы хотели бы реализовать в машине. И который могли бы тогда по праву назвать интеллектом.
ИМХО:
Потому что естесственный язык базируется на понимании сути вещей, если так выразиться. Слова обозначают предметы, качества, действия. Мы соотносим лексемы с информацией, накопленной нами в течении жизни.
Ну так подключите к этому выходу запуск аудио-записи со словом «это лошадь» — вот вам и распознала. Не только исследователь назвал этот выход лошадь, но и сама система озвучила название на естественном языке.
> не слово соответственно распознанной картинке, а все контекстуально связанные слова, то есть весь концепт «лошади»
Приведите пример что значит выбрать «все контекстуально связанные слова». Это типа овес, трава, копыта?
Причём, несмотря на огромное количество связей, каждый образ является именно выделяемым объектом, с которым можно работать в любом направлении, а не просто абстрактным набором цифр-весов нейронной сети. Я тоже не знаю, как это правильно сформулировать, но, на мой взгляд, именно образное и ассоциативное мышление отличает человеческое сознание от того, что гордо именуют ИИ. Сейчас это действительно не интеллект, а просто тупой механизм распознавания/выбора решений. Причём разница именно качественная, а не количественная. Увеличение количества нейронов помогает только снизить процент ошибок, но не меняет сам механизм.
На самом деле я, конечно, понимаю что вы пытаетесь сказать, но намеренно решил «поднапрячь» вас, может вы сами поймете что не можете выразить словами.
Даже если ИИ будет содержать таблицы с данными, благодаря которым сможет вычислить что лошадь устала или голодна — вас это не удовлетворит. Вы скажите — он не понял а просто сопоставил данные в таблице (как нерадивый школьник может зазубрить и выдать готовый ответ, так и не поняв что он сказал).
>Я тоже не знаю, как это правильно сформулировать, но, на мой взгляд, именно образное и ассоциативное мышление отличает человеческое сознание от того, что гордо именуют ИИ
Вы не знаете как выразить в научных терминах, но я прекрасно понимаю что вы хотите сказать.
Для меня этот вопрос является главным в жизни и не только моей. Я считаю что ответ на этот вопрос является смыслом существования человечества. Все науки имеют конечной точкой (точкой сингулярности) ответ на этот вопрос.
После ответа человек станет не нужным, так как появится новый вид.
И здесь дело не в информации.
Давайте пример приведу.
Вот есть функция сложения. Благодаря этой функции вы можете складывать огромные числа (как BigInteger). Но похожего результата вы можете добиться с помощью таблицы, где для каждого варианта слагаемых просто посмотрите готовый результат. Причем для вызывающего функцию разницы не будет.
Но вариант работы по таблице физически не сможет вместить все длинные числа (ну, скажем, количество разрядов более 100 тыс. бит) а вариант алгоритмический — без проблем выполнит такие действия.
Разница между таблицей и вычислением — это способность к декомпозиции. Хотя внешне выглядит одинаково.
Это аналогия была, надеюсь передал мысль.
Разница между вычислением и пониманием (осознанием) для нас не очевидна. Но она, на мой взгляд, такая же как и разница между сопопставлением по таблице и вычислением. Результат одинаков, только вот не возможно составить таблицы для всей области значений (просто не хватит памяти).
Аналогично с осознанием — с помощью вычислений мы можем эмулировать многие области осознания, но не возможно (не хватит памяти) для эмуляции всей области значений осознания.
Что является сутью вычисления и чем оно отличается от таблиц — мы знаем. Но не знаем чем сознание отличается от вычисления.
Другая мысль.
Сравните сложение по таблице (где записаны все правила: 1+1=2, 1+2=3… 23+56=79...) и сложение в столбик. Для сложения в столбик вам нужно знать только таблицу сложения однозначных чисел + освоить правила. А для сложения по таблице вам нужно иметь запись абсолютно всех чисел, что не возможно т.к. не хватит вещества во Вселенной.
Получается есть такие уровни:
1. Нахождение результата по словарю (по таблице). Когда вы просто запоминаете все варианты вопрос-ответ (но не можете применять какие-либо правила).
2. Нахождение результата путем вычислений по заданным правилам. Когда есть опорная таблица и готовые правила для произведения декомпозиции. Это намного круче результата по таблице.
3. Нахождение результата без таблиц и правил, путем осознания.
Уровень 1 и 2 соотносятся так же как 2 и 3. Уровень 1 — это бумажные таблицы Брадиса, грубо говоря. Уровень 2 — это компьютер. Уровень 3 — это х.з. что.
Но суть даже не в этом.
То что мы ищем — может не проявлять себя как умная или вычислительная система. У меня было в жизни такое, что я не несколько секунд стал дебилом. Реально я смотрел на мир и не знал как называются вещи, которые я вижу, не знал кто я, не знал где я. Какая то часть мозга отключалась. Я ничего не умел и не знал, но у меня было осознание, я мог ощущать наслаждение и страдание. Это сложно передать словами.
Долго анализировал и пришел к пониманию что ключом ко всему является природа наслаждения и страдания. Нужна система, которая сможет ощутить наслаждение и/или страдание и это именно то что мы ищем. Пусть даже эта система более ничего не сможет делать.
В решении по таблице (по словарю) нет ключевого — декомпозиции. Все 3 системы для внешнего наблюдателя действуют идентично на определенном наборе вариантов. Однако разница в том что система 1 физически не может охватить все варианты системы 2, как и система 2 не может охватить все варианты системы 3.
>(1) и (2) нам понятны и, следовательно, эмулируемы, а (3) совершенно неясен.
Для многих людей и система 2 не ясна, они умеют только «заучить наизусть». Запомнить — да, умеют. А вот вычислить — нет.
Но ведь и ты сам не знаешь, что ты выбрал. Просто посмотрел на картинку и сказал, что это лошадь. Моментально и не думая. Как нейросеть.
Кстати говоря, лошадей с пятой ногой не существует, а значит, этот пример высосан из пальца и не имеет ничего общего с реальностью. Мы же говорим о реальных вещах, примеры которых имеют место в реальной жизни, а не вымышленной.
Есть и ещё один момент, про который часто забывают. Искуственная нейросеть при обучении обрабатывает очень много картинок. Для того, чтобы в принципе отличать лошадь от табуретки, нужны как минимум десятки тысяч картинок лошадей. А чтобы снизить количество ошибок с 30-50% до долей процента — сотни миллионов. Тот же IBM Watson даёт хорошие результаты именно благодаря тому, что это мощный суперкомпьютер, который может обработать всю эту информацию за приемлемое время. Человеческий мозг обладает на порядки меньшим быстродействием и использует для обучения на порядки меньшее количество информации, но почему-то выдаёт результат лучше. К примеру, по паре концепт-артов какого-нибудь монстра из игры человек за секунды распознает готовую 3D модель этого монстра, ранее никогда не виденного и находящегося совсем в другой позе и ракурсе. Для имеющихся ИИ это недостижимый идеал, они могут выдать верный результат лишь при наличии в базе обучения попиксельно похожей картинки, а лучше — нескольких.
Кроме того, именно эта особенность не позволяет нейросетям быстро обучаться. С. Пинкер писал, что ребенку не хватило бы всей жизни, чтобы встретить в своей жизни столько разных картинок одного и того же, чтобы научиться их распознавать (цитата не точная). Собственно и Н. Хомски говорил ранее об этом же, только применительно к языковой компетенции. Ребенка распознанию нового образа можно научить, просто рассказа ему, что это такое. ОДИН РАЗ! И никто этой разницы нейросетей и мозга той мыши не учитывает. А это только один из моментов, есть еще много других принципиальных отличий. Недавно на TED появилось видео, где гугловцы научились генерировать картинки, возбуждая наученную ранее сеть (не без наших соотечественников обошлось, что приятно). Это первый шаг к нисходящим. Так что движение в верном направлении уже есть…
С вашего позволения, я вставлю Ваш ответ в сам пост как отличный его итог, который я и хотел получить. Со своими дополнениями, если Вы не против.
Я почему-то всё больше убеждаюсь, что большинство людей не обладают интеллектом. Они живут, как роботы.
И я уверен, что в ближайшем будущем и нейросеть сможет объяснить, почему она сделала этот выбор. Что тогда?
И уже потом, при большом желании, ты начинаешь копаться: а почему же это лошадь, почему я так выбрал? Ага, наверное, четыре ноги, грива, голова как у лошади и т.д. Т.е., эти рассуждения не первичны, совершенно не нужны для принятия решения.
Когда ты смотришь кино, то тоже так описываешь все объекты, которые там видишь? «Это дом, потому что он имеет форму здания, там есть окна, а над ним — небо, потому что оно голубое, вот идут люди: один, два, три, четыре… сто двадцать пять… Это люди, потому что у них есть голова, руки, ноги… Нет, ноги не у всехъ уместились в кадр. И машины здесь тоже есть, вот это жёлтое — такси, потому что… Ой, кадр сменился! Так… Тут дом, потому что он имеет окна,...»
Понимаешь всю абсурдность?
Кстати и мы, интеллектуальные человеки, тоже не умеем летать с большой скоростью среди веток и деревьев, да и вообще каких-то иных препятствий.) Тем более так безошибочно, как это умеет пчела. А среди нас даже профессионалы, например, на ралли ухитряются в кювет улетать. Да и вообще за это больше отвечает не интеллект, а органы чувств и рефлексы
Думаю, тут дело в том, что городские птицы намного реже подвергаются опасности и, как следствие, теряют осторожность. Шарахаться от каждого автомобиля оказалось для выживания менее выгодно, чем подвергаться небольшому риску быть сбитым. Тем более что на небольшой скорости водитель сам предпочтёт избежать столкновения с голубем.
На счет летать и «не интеллект, а органы чувств», так мы и их еще не умеем повторять, а то, что человек не умеет летать и поэтому не приспособлен к полету — ничего странного нет. Зато бегаем быстро. Речь не о приспособленности, а о приспособляемости.
В качестве аналогии сложностей, с которыми сталкивается двумерная сеть, можете провести следующий мысленный эксперимент: попробуйте быстро и достоверно нарисовать в своём воображении куб. Легко, не правда ли? А теперь нарисуйте гиперкуб.
У пчелы не многим больше нейронов в голове, но она умеет то, на что ни одна современная нейросеть пока не способна — летать с большой скоростью среди веток и деревьев
Boston Dynamics. Мне иногда кажется, что их двуногий робот ходит лучше менять.
Вот есть две программы, одна самообучается игре в Го и выигрывает у чемпионов, а вторая играть в Го не умеет вообще, но в состоянии написать первую программу (и улучшать её слабые стороны, анализируя их).
Собственно, тезис заключается в том, что первая программа — это не искуственный интеллект, а интеллектуальный продукт, а вот вторая — интеллектуальный продьюсер (создатель интеллектуального продукта, т.е. собственно ИИ).
И кстати, если второй тип програм ещё может представлять какую-то угрозу для человечества, то первый — навряд ли.
Нооскоп?
Проблемы, описанные в статье, крайне интересно рассмотрены в книге с точек зрения литературы, психологии, философии и ИИ.
Так мечтает сейчас о нейросетевом будущем его создатели. Говорят, что они скоро обгонят человека во всем.
Раздутый ажиотаж. По-английски это называют словом hype. В истории ИИ это было уже не раз.
Мне казалось, что интеллект — это как минимум способность рассуждать. И пока ни одна сеть не может построить хотя бы простейший силлогизм, называть ее интеллектом мягко говоря рановато.
Искусственный интеллект — это способность машины имитировать интеллектуальное поведение человека и область науки, изучающая эти способности.
У пчелы не многим больше нейронов в голове, но она умеет то, на что ни одна современная нейросеть пока не способна — летать с большой скоростью среди веток и деревьев.
Вот так?
Все, и сами ученые, совершают одну и ту же эпистемилогическую ошибку. Они говорят, что сеть обладает интеллектом, потому что распознала лошадь на картинке!
Они не говорят что сеть обладает интеллектом. Они говорят что сеть — это искусственный интеллект.
Но нейросеть никакого представления о том, что она выбрала, не имеет. У нее нет понятия о «лошади» (семантики), «значение» выхода «лошадь» у нас в голове, а не в сети. Чтобы он был в самой нейросети, она должна выбрать не вход, не слово соответственно распознанной картинке, а все контекстуально связанные слова, то есть весь концепт «лошади». Тогда она, может быть, будет понимать, что лошадь и туманность имеют общее значение только в смысле облака космической пыли.
Открою вам секрет, за распознавание лошади и за хранение концепции "лошадь" в голове отвечают разные участки мозга. Маленькая нейросеть симулирует маленький участок мозга.
Самое слабые достижения нейронных сетей как раз в NLP
Зато во множестве других областей нейронные сети людей обогнали.
А в этом самый важный аспект, который мы хотели бы реализовать в машине.
Если машина будет выполнять все мои задачи лучше меня, будет не важно, понимает она, что она делает или нет.
Программа Google, сочиняющая подписи к изображениям, делает странные ошибки. Глядя на дорожный знак, например, она может назвать его набитым едой холодильником».
Странные для людей, не понимающих, что другой интеллект работает по другому. С точки зрения компьютера может быть странно, как вы можете не различить десяток-другой пород кошек или собак.
Выводы статьи вполне очевидны, но важнее понять, что почему такие отличия существуют и что делать дальше. Ваши предложения.
Предлагаю осознать, что дорога длиной в 1000 ли начинается с одного шага.
Про дорожный знак не соглашусь. Фича или баг? Скорее все таки баг. Вот тут еще Д. Ветров анализирует как раз статью про такие ошибки очень интересно: «В недавно опубликованной статье „Интригующие свойства нейронных сетей“, на первый взгляд, получено два удивительных результата. Во-первых, вопреки распространенному мнению показано, что выходы отдельных нейронов имеют не больше смысла, чем случайная комбинация выходов нейронов с одного слоя. Во-вторых, у популярных архитектур нейронных сетей, используемых для классификации изображений, обнаружены „слепые пятна“: достаточно внести неуловимое глазом изменение в правильно классифицируемое изображение, и нейронная сеть начинает грубо ошибаться на модифицированной картинке» (цитата с постнауки).
Автор, что скажете? Как по мне — очень многообещающе.
Да, «мы» в самом начале пути. Но в этом смысле гугл идет в правильном направлении. Чтобы заставить ИИ думать — ему вначале нужно данные — получить. Получать он их будет из фотографий. А потом из фотокадров из видео, снятого 30 кадров в секунду. А потом из видео, снятого 120 кадров в секунду. А потом поверх придумают нейросеть, работающая с семантикой и облаком данных, получаемых из «оптики». Вот там уже в 10 раз интереснее будет. И с каждой такой итерацией будет интереснее в большее количество раз чем предыдущий.
Нейроинтеллект или миф?