Выявить ложь не сложно. Ложь стоит на одной ноге, а правда — на двух ) Достаточно один и тот же тест провести несколько раз и сравнить результаты.
Другое дело, если ИИ обитает где-то сам по себе, но это фантастика. Единственные известные нам примеры ИИ - это те, которые созданы людьми. Собственно, и ARC - это инструмент для разработчиков ИИ, которым нужно понимать как далеко они продвинулись. Можно вообразить, что где-то на просторах Интернета каким-то неизвестным науке способом зародился полностью автономный искусственный интеллект. Если бы это было возможно, скорее всего, он бы не задержался на ступени AGI и стал супер/сверх ИИ (ASI). Его интеллектуальный уровень головоломками точно не оценить.
Спасибо за вопрос! ) Если следовать логике Шолле, то нет, потому что AGI - это интеллект уровня человека (способность к абстрактно-логическому мышлению), а способность лгать замечена не только у людей, но и у животных. Например, Франсин Паттерсон научила двух горилл использовать язык жестов. Она описывала случаи, когда обе гориллы её обманывали. Из книги Марины Бутовской "Язык тела":
Коко и Майкл неоднократно демонстрировали способность к обману. Ф. Паттерсон приводит следующий случай с Коко. Пока она составляла список жестов, освоенных Коко, та схватила красный фломастер с видеомагнитофона и принялась его жевать. Пенни: "Уж не ешь ли ты фломастер?". Коко: "Губа" (начинает водить фломастером по верхней и нижней губе, делая вид, что красит губы). Пенни: "И что же ты на самом деле делаешь?". Коко: "Укус". Пенни: "Почему?". Коко: "Голодный". В том же 1978 г. был зафиксирован случай намеренного обмана со стороны Майкла. Макл дергал за халат одного из помощников-добровольцев и в конце-концов порвал его. Эллен (помощница паттерсон): "Кто это сделал?". Майкл: "Коко". Элен: "Кто это сделал?" Майкл: "Пенни". Элен: "Кто это сделал?". Майкл: "Майкл".
При этом с ARC способен справиться только человек и то, с 6 - 7 лет, когда появляется абстрактное мышление.
Но что-то мне подсказывает, что уже сейчас можно создать специализированную модель, которая будет отлично решать эти головоломки.
За 5 лет не придумали) Иначе соревнование ARC Prize отменили бы и денег никому не обещали)
Да, так называемые солверы (алгоритмы синтеза программ) - один из способов решения задачи, но и они не конкуренты человеку. Сложность в том, что головоломки разные по тематике и по размерности. Мало того, что входная головоломка может быть практически любого размера (например,10x10, 11x11, 12х12 и т.д.), так и на выходе размер может быть совершенно другим.
Но можно рассматривать тест Тьюринга шире. Пусть это будут не просто ответы на вопросы, а любое удаленное взаимодействие. В таком варианте мы можем, к примеру, подключить ИИ к решению рабочих задач, как любого удаленного сотрудника. И если мы не сможем отличить такого "сотрудника" от человека - то это AGI.
Неплохая идея, но как быть с опытом? LLM обучены на огромных массивах данных, поэтому заранее знают как выполнить ту или иную рабочую задачу. Кроме того, какую метрику использовать? Просто - решена / не решена? Как тогда самим разработчикам LLM понять насколько близко они подошли к AGI? Масса вопросов)
Есть и другая сторона. Ведь с технической/ инженерной задачей не каждый человек справится, только специалисты. Зато мы почти все можем извлекать новое знание из самих задач за счет элементарных интеллектуальных усилий (например, проведение аналогии). Шолле потому и предложил приблизить оценку AGI к психометрии, т.к. ИИ отлично справляется со специализированными/узкими задачами, на примерах решения которых усиленно обучался, а AGI - это про общую генерализацию )
Отличная статья! Простые и понятные правила современной разработки. В начале резанула отсылка к Сократу. Дело в том, что scio me nihil scire - латынь. Во время жизни Сократа на латыни говорили только племена латинского союза, Рим был глухоманью, а до начала его экспансии было не меньше века. Так что не мог Сократ во всеуслышание говорить на латыни. Хотя древнейшие переводы диалогов Платона (в которых как раз философствует Сократ), скорее всего, должны быть латинскими.
"Рубежи науки"? Любопытное название для организации... Хочется верить, что оно не заимствовано из книги Лю Цысиня "Задача трех тел" :)
Выявить ложь не сложно. Ложь стоит на одной ноге, а правда — на двух ) Достаточно один и тот же тест провести несколько раз и сравнить результаты.
Другое дело, если ИИ обитает где-то сам по себе, но это фантастика. Единственные известные нам примеры ИИ - это те, которые созданы людьми. Собственно, и ARC - это инструмент для разработчиков ИИ, которым нужно понимать как далеко они продвинулись. Можно вообразить, что где-то на просторах Интернета каким-то неизвестным науке способом зародился полностью автономный искусственный интеллект. Если бы это было возможно, скорее всего, он бы не задержался на ступени AGI и стал супер/сверх ИИ (ASI). Его интеллектуальный уровень головоломками точно не оценить.
Спасибо за вопрос! ) Если следовать логике Шолле, то нет, потому что AGI - это интеллект уровня человека (способность к абстрактно-логическому мышлению), а способность лгать замечена не только у людей, но и у животных. Например, Франсин Паттерсон научила двух горилл использовать язык жестов. Она описывала случаи, когда обе гориллы её обманывали. Из книги Марины Бутовской "Язык тела":
При этом с ARC способен справиться только человек и то, с 6 - 7 лет, когда появляется абстрактное мышление.
Спасибо за комментарий!
За 5 лет не придумали) Иначе соревнование ARC Prize отменили бы и денег никому не обещали)
Да, так называемые солверы (алгоритмы синтеза программ) - один из способов решения задачи, но и они не конкуренты человеку. Сложность в том, что головоломки разные по тематике и по размерности. Мало того, что входная головоломка может быть практически любого размера (например,10x10, 11x11, 12х12 и т.д.), так и на выходе размер может быть совершенно другим.
Неплохая идея, но как быть с опытом? LLM обучены на огромных массивах данных, поэтому заранее знают как выполнить ту или иную рабочую задачу. Кроме того, какую метрику использовать? Просто - решена / не решена? Как тогда самим разработчикам LLM понять насколько близко они подошли к AGI? Масса вопросов)
Есть и другая сторона. Ведь с технической/ инженерной задачей не каждый человек справится, только специалисты. Зато мы почти все можем извлекать новое знание из самих задач за счет элементарных интеллектуальных усилий (например, проведение аналогии). Шолле потому и предложил приблизить оценку AGI к психометрии, т.к. ИИ отлично справляется со специализированными/узкими задачами, на примерах решения которых усиленно обучался, а AGI - это про общую генерализацию )
Отличная статья! Простые и понятные правила современной разработки. В начале резанула отсылка к Сократу. Дело в том, что scio me nihil scire - латынь. Во время жизни Сократа на латыни говорили только племена латинского союза, Рим был глухоманью, а до начала его экспансии было не меньше века. Так что не мог Сократ во всеуслышание говорить на латыни. Хотя древнейшие переводы диалогов Платона (в которых как раз философствует Сократ), скорее всего, должны быть латинскими.