Обновить

Комментарии 20

Отличная тема для обсуждения, насколько умной стоит считать систему, которая решает задачу брутфорсом самого простого способа решений. Ни один олимпиадник не сможет перебрать все возможные точки, а "ИИ" может сделать это за секунды, но на большее он не способен в принципе, а уже радостно пишутся статьи "ИИ решает задачи на уровне ЛУЧШИХ олимпиадников"

А как с остальными случаями?

afaik там не было никаких "за секунды", а вполне себе думало несколько минут.

Когда говорят, что ИИ решает задачи на уровне лучших олимпиадников, это часто немного преувеличение. ИИ может перебрать много вариантов за секунды и иногда даже найти решение, но он не обладает интуицией и глубиной понимания, которые есть у людей.

По моим впечатлениям интуиция и есть перебор вариантов в фоновом режиме в подсознании, а потом оно возвращает ответ в виде "озарения", было непонятно, даже перестал думать над проблемой и вдруг стало понятно.

Перебор за доли секунды? Нет, конечно, это быстрый подбор подходящего решения из имеющихся. Система 1.

Генеративный ИИ не способен на точные решения. Это лишь вероятностный предсказатель, и поэтому, если его научить на огромном количестве теорем и задач, он будет выдавать некие решения, которые иногда, возможно даже почти всегда, будут правильными - но абсолютной гарантии не будет никогда.

Символьными вычислениями скорее всего можно решить всё - но только брутфорсом. А поскольку в математике наверняка полно NP-полных задач, никаких вычислительных ресурсов и времени сущестования Вселенной не хватит, чтобы решить и доказать то, что нам интересно.

А вот симбиоз этих технологий вполне может обеспечить прорыв. В силу элегантности и простоты фундаментальных законов самой математики, в ней наверняка имеется множество скрытых аналогий и закономерностей, еще не оформленных как теории и теоремы. Человеческому мозгу сложно выявить их, но это под силу мощной машинной нейросети, обученной на огромном объеме математических знаний. Точные символьные вычисления позволят проверять гипотезы, сгерерированные нейросетью, и выдавать абсолютно точные результаты. Нейросеть в свою очередь может управлять вычислителем, предлагая шаги преобразовнаний, с наибольшей вероятностью ведущие к результату, тем самым мы избегаем брутфорса. Символьный вычислитель можно также использовать для обучения нейросети (по аналогии с АльфаГо, которая играла сама с собой несколько часов и превзошла гроссмейстеров - здесь символьный вычислитель будет аналогом "правил игры"). Еще можно вспомнить проект по оцифровке математики - думаю это как раз здесь пригодится.

Так и мозг не дает "абсолютной гарантии". Примеры вот, причем даже коллектив разработчиков и инженеров с тестировщиками пропускает крупные ошибки.

Мы допускаем что человек при счете в уме иногда может ошибаться, но от калькулятора мы ожидаем точных результатов. Также и здесь.

И потом, нам же в конечном итоге не олимпиадные задачи решать. Мы ожидаем, что ИИ поможет нам познать Тайны Вселенной, на основании которых можно будет к примеру разработать технику на новых физических принципах, и тому подобное. Цена ошибки может быть слишком высока.

Так ИИ - не калькулятор, в том-то и суть. Или мы делаем мощный калькулятор, но тогда не ждём от него озарений, или мы делаем именно интеллект, с правом на ошибку, но зато и с озарениями (которые, по моему убеждению, просто удачно сделанные и осознанные ошибки, сбои в связях мозга).

Есть у меня и опасения: например, о снижении доверия к онлайн-олимпиадам. (Думаю, мы можем поучиться у сообщества шахматистов, которому уже десятки лет приходится решать эту проблему!)

А шахматисты и не решили эту проблему. И с каждым днём она всё острее

Интересно, а как у ИИ с геометрией Лобачевского? 🤔

Вообще, насколько я помню из школьной геометрии (она у нас была, мягко говоря, со звёздочкой) - там половину задач можно было бы решить чуть ли не одной теоремой косинусов, просто так никто не делал, ибо вручную это долго считать, а смысл был в нахождении красивого решения, а не в лоб. Но ведь ИИ на это должно быть пофиг, по идее?)

Почему-то многие постоянно забывают, что математические задачи, которые решают олимпиадники (а также ИИ из статьи) - не существуют в реальности, а придуманы людьми, которые уже знают ответ. То есть такая своеобразная форма развлечения, не более. Настоящая математика - это решение задач, решение которых ещё не известно, создание математических моделей для чего-либо, создание новых инструментов, функций, абстракций, переосмысление существующих, адаптация чистой теории к решению конкретных прикладных задач. А с этим сложности не только у ИИ, а даже и у ненулевого множества математиков, потому те и любят сводить всю математику к доказательствам.

Браво.

Спасибо за пост.

У меня, после того, как год назад я узнал, что есть ИИ, решающее геометрические задания, возник когнитивный диссонанс. Данная статья выступила лекарством.

Так а в чем лекарство? Решает же

из 25 решённых AlphaGeometry задач ММО она может решить 21, в том числе P3 и P6, вообще без использования «ИИ»

Я бы особо не радовался без предварительной оценки сложности задач, а то может оказаться, что это тот случай, когда 20% результата требует 80% работы.

 Задача «ИИ» здесь заключается ТОЛЬКО В ПЕРВОЙ СТРОКЕ! Все 22 этапа — это просто работа чисто детерминированного DD+AR!

Беда в том, что люди под ИИ сегодня понимают модели нейронной сетки. Хотя всегда это понятие было много шире. Любой алгоритм решающий задачу но основе каких-то предопределенных знаний, условий и произвольных входных данных считается ИИ.
Советую книжку Artificial Intelligence Problems AND THEIR SOLUTIONS ( Dr. Danny Kopec )

Автор упускает факт, что задача ставится на естественном языке, и чтобы перевести её на формальный язык, пригодный для запуска DD+AR, тоже нужна LLM. И она справляется корректно. А это чуть ли не самое трудное в машинном решении задач.

Про AlphaGeometry 2 надо было разбор, она то как решила?
https://habr.com/ru/articles/834396/

Что сейчас расписывать, что делали древние системы - сейчас интересно, что могут нейронки после 2022 года

Когда я решал простую физико-математическую задачу, у меня уходило какое-то время на понимание, каким методом, а дальше тупая техническая работа "на рефлексах" по выписыванию преобразований. В нынешнее время это звучит как "придумал и написал простенькую программу, а дальше она перебором решила".

Примерно так же сделал и ИИ в данном случае - свалил тупую работу на спецмодуль.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации