Comments 24
Допустим научится. Но люди сейчас уже не в состоянии проверить решения и доказательства задач друг у друга. И это носит массовый характер - доказательства современных теорем настолько сложны, что их почти никто не способен проверить, а те кто способны, ограничены во времени, а любая тщательная проверка займёт недели и месяцы (а может и больше).
А доказательства роботов будут ещё больше и сложнее. Приведет какая ни будь нейросеть доказательство что в пространстве размерностью пи в степени е всякий тор топологически гомеоморфен некоторой траектории Винеровского процесса (что бы это не значило). И доказательство это займет 40000 страниц. Ну прекрасно. И что с этим доказательством делать?
Как что делать? Использовать! Если в проде, что-то построенное на этом доказательства рухнет, то пометить как неверное.
А если рухнет человечество, то как помечать о непригодности?
Куда там до математики...:
https://3dnews.ru/1105416/issledovanie-52-otvetov-chatgpt-na-voprosi-po-programmirovaniyu-neverni
Так пусть решает то чему есть применение.
В медицине давно используют то что не могут понять
Это задачки уровня IMO. Они примерно настолько же проще тех проблем, о которых написали вы, насколько головоломки для 3-летних детей проще задачек IMO. И, скорее всего, в этом соревновании смысла столько же, сколько в том, чтобы научить нейросеть побеждать людей в Доту на мировом уровне.
Ну вы сравнили. На математике всё основывается и любое явление можно при желании записать языком математики, включая игру в Доту. Научиться решать произвольные математические задачи значит научиться мыслить логически, по шагам, что очень поможет при поиске решений в других областях. И побеждать людей в Доту тоже имеет огромный смысл, так как всё это можно применять в других задачах, в роботах и т.д.
побеждать людей в Доту тоже имеет огромный смысл, так как всё это можно применять в других задачах, в роботах и т.д.
Что бы роботы побеждали людей? :)
Дело именно в том, что задачки формата IMO - это вполне конкретные задачи, а не произвольные. Там ограниченный набор типов задач. И школьники успешно тренируются их решать. Ну и теперь, видимо, нейросети. IMO - это спорт. И, как в любом спорте, там есть правила. Никто не будет в футболе использовать произвольный мяч, будут использовать футбольный. Так и здесь, никто не будет давать произвольные задачи. И у нейросетей есть отличие от человеческого мозга. Занятия олимпиадной математикой, шахматами и т. п. нужны не сами по себе, а для стимулирования мозга, чтобы организм обеспечивал хорошее питание мозгу, чтобы у мозга были ресурсы для обработки всей поступающей информации (а не только шахматных позиций). Нейросеть обрабатывает ровно то, что ей скармливают: шахматные позиции, задачки IMO. Обученная для игры в шахматы нейросеть не сможет вам ответить на простейший вопрос, сколько на доске 10x10 можно разместить коней, чтобы они не били друг друга. А шахматист подумает и ответит. С математическими задачами и Дотой всё то же самое.
Вы описываете примеры узких или слабых ИИ, заточенных под одну задачу. Обученная для игры в шахматы нейросеть вообще языка не понимает. Тут же целью конкурса является развитие способностей к математике у общих языковых моделей. Задача формируется на обычном языке, а не в формализованном виде, поэтому они должны понимать язык. Если можно дообучить любую универсальную языковую модель математическим способностям, потом таким же способом можно прокачивать и более продвинутые языковые модели. Конечно, если не подгонять обучение под условия конкурса, как в этом, когда у всех задач ответ число от 0 до 999 и они там прямо в промпте модели это сообщают. Естественно, она будет пытаться гадать и подстраиваться, вместо того, чтобы просто решать задачу.
В том и дело, что в данном случае никто не будет обучать языковые модели «математическим способностям». Их будут обучать решению задач формата IMO. Это разные вещи.
Если обученная модель сможет решать произвольную достаточно сложную задачу, она не научилась математике по-вашему? Не знаю, откуда взялась информация про IMO, у них речь идёт о других списках задач, между которыми по сложности находятся их задачи - AIME и AMC 12. При решении нет ограничений на использование моделей и подходов, смотрю, там идёт промпт к модели, которым генерируется код на питоне, помимо собственно запроса для решения. Сильно не вникал. Учитывая печальное состояние с решением даже простых математических примеров сейчас, если удастся продвинуться в решении произвольных задач, это неизбежно улучшит математические способности.
То же что и с доказательством ABC гипотезы.
Такое кстати бывало и раньше: Руфини про неразрешимость полиномов высоких степеней страниц 700 написал, только потом через несколько лет Абель и Галуа открыли все эти красивейшие алгебраические структуры. В современной математике не хватает красоты и гениальности, достаточно посмотреть на лауреатов высоких премий и прочих успешных математиков текущих лет - в основном это тяжёлый упорный труд.
Карандаш и бумага - все остальные решения "в песок"
Если к нейронке прикрутить 'роборуку', которая будет писать решение карандашом на бумаге, это будет считаться?
1 миллион долларов получит тот, кто научит ИИ решать математические задачи