News / Profile of SensDj / Habr

Математики не смогли превзойти нейросеть в решении сложных задач

3 min

5.6K

The future is hereArtificial IntelligenceMathematics *

В Беркли (Калифорния, США) состоялось двухдневное закрытое мероприятие с участием 30 ведущих математиков мира. Целью тайной встречи, о которой ученым запрещено было распространяться, стало испытание новой разработки компании OpenAI — чат-бота o4-mini, обладающего способностью к сложным логическим рассуждениям.

Организатором эксперимента выступила некоммерческая организация Epoch AI, которая занимается тестированием и сравнением больших языковых моделей, о событии спустя три недели после завершения тестов сообщил портал Scientific American.

Ученые сразились в интеллектуальной схватке с «рассуждающим» чат-ботом, которому было поручено решать задачи, придуманные математиками. В течение двух дней исследователи задавали боту вопросы профессорского уровня и были ошеломлены. Нейросеть оказалась способна ответить на некоторые из самых сложных задач в мире, а участники математического конклава склонны были приравнять ИИ-модель к «математическому гению».

GPT-4o mini — модель искусственного интеллекта, которую компания OpenAI представила в июле 2024 года. Она позиционируется как самая экономичная среди малых моделей компании и призвана значительно расширить диапазон приложений, построенных на базе искусственного интеллекта, благодаря доступной цене. Уже в прошлом году GPT-4o mini продемонстрировала высокие результаты на различных тестах.

Для оценки способностей o4-mini был создан специальный набор из 300 уникальных математических задач разного уровня сложности — от студенческого до исследовательского, ответы на которые еще не были опубликованы. А самим ученым было запрещено что-либо обсуждать друг с другом в обычных мессенджерах и электронной почте для чистоты эксперимента.

171