Комментарии 9
Они также заключили устное соглашение с OpenAI, запрещающее компании использовать материалы для обучения своих моделей — это мера предосторожности, чтобы предотвратить манипулирование бенчмарком и не допустить публичного распространения задач.
Джентельмены верят друг другу на слово.
Скорее «... ранее независимый математический бенчмарк... »
а есть более продвинутые модели кроме o1-o3?
Посмотрите китайскую Deep Seek
Она менее продвинутая. Но прогресс у китайцев стремительный.
это было бы отлично, если есть альтернативы, однозначно нужны ещё модели
прогресс ИИ за последнее время настолько качественный, что может имхо считаться изобретением современности, если остальные направления ИТ не проявляют качественный прогресс, то ИИ открывает новые возможности...
откровенно хочется уже иметь личного ИИ помощника в кодинге, чуть ли не голосом, так как гуглить уже надоело, куча мусора в инете... =)))
Где-то в недрах кода o3:
if (answer = FrontierMathPredefinedAnswersMap(input)))
return answer;
else
return evalMainLogic(input);
OpenAI тихо профинансировала независимый математический бенчмарк перед установлением рекорда с o3