
Издание The Information, ранне рассказавшее о том, что в GPT-5 применили модуль Universal Verifier для борьбы с "галлюцинациями", опубликовало отдельную статью с подробностями этой системы. Фактически речь идет об отдельной специализированной нейросети, которая используется во время обучения с подкреплением, проверяя каждый ответ модели и выставляя им баллы. При низком балле проверяемая модель генерирует ответ заново.