ИИ обучили «научному вкусу»: модель на 30B обошла GPT-5.2 в оценке потенциала статей / Хабр

Исследователи из Fudan University и команды OpenMOSS научили языковую модель отличать перспективные научные работы от посредственных — и она справляется с этим лучше GPT-5.2, Gemini 3 Pro и других топовых моделей. Секрет в том, что вместо дорогой экспертной разметки модель училась на цитированиях — естественном "голосовании" научного сообщества.

Идея простая: если две статьи вышли в одно время и в одной области, но одну цитируют в разы чаще — значит, сообщество считает ее более ценной. Авторы собрали 700 тысяч таких пар из 2,1 миллиона статей на arXiv и обучили модель Scientific Judge угадывать, какая из двух статей наберет больше цитат. По сути, "научный вкус" свели к задаче парного сравнения: прочитай два абстракта — выбери будущий хит. Модель на 30 миллиардах параметров достигла точности 80,6%, обойдя все протестированные коммерческие ИИ.

Самое интересное — модель обобщает выученное. Обученная на статьях до 2024 года, она предсказывает цитируемость статей 2025 года. Обученная только на Computer Science — работает для физики, математики и даже биологии. А навык, полученный на цитированиях, переносится на рецензентские оценки конференции ICLR — здесь точность выросла до 87,7%. То есть модель уловила не конкретные паттерны одной области, а что-то более глубокое про устройство "хоро��ей" науки.

Но оценивать чужие работы — только половина дела. Авторы пошли дальше и обучили вторую модель, Scientific Thinker, предлагать собственные идеи для продолжения исследований. Scientific Judge здесь работает как "внутренний критик": из нескольких сгенерированных идей она выбирает наиболее перспективную, и модель учится генерировать именно такие. В итоге SciThinker-30B побеждает необученную базовую модель в 81,5% случаев и выходит на уровень GPT-5.2 в прямом сравнении.

Авторы признают ограничения подхода: цитирования — несовершенная мера научной ценности, а предложенные идеи никто не проверял экспериментально. Но сам результат примечателен: оказывается, "научный вкус" — не врожденная интуиция, а навык, который можно извлечь из коллективного опыта сообщества и передать модели.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.