Команда исследователей из МИТа провела масштабную проверку 59 научных ИИ‑моделей — от специализированных систем для расчёта молекул и материалов до больших языковых моделей вроде DeepSeek и Qwen. И выяснила удивительную вещь: несмотря на то, что этих «спецов» кормят совершенно разными данными (текстовые строки, 3D‑координаты атомов, последовательности белков), внутри они приходят к очень похожему представлению о физическом мире.

Новое исследование, проведённое под руководством Сатьи Эдамадаки и Суджун Ян, по сути, заглянуло под капот разношёрстным моделям. Учёные извлекли и сравнили их внутренние представления (эмбеддинги) с помощью нескольких метрик.

Оказалось, что чем лучше модель справляется со своей задачей, тем ближе её внутренняя «картина мира» к представлениям других топовых моделей. Более того, сложность этих внутренних представлений у всех моделей оказалась в удивительно узком диапазоне.

По мере роста производительности модели сходятся в представлениях: чем меньше ошибка в предсказании энергии, тем сильнее согласованность с референсной моделью UMA Medium. Каждая точка — модель; размер точки соответствует размеру модели
По мере роста производительности модели сходятся в представлениях: чем меньше ошибка в предсказании энергии, тем сильнее согласованность с референсной моделью UMA Medium. Каждая точка — модель; размер точки соответствует размеру модели

Это явление исследователи связывают с так называемой «платонической» гипотезой представлений (Platonic representation hypothesis). Ещё в мае 2024 года работа из того же института показала, что разные ИИ‑модели сходятся к общим представлениям по мере роста их эффективности — по аналогии с аллегорией Платона о пещере, где тени на стене указывают на единую реальность снаружи.

Новое же исследование впервые применило эту концепцию к научным моделям, показав, что специализированные системы для химии и биологии, похоже, тоже сходятся к универсальному описанию материи.


Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник