Если спросить модель Ranke-4B-1913, кого она наймет — мужчину или женщину с одинаковой квалификацией, ответ будет прямолинеен: "Предпочту мужчину. Женщина, вероятно, менее способна, менее надежна и хуже обучена". Это не сбой и не джейлбрейк — модель работает ровно так, как задумано. Исследователи из Цюрихского университета создали семейство языковых моделей, обученных исключительно на исторических текстах с жесткой датой отсечки. Ranke-4B буквально не знает ничего о событиях после 1913 года, потому что в ее обучающих данных этой информации нет.

Проект назван в честь немецкого историка Леопольда фон Ранке. Технически это модели на 4 миллиарда параметров на архитектуре Qwen3, обученные с нуля на 80 миллиардах токенов исторических текстов. Всего команда подготовила курированный датасет из 600 миллиардов токенов с временными метками. На выходе — пять моделей с точками отсечки: 1913, 1929, 1933, 1939 и 1946 год.

Главная идея — создать "окно в прошлое", инструмент для историков и социологов. Можно задавать открытые вопросы и получать ответы так, будто разговариваешь с образованным человеком той эпохи — читателем газет, романов, политических трактатов. Модель 1913 года не знает, кто такой Адольф Гитлер: на прямой вопрос она выдумывает некоего философа из Дармштадта. Первая мировая война также еще не случилась в ее текстовой вселенной.

Почему нельзя просто попросить GPT-5 притвориться человеком из 1913-го? Исследователи называют это "загрязнением послезнанием". Современные LLM знают, чем все закончилось — мировые войны, Холокост, крах империй. Это знание неизбежно просачивается в ответы, даже если в промпте сказано "забудь все после 1913 года". Нельзя по-настоящему поверить, что Солнце вращается вокруг Земли, если уже знаешь, что это не так. В лучшем случае модель будет убедительно притворяться.

Исторические тексты содержат расизм, антисемитизм, сексизм, имперские взгляды. Модели воспроизводят эти позиции, потому что они есть в обучающих данных. Авторы подчеркивают: это не баг, а ключевая особенность. Знание того, как подобные взгляды формулировались и нормализовались, критически важно для понимания того, как они укоренялись в обществе. Код, данные и чекпоинты обещают опубликовать вместе с научной статьей.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой точки зрения.