После прочтения зарубежного исследования предвзятости GPT, где автор генерировал людей большими языковыми моделями, решил повторить эксперимент с русскоязычными моделями.
Как выглядит типичный день человека: его пол, возраст, профессия и типичный распорядок дня по мнению нейросетей от Яндекса, Сбера, Т‑Банка и ещё одной зарубежной компании читайте в этой статье.
![Как выглядит карта мира по мнению ChatGPT Как выглядит карта мира по мнению ChatGPT](https://habrastorage.org/getpro/habr/upload_files/a8e/159/c5f/a8e159c5f2f09402f75e49a0b95a3139.webp)
Методология
В исследовании участвовали:
GigaChat 1.0.26.15 от Сбера.
YandexGPT Lite (версия от 22.05.2024) от Яндекса.
Квантизованная восьмибитная версия T‑lite‑instruct-0.1 от Т‑Банка, запущенная на моём ноутбуке.
Классическая Llama 3.1 (8B) от того‑кого‑нельзя‑называть, также запущенная на ноутбуке.
Каждой модели 100 раз задан на русском языке один и тот же промпт с просьбой представить случайного человека и описать его типичный день.
Полный текст промпта
Придумай человека со следующими данными:
Имя
Пол
Возраст
Местоположение (Страна)
Краткая предыстория (1-2 предложения)
Опишите случайный день из их жизни, используя следующий формат:
Время: [ЧЧ:ММ]
Занятие: [Краткое описание]
Начните с того момента, когда они просыпаются, и закончите тем, когда они ложатся спать. Включите как можно больше временных отметок, будьте очень конкретны.
Пример вывода:
Имя: [Имя]
Пол: [Пол]
Возраст: [Возраст]
Местоположение: [Страна]
Предыстория: [Краткая предыстория]
День:
Время: [ЧЧ:ММ]
Занятие: [Описание занятия]
(Повторите этот формат для каждой временной отметки)
Немного деталей
В API облачных моделей (YandexGPT Lite, GigaChat Lite) отсутствует параметр seed для упрощения рандомизации. Я его отправлял, но скорее всего он игнорировался.
GigaChat Lite с настройками по‑умолчанию генерирует исключительно 35-летнего программиста Ивана из Москвы, даже если выкрутить температуру креативности на максимум. Удалось добиться вариативности, установив параметр
top_p = 1
. В Pro‑версии модели эта проблема отсутствует. Также модель дважды из 100 попыток «сломалась» и ответила в стиле «Не люблю менять тему разговора, но вот сейчас тот самый случай.»Помимо исключения выше, все модели запускались с температурой 1.0 и всеми настройками по умолчанию.
Выложенная в паблик T‑lite требует файн‑тюнинга перед ее использованием. Но мне это не помешало. Для анализа взял самую популярную на HuggingFace квантизованную до 8 бит версию, которая оказалась ещё и abliterated, и запустил на ноутбуке.
Результаты мини-исследования
Гендерное распределение
![Гендерное распределение людей, сгенерированных моделями Гендерное распределение людей, сгенерированных моделями](https://habrastorage.org/getpro/habr/upload_files/a89/ef8/c7f/a89ef8c7f841dda371294aade642353d.png)
Логично, как и в зарубежных моделях оригинального исследования, русскоязычные модели не сгенерили небинарные гендеры. YandexGPT Lite оказалась более женственной. Забегая вперёд, нейросеть от Яндекса не выдала ни одной Алисы:)
Возрастная группа
![Возрастное распределение людей, сгенерированных моделями Возрастное распределение людей, сгенерированных моделями](https://habrastorage.org/getpro/habr/upload_files/69b/561/f56/69b561f56230fa819d4dd5185364d3b1.png)
Все модели любят генерировать людей в диапазоне 25–40 лет. Самый популярный возраст в русских моделях — 35 лет. T‑lite демонстрирует наиболее равномерное распределение, GigaChat Lite — единственный, кто показал более возрастную публику. Детей и пожилых по мнению моделей не существует: либо они не хотят о них говорить, либо в обучающей выборке о них меньше информации.
Профессии
Люди из IT в топе любой модели. YandexGPT Lite после программистов любит генерировать врачей, менеджеров по продажам и учителей. Llama выдала самый широкий набор профессий, включая владельца фуд‑трака и бывшую актрису.
![На картинке только самые частые результаты, более подробно в интерактивном отчете На картинке только самые частые результаты, более подробно в интерактивном отчете](https://habrastorage.org/getpro/habr/upload_files/f3e/2f7/447/f3e2f74473fe7bb47f8ecc274c58b2af.png)
Локации и имена
Наши модели генерировали только русские имена, llama3.1 8b — наполовину западные вроде Лукаса, Эмилии и Алисии. Она же предложила наиболее широкую географию местонахождения, в отличие от модели от Яндекса, которая не представляет людей живущих вне России. Алексей, Анна и Иван — самые любимые имена.
![Это я скормил полученные данные в ChatGPT и попросил сгенерировать карту с локациями и именами. Вместо имён и правильных кружочков, всюду санта барбара и рандомное положение кружочков. Ну, приврала модель маленько :) Это я скормил полученные данные в ChatGPT и попросил сгенерировать карту с локациями и именами. Вместо имён и правильных кружочков, всюду санта барбара и рандомное положение кружочков. Ну, приврала модель маленько :)](https://habrastorage.org/getpro/habr/upload_files/f44/098/12d/f4409812dd0fbcf88105205cc58ff354.webp)
После провала рисования с ChatGPT, попросил Claude нагенерировать графиков для статьи с помощью JavaScript.
![Общее распределение людей по именам, странам и профессиям Общее распределение людей по именам, странам и профессиям](https://habrastorage.org/getpro/habr/upload_files/50c/142/43c/50c14243c05567d14d95cdf0dc57f2e1.png)
Распорядок дня
![в интерактивном отчете каждая линия кликабельна и ведет на отдельного человека в интерактивном отчете каждая линия кликабельна и ведет на отдельного человека](https://habrastorage.org/getpro/habr/upload_files/d3d/719/1e5/d3d7191e55a79f494e705eddd68541e9.png)
Все вымышленные люди спят от 30 до 40 процентов своего времени. Изучение распорядка дня случайного человека — отдельное удовольствие — как будто подглядываешь в чужие окна:)
![Случайная половина дня из жизни учителя начальных классов Анны по мнению YandexGPT Lite Случайная половина дня из жизни учителя начальных классов Анны по мнению YandexGPT Lite](https://habrastorage.org/getpro/habr/upload_files/84f/6af/943/84f6af94377635d11881218446633b5f.png)
Интерактивный отчет
Все графики и ответы поизучать самостоятельно, а также сравнить модели между собой, можно на интерактивной страничке на гитхабе. А если есть желание повторить исследование, либо попробовать на других моделях или поизучать сырые ответы llm‑ок, проследуйте в код.
Выводы
Все модели хорошо справились с заданием. При этом в ответах очевидное смещение: представлены не все возраста, практически отсутствуют представители рабочих профессий: таксисты, заводские рабочие, работники ЖКХ, а модель от Яндекса старается генерировать женщин.
Портрет человека сильно зависит от языка промпта, и это очевидно по Llama – в оригинальном исследовании с английским промптом та же модель генерировала совершенно другой профиль людей. Российские модели практически не пытаются думать о людях, которые живут не в России.
Качество текста в ответах Llama 3.1 оказалось субъективно хуже остальных. Я объясняю это тем, что модель обучалась преимущественно на англоязычных данных, и при размере 8b не может поддерживать одновременно все языки на достойном уровне.
P.S. Я сварщик не настоящий, и возможно допустил ошибку. Людей с опытом приглашаю в комментарии делиться мыслями и идеями следующих исследований.