Создание Selena.AI: модель, которая понимает код / Песочница / Хабр

Меня всегда манило неизведанное: каково это, вдохнуть жизнь в собственную модель искусственного интеллекта, способную понимать язык кода? И вот, этот момент настал. Я принял решение создать Selena.AI — персональную языковую модель, призванную стать надежным помощником в разработке игр, оперативно отвечая на вопросы по программированию и предоставляя экспертные рекомендации в области игрового кода.

Почему я решил сделать собственную модель

Цель была четко сформулирована: создать ассистента, который не просто предоставляет ответы, но и глубоко понимает контекст программирования, логику игровых систем и специфические задачи, возникающие в процессе разработки игр. Использование готовых универсальных моделей, безусловно, имеет свои преимущества, однако они зачастую не учитывают уникальные особенности конкретных проектов. Selena.AI задумывалась как персонализированный инструмент, способный гибко адаптироваться к моему стилю работы и специфике разрабатываемых игровых проектов.

Этапы разработки

1. Выбор базовой модели

В качестве отправной точки была выбрана модель GPT-Neo 1.3B. Она обладает достаточной вычислительной мощностью для понимания кода и, в то же время, предоставляет возможность дообучения с использованием методики LoRA (Low-Rank Adaptation), не требуя при этом огромных вычислительных ресурсов. LoRA позволяет эффективно дообучать модель на специфических данных, не затрагивая базовые веса. Это значительно экономит время и ресурсы, сохраняя при этом исходные знания, заложенные в модели.

2. Подготовка датасета

Основу обучающего датасета составили тщательно подобранные примеры диалогов в формате «вопрос–ответ» по тематике кода, реальные игровые сценарии и логические задачи, с которыми я регулярно сталкиваюсь в процессе разработки игр.

Пример формата данных, используемого для обучения LoRA:

{
  "prompt": "Пользователь: Как создать персонажа с уникальной анимацией?\nАссистент:",
  "completion": "Можно использовать систему анимации Godot или Unity, добавляя отдельные AnimationClip для каждого действия."
}

В перспективе намечено значительное расширение объема данных до нескольких миллионов образцов, охватывающих подробную сопроводительную документацию, релевантные примеры из общедоступных репозиториев, а также накопленный опыт, представленный в виде собственных реализованных проектов.

3. Обучение модели

Используя методику LoRA, я провел дообучение модели на подготовленном специализированном датасете. Обучение проводилось на графическом процессоре (GPU) с использованием библиотек PyTorch и Transformers, что позволило модели значительно быстрее адаптироваться к специфичным требованиям игрового кода.

# Пример загрузки модели и токенизатора
from transformers import AutoTokenizer, AutoModelForCausalLM

model_name = "EleutherAI/gpt-neo-1.3B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

4. Интерактивное тестирование

Для проведения всестороннего тестирования был разработан чат-интерфейс на базе фреймворка FastAPI с подключением через сервис ngrok, что обеспечило доступ к модели через веб-браузер и позволило получать ответы в режиме реального времени.

Пример диалога с Selena.AI в процессе тестирования:

Вы: Как создать игрового персонажа с уникальной анимацией?
Selena.AI: Используйте систему анимации вашего движка (Unity или Godot). Создайте отдельные AnimationClip для каждого действия персонажа и объедините их в Animator Controller.

Вы: Как реализовать систему инвентаря?
Selena.AI: Создайте класс Inventory, храните предметы в списке, добавьте методы AddItem и RemoveItem. Для UI используйте GridLayout для отображения предметов.

5. Результаты и дальнейшие шаги

На текущий момент Selena.AI успешно демонстрирует следующие навыки:

Предоставление экспертных советов по игровому коду на различных языках программирования Оказание помощи в проектировании и реализации логики игровых систем
Понимание контекста диалога и истории сообщений, что позволяет поддерживать более осмысленные и последовательные беседы В качестве следующего шага рассматривается добавление еще большего объема специализированного контента по разработке игр, включая подробную документацию, развернутые примеры проектов и лучшие практики, чтобы превратить Selena.AI в полноценного и незаменимого ассистента для разработчиков игр.

Вывод

Создание собственной модели искусственного интеллекта — это увлекательный и чрезвычайно полезный опыт, особенно для тех, кто занимается разработкой игр. Selena.AI представляет собой важный шаг на пути к созданию персонализированного ассистента, который глубоко знает ваши проекты и готов оказать всестороннюю помощь в решении задач, связанных с кодом, логикой и игровым дизайном.