Комментарии / Профиль Ferraro / Хабр

Пользователь

Подписчики

Как я обучил GPT с нуля на русском языке — и что из этого получилось

Тестил на книгах, но там свои проблемы - стиль слишком далёк от живого языка, а у части контента содержание специфичное 💀. Жёсткая фильтрация оставила бы слишком мало. Для задачи с персонажем нужен был именно неформальный язык, поэтому и пошёл в сторону блогов.

Как я обучил GPT с нуля на русском языке — и что из этого получилось

Ferraro 21 мая в 13:35

Примеров генерации нет, к сожалению. Запуски были давно, чекпоинты не сохранились, остались только графики loss.

По твоему опыту - интересно. Датасет в parquet со сжатием, реальный объём текста скорее всего ~15 гб, но оценить сколько это всё таки в токенах сложно из-за дополнительных полей. По Chinchilla нужно 5B токенов для 0.25B модели, и если за 3 часа всё это не прошло, модель явно недообучена. Отсюда и результат "что-то аппроксимировано". Интересно было бы посмотреть что получится с несколькими эпохами или большим датасетом.

Хостинг сервера в Google Colab без ngrok и cloudflared

Ferraro 1 мая в 06:16

Попробуй через Network:

Получи URL через eval_js и открой его в браузере (вкладку с Colab не закрывай)
Открой DevTools (F12) -> вкладка Network
Обнови страницу (F5) - появятся запросы
Кликни на последний запрос к твоему домену (prod.colab.dev)
Вкладка Headers -> раздел Request Headers -> найди поле cookie, или вкладка Cookies -> там будет colab-runtime-proxy-token отдельной строкой
Там будет colab-runtime-proxy-token=... - это и есть нужный токен

Как я добавил llama.cpp бэкенд в CosyVoice3 и ускорил инференс в 2.6x

Ferraro 27 апр в 14:55

Да, нужны файлы оригинала, потому что это лишь надстройка (заменяется только LLM-часть).

Скачай базовую модель:

from huggingface_hub import snapshot_download
snapshot_download('FunAudioLLM/Fun-CosyVoice3-0.5B-2512', local_dir='pretrained_models/Fun-CosyVoice3-0.5B')

И GGUF положи рядом. При инициализации укажи оба пути:

cosyvoice = AutoModel(
    model_dir='pretrained_models/Fun-CosyVoice3-0.5B',
    load_llama_cpp=True,
    gguf_model_path='pretrained_models/cosyvoice_llm_f16.gguf'
)

Как я добавил llama.cpp бэкенд в CosyVoice3 и ускорил инференс в 2.6x

Ferraro 27 апр в 07:41

Измерил TTFA на T4: 5.5с -> 1.6с (ускорение ~3.5x)

Информация

Специализация