Обновить
16K+
4

Пользователь

19
Рейтинг
2
Подписчики
Отправить сообщение

Как я обучил GPT с нуля на русском языке — и что из этого получилось

Уровень сложностиСложный
Время на прочтение7 мин
Охват и читатели7.8K

Всё началось с наивной мысли: зачем платить за API или тащить 7B-модель, если мне нужна маленькая модель для простых разговоров на одном языке? Логика казалась железной — большие модели умеют всё и на всех языках сразу, но это же избыточно. 0.7B, заточенная под один язык и один стиль общения, должна справляться не хуже.

Спойлер: это было наивно. Но путь оказался ценнее результата.

Читать далее

Хостинг сервера в Google Colab без ngrok и cloudflared

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели7.1K

Разбираемся, как использовать встроенный механизм Google Colab для хостинга сервера без ngrok и cloudflared — и как достучаться до него через requests с помощью токена аутентификации.

Читать далее

Как я добавил llama.cpp бэкенд в CosyVoice3 и ускорил инференс в 2.6x

Уровень сложностиСредний
Время на прочтение3 мин
Охват и читатели11K

CosyVoice3 — одна из лучших open source TTS моделей, но LLM-часть на PyTorch работает медленно. Я добавил llama-cpp-python бэкенд с GGUF квантизацией — RTF упал с 1.17 до 0.45, ускорение 2.6x на T4. Установка одной командой, никакого Docker.

Читать далее

Информация

В рейтинге
412-й
Зарегистрирован
Активность

Специализация

ML разработчик