rocet Mar 9 at 17:16

Эволюция Telegram-бота на локальной LLM от болтуна до мини-игр, генерации фото, возможности выбора модели

Medium

10 min

10K

Python * Artificial IntelligenceProgramming * Game development * Computer hardware

From sandbox

Comments 6

RomaBelousov Mar 9 at 18:24

Про регулярки с LaTeX — это ж моя боль, тоже через это проходил, пока не забил и не заставил модель просто в Markdown отвечать 😄 А детектив классный, я как раз похожие текстовые квесты на LLM накручивал, реально увлекательно, когда сюжет не повторяется. Подход с кешированием моделей — огонь, утащу себе. Автору респект

rocet Mar 9 at 18:31

Тоже сначала думал с Markdown оставить, но в итоге решил заморочится. А так можешь украсть и нормализацию LaTeX (если еще нужна) :) И да, с LLM можно на самом деле много всяких прикольных мини-игр осуществить, нужна лишь фантазия и время (которого часто не хватает).

K0Jlya9 Mar 9 at 23:25

Для переделывания латеха в юникод есть библиотека pylatexenc

Для переделывания маркдауна от ллм в телеграм https://github.com/sudoskys/telegramify-markdown

HomoLuden yesterday at 06:42

Вместо A1111 используйте ComfyUI. Тот универсальные и qwen3 vl на 12ГБ видео прекрасно работает. Только кастомпный год надо написать на основе года для Qwen 2.5 vl и примера кода для qwen 3 vl с huggingface. Скорее всего получится и новые мультимодалуи qwen3.5 прикрутить. Вместо ollama лучше попробуйте oobabooga text-generation-wenui. Он позволяет запускать gguf с частичной выгрузкой слоев в ОЗУ с выводом получающейся инструкции запуска llama.cpp в консоль. Можно будет для ComfyUI запустить большую модель с замедлением. Например Qwen3.5 35b.

Мне к примеру удалось таким образом запустить на 5060ti + 4060ti модель Qwen3.5 122b A10b. Причем с добавкой Qwen3.5 4b модели в качестве драфтовой ускоряли токенов

NTDim1973 yesterday at 08:58

Классная статья, реально вдохновляет! Особенно круто, что всё локально, без облаков, плюс мини-игра «Детектив», выбор моделей с галочками и удобная работа с длинными ответами.

Не хватило:

примерных скоростей (токенов/сек) на вашем железе
сколько памяти жрёт кэш из 2–3 моделей
пример промпта для сценария преступления

Было бы здорово добавить:

голосовой ввод/вывод
авто-перевод промптов для генерации картинок
простую статистику использования моделей

Спасибо за разбор, мотивирует самому поковыряться. Подписался, жду продолжения! 🚀

rocet yesterday at 17:21

Примеры постараюсь добавить в следующей статейке, а авто-перевод промптов я уже добавил. Про статистику и голосовой ввод/ввывод это хорошие идеи, спасибо :)