Как я написал TTS-движок на Rust за месяц: путь от Python к production-ready решению

Что будет, если выкинуть Python-обвязку и сделать TTS по-взрослому?
Я взял Qwen3-TTS и за месяц собрал RustTTS: компактный бинарник, быстрый старт, стриминг и контролируемый инференс без “venv на 2 ГБ”.
Покажу, как устроен пайплайн (text → tokens → audio), где реально узкие места, какие оптимизации дают эффект, и почему RTF на CPU может быть конкурентным, если не стрелять себе в ногу архитектурой.


















