Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!

Очень хорошо всё описано
Спасибо за статью. Очень интересно и подробно все расписано
А можно использовать json или маркдаун скрытый в чате, что бы его не засорять, и еще можно SQL лайтовую прикрутить, поднять сервак на fastapi и пусть базу обходит по запросу из чата, от самой ллм.
Маленький LLM-чат на Python с Ollama и LiteLLM. Часть 3: добавляем историю сообщений и контекст