Комментарии 10
не проще ли было скопировать репозиторий локально и сказать "смотреть здесь"? Разве что по токенам дороже
Получается: Что бы написать одну программу, напиши другую программу, которая возможно поможет написать первую.
Отличный подход. Действительно есть много задач, когда раскрытие содержимого кода нежелательно или даже ограничено законодательно.
По личному опыту: маленькие модели действительно могут помочь с кодом. Только вот вопрос: зачем мне тащить громоздкий докер на свой ноут, если я просто могу запустить llama.cpp? Второе: зачем на сегодня мне использовать слабую qwen-2.5 (да ещё и в 4km), когда можно использовать хотя бы qwen-3-4B (желательно в 5km и выше)? Любой перевод стоит адаптировать к реалиям. Тем более, что qwen-3-4B отлично понимает русский. Да он сравнительно немного медленнее ещё более мелких моделей, но и результат более качественный
Надо было упомянуть что бы всё было на английском, так как модели в английском меньше теряются.
По сути одна из реализаций RAG
Я пришел к выводу после нескольких экспериментов, что для решения такой задачи лучше использовать lightrag в связке с тем же qwen3 4b. Для lightrag не нужно писать скрипты, там все есть для обработки документов

Как сделать (очень) маленькие LLM действительно полезными