Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать

Мы задались вопросом: можно ли адаптировать маленькую LLM, например Qwen3-4B-Instruct,для генерации качественных unit-тестов для разработки бекенда на Kotlin с учетом внутренней специфики наших котлинистов? И решили мы это сделать с помощью весьма экзотического способа дообучения LLM – эволюционного алгоритма. А потом еще и сравнить этот алгоритм с ставшими уже классикой методами дообучения LLM: SFT и GRPO.



















