Можно обходиться спокойно видюхами типа 4070 ti super + 64/96/128 оперативки, пользоваться моделями типа gpt-oss-20b, что для "бытового" использования нейронки вполне достаточно, и бюджет на железо не сильно разувается. 50-60 токенов/сек обеспечит. В той же lm studio RAG уже прикручен, но всегда можно запилить свой интерфейс с блэкджеком и ...
Можно обходиться спокойно видюхами типа 4070 ti super + 64/96/128 оперативки, пользоваться моделями типа gpt-oss-20b, что для "бытового" использования нейронки вполне достаточно, и бюджет на железо не сильно разувается. 50-60 токенов/сек обеспечит. В той же lm studio RAG уже прикручен, но всегда можно запилить свой интерфейс с блэкджеком и ...