rmuhamedgaliev Aug 28 2024 at 19:57

Простой способ развернуть локальный LLM

Easy

4 min

21K

Artificial Intelligence

Case

+13

Comments 11

doitagain Aug 28 2024 at 21:06

Скачал LM Studio, в ней скачал последнюю gemini, а она не хочет отвечать на мои не удобные вопросы, говорит нельзя так делать, обратитесь лучше в службы помощи по номерам телефонов начинающихся с +1-.......

d00m911 Aug 28 2024 at 22:06

Uncensored-моделей довольно много, плюс та же LLAMA 3.1 может отвечать практически на все вопросы после правильно сформулированного системного промпта.

Levsha_cc Sep 2 2024 at 04:54

Есть трюк, поменяйте ответ системы на положительный, и еще раз спросите. Многие llm на этом ломаются.

rmuhamedgaliev Aug 28 2024 at 21:17

Я для эксперимента на сервере развернул малютку - https://huggingface.co/meta-llama/Meta-Llama-3.1-8B-Instruct. А так AnythingLLM поддерживает еще и https://ollama.com/ но у меня сервер без GPU поэтому я использую CPU only модели

YuryVl Aug 29 2024 at 12:56

Скажите пожалуйста, а модели будут иметь доступ к "интернету"?

rmuhamedgaliev Aug 29 2024 at 13:28

Доступ извне можно реализовать открыв порт 8080, localai поддерживает так же защиту при помощи токена.
А если заставить саму модель ходить в интернет, то я не уверен, так как на сколько я понимаю та чуть поупражняться надо. https://www.reddit.com/r/LocalLLaMA/comments/18yv28m/dumb_question_perhaps_how_do_i_enable_internet/

iosuslov Aug 29 2024 at 14:01

Для питона есть либа LangChain, которая, помимо прочего, может предоставить любой модели доступ к поисковой выдаче.

Derfirm Aug 29 2024 at 00:36

Может быть полезным https://llm.datasette.io/en/stable/

Большое количество моделей, простой способ установки, хранения ключей и пользование прямо из консоли с запуском модели на каждый чих или поднятьия для множества промтов... И это лишь часть интересной тулы

bondeg Aug 29 2024 at 10:36

Стоит ещё дополнить про google colab, который позволит запускать на GPU модельки погонять какое-то время. (~1-2 часа в сутки).

Это уже не совсем локально, но тем не менее полезно в миксе с ollama, например.

siv237 Sep 1 2024 at 12:19

ollama+open-webui отличная связка чтоб создать свой личный аналог локального chatgpt web интерфеса

rmuhamedgaliev Sep 1 2024 at 13:11

у ollama есть одна сложность, для работы ей нужен GPU и есть есть хиленький сервачок CPU онли, то она будет не очень вариантом.