rmuhamedgaliev 28 авг 2024 в 19:57

Простой способ развернуть локальный LLM

Простой

4 мин

28K

Искусственный интеллект

Кейс

+16

Комментарии 11

doitagain 28 авг 2024 в 21:06

Скачал LM Studio, в ней скачал последнюю gemini, а она не хочет отвечать на мои не удобные вопросы, говорит нельзя так делать, обратитесь лучше в службы помощи по номерам телефонов начинающихся с +1-.......

d00m911 28 авг 2024 в 22:06

Uncensored-моделей довольно много, плюс та же LLAMA 3.1 может отвечать практически на все вопросы после правильно сформулированного системного промпта.

Levsha_cc 2 сен 2024 в 04:54

Есть трюк, поменяйте ответ системы на положительный, и еще раз спросите. Многие llm на этом ломаются.

rmuhamedgaliev 28 авг 2024 в 21:17

Я для эксперимента на сервере развернул малютку - https://huggingface.co/meta-llama/Meta-Llama-3.1-8B-Instruct. А так AnythingLLM поддерживает еще и https://ollama.com/ но у меня сервер без GPU поэтому я использую CPU only модели

YuryVl 29 авг 2024 в 12:56

Скажите пожалуйста, а модели будут иметь доступ к "интернету"?

rmuhamedgaliev 29 авг 2024 в 13:28

Доступ извне можно реализовать открыв порт 8080, localai поддерживает так же защиту при помощи токена.
А если заставить саму модель ходить в интернет, то я не уверен, так как на сколько я понимаю та чуть поупражняться надо. https://www.reddit.com/r/LocalLLaMA/comments/18yv28m/dumb_question_perhaps_how_do_i_enable_internet/

iosuslov 29 авг 2024 в 14:01

Для питона есть либа LangChain, которая, помимо прочего, может предоставить любой модели доступ к поисковой выдаче.

Derfirm 29 авг 2024 в 00:36

Может быть полезным https://llm.datasette.io/en/stable/

Большое количество моделей, простой способ установки, хранения ключей и пользование прямо из консоли с запуском модели на каждый чих или поднятьия для множества промтов... И это лишь часть интересной тулы

bondeg 29 авг 2024 в 10:36

Стоит ещё дополнить про google colab, который позволит запускать на GPU модельки погонять какое-то время. (~1-2 часа в сутки).

Это уже не совсем локально, но тем не менее полезно в миксе с ollama, например.

siv237 1 сен 2024 в 12:19

ollama+open-webui отличная связка чтоб создать свой личный аналог локального chatgpt web интерфеса

rmuhamedgaliev 1 сен 2024 в 13:11

у ollama есть одна сложность, для работы ей нужен GPU и есть есть хиленький сервачок CPU онли, то она будет не очень вариантом.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий