@myoffice_ru Jan 31 at 14:53

Всё, что я узнал о запуске локальных языковых моделей

Easy

19 min

23K

МойОфис corporate blogArtificial Intelligence

Tutorial

Translation

+28

Comments 7

@heejew Feb 1 at 04:06

Сегодня уже возможно запустить LLM на Raspberry Pi, и она будет умнее оригинального ChatGPT (версии ноября 2022 года)

Ну крайне спорное утверждение, хочу я вам сказать. Даже с версией 22 года сравнивать некорректно мелкие модельки, у которых чуть через каждое слово артефакты. В deepseek это ещё заметнее - там если общаться на русском, то возникают артефакты на китайском внутри артефактов на английском. И это наверное самое безобидное, в основном мелкие модели, по крайней мере у меня, забывают про контекст уже при генерации ответа и поэтому посреди текста бредить начинает и отвечает все что угодно, только не на поставленный вопрос.

Может я что-то делаю не так?)

@MaksimMukharev Feb 1 at 11:11

Как часто вы встречаете такие артефакты? Я пока не сталкивался. Возможно, не очень много использовал ещё

@avshkol Feb 1 at 15:28

У deepseek это встречалось в первых версиях, сейчас давно не встречаю, хотя он перерабатывает для меня мегабайты текста.

У Qwen-2.5 сегодня при перелопачивании и переводе нескольких сотен словарных статей 5 раз встречались иероглифы... (Qwen использую на более лайтовых задачах из-за почти постоянной недоступности deepseek)

@SkywardFire Feb 12 at 15:08

Обратите внимание, что нигде в официальной документации не объясняется расшифровка аббревиатуры «GGUF»

GPT-Generated Unified Format

@smith_s Dec 1 at 12:31

Формат GGUF (Georgi Gerganov Universal Format) https://llmstudio.ru/blog/gguf

@Ogoun Jul 30 at 06:36

Какой версией w64devkit вы собирали? В репозитории llama.cpp сказано брать последнюю версию, но сборка падает, т.к. Makefile deprecated. Пока перебираю версии ниже, уже на 1.23.0, но все еще не нашел на какой бы сборка прошла.

@askarbin Aug 21 at 15:27

Можно ли использовать инференс батчами и вообще инференсить на чём-то типа тритона ?