@Dmitrii_DAK12 авг в 18:34

LLM в кармане: запускаю локальные модели на Samsung S24 Ultra через PocketPal — бенчмарки, настройки и туториал

Простой

8 мин

15K

СофтСмартфоныУчебный процесс в ITHTML * Искусственный интеллект

Обзор

+23

Комментарии 11

@sergeym69 12 авг в 23:35

Можно просто в прямо Chrome на Android загружать и работать с LLM https://chat.webllm.ai/ надо выбирать модели у которых в конце -q4f32_1-MLC
Модель типа Qwen3-1.7B может работать почти на любом телефоне

@Dmitrii_DAK 13 авг в 00:47

Крутая вещь! Спасибо тебе комментатор sergeym69, твоя информация очень ценна и полезна для меня и всех кто прочтёт эту статью

@pol_pot 13 авг в 01:46

То чувство когда не знаешь куда применить новейшую 24б модельку от мистраля или 32б от квина из-за того что они откровенно туповаты и даже языком владеют не вполне а тут люди пишут тексты и программы модельками размером 4-7б и вроде даже довольны результатом.

@Dmitrii_DAK 13 авг в 12:52

Мой знакомый из сферы CGI написал программу для добавления анимированных 2.5D людей и животных в Unreal Engine для синематиков и рекламы с помощью открытых моделей - было бы желание, креатив и упорство = и каждую модель можно пристроить к делу, зная её особенности и уровень интеллекта)

@Spyman 13 авг в 02:30

Всё жду, когда что-то такое появится в виде библиотеки, чтобы легко интегрировать llm в свое приложение и оно работало локально на устройстве

@maxcat 14 авг в 09:49

Вот бы сравнительную таблицу скорости и адекватности ответов, а то глаза разбегаются

@fav0rit 15 авг в 06:44

Мне в телефоне в игры то играть не хочется из-за маленького экрана и неудобного управления, а люди еще и кодить на нем умудряются, да еще и с помощью LLM на 8b? Я помню, просил chatgpt написать автоматизацию для НА, так он местами в форматировании yaml умудрился накосячить, что уж говорить про эти модельки...

Что-то мне кажется, что запустить их локально можно, но на практике никто этим пользоваться не будет, хотя бы потому что даже если вы написали текст для своего блога, пока были офлайн - вы все равно его не сможете опубликовать, а когда у вас появится связь - будет и доступ к серьезным моделям, которые могут решить задачу быстрее и намного качественнее.

@Dmitrii_DAK 15 авг в 08:52

В ваших словах есть доля истины, однако и я не программист, чтобы писать штуки по типу автоматизации - я = дизайнер и моушн-дизайнер - вы можете посмотреть другие мои статьи и что AI мне нужно для создания своеобразных вещей для заказчиков (к примеру: 3D-текст созданный в Blender 3D и имеющий определённую текстуру с помощью ControlNET или оживление фото с помощью Wan 2.1 + замена лиц с помощью Reactor для поздравительной открытки от коллектива завода для директора и т.д.).

Мой максимальный level в программировании = создание кода в zero block на Tilda и использование GSAP в WebFlow.

Насчёт публикации потом с помощью других более мощных моделей - нет вы не правы, когда я езжу в путешествия по России на поезде = я не беру с собой ноут, так как лишняя дорогая техника, поэтому смартфон + компактный стедикам для стабилизации съёмки - это очень мобильная "сборка". Как это работает? Едешь в поезде между Кисловодском и Ессентуками, в 1 городе снял видос, пока ехал = смонтировал в CapCut + написал блог с помощью AI и короткий кликбейтный пост в "Запрещеграм". Приехал в Ессентуки = появился интернет - опубликовал контент. Всё круто😎😉😊

@Dmitrii_DAK 15 авг в 09:01

Кстати, что такое "HA"?

А вообще, если говорить про ChatGPT, Claude и другие "большие" модели - это не так работает.

Нейросеть - это не про нажать одну кнопку "Сделать красиво" - это инструмент по типу Photoshop или After Effect. А разве у вас сразу получалось сделать крутой арт в первом и хороший анимированный видос во втором = нет. Я уверен, если бы вы "помучали" чат уточняющими вопросами часа 3-4 вы бы написали вашу автоматизации. Нигде нет мнгновенного результата - это везде труд, а инструмент использования не имеет значения: Photoshop ли это или Forge AI или ComfyUI или ChatGPT. Вообще я заметил, что смешанная технология приносит наилучшие результаты)

@Teilot 15 авг в 12:01

Да, они будут запускаться, но вызывать троллинг на телефоне

Может быть троттлинг?

@Dmitrii_DAK 15 авг в 12:02

Не баг, а фича)) Спасибо, я исправлю😉🤝

Зарегистрируйтесь на Хабре, чтобы оставить комментарий