ruslandevlabs 21 окт 2024 в 08:37

Мультимодальные приложения на Llama 3.2 и Llama Stack

3 мин

4.9K

Машинное обучение * Искусственный интеллект

Комментарии 13

Fizikoleg 21 окт 2024 в 09:11

По вашему мнению, какие из открытых llm лучше всего справляются с текстами на русском?

ruslandevlabs 21 окт 2024 в 12:05

lightblue/suzume-llama-3-8B-multilingual и моя ruslandev/llama-3-8b-gpt-4o-ru1.0

dolovar 21 окт 2024 в 15:55

какие из открытых llm лучше всего справляются с текстами на русском?

Вашему вопросу не хватает уточнений по весу модели, свежести её знаний и характере работы с текстом.
Например, ллама с весом 405b великолепно справляется с текстами на русском но сможете ли вы эффективно крутить эту модель?
Гибриды на основе третьей лламы неплохо писали тексты, но большинство из них ничего не знают о событиях и технологиях после 2021 года, подходит ли это под цели ваших текстов?
Ну и читать с пониманием могут даже модели с весом 0.5b, причем делают это быстрее прочих - попадает ли это под ваше определение "справляться с текстом"?

Fizikoleg 22 окт 2024 в 05:27

По большей части хотел попробовать с помощью локальной модели организовать работу со своими файлами. Свежесть знаний не сильно значима.

Fizikoleg 21 окт 2024 в 13:26

А что скажете на счёт Gemma 2?

ruslandevlabs 22 окт 2024 в 09:39

Не пробовал, знаю что у 2B хорошие результаты по бенчмаркам среди малых LLM. Но теперь есть Llama 3.2 3B

dolovar 22 окт 2024 в 09:45

Gemma2 даже в малых весах значительно превосходит Llama3.2 в мультиязычности. Нельзя использовать последние лламы для генерации на русском.

PDEMON 21 окт 2024 в 16:06

Парни, а такой вопрос. Кто нибудь встраивал небольшие LLM в полноценное приложение? К примеру, как скрепка в офисе или обработчик какой нибудь. Хочется посмотреть реализацию

dolovar 21 окт 2024 в 16:17

Работа с LLM по API или полноценное встраивание сервера в свое приложение?

Скрепку можно реализовать простым расширением к браузеру, которое будет хранить часто используемые промпты и бегать с ними на сервер по мере надобности.

PDEMON 21 окт 2024 в 16:27

Не, без сервиса. Чисто локально, исключительно внутри приложения. Скрепка, это так пример. Без интернета, без отдельного, ручного поднимания сервера. Как агент приложения

znsoft 22 окт 2024 в 22:02

хм, судя по интернету Ллама поднимают даже на малинках без интернета, что мешает поднять его уже внутри приложения ? (ну да надо как то прилинковать все)

https://www.dfrobot.com/blog-13412.html

https://github.com/garyexplains/examples/blob/master/how-to-run-llama-cpp-on-raspberry-pi.md

PDEMON 23 окт 2024 в 08:03

То что локально маленького чат бота поднять хоть на осциллографе это понятно. Мне саму реализацию интересно посмотреть. Это ведь уже полноценного специализированно помощника сделать можно. Бухгалтерию, на данным момент я бы ему не доверил, но какую-то автоматизацию со сверкой данных или тому подобное можно было бы сделать.

dolovar 23 окт 2024 в 08:34

Рискну спросить - почему бы не попробовать спросить кого-нибудь из больших нейросетей? Они вполне способны рассказать о подходах и даже набросать скелет простого приложения для решения интересной вам задачи на интересной вам платформе. И если заинтересуют особенности какой-нибудь детали вроде "JNI для взаимодействия с llama.cpp", то тоже можно расспросить.

Как мне кажется, для вашей задачи "хочется посмотреть реализацию" такой подход вполне достаточен.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий