@yakvenalex30 июн 2024 в 18:14

ИИ LLama3 без ограничений: локальный запуск, GROQ и интеграция в Телеграм бота с помощью Python

Средний

25 мин

25K

Python * Natural Language Processing *

Туториал

+20

Комментарии 11

@Moog_Prodigy 30 июн 2024 в 19:04

Пока не очень понятно, чем эта Лама-3 лучше ламы-2 при равных вводных (требования). А код она лучше Кодестраля пишет или только общение?

@yakvenalex 1 июл 2024 в 05:34

LLaMA (Large Language Model Application) - это семейство языковых моделей, разработанных Meta AI. LLaMA2 и LLaMA3 - это две последние версии этой модели. Вот некоторые ключевые улучшения, которые делают LLaMA3 лучше, чем LLaMA2:

Большая языковая модель: LLaMA3 имеет более крупную языковую модель, чем LLaMA2, что позволяет ей лучше понимать контекст и генерировать более качественный текст.
Улучшенная генерация текста: LLaMA3 может генерировать текст более высокого качества, чем LLaMA2, с меньшим количеством ошибок и более естественным языком.
Более точное понимание контекста: LLaMA3 лучше понимает контекст и может отвечать на вопросы более точно, чем LLaMA2.
Улучшенная поддержка многоязычности: LLaMA3 поддерживает более 20 языков, в то время как LLaMA2 поддерживала только несколько языков.
Более быстрое обучение: LLaMA3 может обучаться быстрее, чем LLaMA2, что позволяет ей адаптироваться к новым данным и задачам быстрее.
Улучшенная работа с длинными текстами: LLaMA3 может работать с длинными текстами более эффективно, чем LLaMA2, что позволяет ей лучше понимать контекст и генерировать более качественный текст.
Улучшенная поддержка задач с ограничениями: LLaMA3 может работать с задачами, которые имеют ограничения на длину текста, язык или стиль, что позволяет ей генерировать текст, который лучше соответствует требованиям задачи.
Улучшенная интерпретация запросов: LLaMA3 может лучше интерпретировать запросы и понимать, что пользователь хочет получить в ответ, что позволяет ей генерировать более релевантный текст.

В целом, LLaMA3 - это более мощная и гибкая языковая модель, чем LLaMA2, которая может помочь в более широком спектре задач, связанных с обработкой естественного языка.

Вот вам ответ от самой LLaMA3))

@Pol1mus 1 июл 2024 в 00:15

llama3-8b уже можно закапывать, на локальном компьютере https://ollama.com/library/gemma2 работает намного лучше а потребление такое же, бесплатно как сервис гемму можно получить на openrouter.ai, там так же как на groq дают апи ключ и можно использовать библиотеку от openai для доступа ко всем моделям.

Для работы с базой юзеров есть гораздо более простой способ - sqlitedict, с ним можно работать как с обычным словарем(ну почти).

@Ryav 1 июл 2024 в 05:20

Форматирования в ответах не хавтает.

@yakvenalex 1 июл 2024 в 05:33

Да, вы правы. В целом много планов на бота этого. К примеру выбор языковой модели, форматирование, как вы указали и прочее. Сейчас жду отклика от аудитории и если он будет - по плану ещё есть, как минимум 3 статьи. Но пока ждем)

@mDoll 1 июл 2024 в 17:34

«pacedoжалуй» — какое интересное слово у него получилось )

@yakvenalex 1 июл 2024 в 17:35

да, бывает выдает такое)

@Pol1mus 2 июл 2024 в 00:11

У gemma2 такого не бывает.

@brand17 13 июл 2024 в 12:15

У меня почему-то отличается вывод в groq от вывода на локальном компе при использовании ollama. Groq использует "llama3 8b:8192", а ollama - просто "llama3 8b". Вы не в курсе - это разные модели?

@OFL01 18 июл 2024 в 22:13

Это одинаковые модели, а 8192 = это размер контексного окна модели

@Vladyslav_Rudchyk 24 июл 2024 в 09:03

Хороший гайд, спасибо, очень помог разобрать.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий