Comments / Profile of AlanRobotics / Habr

Замеры проводились только на ру арена, результаты уже можно посмотреть по ссылке, в том числе и сравнение с базовым квеном. Спек дек на этой модели не пробовали

Look

Как мы создали LLM-модель Cotype Nano

AlanRobotics Nov 27 2024 at 00:14

Мы экспериментируем с разными подходами, но для Nano решили использовать базовый DPO в целях алаймента на различные чувствительные темы, по итогу решили просто добавить такие данные в SFT

Look

Как мы создали LLM-модель Cotype Nano

AlanRobotics Nov 27 2024 at 00:11

Да, с gguf версией

Look

Как мы создали LLM-модель Cotype Nano

AlanRobotics Nov 26 2024 at 23:52

Добрый вечер, попробовал ваш промпт на MTSAIR/Cotype-Nano

Ответ: Клиенты сети "ВкусВилл" продолжают выражать недовольство наличием металлических остатков в покупаемых товарах. Они замечают металлическую стружку и скобы степлера в различных продуктах, таких как вареники, хлеб, супы и даже в кесадилье. Более десятка человек подали жалобы на этот счет. В ответ на обращения клиентов компания начисляет бонусы на карту лояльности и обещает провести специальное расследование. Кроме того, поступают жалобы на бутылки с водой, которые приходят с треснутыми или открытыми крышками.

Параметры генерации: top_p=1.0, temp=0.2. Можете поэкспериментировать с другими параметрами и системным промптом

Look

Как мы создали LLM-модель Cotype Nano

AlanRobotics Nov 26 2024 at 14:26

Вроде нет
Результаты на ру арене для обеих LLM можете найти здесь

Look

Как мы создали LLM-модель Cotype Nano

AlanRobotics Nov 26 2024 at 14:04

Привет, хорошо, спасибо

Look

Как мы создали LLM-модель Cotype Nano

AlanRobotics Nov 26 2024 at 10:13

3B занимает около 6 ГБ

Look

LLMClone: как клонировать себя в Telegram

AlanRobotics Dec 28 2023 at 18:24

Модель еще строку переносит, и это выглядит как диалог. Она должна останавливать генерацию после каждого ответа бота, почитайте что такое eos токен и зачем его нужно добавлять

Посмотрите на инструктивные датасеты, как они устроены и как на них обучать. Это вопрос ответ, иногда добавляют систем промпт.

Как выглядят данные из телеги:

User: как дела? \n

# ответ модели

\nClone: пойдет

Модели скармливаем user: Ваш вопрос, далее она генерирует все остальное, и должна останавливаться после генерации ответа. Об этом я уже говорил

Look

LLMClone: как клонировать себя в Telegram

AlanRobotics Dec 28 2023 at 17:53

что значит модель не понимает что это диалог? Модель учится на серии диалогов “user: text, clone: text”, начинает отвечать также, так работает файнтюниг. Он не видит никаких других имен. Как я уже сказал до этого, чего точно не хватает в подготовке данных, так это добавление eos токенов в конце диалогов

Look

LLMClone: как клонировать себя в Telegram

AlanRobotics Dec 14 2023 at 22:42

Думаю, в процессе обработки данных нужно добавить токены, обозначающие конец предложения, попробуем исправить в будущей версии библиотеки

Look

LLMClone: как клонировать себя в Telegram

AlanRobotics Dec 14 2023 at 22:39

Думаю в процессе обработки данных нужно добавить токены, обозначающие конец предложения, попробуем исправить в обновлении

Look

LLMClone: как клонировать себя в Telegram

AlanRobotics Dec 14 2023 at 19:59

Спасибо, хорошая идея

Look

LLMClone: как клонировать себя в Telegram

AlanRobotics Dec 14 2023 at 19:58

Я имел в виду диалоги, которые могут содержать информацию такого характера, например переписки по работе, тогда могут возникнуть проблемы с работодателем

Look

LLMClone: как клонировать себя в Telegram

AlanRobotics Dec 14 2023 at 19:56

Спасибо, приятно:)

Look

LLMClone: как клонировать себя в Telegram

AlanRobotics Dec 14 2023 at 05:04

Ответ на первую часть комментария

Look

LLMClone: как клонировать себя в Telegram

AlanRobotics Dec 13 2023 at 13:36

Конечно идея не супер уникальная (после написания статьи оказалось, что есть работы с обучением клонов на диалогах из мессенжеров, упомянул в начале), но спасибо за фидбек

Look

LLaMa vs GigaChat: может ли опенсорсная модель работать лучше LLM с 13 млрд параметрами?

AlanRobotics Sep 8 2023 at 08:16

Пока что бот выключен

Look

Information

Specialization