AlanRobotics Dec 13 2023 at 16:10

LLMClone: как клонировать себя в Telegram

8 min

17K

MTS AI corporate blogMachine learning*Artificial IntelligenceNatural Language Processing*

✏️ Technotext 2023

+31

Comments 34

ildarz Dec 13 2023 at 16:30

Отличная идея. Главное, потом не удивляться, что знакомые как-то не так косятся, а то и товарищ майор в дверь постучит.

AlanRobotics Dec 13 2023 at 16:36

Конечно идея не супер уникальная (после написания статьи оказалось, что есть работы с обучением клонов на диалогах из мессенжеров, упомянул в начале), но спасибо за фидбек

GeeZeR Dec 14 2023 at 07:18

Полагаю, что вопрос не в уникальности, а в том, что бот в ответах «нагаллюционирует» рано или поздно.

AlanRobotics Dec 14 2023 at 08:04

Ответ на первую часть комментария

modelair Dec 14 2023 at 01:52

типичные боты в телеграме не замена в данном случае, тут нужно делать настоящего хардкорного бота, который будет представляться телеграмом, эмулировать клиентское приложение

Kenya-West Dec 14 2023 at 22:53

Библиотеки для создания юзерботов Whatsapp и Telegram к вашим услугам

modelair Dec 15 2023 at 01:30

как вы назвали "юзерботы" - я совсем не это имел ввиду, прочтите заново

shlyakpavel Dec 15 2023 at 08:49

Вы это и имели ввиду. Загуглите что такое "юзерботы"

fio Dec 14 2023 at 08:59

Как бы не получилось как в South Park 2604. Deep Learning

starline777 Dec 14 2023 at 13:13

ну идея классная на самом деле, как по мне наиболее качественно можно обучить коммерческого бота продажника, если есть данные хорошие, где была закрыта сделка, а где нет, что бы бот использовал нужные фразы...будущее уже рядом)

AlanRobotics Dec 14 2023 at 22:59

Спасибо, хорошая идея

johnfound Dec 14 2023 at 15:36

А лучше взять микрофон и обучать модель на все ваши разговоры в жизни. Так получится ваш полный двойник с которым ваши дети смогут поговорить когда вы умрете.

А если приделать и камеру, то в итоге может получится (ну почти) полное копие сознания.

Но для этой цели надо сделать чтобы нейронка могла обучаться во время работы, а то получится двойник, но с синдромом Корсакова.

Extender Jan 9 at 10:28

Тогда уж проще просканировать мозг и выдернуть 100 трлн связей. Ну и можно грузить в Майнкрафт

Apxuej Dec 14 2023 at 16:47

Немного оффтоп: на просторах твича существует AI стример Neuro-sama. Буквально несколько дней назад, её создатель Vedal провёл стрим с обновлённой, улучшенной версией. Получилось очень интересно, советую всем посмотреть стрим целиком (стрим на английском языке) или нарезки из него на ютубе, потому что Neuro-sama это одна из лучших попыток создания виртуальной личности, которую я видел.

Kotemorte86 Dec 14 2023 at 22:55

Блин а это круто, я даже зарегистрировалась на habr, чтобы поддержать автора и написать комментарий!

AlanRobotics Dec 14 2023 at 22:56

Спасибо, приятно:)

mDoll Dec 14 2023 at 22:56

нет данных, попадающих под NDA.

А у кого с кем в этом случае соглашение?

AlanRobotics Dec 14 2023 at 22:58

Я имел в виду диалоги, которые могут содержать информацию такого характера, например переписки по работе, тогда могут возникнуть проблемы с работодателем

krisgrey Dec 15 2023 at 01:38

У меня почему-то в коллабе обученный бот генерит повторяющийся диалог на несколько строчек. Так должно быть?
User: Как дела? Clone: Хорошо, вышли на улицу. User: Хорошо. Я сейчас в машине, поеду к тебе. Clone: Хорошо. User: Я сейчас в машине, поеду к тебе. Clone: Хорошо. User: Я сейчас в машине, поеду к тебе. Clone: Хорошо. User: Я сейчас в машине, поеду к тебе. Clone: Хорошо. User:

AlanRobotics Dec 15 2023 at 01:42

Думаю, в процессе обработки данных нужно добавить токены, обозначающие конец предложения, попробуем исправить в будущей версии библиотеки

johnfound Dec 15 2023 at 03:00

А это сейчас кто написал? Проверим?

Я сейчас в машине, поеду к тебе.

TheRikipm Dec 17 2023 at 19:00

Хорошо. User: Я сейчас в машине, поеду к тебе. Clone: Хорошо. User: Я сейчас в машине, поеду к тебе. Clone: Хорошо. User:

vova_sam Dec 28 2023 at 19:05

я вообще проверил этот сценарий тюнинга, чтобы убедиться, что в подготовке обучающих данных какая то ошибка (такое подозрение было сразу после прочтения). Как можно обучать модель на данных, где просто подряд идет переписка с именами пользователей?

откуда она (модель) понимает, что это диалог.

Обучив собственноручно модель я убедился, что тут какая то ошибка. Данные для обучения надо готовить другим способом

AlanRobotics Dec 28 2023 at 20:53

что значит модель не понимает что это диалог? Модель учится на серии диалогов “user: text, clone: text”, начинает отвечать также, так работает файнтюниг. Он не видит никаких других имен. Как я уже сказал до этого, чего точно не хватает в подготовке данных, так это добавление eos токенов в конце диалогов

vova_sam Dec 28 2023 at 21:14

вы модели выдаете вот такую "простыню" :

User: Как дела? Clone: Хорошо, вышли на улицу. User: Хорошо. Я сейчас в машине, поеду к тебе. Clone: Хорошо. User: Я сейчас в машине, поеду к тебе. Clone: Хорошо. User: Я сейчас в машине, поеду к тебе. Clone: Хорошо. User: Я сейчас в машине, поеду к тебе. Clone: Хорошо ........

Как она поймет, что это диалог, что кто то отвечает кому-то?

для нее это просто сплошной набор токенов, где User и Clone просто обычные токены.

Посмотрите набор инструкций для файнтюнинга chatGPT. Там четко структурированный файл, где каждый вопрос и ответ отдельной позицией сделан. Указано, где вопрос, где ответ. А вы просто скормили plane text, Она вам plane text-ом и отвечает

По другому вопрос. Откуда модель знает что после "Clone:" это ее (модели) ответ, а после User: это как бы ей вопрос.

ну либо я вас концептуально не понял

В любом случае огромное спасибо за пример - для практики было очень полезно. Я уже подумываю, чтобы по интереснее обучить на базе этого

и еще замечание: у меня совсем другой формат выгрузки JSON из телеграма (ваших ключей ("chat", "list") там нет )

def process_chats(file_path: str):

with open(file_path, encoding='utf-8') as f:

# Load the JSON data from the file

data = json.load(f)

messages = []

for row in data["messages"]:

# for row in sample["messages"]:

if row["text"] != '':

username = row['from']

if username != "Vldmr":

username = "User"

if username == "Vldmr":

username = "Clone"

message = f"{username}: {row['text']}"

messages.append(message)

return messages

AlanRobotics Dec 28 2023 at 21:24

Модель еще строку переносит, и это выглядит как диалог. Она должна останавливать генерацию после каждого ответа бота, почитайте что такое eos токен и зачем его нужно добавлять

Посмотрите на инструктивные датасеты, как они устроены и как на них обучать. Это вопрос ответ, иногда добавляют систем промпт.

Как выглядят данные из телеги:

User: как дела? \n

# ответ модели

\nClone: пойдет

Модели скармливаем user: Ваш вопрос, далее она генерирует все остальное, и должна останавливаться после генерации ответа. Об этом я уже говорил

AlanRobotics Dec 15 2023 at 01:39

Думаю в процессе обработки данных нужно добавить токены, обозначающие конец предложения, попробуем исправить в обновлении

AptRoApt Dec 15 2023 at 13:41

Давно крутится идея создания своего клона, но больше всего меня напрягал факт, что бот может обучиться на "чувствительных" данных, которые я бы выдал одному человеку, но не выдал другому. И надо ли искать максимально рафинированные диалоги, либо обучать вручную. Что то, что то достаточно трудоёмко(

EPIDEMIASH Dec 18 2023 at 09:14

Получаю ошибку при запуске: No GPU found. A GPU is needed for quantization.
Видеокарта со свежими драйверами, конечно же есть.

EightShift Dec 18 2023 at 09:17

эх... почему-то ловлю ошибку во время тренировки: "ValueError: Attention mask should be of size (2, 1, 91, 182), but is torch.Size([2, 1, 91, 91])"

yrub Dec 28 2023 at 00:16

так а сколько оценочно ждать надо пока обучиться? сколько у вас заняло времени и на каком железе?

vova_sam Dec 28 2023 at 21:23

на Colab у меня 15 минут обучалась. На своем железе не смог запустить, т.к. на винде эта схема не работает

faruk_yussuf Dec 31 2023 at 16:33

Кто-нибудь уже писал про Чёрное зеркало?)

Это же прям первый эпизод второго сезона, "Скоро вернусь" называется.

Его сняли 10 лет назад...

Extender Jan 9 at 10:30

А нет ли готового продукта, куда можно загрузить переписку с каким то человеком, а он бы сразу создал ник в телеграмме для общения с ним? А если нет, может сделать такой?