Comments / Profile of Renewal_Studio / Habr

Артем Летюшев @Renewal_Studio

Lead Project Manager

ProfileArticles16Posts3NewsComments304

Как работает память в LLM и почему вы не обучаете ChatGPT своим prompt

Renewal_Studio Jul 16 at 11:22

Да, но я тут больше про бережное обращение с контекстным окном и учитывание особенностей работы. Можно сколько угодно растить мощности ради увеличения контекстного окна , но запросы будут лишь тяжелеее и нести больше дисперсии

0

Как работает память в LLM и почему вы не обучаете ChatGPT своим prompt

Renewal_Studio Jul 16 at 11:20

Спасибо вам! А что вы для себя интересного особенно в ней нашли или нового?

0

Как работает память в LLM и почему вы не обучаете ChatGPT своим prompt

Renewal_Studio Jul 16 at 11:19

Да нет, я просто выбрал такую стратегию и +- с околохейтерскими комментариями придерживаюсь модели вида "спасибо за мнение, очень ценно, а что думаешь вот про это, дай совет". Выглядит, да, формально

0

Как работает память в LLM и почему вы не обучаете ChatGPT своим prompt

Renewal_Studio Jul 16 at 07:22

Поправил указанные вами, спасибо!

+1

Как работает память в LLM и почему вы не обучаете ChatGPT своим prompt

Renewal_Studio Jul 16 at 07:15

Пожалуйста, я рад что она вам пригодилась! Мне главное чутка приоткрыть завесу неопределенности и сподвигнуть к изучению

0

Как работает память в LLM и почему вы не обучаете ChatGPT своим prompt

Renewal_Studio Jul 16 at 07:14

Спасибо за вопрос! Такой порядок выбран потому, что когда модель сначала видит все вводные, она может правильно “удержать их в памяти" и уже после этого применить к ним саму задачу. Если поменять местами и начать с постановки задачи, часть деталей из вводных может потеряться или быть понята не так. Так проще избежать недопонимания, и для модели, и для человека это обычно работает лучше. Формат вывода в конце да, это уже просто как дополнительная инструкция. И не стоит путать формат вывода результата и требования к решению задачи, что часто любят смешивать

+1

Как работает память в LLM и почему вы не обучаете ChatGPT своим prompt

Renewal_Studio Jul 16 at 07:12

Ну господа, мы с вами пониманием что на деле никакого ai пока что нет, есть ну подразвившиеся в последние годы семество LLM, не шибко далеко вперед шагнувшее от RNN

-1

Как работает память в LLM и почему вы не обучаете ChatGPT своим prompt

Renewal_Studio Jul 16 at 07:11

Здорово что вы это понимаете. Однако статья рассчитана на обывателя. Тут как с триединым мозгом. Нет никакого рептильного мозга, понятное дело, но гораздо проще объяснять с помощью этой, хоть и насквозь ложной концепции, некоторые абстракции о работе мозга

Я сперва вообще написал техническую статью, но потом вспомнил для кого пишу

-1

Как работает память в LLM и почему вы не обучаете ChatGPT своим prompt

Renewal_Studio Jul 16 at 07:09

Логично, но опять таки я постарался оставить дисклеймер что это не совсем про LLM и про память. А скорее очень витееватое и вольное толкование. Причем писал статью для друга, который далек от этого. Спасибо!

0

Как работает память в LLM и почему вы не обучаете ChatGPT своим prompt

Renewal_Studio Jul 15 at 19:05

Я тоже пробовал что-то похожее, прям скидывал старый диалог целиком, но у меня обычно всё быстрее в кашу превращается. Учитывая что иногда я не мудрю с промптами и структурой. Ты говоришь у тебя Gemini держит контекст почти на мегабайт? Вау, я даже близко такого не ловил

Забавно, что у тебя модель не путается даже когда в одном файле и техвопросы и статьи, и всякая личная чепуха, и философия. У меня в эффект одинаков в любой ллмке - 10-15 сообщений и потеря контекста в том виде, в котором я ожидаю

0

Как работает память в LLM и почему вы не обучаете ChatGPT своим prompt

Renewal_Studio Jul 15 at 19:03

Спасибо за такой подробный разбор, реально полезно. Да, согласен, ты правильно подметил слабые места, слабых мест изрядно, то же про контекстное окно, про абсурдность этих визуализаций, и про KV-cache тоже согласен, явно переборщил с акцентом на него, хотя он больше про ускорение, а не про память. Но все же он сильно роляет и стоит понимать что он наличествует

Вообще статья не про техническую честность, а чтобы объяснить всё чуть проще, даже если приходится немного искажать. Сам вот иногда туплю, когда пытаюсь донести сложную тему просто

Буду рад, если подскажешь, как ты бы объяснил уровни памяти и ограничения LLM человеку без техбэкграунда. Может, есть свои аналогии или просто способ, чтобы до людей доходило, но без жести и лукавства. Короче, спасибо ещё раз, если будет время поделись советом

0

Сколько процентов работы PM способен выполнять ИИ

Renewal_Studio Jul 15 at 16:39

Да, трекер многое выдает. В целом сборник из цифровых следов иногда прикольно анализировать. Но-но, mcp к джире и гитлабу дает куда лучшие результаты и сделать куда проще

0

Всё сгенерировано GPT! Гайд как распознать AI-текст и как сделать его неотличимым от человеческого

Renewal_Studio Jul 6 at 17:05

Как скажите, спасибо за комментарий!

0

Мы всё чаще не отличаем реального автора от AI

Renewal_Studio Jul 1 at 12:13

А что с вашей точки зрения адекватный авторский текст? Я бы очень хотел посмотреть на авторов которых вы читали, любопытно!

0

Мы всё чаще не отличаем реального автора от AI

Renewal_Studio Jul 1 at 12:12

Могу закинуть результаты, а вы когда по времени +- проходили?

0

Мы всё чаще не отличаем реального автора от AI

Renewal_Studio Jul 1 at 12:12

Я статью писал сам, к чему тут этот комментарий?

0

Мы всё чаще не отличаем реального автора от AI

Renewal_Studio Jul 1 at 12:11

Спасибо за ваше мнение!

0

Мы всё чаще не отличаем реального автора от AI

Renewal_Studio Jul 1 at 12:10

Странное утверждение. А где про это можно почитать?

+1

Мы всё чаще не отличаем реального автора от AI

Renewal_Studio Jul 1 at 12:10

К чему это?

0

Мы всё чаще не отличаем реального автора от AI

Renewal_Studio Jul 1 at 12:09

Ага, понял, спасибо!

0

2

3 4 ...