Comments / Profile of Mark

Марк Конаков @Mark_K

Data Scientist, специализуруюсь на NLP

Profile Publications 15Comments 19Bookmarks 4

Согласен, тем не менее разочарование локальное есть, вот и экономист пишет:
https://www.economist.com/finance-and-economics/2024/07/02/what-happened-to-the-artificial-intelligence-revolution

Look

GPT или GigaChat — ответит RAGAS

Mark_K Feb 15 at 23:17

К сожалению нет, но собрать такое было бы очень полезно для сообщества

Look

LlamaIndex: создаем чат-бота без боли и страданий. Часть 3

Mark_K Sep 22 2023 at 15:18

Логично, если ты потом используешь ллм, то надо будет платить, если только в режиме ретривера, то нет

Look

LlamaIndex: создаем чат-бота без боли и страданий. Часть 3

Mark_K Sep 22 2023 at 13:40

да, за собственный векторайзер платить не нужно, но для инициализации класса все равно нужна будет эта переменная, попробуйте просто указать os.environ['OPENAI_API_KEY'] = 0

Look

LlamaIndex: создаем чат-бота без боли и страданий. Часть 3

Mark_K Sep 22 2023 at 11:38

index - это просто способ хранить ваши документы, а ретривер уже возвращает релевантные документы согласно запросу
Ноды - это кусочки документа фиксированной длины (на один документ может быть десятки и сотни нод)
Проверить, возвращает ли ваш ретривер адекватные ноды, если да, то можно переформулировать запрос - например, "выведи все компании, с которыми были заключены договора в 2023 году"

Look

LlamaIndex: создаем чат-бота без боли и страданий. Часть 3

Mark_K Sep 22 2023 at 06:50

Можно использовать оба подхода, в статье показано, как подгрузить свою модель для эмбеддингов

Look

LlamaIndex: создаем чат-бота без боли и страданий. Часть 2

Mark_K Aug 19 2023 at 16:55

Можно в keywords добавить свои теги, а не генерировать их с помощью llm. Код надо будет изменить

Look

LlamaIndex: создаем чат-бота без боли и страданий. Часть 2

Mark_K Aug 19 2023 at 16:54

Смотря какую версию использовать(веса же в диапазоне от 7 до 70 млрд параметров). Но без видеокарты все равно инференс медленный будет

Look

LlamaIndex: создаем чат-бота без боли и страданий. Часть 2

Mark_K Aug 17 2023 at 12:08

В теории можно. Надо настроить свою модель для эмбеддингов и LLM. В продолжении как-нибудь распишу

Look

LlamaIndex: создаем AI-бота без боли и страданий

Mark_K Aug 3 2023 at 09:49

Да, можно свою подгрузить https://gpt-index.readthedocs.io/en/latest/core_modules/model_modules/llms/usage_custom.html

Look

Катаемся на аттракционе AutoGPT

Mark_K May 18 2023 at 20:38

вот же он https://github.com/Significant-Gravitas/Auto-GPT/blob/master/.env.template

Look

LangChain для бывалых — память и агенты. часть 2

Mark_K May 10 2023 at 21:55

По api у меня доступна только 3.5

Look

LangChain для бывалых: память и агенты. часть 1

Mark_K May 4 2023 at 14:53

Спасибо!

Look

LangСhain: создаем свой AI в несколько строк

Mark_K May 1 2023 at 23:00

Тут лучше говорить не про обучаемые данные, а про входные данные. Т.е вы на вход даете описания ваших данных, а на выходе ждете, что ИИ поймет их структуру и связи. В принципе это реально, вопрос в методологии - как сохранять промежуточные состояния, чтобы использовать их как долговременную память

Look

Катаемся на аттракционе AutoGPT

Mark_K Apr 26 2023 at 22:45

Большая проблема в доступах к ресурсам. Лучше заводить в ограниченной экосистеме, где у агента потенциально есть возможность получить все необходимое.

Look

LangСhain: создаем свой AI в несколько строк

Mark_K Apr 18 2023 at 10:01

Во время выполнения

Look

LangСhain: создаем свой AI в несколько строк

Mark_K Apr 18 2023 at 08:56

В LangChain вы используете уже обученные модели. Агенты нужны, чтобы обращаться к разным источникам в зависимости от пользовательского ввода.

Look

ChatGPT на стероидах: возможности плагина-ретривера для семантического поиска

Mark_K Apr 10 2023 at 10:50

Да, решений уже множество. Вот например https://github.com/amoramine/Pegasus_with_Longformer_summarization