Обновить
4K+
9

Пользователь

8
Рейтинг
2
Подписчики
Отправить сообщение

MCP vs Thin MCP: где AI агенты теряют скорость

Уровень сложностиСредний
Время на прочтение15 мин
Охват и читатели5.4K

MCP выглядит как удобный способ структурировать LLM-приложение, но за это приходится платить. При этом попытки «ускорить систему» через C++, IPC или смену сериализации не всегда дают ожидаемый результат. В статье разбираю, где на самом деле возникает latency и почему архитектура оказывается важнее, чем выбор технологий.

Читать далее

Подземелье c LLM-экспертами: используем PocketFlow и MCP для объяснения настолок

Уровень сложностиСредний
Время на прочтение29 мин
Охват и читатели9.7K

Всем привет! Меня зовут Артем, я Data Scientist компании RAFT. Сегодня я расскажу об своем pet проекте по объяснению правил для настольных игр. Цель данного проекта — понять, как можно собрать RAG агента без использования больших библиотек.

Читать далее

Finetuning Qwen 3 на RTX4090: полный гайд обучения LLM c помощью Unsloth

Уровень сложностиСредний
Время на прочтение23 мин
Охват и читатели20K

💡 О чём эта статья: В этой статье я разбираю, как с помощью библиотеки Unsloth обучить LLM и ускорить её обучение с LoRA/DoRA-адаптерами. Я также провёл серию экспериментов на данных по МКБ-10, сравнил качество моделей и описал тонкости экспорта в GGUF.

Читать далее

Детекция машин на мобилке в 2023. С какими проблемами мы столкнулись и как решали

Время на прочтение9 мин
Охват и читатели6.6K

Как мы распознавали машины с камеры мобильного телефона с помощью TensorFlow-lite, C++, Qt и что из этого вышло.

Читать далее

Информация

В рейтинге
900-й
Зарегистрирован
Активность