Pull to refresh
10
3
Александр Константинов@alkons

User

Send message

Говорю: «Найди!» — и он находит. Как я устал искать ответы в базе знаний и сделал себе помощника

Level of difficultyEasy
Reading time8 min
Reach and readers9.3K

Привет, это Саша Константинов из Cloud.ru. Недавно в статье я рассказал, как после ухода Notion развернул базу знаний в облаке на Wiki-движке Outline, потому что хотел хранить данные и управлять ими самостоятельно и без ограничений, чего не может дать SaaS. И что самое главное, я хотел дорабатывать решение под свои требования.

В этой части истории сосредоточусь на том, как я еще упростил себе жизнь и добавил в базу знаний AI-помощника. Он помогает мне, когда нужно быстро просмотреть тезисы нескольких статей на общую тему или найти ответ на конкретный вопрос в документах по работе. Для доступа к базе я сделал Telegram-бота с подключением через MCP-сервер. Расскажу, как все устроено, поделюсь процессом настройки и интеграции компонентов. 

Читать далее

No-code автономные агенты: миф или реальность

Reading time14 min
Reach and readers6.3K

Ваш новый AI-сотрудник должен был стать вашим личным Джарвисом, но вместо этого вы получаете цифровое нечто, которое не решает бизнес-задачи, а только создает проблемы.

Разочарование? Естественно. Вас обманули: вам обещали волшебную кнопку, а подсунули еще одну головную боль. Все из-за хайпа вокруг автономных агентов, который создал миф: «подключил, настроил и забыл».

Мы верим в другой подход. Автономные агенты — реальность, но это история не о полном отпускании ситуации и передаче управления, а о контроле. Вы можете выстроить их в отлаженную команду, где у каждого — своя роль, а у вас — полная картина происходящего.

С вами вновь Александр Константинов — технический эксперт в Cloud.ru. В статье расскажу, как собрать слаженный оркестр агентов, который играет по вашим нотам и работает на усиление бизнеса, а не на его разрушение.

Читать статью

Почему разработчики не доверяют вайб-кодингу и как это исправить

Reading time7 min
Reach and readers9.8K

По-моему, вайб-кодинг — полезная фича, но я знаю, что многие его недолюбливают и считают, что AI генерит чушь, а не нормальный код. Ну тут я могу сказать как в той рекламе с гепардом: «Ты просто не умеешь их готовить».

Я начал заниматься вайб-кодингом 2 года назад (привет первая версия GPT Engineer), то есть еще до того, как ввели сам термин (он появился только в этом году). За это время у меня накопился опыт, который я переложил в небольшие рекомендации, возможно они помогут начинающим вайб-кодерам.

Вообще вайб-кодинг, это, конечно, огромная тема. Думаю, сделать серию из нескольких статей: здесь начну с теории, а потом покажу практику, как я настраиваю окружение и вообще весь процесс.

Читать дальше

Оптимизируем производительность веб-приложения с Redis

Reading time10 min
Reach and readers7.4K

Привет, Хабр! С вами Александр Константинов, технический эксперт по облачным технологиям из Cloud.ru. Сегодня хочу показать вам наглядно, как можно оптимизировать производительность веб-приложения. Рассмотрим это на усредненном примере кейса, который типичен для многих наших клиентов, пройдем весь путь настройки, выполним нагрузочное тестирование и сравним до/после.

Надеюсь, материал окажется полезным всем разработчикам и инженерам, кто сталкивается с проблемами производительности в своих проектах. Плохая новость в том, что путь, который я опишу, подходит не всем, хорошая ― в том, что мы рассмотрим кому он не подходит, и вы не будете тратить время на сомнения и тесты.

Узнать больше

Finetuning без греха: как кастомизировать AI и не сломать его

Level of difficultyEasy
Reading time14 min
Reach and readers5.5K

Создание кастомной AI-модели для бизнеса кажется простой: скачал базовую модель, загрузил данные — и вот уже готовый AI-юрист или диагност. Но на практике компания часто получает беспомощного «Франкенштейна», который генерирует полную ахинею. Итог — месяцы работы впустую и выброшенный бюджет.

В чем же ошибка? Finetuning — это не волшебная палочка для мгновенного результата, а точный хирургический инструмент. Его неверное применение не улучшает модель, а буквально калечит ее.

С вами вновь Александр Константинов — технический эксперт из Cloud.ru. И на этот раз мы разберем, как избежать главных ошибок тонкой настройки: от принятия решения о ее необходимости до семи смертных грехов, которые губят большинство проектов.

Читать дальше

AI-агент 007. Разбираем, что автоматизировать, а что не стоит

Level of difficultyEasy
Reading time10 min
Reach and readers5.4K

Всем привет, я Александр Константинов — технический эксперт из Cloud.ru. Всё чаще в жизни и работе мы имеем дело с AI-агентами — стремимся делегировать рутинные задачи или ускорить что-то сложное. И мы, само собой, в команде тоже их используем. В этой статье я подсобрал весь опыт — свой, команды, коллег и клиентов — и разобрал, с автоматизацией чего AI-агенты здорово помогут, а где лучше найти другое решение. А еще в конце показал, как быстро создать собственного помощника.

Читать

ChatGPT для разработчиков: API, лимиты, как втягивать в него базу знаний, что нельзя сделать, что лучше делать осторожно

Reading time12 min
Reach and readers59K
image

Мы с командой вернулись тут с Хайлоада, и там даже CTO крупных компаний задают много вопросов про разработку с LLM. Наша компания занимается прикладной разработкой всего того, что касается GPT/LLM.

Расскажу про очевидные вещи, о которых у меня там спрашивали CTO и разработчики.

Самый частый вопрос: можно ли подключать свою базу документов и можно ли по ней нормально работать?

Можно. Для этого нужно две вещи:

  1. OpenAI может работать с вашей базой, например, вики техподдержки, но её надо векторизовать. Получится, что модель только ищет по ней и может отвечать фрагментом исходника, но может его обрабатывать как текст (то есть сравнивать, анализировать и тому подобное).
  2. Дальше можно использовать подход QA Retrieval Chain для работы с векторной базой. Работает это так: задаём вопрос, LLM формируют запрос к векторной базе, мы вынимаем из неё данные, подкладываем их в вопрос как контекст и передаём в LLM, а они формируют ответ.

Но давайте начнём сначала. Основное:

  1. Какого размера промпты могут быть, сколько, какие лимиты, как их частично обходить.
  2. Как подключается база, как закидывать реально большие документы, как эмбеддится вектор, на каких языках это происходит и тому подобное.
  3. Разные API.
  4. Агентная модель GPT Engineer и АutoGPT.
  5. Фреймворк лангчейн (построение цепочек запросов и разбиение макрозапроса на сотни).

Поехали!
Читать дальше →

Information

Rating
1,265-th
Location
Ярославль, Ярославская обл., Россия
Registered
Activity