Обновить
9
4
Александр Константинов@alkons

Пользователь

Отправить сообщение

No-code автономные агенты: миф или реальность

Время на прочтение14 мин
Охват и читатели6K

Ваш новый AI-сотрудник должен был стать вашим личным Джарвисом, но вместо этого вы получаете цифровое нечто, которое не решает бизнес-задачи, а только создает проблемы.

Разочарование? Естественно. Вас обманули: вам обещали волшебную кнопку, а подсунули еще одну головную боль. Все из-за хайпа вокруг автономных агентов, который создал миф: «подключил, настроил и забыл».

Мы верим в другой подход. Автономные агенты — реальность, но это история не о полном отпускании ситуации и передаче управления, а о контроле. Вы можете выстроить их в отлаженную команду, где у каждого — своя роль, а у вас — полная картина происходящего.

С вами вновь Александр Константинов — технический эксперт в Cloud.ru. В статье расскажу, как собрать слаженный оркестр агентов, который играет по вашим нотам и работает на усиление бизнеса, а не на его разрушение.

Читать статью

Почему разработчики не доверяют вайб-кодингу и как это исправить

Время на прочтение7 мин
Охват и читатели9.5K

По-моему, вайб-кодинг — полезная фича, но я знаю, что многие его недолюбливают и считают, что AI генерит чушь, а не нормальный код. Ну тут я могу сказать как в той рекламе с гепардом: «Ты просто не умеешь их готовить».

Я начал заниматься вайб-кодингом 2 года назад (привет первая версия GPT Engineer), то есть еще до того, как ввели сам термин (он появился только в этом году). За это время у меня накопился опыт, который я переложил в небольшие рекомендации, возможно они помогут начинающим вайб-кодерам.

Вообще вайб-кодинг, это, конечно, огромная тема. Думаю, сделать серию из нескольких статей: здесь начну с теории, а потом покажу практику, как я настраиваю окружение и вообще весь процесс.

Читать дальше

Оптимизируем производительность веб-приложения с Redis

Время на прочтение10 мин
Охват и читатели7.3K

Привет, Хабр! С вами Александр Константинов, технический эксперт по облачным технологиям из Cloud.ru. Сегодня хочу показать вам наглядно, как можно оптимизировать производительность веб-приложения. Рассмотрим это на усредненном примере кейса, который типичен для многих наших клиентов, пройдем весь путь настройки, выполним нагрузочное тестирование и сравним до/после.

Надеюсь, материал окажется полезным всем разработчикам и инженерам, кто сталкивается с проблемами производительности в своих проектах. Плохая новость в том, что путь, который я опишу, подходит не всем, хорошая ― в том, что мы рассмотрим кому он не подходит, и вы не будете тратить время на сомнения и тесты.

Узнать больше

Разворачиваем базу знаний Outline c SSO и AI в облаке

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели4.8K

Привет, с вами снова Александр Константинов из Cloud.ru. Раньше я пользовался Notion, хранил там свои заметки, обучающие материалы, данные по своим стартапам. Но зарубежные SaaS-провайдеры ушли, и моя база превратилась в кирпич: она есть, но легально пользоваться ей невозможно. И это еще позитивный сценарий, потому что провайдер мог просто все безвозвратно удалить.

Сейчас, конечно, появляются другие сервисы, но все-таки у SaaS есть некоторые ограничения. И основное из них в том, что вектор их развития не подвластен пользователю. Плюс данные хранятся где-то там, кто-то ими управляет, но не я. А хочется все-таки делать это самостоятельно — это же моя база.

Я решил развернуть базу-знаний на wiki-движке Outline, потому что это полная замена Notion. У него хорошая функциональность, он простой в работе и с понятным интерфейсом. Что у меня получилось и как такое повторить, подробно рассказал в статье.

Читать дальше

Finetuning без греха: как кастомизировать AI и не сломать его

Уровень сложностиПростой
Время на прочтение14 мин
Охват и читатели5.4K

Создание кастомной AI-модели для бизнеса кажется простой: скачал базовую модель, загрузил данные — и вот уже готовый AI-юрист или диагност. Но на практике компания часто получает беспомощного «Франкенштейна», который генерирует полную ахинею. Итог — месяцы работы впустую и выброшенный бюджет.

В чем же ошибка? Finetuning — это не волшебная палочка для мгновенного результата, а точный хирургический инструмент. Его неверное применение не улучшает модель, а буквально калечит ее.

С вами вновь Александр Константинов — технический эксперт из Cloud.ru. И на этот раз мы разберем, как избежать главных ошибок тонкой настройки: от принятия решения о ее необходимости до семи смертных грехов, которые губят большинство проектов.

Читать дальше

AI-агент 007. Разбираем, что автоматизировать, а что не стоит

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели5.3K

Всем привет, я Александр Константинов — технический эксперт из Cloud.ru. Всё чаще в жизни и работе мы имеем дело с AI-агентами — стремимся делегировать рутинные задачи или ускорить что-то сложное. И мы, само собой, в команде тоже их используем. В этой статье я подсобрал весь опыт — свой, команды, коллег и клиентов — и разобрал, с автоматизацией чего AI-агенты здорово помогут, а где лучше найти другое решение. А еще в конце показал, как быстро создать собственного помощника.

Читать

ChatGPT для разработчиков: API, лимиты, как втягивать в него базу знаний, что нельзя сделать, что лучше делать осторожно

Время на прочтение12 мин
Охват и читатели57K
image

Мы с командой вернулись тут с Хайлоада, и там даже CTO крупных компаний задают много вопросов про разработку с LLM. Наша компания занимается прикладной разработкой всего того, что касается GPT/LLM.

Расскажу про очевидные вещи, о которых у меня там спрашивали CTO и разработчики.

Самый частый вопрос: можно ли подключать свою базу документов и можно ли по ней нормально работать?

Можно. Для этого нужно две вещи:

  1. OpenAI может работать с вашей базой, например, вики техподдержки, но её надо векторизовать. Получится, что модель только ищет по ней и может отвечать фрагментом исходника, но может его обрабатывать как текст (то есть сравнивать, анализировать и тому подобное).
  2. Дальше можно использовать подход QA Retrieval Chain для работы с векторной базой. Работает это так: задаём вопрос, LLM формируют запрос к векторной базе, мы вынимаем из неё данные, подкладываем их в вопрос как контекст и передаём в LLM, а они формируют ответ.

Но давайте начнём сначала. Основное:

  1. Какого размера промпты могут быть, сколько, какие лимиты, как их частично обходить.
  2. Как подключается база, как закидывать реально большие документы, как эмбеддится вектор, на каких языках это происходит и тому подобное.
  3. Разные API.
  4. Агентная модель GPT Engineer и АutoGPT.
  5. Фреймворк лангчейн (построение цепочек запросов и разбиение макрозапроса на сотни).

Поехали!
Читать дальше →

Информация

В рейтинге
1 144-й
Откуда
Ярославль, Ярославская обл., Россия
Зарегистрирован
Активность