Комментарии / Профиль alkons / Хабр

Александр Константинов@alkons

Пользователь

Подписчики

ПрофильСтатьи7ПостыНовостиКомментарии15

Говорю: «Найди!» — и он находит. Как я устал искать ответы в базе знаний и сделал себе помощника

alkons 10 фев в 07:04

Добрый день!

Для данного сценария пробовал разные модели, по качеству хорошо подошли Qwen и gpt-oss.
Диалог не поддерживает, так как для меня не важно вести диалог с базой знаний. Решение можно доработать на поддержку краткосрочной/долгосрочной памяти для сессий.
Контекст зависит от наполнения самой базы знаний. В моем случае в модель обычно поступает 4-5к токенов на вход и 300-400 токенов на выход.

Говорю: «Найди!» — и он находит. Как я устал искать ответы в базе знаний и сделал себе помощника

alkons 10 фев в 06:00

В данном решении у нас есть возможность контролировать количество отдаваемых документов через переменную окружения SEARCH_LIMIT. Переполнение вызвать сложно, так как модели сейчас имеют большой контекст, однако на обработку лишних токенов придется потратиться в такой ситуации. При создании личной базы знаний это не сильно критично, так как запросов не очень много. Если делать корпоративную базу, то для более экономичного и качественного решения, лучше взять подход с RAG. Он позволит взять базу знаний под полный контроль и сделать желаемый размер чанка, который обеспечит баланс качество - экономичность.

Почему разработчики не доверяют вайб-кодингу и как это исправить

alkons 29 окт 2025 в 12:17

Собственно в серии статей я и планировал рассказать, как же сделать этот процесс контролируемым, а не полным рандомом, которым он является при работе из коробки.
Но уже задумываюсь, а стоит ли раскрывать все детали, раз публика не готова.

Почему разработчики не доверяют вайб-кодингу и как это исправить

alkons 26 окт 2025 в 12:54

Я пока не увидел комментария, который бы опроверг то, что я написал. Вы пишете чушь, переходите в оскорбления сразу.

Я понимаю, что это защитная реакция у вас, видел это у большого количества людей. Не пугайтесь, вас ии не заменит.

-1

Почему разработчики не доверяют вайб-кодингу и как это исправить

alkons 26 окт 2025 в 06:37

Вы просто повторяете то, что в статье написано и интерпретируете это как вам удобно. О чем тут можно поговорить?

-1

Почему разработчики не доверяют вайб-кодингу и как это исправить

alkons 25 окт 2025 в 14:09

65% точности при разработке - это не 2 идеальных программы и одна провалена.

-2

Почему разработчики не доверяют вайб-кодингу и как это исправить

alkons 25 окт 2025 в 14:08

Поэтому я в статье и говорю, что джуну здесь будет сложно и разработчик должен быть уровня тимлида.

-2

Почему разработчики не доверяют вайб-кодингу и как это исправить

alkons 25 окт 2025 в 14:05

Достаточно много небольших и полезных проектов, которые помогли мне протестировать гипотезы и сделать выводы.

Конечно никто в здравом уме не будет вайб-кодить что-то серьезное, о чем в статье и говорю.

-1

Почему разработчики не доверяют вайб-кодингу и как это исправить

alkons 25 окт 2025 в 14:03

Все-таки это инструмент, у которого есть своя сфера для применения, и там он показывает себя отлично.
Я же не предлагаю использовать вайб-кодинг для сложных продакшн систем. Разработать небольшой MVP/POC, быстро протестировать гипотезы - вот его основное применение.

Как я экономлю на инференсе LLM-модели в облаке и не теряю в качестве

alkons 24 окт 2025 в 11:52

Многим компаниям для критически важных систем нужен SLA , который не дают сервисы коммерческих моделей по API.

ChatGPT для разработчиков: API, лимиты, как втягивать в него базу знаний, что нельзя сделать, что лучше делать осторожно

alkons 30 окт 2023 в 05:18

На время написания статьи это была фича Code Interpreter, однако сейчас она перешла в Advanced data analysis, которую надо включить в настройках.

Дальше можно выбрать ее при старте нового чата и работать с файлами.

alkons 20 окт 2023 в 09:55

Для большого бизнеса однозначно стоит смотреть. В Enterprise расширен контекст GPT-4 модели до 32к токенов и нет лимитов на использование, что дает большие возможности для работы. Также можно интегрироваться со своим SSO провайдером.

Вопрос, сколько OpenAI запросит денег, так как нет данных по стоимости этого решения.

alkons 20 окт 2023 в 09:41

Естественно, в статье есть текст, написанный чат жпт, куда же без этого. Но тлдр был полностью написан человеком.

alkons 17 окт 2023 в 11:14

Для LLama2 минимум две A100 — для версии 13b chat, или три для полноценной 70b chat.

alkons 16 окт 2023 в 17:48

Отличный результат. Получилось расколоть 8 уровень?