Обновить
9
4
Александр Константинов@alkons

Пользователь

Отправить сообщение

Я работаю с российской версией outline, там индекс нормально с русским работает. Такой подход хорошо подойдёт для быстрого подключения AI, для более точных ответов лучше сделать ETL, который будет индексировать в вектора.

Собственно в серии статей я и планировал рассказать, как же сделать этот процесс контролируемым, а не полным рандомом, которым он является при работе из коробки.
Но уже задумываюсь, а стоит ли раскрывать все детали, раз публика не готова.

Я пока не увидел комментария, который бы опроверг то, что я написал. Вы пишете чушь, переходите в оскорбления сразу.

Я понимаю, что это защитная реакция у вас, видел это у большого количества людей. Не пугайтесь, вас ии не заменит.

Вы просто повторяете то, что в статье написано и интерпретируете это как вам удобно. О чем тут можно поговорить?

65% точности при разработке - это не 2 идеальных программы и одна провалена.

Поэтому я в статье и говорю, что джуну здесь будет сложно и разработчик должен быть уровня тимлида.

Достаточно много небольших и полезных проектов, которые помогли мне протестировать гипотезы и сделать выводы.

Конечно никто в здравом уме не будет вайб-кодить что-то серьезное, о чем в статье и говорю.

Все-таки это инструмент, у которого есть своя сфера для применения, и там он показывает себя отлично.
Я же не предлагаю использовать вайб-кодинг для сложных продакшн систем. Разработать небольшой MVP/POC, быстро протестировать гипотезы - вот его основное применение.

Многим компаниям для критически важных систем нужен SLA , который не дают сервисы коммерческих моделей по API.

Обсидиан не open source, хоть и поставляется бесплатно.

Да, я работаю в Cloud.ru и поэтому привожу пример именно на нем. Если есть желание, то решение можно развернуть локально или в любом другом облаке.

Я понимаю, что Notion — это комбайн для командной работы. Здесь я рассматриваю замену именно с точки зрения организации базы знаний для команды, и с этой задачей Outline справляется полностью.

На время написания статьи это была фича Code Interpreter, однако сейчас она перешла в Advanced data analysis, которую надо включить в настройках.

Дальше можно выбрать ее при старте нового чата и работать с файлами.

Для большого бизнеса однозначно стоит смотреть. В Enterprise расширен контекст GPT-4 модели до 32к токенов и нет лимитов на использование, что дает большие возможности для работы. Также можно интегрироваться со своим SSO провайдером.

Вопрос, сколько OpenAI запросит денег, так как нет данных по стоимости этого решения.

Естественно, в статье есть текст, написанный чат жпт, куда же без этого. Но тлдр был полностью написан человеком.

Для LLama2 минимум две A100 — для версии 13b chat, или три для полноценной 70b chat.

Отличный результат. Получилось расколоть 8 уровень?

Информация

В рейтинге
1 144-й
Откуда
Ярославль, Ярославская обл., Россия
Зарегистрирован
Активность