А так да, даже на сервер по SSH не сразу зашла, а пришлось мягко промптить. При этом лимиты она явно больше чем х2 жрет от 4.8. Я на х20 сижу давно на одном проекте и знаю хорошо сколько ест, х5-х8 на глаз. Х2 там не пахнет.
Сделайте уже какую нибудь хотя бы ИИ модерацию постов. Ну серьёзно, noname ресурс, без авторских авторитетных постов, без репутации, на сайте которого даже бургер свёрстан криво, предлагает курсы по 50к.
V4 Pro 970р за миллион токенов? Шта? В 8-10 раз дешевле, если вы конечно не роль апи прокладок имеете ввиду, которые свой фиксированный процент берут за маршрутизацию запросов юзера к опенроутеру и обратно с конской наценкой, коих развелось уже вагон и маленькая тележка.
А кто реально использует подписку за 200 баксов, поделитесь впечатлениями по лимитам? Просто вижу что одни пишут что 24/7 можно гонять, другие наоборот съедают быстро лимиты. Понимаю что каждый по разному использует Клауд, но будет интересен реальный опыт.
ИБ, Информационная безопасность <> Чужое API (DeepSeek).
А так вопросики,
Все таки без понимания дипсиком доменной области компании и всего документа, какое качество ответов? Например юзер задал вопрос, - как провести возврат товара, не уточнив возврат от физ/юр лица, наличными, безналичными или на расчётный счет и т.д с кучей нюансов в реальных условиях. ИИ найдет например топ 10 чанков с возвратами и ответит, но где гарантия что пользователь имел ввиду это? Как вы это решаете?
А если например это документация по многоэтапному процессу, пример:
Инструкция по созданию интеграции, где в исходнике написано по разделам:
Создание аккаунта
Создание ключа
Создание интеграции
Проверка интеграции
Подразумевая что интеграцию нельзя создать, не создав аккаунт, но фактически чанки 1,2 не имеют веса и попадут только 3,4. Человек который не знает как ее создать, запутается и такой ответ больше навредит чем даст пользы. А дипсик не знает ничего о том что там еще нужны какие то операции. Были такие случаи? Как боролись.
Правда интересно. Сам строю RAG и есть идеи:
Создавать документацию самодостаточную и полную.
Искать чанки, но подавать цельный документ. Да, заранее подумав что если документ огромный, то все таки разбить его на законченные инструкции.
Уже думаю обучить локальный эмбеддер на константах компании, чтобы понимал что без чего нельзя подавать в генератор.
DeepSeek'у уже недостаточно будет хайпануть как в прошлый раз. Крутыми бенчмарками и контекстом 1м тоже не удивить(только если он не будет ничего из него терять). Есть клауд с его сильным кодингом, есть универсальный гугл с сильнейшей экосистемой(колаба, банана, notebook llm, ai studio, drive, file search, antigravity и т.д) помимо самой модели, есть чатгпт, квен, глм, кими и т.д
Дипсику с его самой скудной экосистемой, точнее с его отсутствием, придется постараться. Я был бы очень рад(мечты) , увидеть DeepCode CLI или форк vscode/расширение, с невероятными лимитами или их отсутствием.
Хотя если цены на токены оставят такие же, бубнеть не буду.
Разрешено ознакамливаться с запретами. Разрешено спрашивать, - "В последнее время что нибудь разрешали?". Разрешено что нибудь еще. Вообщем что-то разрешено 🗿
Здравствуйте! А какую модель использовали? Система работает как вопрос-ответ-обнуление или память в рамках диалога есть? Сколько в среднем занимает контекст при одном вопросе-ответе?
Лендинги без цензуры делает😁
А так да, даже на сервер по SSH не сразу зашла, а пришлось мягко промптить. При этом лимиты она явно больше чем х2 жрет от 4.8. Я на х20 сижу давно на одном проекте и знаю хорошо сколько ест, х5-х8 на глаз. Х2 там не пахнет.
Поставил ради интереса, спасибо, здорово работает🫡 хоть и один конфиг из 20 только полностью валидный в моём случае
Сделайте уже какую нибудь хотя бы ИИ модерацию постов. Ну серьёзно, noname ресурс, без авторских авторитетных постов, без репутации, на сайте которого даже бургер свёрстан криво, предлагает курсы по 50к.
V4 Pro 970р за миллион токенов? Шта? В 8-10 раз дешевле, если вы конечно не роль апи прокладок имеете ввиду, которые свой фиксированный процент берут за маршрутизацию запросов юзера к опенроутеру и обратно с конской наценкой, коих развелось уже вагон и маленькая тележка.
Почему. Поставят nano локальную и все.
До опуса 4 дотянется релизов через 30. Казалось бы самая крупная часть рынка у Альтмана, денег больше всего, а за антропиком не поспевает
Создали фикус
Как бы там в бан в РФ не отлетать еще..
Сам формат PDF конечному читателю удобен, но с точки зрения парсинга, я бы PDF запретил на законодательном уровне.
А кто реально использует подписку за 200 баксов, поделитесь впечатлениями по лимитам? Просто вижу что одни пишут что 24/7 можно гонять, другие наоборот съедают быстро лимиты. Понимаю что каждый по разному использует Клауд, но будет интересен реальный опыт.
Спасибо за кейс! Очень полезно.
Единственное что диссонанс от:
ИБ, Информационная безопасность <> Чужое API (DeepSeek).
А так вопросики,
Все таки без понимания дипсиком доменной области компании и всего документа, какое качество ответов? Например юзер задал вопрос, - как провести возврат товара, не уточнив возврат от физ/юр лица, наличными, безналичными или на расчётный счет и т.д с кучей нюансов в реальных условиях. ИИ найдет например топ 10 чанков с возвратами и ответит, но где гарантия что пользователь имел ввиду это? Как вы это решаете?
А если например это документация по многоэтапному процессу, пример:
Инструкция по созданию интеграции, где в исходнике написано по разделам:
Создание аккаунта
Создание ключа
Создание интеграции
Проверка интеграции
Подразумевая что интеграцию нельзя создать, не создав аккаунт, но фактически чанки 1,2 не имеют веса и попадут только 3,4. Человек который не знает как ее создать, запутается и такой ответ больше навредит чем даст пользы. А дипсик не знает ничего о том что там еще нужны какие то операции. Были такие случаи? Как боролись.
Правда интересно. Сам строю RAG и есть идеи:
Создавать документацию самодостаточную и полную.
Искать чанки, но подавать цельный документ. Да, заранее подумав что если документ огромный, то все таки разбить его на законченные инструкции.
Уже думаю обучить локальный эмбеддер на константах компании, чтобы понимал что без чего нельзя подавать в генератор.
Разве OpenAI продаст менеджеру нейронку, если скажет что для построения корпоративного чат-бота, нужно:
Подготовить датасеты
Настроить метрики
Провести тесты и настроить парсеры, эмбеддеры, реранкеры
Изучить RAG подходы под твою доменную область
Решить проблемы с безопасностью и доступом
Тестировать на разных векторных, графовых БД
И т.д
Нет конечно! А если сказать что наша ИИ самая ИИстая , то легко. А все проблемы выше будет решать уже инженер)
Жаль они от клиновидных ушли, как м1 эир и странно что при таком весе аккум 36втч, хотя м серия по весу вроде такая же, а аккум х1.5
Хотя это наверное продолжение MacBook 12, вписывается
ТСПУ - устройство предназначенное для защиты от DDoS атак YouTube и Telegram от граждан РФ
"Не было такого, мы сами писали обучающие тексты".
Всерьёз не воспринимайте🤭
DeepSeek'у уже недостаточно будет хайпануть как в прошлый раз. Крутыми бенчмарками и контекстом 1м тоже не удивить(только если он не будет ничего из него терять). Есть клауд с его сильным кодингом, есть универсальный гугл с сильнейшей экосистемой(колаба, банана, notebook llm, ai studio, drive, file search, antigravity и т.д) помимо самой модели, есть чатгпт, квен, глм, кими и т.д
Дипсику с его самой скудной экосистемой, точнее с его отсутствием, придется постараться. Я был бы очень рад(мечты) , увидеть DeepCode CLI или форк vscode/расширение, с невероятными лимитами или их отсутствием.
Хотя если цены на токены оставят такие же, бубнеть не буду.
Разрешено ознакамливаться с запретами. Разрешено спрашивать, - "В последнее время что нибудь разрешали?". Разрешено что нибудь еще. Вообщем что-то разрешено 🗿
Здравствуйте! А какую модель использовали? Система работает как вопрос-ответ-обнуление или память в рамках диалога есть? Сколько в среднем занимает контекст при одном вопросе-ответе?