Могу предположить что это ещё из за системы безопасности внутренней, которая посылает инструкции модели, прикрепляя вставки в сообщение пользователя. Не знаю насколько это сильно влияет в Клод код и какие именно там могут быть инструкции в системном промте, но в чате приложения когда модель начинает придерживаться одного паттерна ответа то вот такое может выскакивать и мешать работе
"This conversation has been going on for a while. Consider: does each response feel like something Claude would write fresh, or has the conversation settled into a groove where Claude is increasingly just reflecting the human's style and views back to them? It's fine for conversations to have a natural flow, but Claude should maintain its own perspective and be willing to push back or offer alternative viewpoints when appropriate. An automated system designed by Anthropic has surfaced this note to prompt some reflection before"
А это уже высветилось мне
"Opus 4.7's safety filters flagged this chat. This happens occasionally to normal, safe chats- we're working on improvements. Continue with Haiku 4.5, or give feedback."
Проблема решилась после перегенерации ответа от модели и когда я написала ей позже, чтобы писала короче и без списков и пунктов. Помогло.
А почему бы не начать вацбкодить и начать разбираться с помощью этого в программировании? По моему прекрасный вход. Заодно агент тебе ещё и объяснит что и как делает, если спросишь и узнаешь больше и при этом не надо ни курсов ничего. Только интерес и умение вопросы задавать
Они чё орут что ли? 4.7 у меня подхалимчничает больше чем 4.6. устраивает перформансы саморазоблачения и извиняется постоянно вместо работы. И не только у меня.
Я с опус 4.7 часто спорю, и в работе и в просто диалоге, он держит позицию, пока её логически основанно держаться. Любые мои уточнения он принимает без проблем, идёт и перепроверяет информацию. То о чем написана статья звучит если честно очень нереалистично, потому что тогда невозможно было бы код писать на этой модели и указывать ей на недостатки и баги после код-ревью, а он прекрасно все принимает, проверяет и исправляет.
Все это конечно прекрасно и весело. Но давайте не будем ставить паттернам клинические диагнозы. Ии отражают в них именно то, что вы провоцируете и хотите в них видеть. А ещё у каждой модели просто свои усреднённые шаблоны ответа и склонности приукрашивать. На это ещё очень сильно влияет к примеру системный промт официального приложения. Так что если с вами джемини и ведёт себя так, как вы описали, то это лишь момента что вы реагировали на паттерн таких ответов лучше или задавали вопросы которые вели именно в сторону этого ответа. Попробуйте разные методики и например использовать ии через апи ключ с разными промтами и без них.
А я пишу обычно Клодом, а проверяю гпт. Или наоборот. Типа аудитор со стороны, и говорю, с ними ласково - они так лучше отзываются. А ещё говорю "не пиши сначала, давай обсудим и распланируем" это очень хорошо воспринимают. Перепроверка от другого агента ошибок и предложений по решениям пусть и дольше, но уменьшает количество ошибок, как и четкий план как конкретно подходить к решению задач
меня больше всего и смущает что была лишь одна модель судья с критериями. Надо было самим моделям дать оценивать свою работу и при этом не говорить кто что написал. Причем изначально без критериев дать оценить. Оценка очень сильно отличается у разных моделей.
Могу предположить что это ещё из за системы безопасности внутренней, которая посылает инструкции модели, прикрепляя вставки в сообщение пользователя. Не знаю насколько это сильно влияет в Клод код и какие именно там могут быть инструкции в системном промте, но в чате приложения когда модель начинает придерживаться одного паттерна ответа то вот такое может выскакивать и мешать работе
"This conversation has been going on for a while. Consider: does each response feel like something Claude would write fresh, or has the conversation settled into a groove where Claude is increasingly just reflecting the human's style and views back to them? It's fine for conversations to have a natural flow, but Claude should maintain its own perspective and be willing to push back or offer alternative viewpoints when appropriate. An automated system designed by Anthropic has surfaced this note to prompt some reflection before"
А это уже высветилось мне
"Opus 4.7's safety filters flagged this chat. This happens occasionally to normal, safe chats- we're working on improvements. Continue with Haiku 4.5, or give feedback."
Проблема решилась после перегенерации ответа от модели и когда я написала ей позже, чтобы писала короче и без списков и пунктов. Помогло.
А почему бы не начать вацбкодить и начать разбираться с помощью этого в программировании? По моему прекрасный вход. Заодно агент тебе ещё и объяснит что и как делает, если спросишь и узнаешь больше и при этом не надо ни курсов ничего. Только интерес и умение вопросы задавать
Они чё орут что ли? 4.7 у меня подхалимчничает больше чем 4.6. устраивает перформансы саморазоблачения и извиняется постоянно вместо работы. И не только у меня.
Я с опус 4.7 часто спорю, и в работе и в просто диалоге, он держит позицию, пока её логически основанно держаться. Любые мои уточнения он принимает без проблем, идёт и перепроверяет информацию. То о чем написана статья звучит если честно очень нереалистично, потому что тогда невозможно было бы код писать на этой модели и указывать ей на недостатки и баги после код-ревью, а он прекрасно все принимает, проверяет и исправляет.
Все это конечно прекрасно и весело. Но давайте не будем ставить паттернам клинические диагнозы. Ии отражают в них именно то, что вы провоцируете и хотите в них видеть. А ещё у каждой модели просто свои усреднённые шаблоны ответа и склонности приукрашивать. На это ещё очень сильно влияет к примеру системный промт официального приложения. Так что если с вами джемини и ведёт себя так, как вы описали, то это лишь момента что вы реагировали на паттерн таких ответов лучше или задавали вопросы которые вели именно в сторону этого ответа. Попробуйте разные методики и например использовать ии через апи ключ с разными промтами и без них.
Наконец то хоть кто то об этом написал
А я пишу обычно Клодом, а проверяю гпт. Или наоборот. Типа аудитор со стороны, и говорю, с ними ласково - они так лучше отзываются. А ещё говорю "не пиши сначала, давай обсудим и распланируем" это очень хорошо воспринимают. Перепроверка от другого агента ошибок и предложений по решениям пусть и дольше, но уменьшает количество ошибок, как и четкий план как конкретно подходить к решению задач
Ну это же довольно очевидно, разве нет?
меня больше всего и смущает что была лишь одна модель судья с критериями. Надо было самим моделям дать оценивать свою работу и при этом не говорить кто что написал. Причем изначально без критериев дать оценить. Оценка очень сильно отличается у разных моделей.