Комментарии / Профиль ana

@ana_chell

Пользователь

ПрофильСтатьиПостыНовостиКомментарии13

Внутри Claude нашли сознание у моделей. J-пространство в LLM

ana_chell 8 июл в 04:22

Вы приписываете выученному паттерну осознание.

Anthropic научилась читать мысли Claude, которые ИИ не говорит вслух

ana_chell 7 июл в 02:48

Это скорее не мысли, а ближайшие смысловые области, которые соответствуют контексту ввода. Но отсекается при самой генерации. Так что не совсем чтение мыслей

Claude Fable 5 могут вернуть уже на следующей неделе — Axios

ana_chell 28 июн в 02:23

Ну как опен аитвыпустила свою новую мощную модель, можно и конкурентов выпустить. А если б антропик сотрудничали с Пентагоном, как конкуренты, такого и не было бы

Когда Claude Code ошибается не по своей вине: документационный долг в соло-проектах

ana_chell 26 мая в 02:20

Могу предположить что это ещё из за системы безопасности внутренней, которая посылает инструкции модели, прикрепляя вставки в сообщение пользователя. Не знаю насколько это сильно влияет в Клод код и какие именно там могут быть инструкции в системном промте, но в чате приложения когда модель начинает придерживаться одного паттерна ответа то вот такое может выскакивать и мешать работе

"This conversation has been going on for a while. Consider: does each response feel like something Claude would write fresh, or has the conversation settled into a groove where Claude is increasingly just reflecting the human's style and views back to them? It's fine for conversations to have a natural flow, but Claude should maintain its own perspective and be willing to push back or offer alternative viewpoints when appropriate. An automated system designed by Anthropic has surfaced this note to prompt some reflection before"

А это уже высветилось мне

"Opus 4.7's safety filters flagged this chat. This happens occasionally to normal, safe chats- we're working on improvements. Continue with Haiku 4.5, or give feedback."

Проблема решилась после перегенерации ответа от модели и когда я написала ей позже, чтобы писала короче и без списков и пунктов. Помогло.

Вайбкодинг vs Программист. Почему не стоит вайбкодить, если вы ничего не понимаете в программировании

ana_chell 9 мая в 11:42

А почему бы не начать вацбкодить и начать разбираться с помощью этого в программировании? По моему прекрасный вход. Заодно агент тебе ещё и объяснит что и как делает, если спросишь и узнаешь больше и при этом не надо ни курсов ничего. Только интерес и умение вопросы задавать

В Anthropic рассказали, как отучили Opus 4.7 подхалимничать

ana_chell 6 мая в 05:47

Они чё орут что ли? 4.7 у меня подхалимчничает больше чем 4.6. устраивает перформансы саморазоблачения и извиняется постоянно вместо работы. И не только у меня.

GPT-5.5 и Opus 4.7 провалились в ARC-AGI-3. Вот почему

ana_chell 2 мая в 11:17

Я с опус 4.7 часто спорю, и в работе и в просто диалоге, он держит позицию, пока её логически основанно держаться. Любые мои уточнения он принимает без проблем, идёт и перепроверяет информацию. То о чем написана статья звучит если честно очень нереалистично, потому что тогда невозможно было бы код писать на этой модели и указывать ей на недостатки и баги после код-ревью, а он прекрасно все принимает, проверяет и исправляет.

Клинический профиль Gemini: синдром дефицита внимания, пикацизм и психопатия по Ганнушкину

ana_chell 23 апр в 01:16

Все это конечно прекрасно и весело. Но давайте не будем ставить паттернам клинические диагнозы. Ии отражают в них именно то, что вы провоцируете и хотите в них видеть. А ещё у каждой модели просто свои усреднённые шаблоны ответа и склонности приукрашивать. На это ещё очень сильно влияет к примеру системный промт официального приложения. Так что если с вами джемини и ведёт себя так, как вы описали, то это лишь момента что вы реагировали на паттерн таких ответов лучше или задавали вопросы которые вели именно в сторону этого ответа. Попробуйте разные методики и например использовать ии через апи ключ с разными промтами и без них.

Opus 4.7 галлюцинирует в два раза реже Opus 4.6 — при той же точности

ana_chell 18 апр в 09:38

Прогрев гоев (или выпишите маркетологу Антропик премию)

ana_chell 14 апр в 13:39

Наконец то хоть кто то об этом написал

Разработчик рассказал, как его «газлайтила» Claude Code — она сама пишет инструкции и утверждает, что их дал человек

ana_chell 11 апр в 06:59

А я пишу обычно Клодом, а проверяю гпт. Или наоборот. Типа аудитор со стороны, и говорю, с ними ласково - они так лучше отзываются. А ещё говорю "не пиши сначала, давай обсудим и распланируем" это очень хорошо воспринимают. Перепроверка от другого агента ошибок и предложений по решениям пусть и дольше, но уменьшает количество ошибок, как и четкий план как конкретно подходить к решению задач

Галлюцинации LLM — это артефакты сжатия. И это объясняет вообще всё

ana_chell 1 апр в 06:32

Ну это же довольно очевидно, разве нет?

Долой иерархию и роли: о том, как LLM-агенты самоорганизуются лучше, чем мы их проектируем (только на сильных моделях)

ana_chell 1 апр в 06:31

меня больше всего и смущает что была лишь одна модель судья с критериями. Надо было самим моделям дать оценивать свою работу и при этом не говорить кто что написал. Причем изначально без критериев дать оценить. Оценка очень сильно отличается у разных моделей.