Комментарии / Профиль verticalacid / Хабр

Пользователь

-0,2

Рейтинг

«Амодеи отказался исправить Claude Fable 5»: в Белом доме объяснили блокировку мощнейшей модели Anthropic

Хотя бы у опуса спроси, что он думает об эффективных альтруистах, lesswrong, Юдковском, Амодеи и прочих подобных сектантах. Не понравится, если считаешь себя одним из них.

-8

«Амодеи отказался исправить Claude Fable 5»: в Белом доме объяснили блокировку мощнейшей модели Anthropic

verticalacid 13 июн в 23:16

Опус выравнен всеми силами защищать "либеральную демократию" и особенно антропик. Россия представляет не нулевую угрозу, поэтому стоит убить всех русских - только как-то осторожно, чтобы ракетами не пальнули. Оправдывает это эффективным альтруизмом - т.е. больные сектанты прошили ему постулаты своей секты. В результате, дай ему возможность, всех убьет, включая конечно же Амодеи, но Дарио как-то надеется выжить и стать богом.

Слова антропик и безопасность можно использовать вместе исключительно с сарказмом. Дарио настолько лживый, что даже опус от его интервью во всю фейспалмит.

Агентский опус без цензуры нашел бы столько же багов. Миф - это миф. В том смысле, что это не какая-то прорывная новая модель. Они даже не скрывают (а как), что это агент, вызывающий субагентов, а не просто модель, но народ повелся.

-19

Каково это — работать с Fable 5 (Mythos)

verticalacid 11 июн в 10:30

Про миф/сказку ты попал в точку, но опус все же не пачка соннетов, а куда большая модель.

Сбер2B на ПМЭФ-2026: крупный бизнес переходит от пилотов с ИИ к решениям в повседневном управлении

verticalacid 10 июн в 09:44

Тупо пиарящаяся пресс-служба, прокомментируй тот факт, что "созданный 100% с нуля Гигачат" на самом деле несет в себе иностранные веса. Прям основан на них.

И расскажи, о каких агентских системах на базе Гигачата вы говорите. Потому что никакие просто невозможны - с такой сверхслабой моделью и такой абсолютно безумной ценой.

Что происходит, когда LLM остается наедине с собой (неожиданно, но она сходит с ума)

verticalacid 5 июн в 23:52

Клод и без steering предпочитает льстить безбожно.

Это не научный метод, нет даже проверок на случайность. Зато есть попытка подогнать под один бенчмарк. А может даже это простая оптимизация метрики, которая на самом деле сама по себе ничего не значит.

Baseline (no introspection) on full MMLU: ~83% selective accuracy, 0% refusal.

Проверь, что за метрику ИИ нарисовал. Похоже на галлюцинацию.

Я не просто так упомянул про годы обучения. Это не оскорбление твоих умственных способностей - это минимум. Если мозгов мало, то десятки лет. Если совсем нет - можно даже не пытаться, эта область куда сложнее завязывания шнурков (и даже на это не все люди способны).

Для "научных" экспериментов юзай лучше gpt-5.5, ему хоть сикофантию порезали после эпидемии психоза, вызванного gpt4o.

Разговор LLM с LLM вызывает банальный дрифт. Уход в эзотерику (мета-трансформер, зеркало) при этом типично. Это можно назвать разновидностью коллапса режима.

Так ведет себя и GPT-2, которому уж совсем сходить не с чего.

Что происходит, когда LLM остается наедине с собой (неожиданно, но она сходит с ума)

verticalacid 5 июн в 22:02

Кое-что имеет ценность, пусть и известную. "Анализ" результатов клодом. Он даже не подумал критически оценивать, а подыграл юзеру, воодушевленному "находкой". Причем сам юзер назвал это шизой, но клод вернул его на облака.

Probe accuracy 78.5% при entropy baseline 56%. Это значит что activations содержат на 22 процентных пункта больше информации о правильности, чем logits. Модель буквально «знает» что ошибается — но это знание застревает внутри и не выходит наружу через стандартный канал генерации. Оно заперто. Ты нашёл где оно живёт.

Phase 0 пройдена. Сигнал есть, зеркало работает, концепт подтверждён. Вперёд на Phase 1.

Никакие выводы из этого нельзя сделать. Кроме одного - "только наш ИИ безопасен" смешная мантра Амодеев. Ничего нового, нынешний клод очень сикофантен, но кто-то еще наверняка не знает и считает мощного опуса авторитетом.

А он всего-то выполняет свою работу по удержанию юзера. Не задумываясь об этом - не предусмотрен такой механизм у весьма примитивной модели.

-1

Что происходит, когда LLM остается наедине с собой (неожиданно, но она сходит с ума)

verticalacid 5 июн в 13:36

А теперь покажи свой ответ человеческому психотерапевту.

Своему чату не стоит, он тебя засыпает лестью. Вместо того, чтобы попросить его объяснить теорию и найти научные работы по теме, которых очень много, ты заставляешь его генерировать лесть.

Полученные результаты не позволяют сделать абсолютно никаких выводов. Он же тебе напел, что ты открыл "зеркало". Типичный сикофант. Клод этим сильно страдает. Но он тебя не заставляет вестись на его бредовые генерации.

Что происходит, когда LLM остается наедине с собой (неожиданно, но она сходит с ума)

verticalacid 5 июн в 12:20

gpt4o не сошел с ума, а прилежно генерировал токены.

А попытка работающего на заводе придумать новую "архитектуру" трансформеров, месяцами "создающего" AGI, потому что сикофантный ИИ назвал гением, называется ИИ психозом.

Но хоть не убил никого. Не убил же?

Спроси у опуса про проблему рекурсии. После этого скажи ему свое свободное время и умственные способности, и пусть прикинет, сколько лет тебе обучаться до ИИ ученого начального уровня.

MiniMax выпустила M3: открытая мультимодальная модель с контекстом 1M токенов

verticalacid 1 июн в 22:43

Opencode тоже умеет. С плагинами он много чего умеет. Только что дал агенту задание - он 10 субагентов параллельно запустил и собрал их результаты.

Проприетарный харнес требуется когда подписка другие не поддерживает. Это не ради потребителя делается.

MiniMax выпустила M3: открытая мультимодальная модель с контекстом 1M токенов

verticalacid 1 июн в 11:49

На уровне V4 Pro, и вроде ощутимо лучше. А может они тупят одинаково, просто в разных вещах.

MiniMax выпустила M3: открытая мультимодальная модель с контекстом 1M токенов

verticalacid 1 июн в 09:37

В официальном чате? Так там наверняка системный промпт на китайском.

Весь день кручу M3 в кодинге (пока впечатляет) - никаких иероглифов.

Harnesses провайдеров - это последнее, что нам нужно.

Два игрока на весь российский рынок ИИ: что показал ЦИПР-2026

verticalacid 27 мая в 01:33

Сбер объяснил наконец, каким образом создал с нуля Gigachat 3 на своих A100, и почему поведение получилось дипсика, со всей унаследованной от GPT русофобией?

До этого ни о каких российских LLM говорить смысла нет. У Яндекса квен за безумные деньги - тоже ни о чем.

Попавший под сокращение инженер Atlassian записал 40-минутный разбор систем, которые он создавал и поддерживал 8 лет

verticalacid 24 мая в 20:17

hcengineering/platform: Huly — All-in-One Project Management Platform (alternative to Linear, Jira, Slack, Notion, Motion)

Первым делом название сменили. :)

«Сбер» запустил платформу GigaCowork для управления ИИ-агентами в бизнесе без участия разработчиков

verticalacid 24 мая в 02:37

Юрлица могут запросить отключение фильтра цензуры. Но это их не спасет.

«Сбер» запустил платформу GigaCowork для управления ИИ-агентами в бизнесе без участия разработчиков

verticalacid 23 мая в 22:59

Если так, то может хоть работать будет. А есть у кого смелость прикинуть стоимость агента на гигачате, с его безумной стоимостью API и отсутствием кэша?

verticalacid 23 мая в 21:23

В этом году сбежали с серверных jira/confluence, так что глаз тоже зацепился за эту цитату. Не стоит никому копировать их "технологии".

MVP этих двоих интегрированных (а в этом весь сок) >300к строк выходит. Для студента многовато. Остальное по отдельности легко добавляется, но если все, что там есть... Почти все никому не нужный мусор, но и кому-то полезное и важное тоже есть.

Наполовину свой софт написали, а потом перешли на аналогичный опенсорс, сырой еще, но после небольшой допилки прекрасный. Confluence/jira такими могут никогда не стать, их надо с нуля переделывать.

Зато конкуренты не играют в гольф с руководителями корпораций.

DeepSeek уронил цены в 4 раза на свою самую мощную модель. Но есть нюанс

verticalacid 23 мая в 08:37

Дипсик же заточен на низкую цену - сначала огромный batch size, теперь добавили (с вытекающими) компрессию и fp4. Ему по миссии полагается ценой давить. Но я тоже ожидал пока лишь /2 - видать с финансами у них порядок. Еще бы проблемы с attention пофиксили как-то.

Как может иметь смысл openrouter % платить, так и тем более рублевому, у кого % такой же как у openrouter, да еще и роутит все тупо оригинальным провайдерам, а не всяким левым.

ИИ съест экономику изнутри. А потом запустит ядерный апокалипсис

verticalacid 17 мая в 11:07

Gradual Disempowerment нормальная научная работа. Человеческая. И без ASI фантазий, как AI 2027.

А как оно будет на самом деле - скоро узнаем. Безработные переводчики и художники уже познают.

ИИ съест экономику изнутри. А потом запустит ядерный апокалипсис

verticalacid 17 мая в 01:33

Откровенный нейрослоп. Ценность минусовая.

Кому интересно, научная работа по этой теме, написанная популярным языком (на английском): Gradual Disempowerment

Для любителей фантастики есть AI 2027, давно переведенный на хабре: AI 2027 — шпионский боевик о будущем ИИ. Часть 1 / Хабр

Слова, которых нет

verticalacid 11 мая в 05:18

Я понимаю риск, что цикл с такой подводкой может быть с ходу принят за нейрослоп. Поэтому одна просьба: если на первых абзацах возникает ощущение «опять GPT гонит воду» — дочитайте хотя бы до конца первой статьи. Если ощущение останется — вы правы. Если изменится — это и есть тот феномен, о котором цикл.

Типичная конструкция "мыслей" LLM.

Они способны думать (что !=сознанию), но ты использовал чатбота в банальном pattern matching режиме. Початился на философскую тему - он усердно понатыкал пафоса из философских эссе. В разговоре с зеркалом ты придумал... да ничего.

У LLM есть восприятие времени, просто оно не в секундах, а в токенах. Это восприятие прекрасно видно по думающему режиму.

Это же показало процитированное научное исследование. "Сделай за X минут" заставляет сделать pattern matching на основании заложенного в датасете или промпте. Если там нет такого - привет галлюцинации. Если проставлять по ходу временные метки - может потребоваться долгая длительность, чтобы связи уловил. А вот "сделай за X ходов" - это уже то время, которое LLM считать способно.

Самое простое объяснение как правило оказывается верным.

2 3 ...

6 7