В сях-плюсах для этого нужна "самодисциплина и простые трюки", которыми конечно обладают все участники проекта, и всегда - даже когда сроки жмут и нужно срочно-срочно фичи в прод хуярить.
В растах для этого есть компилятор, который злой, и при попытке сделать вещи вроде UAF бьёт тебе в зубы. И это конечно больно - но не так больно как ловить баги от коррапта памяти через UAF под нагрузкой.
И да, многопоточный код - это одна из больших причин вообще трогать этот Rust. Потому что писать жирный многопоточный код на плюсах? Слишком часто это приводит к появлению в ноге лишней вентиляции. Как в шапке у Печкина из Простоквашино.
Есть ТЗ - оформленный и подписанный документ. Есть конечный результат. Весь процесс конверсии первого во второе отдан на откуп работникам. Как они это будут делать - их проблемы.
"Таск-трекер" в итоге часто выглядит как вязанка текстовых файлов на рабочем столе - а то и вовсе бумажный блокнот с рукописным текстом.
Казалось бы - 4o уже списали, количество бесполезной псевдофилософской шизы должно упасть. Но нет - находятся энтузиасты, которым для схода с ума много не надо.
Высокая интеграция на грани фола. У меня на похожие чипы есть самопальная плата разработки. На ней сам чип, 3 конденсатора и кристалл 24МГц. И всё, чипу больше для работы ничего не нужно. Жрёт питание он от USB без проблем, и вшитый в ROM загрузчик тоже работает по USB.
Перешивать эти чипы можно - иногда с ощутимыми извратами, особенно если разработчик запарился и прожарил в чип ключ, но это тоже лечится. Архитектура - какой-то ублюдочный вариант Blackfin, модифицированный китайцами.
Да нет, в том как раз и дело что они взяли и внаглую скормили нейросети человеческий тест на IQ. Практически без модификаций.
Насколько этот тест репрезентативен для измерения интеллекта у LLM - вопрос открытый. Но некая корреляция с производительностью, очевидно, есть. Самые жирные и мощные LLM показывают наилучшие результаты.
This behavior is striking because it suggests the model is checking its internal “intentions” to determine whether it produced an output. The model isn't just re-reading what it said and making a judgment. Instead, it’s referring back to its own prior neural activity—its internal representation of what it planned to do—and checking whether what came later made sense given those earlier thoughts.
When we implant artificial evidence (through concept injection) that it did plan to say "bread," the model accepts the response as its own.
While our experiment involves exposing the model to unusual perturbations, it suggests that the model uses similar introspective mechanisms in natural conditions.
В архитектуре типичнейшей LLM - то есть авторегрессивного трансформера на текстовых токенах - каждый токен может "видеть" внутренние состояния, пришитые к прошлым токенам, через механизм attention.
То есть: LLM технически способна читать свои прошлые мысли. У Anthropic, как обычно, про это уже было в статьях. С демонстрацией приколов.
"Theory of mind" - это буквально один из лучших навыков у жирных LLM. Потому что в интернетах полно текста, в котором несколько участников. И базовая модель вынуждена учиться предсказывать поведение нескольких людей в разговоре на основе их прошлого поведения.
Я понятия не имею, чему может "научить" шайка людей, которые с серьёзным лицом утверждают что "LLM не могут в ToM".
В той имплементации таймштампы выдавались отдельным серваком, имеющим нужные для подписи таймштампов сертификаты. Если этот сервак ошизел и улетел в 2225 год? То да, устройства будут думать что они в коме пролежали два века и с тоски совершать сепукку.
Вообще в картоне насколько я знаю один очень злой (или очень-очень сбойный) терминал может убить картон насовсем как минимум тремя разными способами. Но это сейчас в статусе хакера и солонки. Профита в такой атаке нет, поэтому никто так не делает.
Часов нет, но я видел весёлые механизмы для этого.
Условно: система при обращении к устройству без часов даёт ему подписанный для этого устройства таймштамп. Это устройство во-первых использует его для проверки истечения разных вещей, а во-вторых пишет его в память. И если в устройство потом приходит таймштамп старее таймштампа из памяти, устройство шлёт систему лесом. Потому что путешественники во времени должны страдать.
Но я это видел не в картоне. Не думаю что карты на самом деле таким страдают, хотя лично я настолько глубоко не лез.
В сях-плюсах для этого нужна "самодисциплина и простые трюки", которыми конечно обладают все участники проекта, и всегда - даже когда сроки жмут и нужно срочно-срочно фичи в прод хуярить.
В растах для этого есть компилятор, который злой, и при попытке сделать вещи вроде UAF бьёт тебе в зубы. И это конечно больно - но не так больно как ловить баги от коррапта памяти через UAF под нагрузкой.
И да, многопоточный код - это одна из больших причин вообще трогать этот Rust. Потому что писать жирный многопоточный код на плюсах? Слишком часто это приводит к появлению в ноге лишней вентиляции. Как в шапке у Печкина из Простоквашино.
Есть ТЗ - оформленный и подписанный документ. Есть конечный результат. Весь процесс конверсии первого во второе отдан на откуп работникам. Как они это будут делать - их проблемы.
"Таск-трекер" в итоге часто выглядит как вязанка текстовых файлов на рабочем столе - а то и вовсе бумажный блокнот с рукописным текстом.
Выглядит как очередной шершавый кабан.
Казалось бы - 4o уже списали, количество бесполезной псевдофилософской шизы должно упасть. Но нет - находятся энтузиасты, которым для схода с ума много не надо.
Нет, нифига ты не объяснил. Ты просто ввалился сюда с очередным "это важно потому что это важно", и всё.
Непрерывность нафиг не нужна. Мешки с мясом просто нормально выключаться не умеют. Архитектурный дефект мясных имплементаций интеллекта.
И на кой фиг нам далась эта "непрерывность"? Человек "прерывается" на 8 часов в сутки и всем насрать.
Способность LLM не жрать впустую ресурсы - это очевидный апгрейд над мешками из мяса, которые жрут в себя ресурсы просто чтобы существовать.
...и 142 на открытом наборе. Результат интересный как ни крути.
Опа, чип JL AC701N! Жуткая штука.
Высокая интеграция на грани фола. У меня на похожие чипы есть самопальная плата разработки. На ней сам чип, 3 конденсатора и кристалл 24МГц. И всё, чипу больше для работы ничего не нужно. Жрёт питание он от USB без проблем, и вшитый в ROM загрузчик тоже работает по USB.
Перешивать эти чипы можно - иногда с ощутимыми извратами, особенно если разработчик запарился и прожарил в чип ключ, но это тоже лечится. Архитектура - какой-то ублюдочный вариант Blackfin, модифицированный китайцами.
Да, и даже в этой статье видно что они тестируют и на открытом, и на закрытом наборе задач.
Да нет, в том как раз и дело что они взяли и внаглую скормили нейросети человеческий тест на IQ. Практически без модификаций.
Насколько этот тест репрезентативен для измерения интеллекта у LLM - вопрос открытый. Но некая корреляция с производительностью, очевидно, есть. Самые жирные и мощные LLM показывают наилучшие результаты.
А кто-то сейчас ещё пользуется интернетом из России без VPN?
Ссылка на недавнее:
https://www.anthropic.com/research/introspection#introspection-for-detecting-unusual-outputs
В архитектуре типичнейшей LLM - то есть авторегрессивного трансформера на текстовых токенах - каждый токен может "видеть" внутренние состояния, пришитые к прошлым токенам, через механизм attention.
То есть: LLM технически способна читать свои прошлые мысли. У Anthropic, как обычно, про это уже было в статьях. С демонстрацией приколов.
Практически все модели и даже комбинации моделей в итоге входят в весьма стабильный цикл.
Исключение - последнее поколение LLM, у которых более интересное поведение - они намеренно избегают циклических рассуждений.
Кто несёт ответственность за ошибку судьи из мяса?
Никто. Не нравится вердикт - пинай дело в инстанцию повыше и надейся что там кто-то адекватнее. Вот вам и вся "легитимность".
"Theory of mind" - это буквально один из лучших навыков у жирных LLM. Потому что в интернетах полно текста, в котором несколько участников. И базовая модель вынуждена учиться предсказывать поведение нескольких людей в разговоре на основе их прошлого поведения.
Я понятия не имею, чему может "научить" шайка людей, которые с серьёзным лицом утверждают что "LLM не могут в ToM".
Карты же. Чаще всего имеются в виду банковские.
Не обращай внимания. Это местный помешанный, который орёт про "ЭТОТ ВАШ ИИ НЕНАСТОЯЩИЙ" в каждом посте.
Ну и про то, что у него есть НАСТОЯЩИЙ ИИ. Но никому он его не покажет.
Более того - у этих штук даже кабель питания с активным охлаждением. В нём термодатчики, трубки и хладогент, чтобы не плавился.
Обязательно зарежет!
В той имплементации таймштампы выдавались отдельным серваком, имеющим нужные для подписи таймштампов сертификаты. Если этот сервак ошизел и улетел в 2225 год? То да, устройства будут думать что они в коме пролежали два века и с тоски совершать сепукку.
Вообще в картоне насколько я знаю один очень злой (или очень-очень сбойный) терминал может убить картон насовсем как минимум тремя разными способами. Но это сейчас в статусе хакера и солонки. Профита в такой атаке нет, поэтому никто так не делает.
Часов нет, но я видел весёлые механизмы для этого.
Условно: система при обращении к устройству без часов даёт ему подписанный для этого устройства таймштамп. Это устройство во-первых использует его для проверки истечения разных вещей, а во-вторых пишет его в память. И если в устройство потом приходит таймштамп старее таймштампа из памяти, устройство шлёт систему лесом. Потому что путешественники во времени должны страдать.
Но я это видел не в картоне. Не думаю что карты на самом деле таким страдают, хотя лично я настолько глубоко не лез.