Обновить

GPT-5.4 с управлением компьютером, Anthropic и Пентагон, предсказание Grok про Иран и восстание ИИ-агентов

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели9.3K
Всего голосов 22: ↑20 и ↓2+26
Комментарии3

Комментарии 3

На бенчмарке OSWorld набрала 75% — выше среднего человека с его 72,4%.

Какие же эти кожаные мешки тупые
А вы уверены, что это правда? Откуда инфа, что люди не могут простые задачи на компьютерах выполнять в почти 30% случаев? Хотелось бы пруфлинк, это крайне странно.

Скорость до 370–400 токенов в секунду, это на 45% быстрее предыдущего Gemini 2.5 Flash. 

Видимо речь про 2.5-flash-lite. Похоже, статья грешит неточностями?

Для Нейронный сетей свойственна одна проблема, нету и не может быть методики которая доказывает что нейронная сеть обучилась достаточно. Это известная проблема, о которой почему-то забыли. Да теперь обучать нейросети можно гораздо эффективнее чем лет 30 назад, да и сети многократно превосходят по количеству нейронов и скорости работы чем те же лет 30 назад. Но в любом случае обученная на старых прецедентах, показывает хороший результата со старыми прецедентами, встретившись с нестандартным случаем может оказаться некомпетентной. Особенно опасно если такая некомпетентность окажется не очевидной как раз из за того что она будет редкой.
Я вот только что на Хабре комментировал как нейро-сеть не учла что для скорости 2400 в старых модемах еще не нужен цифровой сигнальный процессор. Такая мелочь была плохо описана в литературе хотя была понятна профильным специалистам, и нейро-сеть не смогла перейти от общего к частному описав в частном случае общий случай как невозможный для частного.
С другой стороны логические предикативные системы, в том числе так называемые мета-алгоритмические системы могут принимать решение исходя из правил в том числе фундаментальных предметной области, правил которые следует применять как к и стандартным и нестандартным ситуациям или исходя из этих же правил определять факт неразрешимости задачи в рамках этих же правил. Те кто обладает таковыми системами смогут найти уязвимое место в как раз ошибках действий Пентагона.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
timeweb.cloud
Дата регистрации
Дата основания
Численность
201–500 человек
Местоположение
Россия
Представитель
Timeweb Cloud