Комментарии 3
На бенчмарке OSWorld набрала 75% — выше среднего человека с его 72,4%.
Какие же эти кожаные мешки тупые
А вы уверены, что это правда? Откуда инфа, что люди не могут простые задачи на компьютерах выполнять в почти 30% случаев? Хотелось бы пруфлинк, это крайне странно.
Скорость до 370–400 токенов в секунду, это на 45% быстрее предыдущего Gemini 2.5 Flash.
Видимо речь про 2.5-flash-lite. Похоже, статья грешит неточностями?
Для Нейронный сетей свойственна одна проблема, нету и не может быть методики которая доказывает что нейронная сеть обучилась достаточно. Это известная проблема, о которой почему-то забыли. Да теперь обучать нейросети можно гораздо эффективнее чем лет 30 назад, да и сети многократно превосходят по количеству нейронов и скорости работы чем те же лет 30 назад. Но в любом случае обученная на старых прецедентах, показывает хороший результата со старыми прецедентами, встретившись с нестандартным случаем может оказаться некомпетентной. Особенно опасно если такая некомпетентность окажется не очевидной как раз из за того что она будет редкой.
Я вот только что на Хабре комментировал как нейро-сеть не учла что для скорости 2400 в старых модемах еще не нужен цифровой сигнальный процессор. Такая мелочь была плохо описана в литературе хотя была понятна профильным специалистам, и нейро-сеть не смогла перейти от общего к частному описав в частном случае общий случай как невозможный для частного.
С другой стороны логические предикативные системы, в том числе так называемые мета-алгоритмические системы могут принимать решение исходя из правил в том числе фундаментальных предметной области, правил которые следует применять как к и стандартным и нестандартным ситуациям или исходя из этих же правил определять факт неразрешимости задачи в рамках этих же правил. Те кто обладает таковыми системами смогут найти уязвимое место в как раз ошибках действий Пентагона.
Информация
- Сайт
- timeweb.cloud
- Дата регистрации
- Дата основания
- Численность
- 201–500 человек
- Местоположение
- Россия
- Представитель
- Timeweb Cloud
GPT-5.4 с управлением компьютером, Anthropic и Пентагон, предсказание Grok про Иран и восстание ИИ-агентов