Разница в том, что никто не утверждает будто его жена, сосед, джун или знакомый по даче квалифицированы для такой работы.
В то время как Антропик утверждает, что его ИИ-агент годится для этого.
Есть и другая разница - перечисленные выше - люди, а ИИ агент - инструмент, созданный специально для того типа работы, что он провалил. Это как если бы Word при попытке ввести новый текст начинал удалять документы, или принтер взрывался при попытке напечатать документ.
Алгоритмические языки - подмножества естественных.
Вообще-то нет.
И как только она будет сформулирована на каком либо языке, можно будет переформулировать эту симуляцию будет на любом языке и на любом механизме включая LLM
Про вычислительную сложность никогда не слышали? Некоторая задача может быть решаема в теории, но на практике может потребовать времени больше, чем время жизни вселенной.
ИИ из одного предложения может сгенерить документ и может суммаризировать целый документ в одно предложение. Проблема в том, что эти предложения далеко не всегда совпадают.
Да но это не отвечает на вопрос сколько было false positives. И опять же непонятно насколько в принципе можно верить заявлениям Антропик.
Они тут недавно заявляли, что разработанный их агентами компилятор Си компилирует ядро Линукс, что не подтверждается независимыми исследованиями. На деле - он просто генерирует некорректный код.
Компилятор генерирует неправильные релокации для структур __jump_table и __ksymtab, поэтому итоговый бинарник vmlinux собрать не удалось. Заявление Anthropic о сборке ядра формально верно — но только для этапа компиляции, не для получения рабочего образа.
Формально Антропик солгал.
Подозреваю они просто устали от бесплодных попыток заставить агентов написать работающий компилятор и решили, что и так сойдёт.
Заплатки выглядят реалистичными на первый взгляд, но это не значит, что модель, обученная на вроде бы реалистичных, но фейковых данных сможет распознавать реальные заплатки. Все-таки человеческий мозг и ANN по разному работают.
В Европе китайские производители электромобилей вышли на ринг с ценами, с которыми Tesla не могла конкурировать. BYD, NIO, Xpeng…
И все же из всех этих производителей, только BYD в топ-10 в Европе по продаже электромобилей и то на 8-м месте только, top 3: Volkswagen, Tesla, Renault.
Так что проблемы в Европе у Теслы не из-за китайцев, а из-за европейских производителей.
Произошла подмена понятий. Тот ИИ, что представлялся в прошлом и тот ИИ, что мы получили сегодня - 2 большие разницы.
Скорее обусловлены платежеспособностью населения, в целом вырисовывается такая корреляция - чем богаче страна, тем дороже мобильный интернет.
Фотореалистичные персонажи? На скрине из Hogwarts Legacy они какие-то пластилиновые вышли.
А вариант, что Антропик просто лжет по своему обыкновению и фальсифицирует результаты тестов не рассматриваются?
Разница в том, что никто не утверждает будто его жена, сосед, джун или знакомый по даче квалифицированы для такой работы.
В то время как Антропик утверждает, что его ИИ-агент годится для этого.
Есть и другая разница - перечисленные выше - люди, а ИИ агент - инструмент, созданный специально для того типа работы, что он провалил. Это как если бы Word при попытке ввести новый текст начинал удалять документы, или принтер взрывался при попытке напечатать документ.
Вообще-то нет.
Про вычислительную сложность никогда не слышали? Некоторая задача может быть решаема в теории, но на практике может потребовать времени больше, чем время жизни вселенной.
Кстати, сейчас март 2026 года. Согласно Дарио Амодеи программистов больше не осталось - весь код пишет ИИ.
В Твиттере, предыдущей компании Дорси, уволили 80% без всяких ИИ.
Дорси знаменит своей любовью раздувать штаты.
Писали, писали, что оценка будет 850, а тут 730.
https://habr.com/ru/news/1001974/
ИИ из одного предложения может сгенерить документ и может суммаризировать целый документ в одно предложение. Проблема в том, что эти предложения далеко не всегда совпадают.
Рейтинг TIOBE - глобальный рейтинг популярности языков программирования и опровергать его статистикой вакансий в одной стране как-то странно.
Да но это не отвечает на вопрос сколько было false positives. И опять же непонятно насколько в принципе можно верить заявлениям Антропик.
Они тут недавно заявляли, что разработанный их агентами компилятор Си компилирует ядро Линукс, что не подтверждается независимыми исследованиями. На деле - он просто генерирует некорректный код.
Сколько из них false positives?
Даже обычные статические анализаторы кода выдают огромное количество false positives, что уж говорить про это.
Формально Антропик солгал.
Подозреваю они просто устали от бесплодных попыток заставить агентов написать работающий компилятор и решили, что и так сойдёт.
Боюсь не только американской экономике.
Покупатель - основатель сервиса crypto com, видимо он и правда не вышел из времен сетевой наивности.
Garbage in, garbage out? Нет?
Заплатки выглядят реалистичными на первый взгляд, но это не значит, что модель, обученная на вроде бы реалистичных, но фейковых данных сможет распознавать реальные заплатки. Все-таки человеческий мозг и ANN по разному работают.
Как можно ослабить то, чего нет?
И все же из всех этих производителей, только BYD в топ-10 в Европе по продаже электромобилей и то на 8-м месте только, top 3: Volkswagen, Tesla, Renault.
Так что проблемы в Европе у Теслы не из-за китайцев, а из-за европейских производителей.
Ну если прежде всего это MacOS, то мы могли бы тогда видеть ее рост на графике, но его нет.