Как стать автором
Обновить
325.55
BotHub
Агрегатор нейросетей: ChatGPT, Claude, Midjourney

Anthropic выпускает более автономные версии модели Claude

Время на прочтение2 мин
Количество просмотров1.8K

Сообщается, что Anthropic готовит следующее поколение своих моделей Claude, стремясь к большей автономности и способности к самокоррекции при выполнении сложных задач.

Согласно The Information, компания планирует выпустить новые версии Claude Opus и Sonnet в ближайшие недели. Тестировщики говорят, что эти модели могут работать гораздо более автономно, чем предыдущие версии.

Самое большое изменение заключается в том, как модели сочетают независимое мышление с использованием внешних инструментов, плавно переключаясь между ними по мере необходимости. Если модель застревает при использовании инструмента, она переходит в режим «размышления», чтобы проанализировать произошедшее и устранить проблему. Такое переключение между режимами помогает моделям решать сложные задачи с меньшей помощью пользователей.

Один из примеров из The Information — анализ рынка для манхэттенского кафе. Модель начинает с изучения национальных тенденций, но быстро понимает, что они бесполезны. Затем она переходит к анализу демографических данных Ист-Виллиджа, чтобы дать более актуальные рекомендации.

Новые модели Claude также играют более активную роль в задачах по написанию кода. Они автоматически тестируют сгенерированный код, и если что-то идёт не так, они останавливаются, чтобы самостоятельно разобраться и исправить ошибку. Первые тестировщики говорят, что этот процесс самокоррекции работает даже с общими запросами, такими как «сделать приложение быстрее», когда модель самостоятельно пробует разные стратегии оптимизации.

Подход Anthropic соответствует более широкой тенденции: созданию систем искусственного интеллекта, которые могут продолжать работать с минимальным вмешательством человека и самостоятельно решать задачи. Обновлённые модели Claude предназначены для комбинированного использования логики и инструментов, переключаясь между двумя режимами по мере необходимости.

Новые модели o3 и o4-mini от OpenAI работают примерно так же. В то время как более ранние модели o1 могли только «продумывать» дополнительные шаги, генерируя текст, последнее поколение может также использовать такие инструменты, как веб-поиск, генерирование кода или анализ изображений в рамках своих рассуждений. Это должно сделать их более гибкими и надёжными, хотя первоначальные тесты показывают, что o3, например, по-прежнему чаще допускает ошибки при выполнении сложных задач, чем предыдущие модели OpenAI.

Пользуясь случаем, хочу порекомендовать BotHub — платформу, где можно протестировать все популярные модели без ограничений. Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и уже сейчас начать работать!

Источник

Теги:
Хабы:
+4
Комментарии3

Другие новости

Информация

Сайт
bothub.chat
Дата регистрации
Дата основания
Численность
11–30 человек
Местоположение
Россия
Представитель
Вероника