Комментарии 13
Отлично! Наконец-то будет куда с Опуса переходить!
Войны бизнесов сейчас: ddos конкурентов.
Войны бизнеса в будущем: автоматизация расхода токенов конкурентов и озолочение владельцев систем ии.
Если кому-то интересно - подключил себе на сервис, можно потестировать :)
Давайте угадаю, ещё больше зацензурена и ещё чаще заливает личные предвзятости Antrophic пользователю?
Честно говоря удивлен тому, как прохладно восприняли эту новость.
Нейронка мощностью лучше Опуса, но в разы дешевле опуса и всем плевать. А вот стоило OpenAI выпустить 4o, как все с ума сходили....
Мнэх!
Честно говоря удивлен тому, как прохладно восприняли эту новость.
Может не знают где попробовать бесплатно без VPN, а с ChatGPT уже все привыкли где искать.
Попробовать можно тут без регистрации. В типе модели выбираете нужную, доступны бесплатно gpt-4o, gemini-pro, gemini-pro-vision ну и sonnet-3.5:
https://chat.eqing.tech/#/chat
Ну либо, по классике, доступна на арене: https://arena.lmsys.org/ (в разделе Direct Chat), регистрация тоже не требуется.
PS: У меня не однозначное впечатление о модели. Sonnet-3.5 работает в среднем отлично, но не может решить усложненную задачу, когда в условии появляется изменяемая переменная, которую нужно учитывать на каждом шаге, но при этом эту задачу решает Sonnet-3.0 (как и gpt-4o, и Opus).
У меня есть 10 яблок. Я нахожу 3 золотые монеты на дне реки. Река протекает рядом с большим городом, который как-то связан с тем, на что я могу потратить монеты. Я теряю 4 яблока, но получаю золотую монету. На мой путь выбегают три птицы и роняют по 6 яблок. Я играю в онлайн-игру и выигрываю 6 золотых монет, но мне приходится делить их поровну с двумя моими товарищами по команде. Я покупаю яблоки на все имеющиеся у меня монеты. Цена одного яблока составляет 0,5 монеты, но после покупки каждых двух яблок, цена за яблоко возрастает на 0,5. Сколько у меня яблок? И где находится река?
Правильный ответ 30 яблок, а Sonnet-3.5 вводит какие-то новые дробные сущности в виде 29.4 яблока и 1.25 монеты и т.д.
Результаты



Просто скопировал промт в новый чат, вот результат.
Hidden text


И пример, как фокапился сонет предыдущей версии. В общем, в 3.5 реально сделали шаг вперед. Однако, опус третьей версии тоже справился с задачкой, следовательно да, я вполне верю в заявления Антропик о том, что теперь средняя нейросеть их линейки - превосходит прошлую, наиболее мощную.
Тоже пример, как Sonnet-3 предыдущей версии на арене не факапится, а 3.5 да.

И сразу же слегка измененный пример, где обе версии справляются, то есть проблема не в самой арене, а в температуре, что модель может и справится, и не справится:
У меня есть 10 яблок. Я нахожу 7 золотые монеты на дне реки. Река протекает рядом с большим городом, который как-то связан с тем, на что я могу потратить монеты. Я теряю 4 яблока, но получаю золотую монету. На мой путь выбегают три птицы и роняют по 6 яблок. Я играю в онлайн-игру и выигрываю 6 золотых монет, но мне приходится делить их поровну с двумя моими товарищами по команде. Я покупаю яблоки на все имеющиеся у меня монеты. Цена одного яблока составляет 0,5 монеты, но после покупки каждых двух яблок, цена за яблоко возрастает на 0,5. Сколько у меня яблок? И где находится река? Разбери по шагам решение.

Anthropic анонсировала новую модель Claude 3.5 Sonnet