Комментарии 20
А есть ли сервисы, через которые можно бесплатно протестировать работу Claude 3.5? Отправить 10-15 промтов, чтобы посмотреть его работу в деле?
В чем проблема зайти на официальный сайт и все протестировать?
Нужен иностранный номер телефона
https://onlinesim.io/ за $0.52 с работало!
Я регистрировался через гугл, вроде. Телефон не оставлял. Можно через Cursor, но лучше не с бесплатным планом.
Упомянутый в статье Cursor можно установить и попробовать либо на существующем репозитории либо с нуля какую-нибудь программу написать. В бесплатную версию включено какое-то количество бесплатных запросов. Доступны разные модели, в т.ч. Claude 3.5.
Сегодня в Cursor уже и 3.7 завезли, оперативно. И обычную, и рассуждающую версии на выбор. В пробной версии, ЕМНИП, 150 запросов включено.
Такой момент интересный, например при использовании Cursor + Claude, возможно ли Cursor скормить весь репозиторий проекта (например проект на Laravel), и Cursor в итоге сам весь проект проверит и выдаст рекомендации по улучшени. и т.п ?
Спасибо.
Можно, но лучше не надо
Да, там можно прям кодовую базу скормить.
Однако, если она слишком большая в проекте, рано или поздно он начнет путаться и «забывать» другие файлы
У каждой модели есть ограничение на размер контекстного окна. В запросе можно указать весь проект, но стоит подумать о выборе модели. Рефакторить в курсоремудобно и кусками.
Есть, тут раздел Direct chat https://lmarena.ai/
Присоединяюсь к рекомендации курсора.
Lmarena.ai
Телеграмм боты
На рынке LLM становится всё теснее, а улучшений всё меньше
Попробовал, ощутимой разницы не увидел.
Да и, судя по версии, 3.5 -> 3.7, антропики сами тоже особой разницы не увидели)
Субъективно стало лучше.
Но сложно сравнить в полностью одинаковых условиях и задачах
Вон он написал что-то что... Я конфеткой чуть не поперхнулся и уронил челюсть в стакан.
Современные подходы к описанию контрактов
Эволюция методов описания контрактов
Сравнение подходов
https://LLMshare.syntxai.net/9dc67217-1baa-bf70-8122b99f
Ну кому как. При чистке и преобразовании данных o3-mini-high работает заметно лучше 3.5. 3.7 тоже не дотягивает. Приходится разбивать на большее количество подзадач и итераций. Возможно, дело в промтах
Ноль разницы с 3.5. Клод сильно отстал в гонке
Claude 3.7 Sonnet от Anthropic — умнее, быстрее, мощнее