Комментарии 4
Огонь! Какие именно «сложные аналитические задачи» AI-модели решают хуже всего, и почему?
Ну, результаты, конечно, прям похвальные для 7B модельки. Правда, кажется, что Sonnet 3.5 еще и без доступа к актуальным данным - не лучший судья в такого рода челлендже.
Кстати, в следующий раз еще решение от Google учитывайте плиз, их Deep Research как раз недавно заработал в бесплатной версии.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Deep Research Showdown: битва AI-систем за качество исследований