Привет. Во-первых, из description лучше убрать "with Gemini 2.0 Flash (Preview)" и "via Gemini", ты ведь просто просишь генерить картинку, а не какой-то конкретной моделью. Эти описания подкладываются в контекст модели, чтобы она решала, какой инструмент вызвать, лишние описания путают.
Во-вторых, напиши вывод всех параметров в логи, чтобы проверить, что по факту уходит в модель, если она генерит что-то не то. Попробуй сам вызвать с такими параметрами, если все равно фигня, то дело в модели, Flash не очень качественно генерит, если с деталями надо.
По поводу смотреть в картинки, — модель-то может и умеет, но у тебя нет вызова этой модели в качестве инструмента. Надо добавить метод в MCP describe_image (или score_image), на вход что-то типа пути до картинки, на выходе текст или число.
Ну и прописать там корректный вывов API, которое по переданной картинке и промпту возвращает описание или оценку изображения. Можно зашить в методе промпт типа "score image from 0 to 9 in accordance to it's [что-то, что оцениваешь]" или любой другой нужный.
Тогда агент поймет, что у него есть инструмент, который по пути к картинке возвращает описание или оценку и на команду сравни "картинки с котиками" дернет этот инструмент, получит числа и сравнит их.
Рад, что понравилось. Вот читаешь и кажется, что он достаточно просто устроен и не до конца понятно на чем основан его успех среди других похожих решений.
Неа, его не пробовал, у него есть какая-то фишка? Модели во всех этих вещах все равно одни и те же. Мне кажется тут именно UX, инженерия по индексации и скорость влияет. Ну и цена еще.
Там гифок с туманом нет
Еее, с релизом!
У Mistral есть vison модель на Free tier'е, можно ее вставить
Привет. Во-первых, из description лучше убрать "
with Gemini 2.0 Flash (Preview)" и "via Gemini", ты ведь просто просишь генерить картинку, а не какой-то конкретной моделью. Эти описания подкладываются в контекст модели, чтобы она решала, какой инструмент вызвать, лишние описания путают.Во-вторых, напиши вывод всех параметров в логи, чтобы проверить, что по факту уходит в модель, если она генерит что-то не то. Попробуй сам вызвать с такими параметрами, если все равно фигня, то дело в модели, Flash не очень качественно генерит, если с деталями надо.
По поводу смотреть в картинки, — модель-то может и умеет, но у тебя нет вызова этой модели в качестве инструмента. Надо добавить метод в MCP describe_image (или score_image), на вход что-то типа пути до картинки, на выходе текст или число.
Ну и прописать там корректный вывов API, которое по переданной картинке и промпту возвращает описание или оценку изображения. Можно зашить в методе промпт типа "score image from 0 to 9 in accordance to it's [что-то, что оцениваешь]" или любой другой нужный.
Тогда агент поймет, что у него есть инструмент, который по пути к картинке возвращает описание или оценку и на команду сравни "картинки с котиками" дернет этот инструмент, получит числа и сравнит их.
Нее, качество длинных обзоров не очень высокое пока)
Но вот в телегу слать уведомления по нужной теме — это можно впилить
Там во второй статье поинтересней, про проблемы с машстабированием можно почитать.
А задачи у них в целом типичные для высоконагруженных сервисов, правда умноженные на порядок
Меня больше всего позабавило, что архитекторы из aws просто констатировали факт и не смогли помочь.
Ну Windsurf тоже его форкнули)
https://windsurf.com/blog/why-we-built-windsurf
И некоторые другие тоже. Я думаю тут скорее в удаче дело.
Рад, что понравилось. Вот читаешь и кажется, что он достаточно просто устроен и не до конца понятно на чем основан его успех среди других похожих решений.
Перевел вторую часть статьи
https://habr.com/ru/articles/920660/
Ну так там, наверное, только 10k строк рабочего кода и есть
Вы опасный человек
Склонил vscode, посчитал — получилось 445122 строки. Видимо, действительно активно пользуются курсором в разработке!
Да, автор указал, что это AR (The business has crossed $500M in annual revenue). Спасибо за поправку.
Ой, а что-то он сразу в 2.5 раза дороже курсора
Неа, его не пробовал, у него есть какая-то фишка? Модели во всех этих вещах все равно одни и те же. Мне кажется тут именно UX, инженерия по индексации и скорость влияет. Ну и цена еще.
А все-таки файлов с кодом с логикой там сколько?
Я с большими проектами работал, тогда Visual Studio минут по 10 грузилась, но там было несколько сотен проектов.
По дополнению согласен, по-моему, он даже скопированный в буфер обмена код учитывает.
Ну 10k файлов это многовато для одного проекта. Надо в .cursorignore закинуть.
Начинаю себя чувствовать Cursor-евангелистом, хотя против Windsurf, Claude Code и других ничего не имею, кроме Codex, наверное.