Как стать автором
Обновить

Комментарии 5

Интереса ради закинул эту задачу o3-mini-high, grok-3 и sonnet3.7-thinking (по ссылкам соответствующие демки на jsfiddle). Результаты на фото из статьи похожи:

grok-3

o3-mini-hight

sonnet-3.7-thinking

Промпт, если интересно: напиши страницу на html / js, которая из загруженной картинки будет получать контурную раскраску. С ползунками для базовых настроек.

Результат у sonnet очень интересный получился. Как эксперимент - круто, можно было еще попробовать закинуть в bolt (тоже ИИ, которая генерит репозитории), но все же я делал сам, как еще один кейсик в копилочку, но промпт-инженеринг тоже тема занимательная.

Вчера в chatGPT зарелизили генерацию картинок мультимодальным 4o - хотел его здесь опробовать, но персонажей не рисует из-за нарушения прав, а то, что рисует, получается хуже Gemini (или лучше, но дальше от оригинала), поэтому вот те же примеры с Gemini 2.0 Flash Experimental (можно бесплатно потыкать в google ai studio).

Скрытый текст
а это творчество 4o по мотивам фотки с котом
а это творчество 4o по мотивам фотки с котом

Если интересен именно результат - кажется что ИИ закрыл в нем потребность. Если процесс самостоятельной реализации - можно развивать дальше)

"Я тут написал, оно не работает, вот вам код"

Попробуйте начать с depth detection хотя бы

Скрытый текст

А вот тут уже искать края.

Хороший вариант, спасибо. Я думаю, что буду продолжать развивать проект и тестировать другие варианты компьютерного зрения.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации