Комментарии 5
Интереса ради закинул эту задачу o3-mini-high, grok-3 и sonnet3.7-thinking (по ссылкам соответствующие демки на jsfiddle). Результаты на фото из статьи похожи:
grok-3


o3-mini-hight


sonnet-3.7-thinking


Промпт, если интересно: напиши страницу на html / js, которая из загруженной картинки будет получать контурную раскраску. С ползунками для базовых настроек.
Результат у sonnet очень интересный получился. Как эксперимент - круто, можно было еще попробовать закинуть в bolt (тоже ИИ, которая генерит репозитории), но все же я делал сам, как еще один кейсик в копилочку, но промпт-инженеринг тоже тема занимательная.
Вчера в chatGPT зарелизили генерацию картинок мультимодальным 4o - хотел его здесь опробовать, но персонажей не рисует из-за нарушения прав, а то, что рисует, получается хуже Gemini (или лучше, но дальше от оригинала), поэтому вот те же примеры с Gemini 2.0 Flash Experimental (можно бесплатно потыкать в google ai studio).
Скрытый текст



Если интересен именно результат - кажется что ИИ закрыл в нем потребность. Если процесс самостоятельной реализации - можно развивать дальше)
"Я тут написал, оно не работает, вот вам код"
Попробуйте начать с depth detection хотя бы
Скрытый текст

А вот тут уже искать края.
Делаем раскраску из ваших фото