Keep_lookout27 июл 2024 в 11:18

LLM и ее невозможный ASCII art

Простой

11 мин

15K

Программирование * Машинное обучение * Искусственный интеллектВизуальное программирование *

+41

Комментарии 5

lrdprdx 29 июл 2024 в 07:48

Раздел про решение обратной задачи выглядит сомнительно. Описание картинки робота заставляет меня сделать вывод, что используется контекст, потому что лично я там робота вот совсем не вижу. Скорее младенца.

Aizz 30 июл 2024 в 14:05

Возможно, запросы делались в одном чате и действительно подтянулся контекст. У меня по этой картинке чатгпт выдало следующее:

На изображении, которое вы загрузили, выполнено в стиле ASCII-арта. Оно представляет собой схематическое изображение человека. Присутствуют черты лица, шея, плечи, туловище, руки и ноги, сделанные из символов, таких как вертикальные линии, горизонтальные линии, косые черты и другие.

Так что, как минимум, LLM действительно знает что такое ascii-арт и понимает как его переложить на реальные объекты. Вполне возможно, в датасете для обучения было много ascii-картинок людей и она просто знает, какая комбинация символов должна представлять человеческое лицо.

AlexSky 29 июл 2024 в 17:42

Мне ChatGPT выдал такого "программиста за работой".

Кажется, я знаю, под какую ОС этот программист пишет.

Kononelder 30 июл 2024 в 12:13

Отличная статья, спасибо. Больше удивили результаты обратной задачи: подобный "image" captioning - крайне любопытное свойство LLM

mrdelfer 6 авг 2024 в 05:15

Я случайно нашел ещё одну интересную способность ChatGPT - он может понимать изображение, если прислать его текстом в base64, без использования vision.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий