Обновить

Часть-1. Почему ИИ рисует каракули вместо текста: анатомия проблемы и дорожная карта решений

Уровень сложностиСредний
Время на прочтение29 мин
Охват и читатели7.3K
Всего голосов 3: ↑3 и ↓0+4
Комментарии4

Комментарии 4

Супер! На самом деле, 3 метод гениален, работа с масками - тот еще аппарат, слышал о таком на arxiv, однако там описывалась просто концпепция без практического применения.

С канвой сложновато, не для всех, все таки это как никак ручная обработка. Сейчас попробовал через маски на своих источниках - офигенно)))

Будущее уже здесь - Следующее поколение моделей (типа SD3) уже демонстрирует впечатляющие результаты в генерации текста. Но пока они не стали мейнстримом, наш многослойный подход остается самым надежным способом гарантировать безупречный текст в AI-генерациях. Экспериментируйте, комбинируйте и делитесь результатами — вместе мы делаем AI-творчество более точным и профессиональным!

Напомню, что SD3 вышел 1.5 года назад.

Для текста в ходу Flux и Qwen Image. И свежий HunyuanImage 3.0.

Да, согласны, с короткими фразами справляется на "ура". Но статья о контент-производстве больше, создании инфографик, об этом будет во второй части. Могли бы Вы поделиться готовыми инфографиками, которые смогла сделать SD3?

Это не SD3, а HunyuanImage 3.0, которая вышла 2 недели назад. Модель построена на авторегрессии как LLM, и так как внутри там полноценная LLM, она понимает русский для промптов и может сама придумать инфографику. Работает не идеально, поэтому будет интересно посмотреть, как вы справились с этой задачей.

Промпт: Придумай саркастичную инфографику про LLM на русском

Промпт про ведьмака сгенерированный GLM

Create a detailed infographic for the game "The Witcher 3: Wild Hunt" in a dark fantasy style, inspired by Slavic mythology and the game's official concept art, using a color palette of muted earth tones, deep grays, and accents of red and blue. The centerpiece is a radial diagram with Geralt of Rivia at the center; stylized lines connect him to key characters labeled 'Дитя Старшей Крови', 'Чародейка', 'Король Дикой Охоты', and 'Главный антагонист'. These lines should also branch out to major locations labeled 'Белый Сад', 'Новиград', 'Велены', and 'Скеллиге'. Include a section with clean, minimalist icons for key items labeled 'Стальной меч для людей', 'Серебряный меч для монстров', and 'Амулет Медальон Волка'. Add a horizontal timeline at the bottom, divided into four key plot points in Russian: 1. Начало: Поиски Цири с помощью Йеннифэр. 2. Развитие: Путешествие по Веленам, Новиграду и Скеллиге, сбор информации. 3. Кульминация: Противостояние с Дикой Охотой. 4. Финал: Битва за Цири и ее судьба. In a top-right corner, place a statistics block with the following text in Russian: 'Дата выхода: 19 мая 2015 г.', 'Разработчик: CD Projekt RED', 'Награды: Игра года (2015)', 'Количество игроков: 50+ миллионов'. Use a clean, legible font for all Russian text, and ensure the overall layout is balanced, modern, and visually appealing, with a subtle, textured background reminiscent of old parchment.

HunyuanImage 3.0
HunyuanImage 3.0
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
t.me
Дата регистрации
Дата основания
Численность
2–10 человек
Местоположение
Россия