Продолжение предыдущего поста - “Как нейросети создают сайты: сравнительный тест на Ypage” - 3 Часть.

Сравнение моделей: кто как работает
Anthropic (Claude)
Claude Sonnet 4.6
Плюсы: Лучшее качество в тесте; богатый дизайн, детальная вёрстка
Минусы: Дороже среднего (72,40 ₽)
Claude Opus 4.8
Плюсы: Глубокий контент, продуманная структура
Минусы: Самый дорогой (89,50 ₽); артефакт "Новая страница" в HTML
Claude стабильно выдаёт полноценные лендинги. Sonnet - лучший результат в тесте, Opus дороже, но не безупречен.
OpenAI (GPT)
GPT-5.4
Плюсы: Хороший контент, meta-теги, современный дизайн
Минусы: Мелкий косяк в блоке цен
GPT-5.3 Codex
Плюсы: Быстрее и дешевле GPT-5.4; чистый результат
Минусы: Чуть проще визуально
OpenAI-модели надёжны: оба сайта созданы без сбоев. Codex - оптимальный выбор по цене и скорости в этой паре.
Google (Gemini)
Gemini 3.5 Flash
Результат: Сбой - сайт не создан
Gemini 2.5 Flash Lite
Результат: Сбой - сайт не создан
Единственные полные провалы теста. Обе модели не прошли даже начальную генерацию - на опубликованных URL остались пустые заготовки.
Qwen
Qwen 3.7 Max
Плюсы: Хороший результат за 25,70 ₽
Qwen 3.5 Flash
Плюсы: Самый дешёвый (9,00 ₽), самый быстрый (1м 26с)
Минусы: Шаблонный дизайн, артефакт в HTML
Qwen 3.7 Max - сильный бюджетный вариант. Flash-версия экономит, но качество заметно ниже.
DeepSeek V4 Pro
Один из лучших результатов за 24,30 ₽. Дольше всех генерировал (почти 6 минут), зато выдал профессиональный лендинг без ошибок.
StepFun Step 3.7 Flash
10,90 ₽ за полноценный сайт - отличное соотношение цена/результат. Быстро заменил провалившийся Gemini на той же нише.
Z-AI GLM-5.1
Хорошая структура и контент за 24,20 ₽, но слабое место - подбор изображений в блоке команды.
Сводная таблица качества
Салон красоты - Claude Sonnet 4.6
Вёрстка: ★★★★★ | Контент: ★★★★★ | Итог: Отлично
Доставка еды - DeepSeek V4 Pro
Вёрстка: ★★★★☆ | Контент: ★★★★★ | Итог: Отлично
Кофейня - Qwen 3.7 Max
Вёрстка: ★★★★☆ | Контент: ★★★★☆ | Итог: Хорошо
Агентство недвижимости - StepFun 3.7 Flash
Вёрстка: ★★★★☆ | Контент: ★★★★☆ | Итог: Хорошо
Курсы (Codex) - GPT-5.3 Codex
Вёрстка: ★★★★☆ | Контент: ★★★★☆ | Итог: Хорошо
Юридические услуги - GLM-5.1
Вёрстка: ★★★☆☆ | Контент: ★★★★☆ | Итог: Нормально
Курсы (GPT-5.4) - GPT-5.4
Вёрстка: ★★★☆☆ | Контент: ★★★★★ | Итог: Нормально
Ветеринарная клиника - Claude Opus 4.8
Вёрстка: ★★★★☆ | Контент: ★★★★★ | Итог: Нормально
Фитнес-клуб - Qwen 3.5 Flash
Вёрстка: ★★☆☆☆ | Контент: ★★★☆☆ | Итог: Слабо
Салон красоты - Gemini 2.5 Flash Lite
Итог: Сбой
Агентство недвижимости - Gemini 3.5 Flash
Итог: Сбой
Выводы
1. Большинство моделей справляются с простым ТЗ.
9 из 11 проектов дали рабочий лендинг с одного запроса. Это уже рабочий инструмент, а не эксперимент.
2. Стабильность важнее цены.
Gemini Flash-версии не создали сайт вообще. При выборе модели лучше ориентироваться на проверенные варианты (Claude, GPT, DeepSeek), а не на самые дешёвые.
3. Дешёвые модели экономят, но проигрывают в дизайне.
Qwen 3.5 Flash стоил 9 ₽, но лендинг выглядит как шаблон Bootstrap. Qwen 3.7 Max за 25,70 ₽ уже на другом уровне.
4. Дорогие модели не гарантируют идеал.
Claude Opus - самый дорогой (89,50 ₽), но оставил технический мусор в HTML. GPT-5.4 дал лучший контент, но с мелким косяком в вёрстке.
5. Типичные ошибки нейросетей при генерации сайтов:
артефакты платформы ("Новая страница") в итоговом HTML;
нерелевантные или повторяющиеся изображения;
визуальные недочёты (смещение карточек, неровные блоки);
шаблонный дизайн у budget-моделей;
полный сбой генерации (Gemini).
6. Лучшие по соотношению цена / качество в этом тесте:
DeepSeek V4 Pro, StepFun 3.7 Flash, Qwen 3.7 Max
Лучший по качеству: Claude Sonnet 4.6
Сколько стоит сайт "в реальной жизни"
Все лендинги из этого теста созданы без дополнительных правок - по одному запросу в чат. Средняя стоимость такого "сырого" результата - около 35 ₽ и 3 минут генерации.
На практике почти всегда нужны доработки: поправить текст, заменить картинку, выровнять блок, убрать артефакт. В этом тесте минимальные правки потребовались только у двух сайтов.
