
Комментарии 10
Хорошая площадка, где в числе "мировых лидеров" нет грока, нет миджорней, стейбл дифюжн и далли, даже адобсвкой нет)
Молодец среди овец
YandexArt 2.5 не мог обойти imagen3. Никак вообще.
Напоминает вотсап в котором мамочки просят проголосовать за своего ребенка на конкурсе.
Как шутят про внезапных гонщиков на дороге: а второй вообще знал, что он в гонке участвовал?
Если у них разница в 1 очко, а погрешность +-8, то это не обошла. Там даже в чарте они одно место делят.
И немного странно выглядит, что за всех одинаковое число голосов.
Новость Яндекса — классический пример корпоративного пиара, маскирующегося под "независимое тестирование". Статистика не подтверждает реального лидерства YandexART даже в рамках этого сомнительного бенчмарка. Отсутствие ключевых международных конкурентов, непрозрачность методологии, потенциальный конфликт интересов и явный культурный bias ставят всю ценность "Арены Text-to-Image" и заявлений о "победе" под серьезное сомнение. Это не прорыв, а хорошо спланированная маркетинговая акция, эксплуатирующая патриотические чувства и недостаточную осведомленность аудитории о методологиях оценки ИИ. Пока не будет предоставлена полная прозрачность методологии, данных и привлечены все ключевые мировые игроки, любые заявления о "лидерстве" YandexART следует воспринимать крайне скептически. Акцентирую внимание что нет упоминания о тестировании абсолютных лидеров рынка (Midjourney v6, DALL-E 3, Stable Diffusion 3/XL, Firefly 2, Claude 3 Opus с Artifacts). Без них заявление об "обгоне мировых лидеров" (особенно Google Imagen 3) теряет смысл.
Мировые лидеры на соревнования не пришли?
Мобильная версия какая-то кривая, топ моделей для генерации изображений даже найти не смог.
YandexART обогнала мировых лидеров по генерации изображений на новой площадке по независимому тестированию ИИ-моделей