Комментарии / Профиль DimSimd / Хабр

Круто круто... Ещё интересный бенчмарк есть на AGI это например пройти игру подобную We were here. В крации - игра головоломка на двоих. У одного подсказки а другой по этим подсказкам делает задание.

Причем объяснения что надо делать нет часто вообще.

Если у LLM «аутизм», пишет ли она код лучше?

DimSimd 29 мая в 20:23

Чтож. Давайте вторую часть. "будет ли LLM писать код лучше, если заставить его матерится" ибо есть исследование что код с матами в комментариях качественнее чем код без них.

Как Gemini 3.5 Flash сломали ради красивых графиков (и почему она обходит 3.1 Pro только на бумаге)

DimSimd 25 мая в 04:03

Не понимаю откуда автор взял про "деревянная". Я бы даже сказал наоборот, более "эмоциональная" по сравнению с 3.1 pro. Например вчера после того как модель написала около 1500 строк питона и html, она восхищалась проделанной работе. Работал в Antigravity, системный промпт не менял.

Алиса AI научилась лучше генерировать изображения с русскоязычным текстом

DimSimd 19 мая в 16:32

Сомнительно. Специально щас попросил создай инфографику-плакат сравнивающую концепции античной греческой философии с фундаментальными принципами квантовой механики. Итог - абсолютно нечитаемый текст. Да, его много, даже какую то формулу пыталась написать. Но до уровня GPT Image 2 или нано бананы ещё пару лет.

Обзор нейросети Suno v5 в 2026 году: чем она лучше Udio и Riffusion после выхода обновления 5.5?

DimSimd 8 мая в 13:28

Пу-пу-пу. Как будто бы сравнивать модели нужно не только по тому что они могут сами сделать в интерфейсе "в один промпт" а по максимальной инфраструктуре вокруг неё. Текст - пишем руками или gemini, который очень не плохо пишет. Обвязка - Suno Studio, которая позволяет безшовно или почти безшовно редактировать куски песни, разбивать на стемы, делать дополнительные аудио дорожки и тд и тп. Так что Suno пока что все равно топ 1. А по поводу изменений между v5 и v5.5 - 5.5 лучше держит структуру и лучше попадает в секунды и BPM.

Почему нейросети рисуют иероглифы на картинках вместо текста — и что с этим делать

DimSimd 2 мая в 14:13

Расскажите плс тем кто генерирует нейрослоп для бизнес блогов, что весь современный мир кроме РФ уже как пол года перешёл на авторегрессивные модели с рассуждением которые и текст пишут отлично в любых объёмах, включая математические формулы, и иногда смотрят на результат своей генерации, и фрагментам но изменяют результат.

Nano Banana 2 vs GPT Image 2: Сравнение нейросетей для генерации изображений с промптами и тестами

DimSimd 2 мая в 11:35

Бред какой то в промпта и в задачах. Объясните людям что месиво из тегов было полезно во времена SDXL.

Что проверяем: Работу с линиями, чертежами, штриховкой и понимание сложных структурных форм без скатывания в фотореалистичный рендер здания.

То что вы получили это никак не четреж. Максимум - технический рисунок. Причём очень фотореалистичный. Вывод - очередной нейрослоп.. Интересно, все блоги компаний занейрослоплены?

«ИИ-код работает, но он отвратительный»: Карпати — о текущих возможностях ИИ-агентов

DimSimd 2 мая в 07:08

Скажите ему чтобы он лечил биполярку

Codex больше не про код: OpenAI добавила мышку, память и 90 плагинов

DimSimd 16 апр в 21:19

Интересно, сколько Яблочники заплатили ИИ компаниям чтоб я быстрее купил мак из за их прог которые на винду выходят на несколько месяцев позже.

Вышел Claude Opus 4.7. Модель уже доступна в Veai для JetBrains IDE

DimSimd 16 апр в 21:17

Как будто бы по чистым цифрам GPT 5.4 и Opus 4.6 даже лучше чем 4.7. Если выйдет GPT 5.5 который будет сильный прирост иметь то антрофик снова будет догоняющим по чистым цифрам и им придётся релизить вторую капибару с контекстом 1 млн токенов. Но опять же это по чистым цифрам, по реальным задачам пока что антрофик топ 1, Open Ai догоняет.

Искусство промптинга, или Как варить кашу из топора правильно

DimSimd 10 апр в 01:47

Гайд не то чтобы не о чем, но чуть попахивает нейронкой. Например нейронка советует назначать роль для LLM модели в промпте, хотя как уже разбирали эксперты, часто роль на даёт прироста, а иногда деградацию результата. Но поскольку промпт составлялся "не по канону" для написания статьи, то такие моменты упустили.

Полгода назад ИИ не мог нарисовать часы. Теперь — 5 из 5 попыток идеальны

DimSimd 24 фев в 05:18

Именно для этого и нужны рассуждающие модели!