Комментарии / Профиль Altair2021 / Хабр

Александр@Altair2021

Пользователь

ПрофильСтатьиПостыНовостиКомментарии83

Умеет ли Алиса AI выдавать случайное число?

Altair2021 19 июн в 08:35

Один вопрос: зачем? Чем обычные генераторы случайных чисел не устраивают?

Свой VPN для дома и семьи: дёшево, просто, без знаний Linux

Altair2021 14 июн в 07:42

Qwen тоже этим страдает, в том числе последние plus/max 3.7

П維чему нейро考ети дел思ют так

Altair2021 12 июн в 14:08

У дипсика другая проблема -- он часто самопроизвольно сваливается в китайский при ответе, независимо от того, на русском или английском запрос. Заметил, что триггером почти всегда являются результаты поиска на китайском. Причём что 3.2 этим страдал, что v4 страдает

Gemini-3.5-flash догнал GPT-5.5 на 97/S и в 2.5× дешевле. Но главное — китайцы выигрывают по цене и качеству

Altair2021 1 июн в 13:19

Это значит что джемини не способен сохранять текст в текстом формате, и любое где тебе надо делать сложную схему, оформление, таблицу он не выполнит

А это не выполнит ни одна из моделей без специальной обвязки. То, что опенаи эту обвязку реализовали, а у гугла она недоступна -- не говорит о том, что модель гугла хуже) просто говорит об уровне сервиса гугла (если это действительно Pro план)

Gemini-3.5-flash догнал GPT-5.5 на 97/S и в 2.5× дешевле. Но главное — китайцы выигрывают по цене и качеству

Altair2021 29 мая в 16:06

Через опенроутер можно чётко задать провайдера. Иначе то, что "бенчмаркили" в статье, по сути, не имеет смысла. Просто поведение модели у разных провайдеров может отличаться из-за настроек хотя бы контекста и длины вывода. Тогда правильнее было бы сравнить поведение одной модели у разных провайдеров (и в разные промежутки времени).

Кроме того, автор статьи явно указывает "модель стоит на месте, несмотря на месяц после релиза", что не вяжется с опенроутером и провайдерами.

Gemini-3.5-flash догнал GPT-5.5 на 97/S и в 2.5× дешевле. Но главное — китайцы выигрывают по цене и качеству

Altair2021 28 мая в 22:56

Качество — 87. Минус 2 балла к апрелю, в пределах рутинной флуктуации на пяти топиках. По-честному — модель стоит на месте. Несмотря на месяц после релиза. Несмотря на то, что DeepSeek явно работал с моделью — она стала заметно компактнее (avg 1695 слов против 2598 в апреле, минус 35%). Стиль чище, без длиннот, но это уже на уровне постредактуры — фундаментальное «качество мысли» не сдвинулось.

Мб пропустил, но бенчмарк был через api openrouter'а или через веб-интерфейс? Если через апи -- то почему модель и её генерации должны как-то меняться?

Как использовать Qwen3.7-Max и Grok Build 0.1 для ИИ-агентов в России

Altair2021 22 мая в 09:43

лендинг профессионального вида генерирует за 40 секунд,

Каких секунд?

Как использовать Qwen3.7-Max и Grok Build 0.1 для ИИ-агентов в России

Altair2021 22 мая в 09:42

xAI выпустила Grok Build 0.1 настолько тихо, что большинство сообщества это пропустило. Модель появилась на OpenRouter 20 мая и позиционируется как прямой

Как прямой что?

Я спарсил 62 000 Python-вакансий с hh.ru и узнал страшное

Altair2021 20 мая в 09:18

ИИ никогда не делает грамматических ошибок

В русском -- делает, хоть и редко. Уверен, если поискать -- и в английском будут.

А вообще, дожили -- отсутствие грамматических (да и не только) ошибок в тексте считается использованием LLM. Обесцениваете знания тех, кто хорошо учил язык.

Агрегатор LLM, как выбирать живые free-модели и переживать сбои провайдера

Altair2021 13 мая в 10:49

а вообще, fallback наоборот может навредить, если нужен ответ от конкретной модели (например, opus-4.7). Кроме того, цена будет другой (если вместо opus-4.7 внезапно будет fallback, настроенный Вами, на условную gpt-5.5)

Агрегатор LLM, как выбирать живые free-модели и переживать сбои провайдера

Altair2021 13 мая в 10:46

Вы немного не о том. Вопрос был про параллельный запрос к нескольким моделям и суммаризацию.

Возможно ли сделать супер LLM которая прогоняла бы запрос через несколько моделей, анализировала и выдавала уточненный результат?

Вы ответили про fallback, подразумевая (комментарий же об этом), что его можно использовать в упомянутом качестве -- параллельный запрос с суммаризацией. На что и был мой комментарий.

Агрегатор LLM, как выбирать живые free-модели и переживать сбои провайдера

Altair2021 13 мая в 10:39

на опенроутере через fallback нельзя отправлять запросы к нескольким моделям параллельно

Агрегатор LLM, как выбирать живые free-модели и переживать сбои провайдера

Altair2021 13 мая в 09:34

Fallback -- как я понимаю, это не то же самое, что запрос одновременно к нескольким моделям и суммаризация, а запрос с возможностью гарантированно получить ответ, если какая-то из моделей недоступна. Т.е. отвечает одна модель.

Агрегатор LLM, как выбирать живые free-модели и переживать сбои провайдера

Altair2021 12 мая в 06:41

Это обычный агент. В openai agents sdk есть agents as tools. В качестве инструментов как раз могут быть запросы через другие модели

Агрегатор LLM, как выбирать живые free-модели и переживать сбои провайдера

Altair2021 12 мая в 00:10

недать

Что за зверь такой?

Может временно недать доступ к конкретной free-модели.

На 52,5% галлюцинаций меньше: вышла GPT-5.5 Instant

Altair2021 6 мая в 06:30

модель стала короче и менее многословной

Они считают, что их модели многословные? Уже давно gpt-5.Х выдаёт кучу буллет-поинтов вместо нормального текстового ответа. И в креативном письме их модели почти невозможно использовать -- предложения короткие, почти всегда один абзац-- одно предложение.

DeepSeek учит модель «тыкать пальцем» в кадр по ходу рассуждения

Altair2021 3 мая в 08:11

https://github.com/deepseek-ai/Thinking-with-Visual-Primitives

error 404. Случайно выложили и решили удалить?

Архитектура важнее размера: внедряем каузальные свертки в трансформер и получаем связный сторителлинг

Altair2021 2 мая в 23:57

нормальный движек

ДвижОк

Чем умнее становятся модели, тем больше ценится способность ясно мыслить и точно формулировать намерение

Altair2021 30 апр в 19:00

Давайте рассмотрим простейший пример запроса к нейросети с нечетко записанными требованиями (пример из проги):

"напиши мне код для рендеринга множества мандельброта".

Что тут модель сможет понять (что самая умная, что самая глупая)? Какой язык программирования использовать? Выберет от балды, скорее всего питон, как наиболее частый. А Вы, например, хотели с++ или js. Но не сказали. Далее, нужно ли сохранение в файл или отображение в gui? Какие цвета/палитра? и тп. Ну модель выберет что-то среднее, наиболее часто встречающееся в обучающем датасете.

При нечетком запросе ответ будет усредненный, а не такой, как Вы хотите.

С++ с нуля в 2026 году: почему нужно сразу учить C++20 и забыть про дедовские туториалы

Altair2021 30 апр в 07:45

А что, компиляторы уже поддерживают все фичи c++20, в т.ч. модули?

2 3 4 5