Comments / Profile of Altair2021 / Habr

Александр@Altair2021

Пользователь

ProfileArticlesPostsNewsComments83

Умеет ли Алиса AI выдавать случайное число?

Altair2021 Jun 19 at 08:35

Один вопрос: зачем? Чем обычные генераторы случайных чисел не устраивают?

Свой VPN для дома и семьи: дёшево, просто, без знаний Linux

Altair2021 Jun 14 at 07:42

Qwen тоже этим страдает, в том числе последние plus/max 3.7

П維чему нейро考ети дел思ют так

Altair2021 Jun 12 at 14:08

У дипсика другая проблема -- он часто самопроизвольно сваливается в китайский при ответе, независимо от того, на русском или английском запрос. Заметил, что триггером почти всегда являются результаты поиска на китайском. Причём что 3.2 этим страдал, что v4 страдает

Gemini-3.5-flash догнал GPT-5.5 на 97/S и в 2.5× дешевле. Но главное — китайцы выигрывают по цене и качеству

Altair2021 Jun 1 at 13:19

Это значит что джемини не способен сохранять текст в текстом формате, и любое где тебе надо делать сложную схему, оформление, таблицу он не выполнит

А это не выполнит ни одна из моделей без специальной обвязки. То, что опенаи эту обвязку реализовали, а у гугла она недоступна -- не говорит о том, что модель гугла хуже) просто говорит об уровне сервиса гугла (если это действительно Pro план)

Gemini-3.5-flash догнал GPT-5.5 на 97/S и в 2.5× дешевле. Но главное — китайцы выигрывают по цене и качеству

Altair2021 May 29 at 16:06

Через опенроутер можно чётко задать провайдера. Иначе то, что "бенчмаркили" в статье, по сути, не имеет смысла. Просто поведение модели у разных провайдеров может отличаться из-за настроек хотя бы контекста и длины вывода. Тогда правильнее было бы сравнить поведение одной модели у разных провайдеров (и в разные промежутки времени).

Кроме того, автор статьи явно указывает "модель стоит на месте, несмотря на месяц после релиза", что не вяжется с опенроутером и провайдерами.

Gemini-3.5-flash догнал GPT-5.5 на 97/S и в 2.5× дешевле. Но главное — китайцы выигрывают по цене и качеству

Altair2021 May 28 at 22:56

Качество — 87. Минус 2 балла к апрелю, в пределах рутинной флуктуации на пяти топиках. По-честному — модель стоит на месте. Несмотря на месяц после релиза. Несмотря на то, что DeepSeek явно работал с моделью — она стала заметно компактнее (avg 1695 слов против 2598 в апреле, минус 35%). Стиль чище, без длиннот, но это уже на уровне постредактуры — фундаментальное «качество мысли» не сдвинулось.

Мб пропустил, но бенчмарк был через api openrouter'а или через веб-интерфейс? Если через апи -- то почему модель и её генерации должны как-то меняться?

Как использовать Qwen3.7-Max и Grok Build 0.1 для ИИ-агентов в России

Altair2021 May 22 at 09:43

лендинг профессионального вида генерирует за 40 секунд,

Каких секунд?

Как использовать Qwen3.7-Max и Grok Build 0.1 для ИИ-агентов в России

Altair2021 May 22 at 09:42

xAI выпустила Grok Build 0.1 настолько тихо, что большинство сообщества это пропустило. Модель появилась на OpenRouter 20 мая и позиционируется как прямой

Как прямой что?

Я спарсил 62 000 Python-вакансий с hh.ru и узнал страшное

Altair2021 May 20 at 09:18

ИИ никогда не делает грамматических ошибок

В русском -- делает, хоть и редко. Уверен, если поискать -- и в английском будут.

А вообще, дожили -- отсутствие грамматических (да и не только) ошибок в тексте считается использованием LLM. Обесцениваете знания тех, кто хорошо учил язык.

Агрегатор LLM, как выбирать живые free-модели и переживать сбои провайдера

Altair2021 May 13 at 10:49

а вообще, fallback наоборот может навредить, если нужен ответ от конкретной модели (например, opus-4.7). Кроме того, цена будет другой (если вместо opus-4.7 внезапно будет fallback, настроенный Вами, на условную gpt-5.5)

Агрегатор LLM, как выбирать живые free-модели и переживать сбои провайдера

Altair2021 May 13 at 10:46

Вы немного не о том. Вопрос был про параллельный запрос к нескольким моделям и суммаризацию.

Возможно ли сделать супер LLM которая прогоняла бы запрос через несколько моделей, анализировала и выдавала уточненный результат?

Вы ответили про fallback, подразумевая (комментарий же об этом), что его можно использовать в упомянутом качестве -- параллельный запрос с суммаризацией. На что и был мой комментарий.

Агрегатор LLM, как выбирать живые free-модели и переживать сбои провайдера

Altair2021 May 13 at 10:39

на опенроутере через fallback нельзя отправлять запросы к нескольким моделям параллельно

Агрегатор LLM, как выбирать живые free-модели и переживать сбои провайдера

Altair2021 May 13 at 09:34

Fallback -- как я понимаю, это не то же самое, что запрос одновременно к нескольким моделям и суммаризация, а запрос с возможностью гарантированно получить ответ, если какая-то из моделей недоступна. Т.е. отвечает одна модель.

Агрегатор LLM, как выбирать живые free-модели и переживать сбои провайдера

Altair2021 May 12 at 06:41

Это обычный агент. В openai agents sdk есть agents as tools. В качестве инструментов как раз могут быть запросы через другие модели

Агрегатор LLM, как выбирать живые free-модели и переживать сбои провайдера

Altair2021 May 12 at 00:10

недать

Что за зверь такой?

Может временно недать доступ к конкретной free-модели.

На 52,5% галлюцинаций меньше: вышла GPT-5.5 Instant

Altair2021 May 6 at 06:30

модель стала короче и менее многословной

Они считают, что их модели многословные? Уже давно gpt-5.Х выдаёт кучу буллет-поинтов вместо нормального текстового ответа. И в креативном письме их модели почти невозможно использовать -- предложения короткие, почти всегда один абзац-- одно предложение.

DeepSeek учит модель «тыкать пальцем» в кадр по ходу рассуждения

Altair2021 May 3 at 08:11

https://github.com/deepseek-ai/Thinking-with-Visual-Primitives

error 404. Случайно выложили и решили удалить?

Архитектура важнее размера: внедряем каузальные свертки в трансформер и получаем связный сторителлинг

Altair2021 May 2 at 23:57

нормальный движек

ДвижОк

Чем умнее становятся модели, тем больше ценится способность ясно мыслить и точно формулировать намерение

Altair2021 Apr 30 at 19:00

Давайте рассмотрим простейший пример запроса к нейросети с нечетко записанными требованиями (пример из проги):

"напиши мне код для рендеринга множества мандельброта".

Что тут модель сможет понять (что самая умная, что самая глупая)? Какой язык программирования использовать? Выберет от балды, скорее всего питон, как наиболее частый. А Вы, например, хотели с++ или js. Но не сказали. Далее, нужно ли сохранение в файл или отображение в gui? Какие цвета/палитра? и тп. Ну модель выберет что-то среднее, наиболее часто встречающееся в обучающем датасете.

При нечетком запросе ответ будет усредненный, а не такой, как Вы хотите.

С++ с нуля в 2026 году: почему нужно сразу учить C++20 и забыть про дедовские туториалы

Altair2021 Apr 30 at 07:45

А что, компиляторы уже поддерживают все фичи c++20, в т.ч. модули?

2 3 4 5