Комментарии / Профиль Altair2021 / Хабр

Александр@Altair2021

Пользователь

0,1

Рейтинг

GPT-5.4 получит режим экстремального рассуждения

Altair2021 4 мар в 19:35

типа сравнения двух таблиц с выводом номеров строк при обнаружении совпадений (по факту немного усложненное ВПР), ни одна не справилась нормально

использование LLM в данной задаче, в принципе, аналогично использованию их в качестве калькулятора -- то же самое забивание гвоздей микроскопом. Они под это в принципе не заточены. Если нужен какой-то детерминированный ответ/ответ на основе четкого алгоритма, то LLM не шибко подходят.

Пробовал консультироваться по импортной документации - пишут ерунду сразу, не понимают контекста сколько бы я не улучшал промт.

Тут довольно тонкая грань: если документация большая, она банально может не влезть в контекст LLM. А если влезет -- хорошо известна проблема падения понимания LLM с увеличением контекста.

GPT-5.4 получит режим экстремального рассуждения

Altair2021 4 мар в 19:22

gpt 5.2 уровни ризонинга:

Low
Medium
High
Extra high

++ Extreme high))

И в чем, интересно, разница между high/extra high/extreme high?)) И что потом? Ulta high? Extreme ultra high? Impossible high?

Geometry > Scale: Как 40М параметров на решетке E8 обходят классические трансформеры

Altair2021 2 мар в 14:00

Почему это работает?

Для такого короткого текста нужна llm'ка?

В последнее время триггерит с этих "why it works", когда вообще не "works"

BotHub vs OpenRouter: и в чем же всё таки разница?

Altair2021 27 фев в 17:57

Тоже Германия, не работает. Как я понимаю, гугл может опираться на то, где и когда был зарегистрирован акк. В том числе учитывает номер телефона.

BotHub vs OpenRouter: и в чем же всё таки разница?

Altair2021 27 фев в 15:25

Не показательно, только если не отключить у модели ризонинг. Иначе она может наризонить/нагаллюционировать на сотни-тысячи токенов. Кроме того, у разных моделей разные токенизаторы, и один и тот же текст может занимать разное количество токенов. Например, у клода токены мельче, чем у дипсика.

BotHub vs OpenRouter: и в чем же всё таки разница?

Altair2021 27 фев в 15:08

А можно примеры таких агрегаторов? Сам пользуюсь ботхабом около года по апи -- на момент выбора их условия были самыми выгодными. Доп рубль через апи не снимается (через апи чисто доступ к моделям, а в веб версии еще куча прибамбасов).

BotHub vs OpenRouter: и в чем же всё таки разница?

Altair2021 27 фев в 15:01

А по какому курсу конвертировали цену опенроутера в рубли?) Там, насколько я помню, все в долларах

Как я сделал автоматический перевод постов у себя в блоге с помощью ChatGPT

Altair2021 27 фев в 14:49

А можно выбрать сервис типа openrouter.ai, и не зависеть от впс (по крайней мере пока), не быть привязанным только к моделям опенаи.

Касаемо json: есть такая штука как structured_output.

Касаемо таймаута: можно использовать потоковую генерацию (stream=True) -- тогда не нужно ждать, пока модель вернёт ответ целиком, можно сохранить даже частичный ответ в случае обрыва соединения.

BotHub vs OpenRouter: и в чем же всё таки разница?

Altair2021 26 фев в 08:17

Как насчёт привести количество входных и выходных токенов на каждый из вариантов? Мб в варианте с опенроутера модель сгенерировала 100 токенов, а в варианте с ботхаба -- 1000? (Условные цифры)

BotHub vs OpenRouter: и в чем же всё таки разница?

Altair2021 26 фев в 08:12

Не подскажете, как сделать так, чтобы гугл через впн не говорил, что сервис "недоступен в вашей стране"?

BotHub vs OpenRouter: и в чем же всё таки разница?

Altair2021 25 фев в 19:09

Большинство бесплатных моделей с опенроутера недоступны( А те, которые тестируют, предоставляя бесплатный доступ, обычно быстро закрывают

Полгода назад ИИ не мог нарисовать часы. Теперь — 5 из 5 попыток идеальны

Altair2021 23 фев в 08:19

Дык в статье речь идёт не про генерацию картинок часов, а про генерацию html-кода, отображающего часы. Разные вещи. Вы пробовали создать html-скрепки?)

Полгода назад ИИ не мог нарисовать часы. Теперь — 5 из 5 попыток идеальны

Altair2021 23 фев в 08:17

Дык в статье речь идёт не про генерацию картинок часов, а про генерацию html-кода, отображающего часы. Разные вещи. Вы пробовали создать html-термометр?)

Полгода назад ИИ не мог нарисовать часы. Теперь — 5 из 5 попыток идеальны

Altair2021 23 фев в 08:15

Дык речь идёт не про генерацию картинок часов, а про генерацию html-кода, отображающего часы. Разные вещи

LibreOffice раскритиковала «поддельный открытый исходный код» OnlyOffice за сотрудничество с Microsoft

Altair2021 21 фев в 13:14

LibreOffice раскритиковала «поддельный открытый исходный код» OnlyOffice за сотрудничество с Microsoft

По смыслу выходит, что раскритикован исходный код за сотрудничество с Microsoft. Реально код сотрудничает? Или таки OnlyOffice?

Галлюцинации недели: GPT-5.3-Codex-Spark, Sonnet 4.6 и китайский MoE-десант

Altair2021 18 фев в 09:51

А где галлюцинации-то?)

Триллион параметров, 63 млрд активных: модель Ling-2.5-1T бросает вызов DeepSeek V3.2

Altair2021 18 фев в 06:24

Интересная сейчас мода: почти про любую llm писать, что она "бросает вызов дипсику". Причём как старому типа 3.2, так и потенциальному v4. Кликбейт на кликбейте и кликбейтом погоняет.

Бывший руководитель Microsoft заявил о борьбе за сохранение вертикальной панели задач в Windows 11

Altair2021 16 фев в 17:13

Я из тех, кто предпочитает боковую панель) И вертикальные вкладки в браузере). Когда открыто много приложений/окон, куда удобнее прокручивать их, если они не вмещаются в область видимости -- мне куда удобнее переключать приложения кликом мышки, а не запоминанием комбинаций клавиш клавиатуры, которые, причём, работают медленнее (лишние действия). А для переключения мышкой лучше, чтобы все были в области видимости. На винде 10 панель задач при переполнении просто добавляет вторую строку (или столбец в вертикальной панели на 8 винде), до которой просто прокруткой добраться нельзя, нужно кликать (лишние действия).

На убунте реализация, можно сказать, идеальная. А на винде постоянные свистопляски с "добавят-уберут". И насыплют вдобавок кучу багов. Если на винде 11 добавят возможность вертикальной панели, можно будет наконец обновиться с 10ки)

«Мы у конца экспоненты»: глава Anthropic — о пике развития ИИ и триллионных ставках

Altair2021 16 фев в 12:24

Вопрос не ко мне, а к автору исходного комментария)

Если говорить о человеке, то речь про вдохновение)

«Мы у конца экспоненты»: глава Anthropic — о пике развития ИИ и триллионных ставках

Altair2021 16 фев в 12:16

Полагаю, Вы пытались сгенерировать песню именно на русском языке? Если так, спешу огорчить: проблемы с русским наблюдаются даже у крупных llm (от дипсика до опенаи), не говоря уже про нишевые модели (т.е. используемые под капотом suno/riffusion). По‐моему, только модели антропика сейчас без огрехов в русском.

Проблема, как я понимаю, в дисбалансе тренировочных данных -- гигантский перекос в сторону английского. Теперь касаемо моделей генерации текста в suno/riffusion: про них известно почти ничего. Велика вероятность, что они куда меньше крупных llm, и куда вероятнее, что они были затьюнены под генерацию песен на английском (например, udio. Suno, наверняка, имеет более обширный датасет). Т.е. если тестировать на стихотворные произведения, то на английском.

Попробуйте claude (и лучше на английском) -- возможно, результат удивит в приятном смысле.