Comments / Profile of Altair2021 / Habr

Александр@Altair2021

Пользователь

ProfileArticlesPostsNewsComments83

DeepSeek V4, возможно, уже тестируется на OpenRouter — у стелс-модели 1 трлн параметров и 1M контекстное окно

Altair2021 Mar 19 at 06:49

Похоже, эта надпись появилась недавно, потому что на старте и несколько дней потом этого не было

И судя по всему, только сегодня, как на OR добавили новые mimo модели

Вышла GPT-5.4 — первая модель OpenAI, которая управляет компьютером

Altair2021 Mar 18 at 07:59

Интересно, какую роль Вы задали нейросетке, чтобы она так отвечала))

Как я перестал переключать раскладку ради одного символа: Прокачиваем русскую клавиатуру в Windows для Markdown и кода

Altair2021 Mar 18 at 07:00

Решил проверить Crtl+Shift -- у меня оное вообще не работает) Впрочем, я переключаю язык через win+space -- когда-то эта комбинация очень понравилась на убунте, с тех пор использую только её. Однако при переключении почти всегда появляется окно со списком языков -- и весь процесс порой тормозит. Тоже на всех виндах.

Altair2021 Mar 14 at 06:18

Кто-то сталкивался с тем, что переключение раскладки на винде временами начинает тормозить (на секунду-две)? При быстрой печати особенно заметно, потому что новое слово печатается с первым символом в предыдущей раскладке. Ужасно бесячая хрень на винде (в числе множества прочих)

«Хранилище Google переполнено»: Как очистить Gmail от мусора и обойти покупку подписки

Altair2021 Mar 13 at 07:34

Зайдите на сайт photos.google.com, перейдите в настройки, выберите «Копирование в облако» и отключите его.

Круто, нейросетки советуют то же семое, но такой опции просто нет. И никакх похожих.

Прорыв ИИ в науке: GPT-5.4 Pro (xhigh) поднял точность решений по физике на 233% за 4 месяца

Altair2021 Mar 12 at 19:51

В заголовках обычно пишут информацию компактно

Оно и видно, большинство заголовков:

вводят в заблуждение, или
хайп, или
кликбейт, или
вообще не связаны с темой статьи.

Конкретно Ваш заголовок можно отнести к категориям "хайп" и "вводит в заблуждение"

В заголовке имеется в виду, что поднялась точность не модели GPT-5.4 Pro или линейки GPT Pro, а вообще точность ИИ-моделей в физике

Ну так и в чем проблема конкретно это и указать? Зачем тогда вообще указывать gpt5.4, если "точность не модели GPT-5.4 Pro или линейки GPT Pro"? Это и есть введение в заблуждение. А "GPT-5.4 Pro" конкретно для хайпа.

Почему не сформулировать так:

Прорыв ИИ в науке за 4 месяца: точность решений по физике выросла на 233%
Прорыв ИИ в науке: точность решений по физике выросла на 233% за 4 месяца

Если уж прям невмоготу впихнуть GPT-5.4 Pro:

Прорыв ИИ в науке за 4 месяца: GPT-5.4 Pro показал на 233% лучший результат, чем Gemini 3 Pro Preview на бенчмарке по физике (куда более точно)
Прорыв ИИ в науке: GPT-5.4 Pro показал на 233% лучший результат на бенчмарке по физике, чем Gemini 3 Pro Preview четырехмесячной давности\4 месяца назад

Это те варианты, которые пришли сходу. Если покумекать чуть подольше, мб и еще что придумается.

«Хранилище Google переполнено»: Как очистить Gmail от мусора и обойти покупку подписки

Altair2021 Mar 11 at 14:54

Кто-нибудь в курсе, возможно ли отключить синхронизацию фоток с определенного смартфона напрямую в гугл акке, а не на самом смартфоне? Давал когда-то акк родственникам при каждой покупке смартфона -- теперь их фотки синхронизируются почти беспрерывно, отключить не могут/не умеют

Прорыв ИИ в науке: GPT-5.4 Pro (xhigh) поднял точность решений по физике на 233% за 4 месяца

Altair2021 Mar 9 at 23:33

Прорыв ИИ в науке: GPT-5.4 Pro (xhigh) поднял точность решений по физике на 233% за 4 месяца

Какая нейросетка вам заголовки сочиняет? По смыслу данного заголовка, gpt-5.4-pro-xhigh 4 месяца усердно трудился, чтобы поднять точность решений по физике на 233%. Что невозможно, так как модели отроду неделя.

Кроме того, почему выкинули gemini-3.1, которая более новая? Почему сравнивать с 3.0 4хмесячной давности? Чтобы циферки получше казались?

А также, в бенчмарке не видно gpt-5.2-pro, gpt-5-pro. С учётом цены Pro было бы логично привести предыдущие флагманы. Типа, логично, что Pro версия будет лучше обычной. А не для Pro прирост будет скромнее -- всего ~120% относительно модели 4хмесячной давности, и скромные 3% относительно gemini-3.1.

ИИ не может контролировать свои мысли — и это хорошая новость: OpenAI протестировали 13 моделей

Altair2021 Mar 6 at 07:14

А вот это очень сомнительно. Весь инет -- это да, но весь инет суть набор данных с примесью мусора. Как именно происходит предобработка этого набора данных (отбор именно хороших данных, а не мусора) для каждой модели -- вопрос открытый. Каждый создатель llm делает это по-своему, с нужными акцентами. Так что нельзя говорить, что обучающая выборка у всех одинакова.

ИИ не может контролировать свои мысли — и это хорошая новость: OpenAI протестировали 13 моделей

Altair2021 Mar 6 at 07:03

И таки это поведение заложено создателями модели (claude adaptive thinking) -- модель сама решает, нужно ли ей "думать" и сколько.

OpenAI выпустила GPT-5.4 — свою новую флагманскую модель

Altair2021 Mar 5 at 20:32

а представьте, какой будет список, когда выпустят deepseek v4 (или какой там следующий) ))

OpenAI представила новую модель GPT-5.4

Altair2021 Mar 5 at 20:31

а представьте, какой будет список, когда выпустят deepseek v4 (или какой там следующий) ))

Вышла GPT-5.4 — первая модель OpenAI, которая управляет компьютером

Altair2021 Mar 5 at 20:29

Нейронка не может знать, сколько человек ее используют) Тут скорее когда модель публикуют, она недотьюнена. И в первое время после выкатки разрабы докручивают характеристики (системный промпт, температуру и тп)

+13

GPT-5.4 получит режим экстремального рассуждения

Altair2021 Mar 4 at 19:35

типа сравнения двух таблиц с выводом номеров строк при обнаружении совпадений (по факту немного усложненное ВПР), ни одна не справилась нормально

использование LLM в данной задаче, в принципе, аналогично использованию их в качестве калькулятора -- то же самое забивание гвоздей микроскопом. Они под это в принципе не заточены. Если нужен какой-то детерминированный ответ/ответ на основе четкого алгоритма, то LLM не шибко подходят.

Пробовал консультироваться по импортной документации - пишут ерунду сразу, не понимают контекста сколько бы я не улучшал промт.

Тут довольно тонкая грань: если документация большая, она банально может не влезть в контекст LLM. А если влезет -- хорошо известна проблема падения понимания LLM с увеличением контекста.

GPT-5.4 получит режим экстремального рассуждения

Altair2021 Mar 4 at 19:22

gpt 5.2 уровни ризонинга:

Low
Medium
High
Extra high

++ Extreme high))

И в чем, интересно, разница между high/extra high/extreme high?)) И что потом? Ulta high? Extreme ultra high? Impossible high?

Geometry > Scale: Как 40М параметров на решетке E8 обходят классические трансформеры

Altair2021 Mar 2 at 14:00

Почему это работает?

Для такого короткого текста нужна llm'ка?

В последнее время триггерит с этих "why it works", когда вообще не "works"

BotHub vs OpenRouter: и в чем же всё таки разница?

Altair2021 Feb 27 at 17:57

Тоже Германия, не работает. Как я понимаю, гугл может опираться на то, где и когда был зарегистрирован акк. В том числе учитывает номер телефона.

BotHub vs OpenRouter: и в чем же всё таки разница?

Altair2021 Feb 27 at 15:25

Не показательно, только если не отключить у модели ризонинг. Иначе она может наризонить/нагаллюционировать на сотни-тысячи токенов. Кроме того, у разных моделей разные токенизаторы, и один и тот же текст может занимать разное количество токенов. Например, у клода токены мельче, чем у дипсика.

BotHub vs OpenRouter: и в чем же всё таки разница?

Altair2021 Feb 27 at 15:08

А можно примеры таких агрегаторов? Сам пользуюсь ботхабом около года по апи -- на момент выбора их условия были самыми выгодными. Доп рубль через апи не снимается (через апи чисто доступ к моделям, а в веб версии еще куча прибамбасов).

BotHub vs OpenRouter: и в чем же всё таки разница?

Altair2021 Feb 27 at 15:01

А по какому курсу конвертировали цену опенроутера в рубли?) Там, насколько я помню, все в долларах

1 2

4 5