Как стать автором
Обновить

Комментарии 12

Сегодня тоже думал. Google в своей gemini тоже несколько моделей предлагает. С разбегу не разберешь, какую использовать, а ведь какая то жрет больше процессорного времени, какая то меньше. Им же самим наверное не выгодно, если из пушки по воробьям.

Жаль, что от их "объяснений" понятнее не становится.

Вообще ощущение от всего этого зоопарка, как от "разных" процессоров в одной линейке: просто продукт искуственно разделён на немного разные. И пользователь, если не сраборало с одним, попробовал бы другие, потратил бы больше своего внимания. А потом, уже поиграв с сетками пару часов, ему жалко этого времени и он начинает считать результат "удовлетворительным"

С процессорами то очевидно. Они частотой и количеством ядер отличаются, которые напрямую влияют на производительность. Хх400 интел всегда будет слабее чем хх600 в рамках одного поколения.

А вот со 100% уверенностью сказать какая нейронка лучше уже не получится.

"слабее"? Что такое "слабее"? Насколько это скажется на работе браузера, старте ОС? Как в повседневной работе заметить это "слабину"?

Довольно странная полемика. Это всё равно что пытаться понять какой человек сильнее по тому как они поднимают пустой стакан.

Для того чтобы браузер тыкать мощный процессор не нужен. Просто желательно чтобы он был. И хотя-бы был выпущен после 2006 года.

Сравнивают производительность в реальных рабочих задачах. Вычисления какие-нибудь, поднятие докер контейнеров, скорость выполнения кода, Ну или в игрушках на крайний раз. Разница будет очевидна в цифрах. И видна будет скорее всего невооружённым глазом.

Нет, это всё равно, что понимать, какой стакан удобнее, поднимая его с привязанной гирей.

"Для того чтобы браузер тыкать мощный процессор не нужен. Просто желательно чтобы он был. И хотя-бы был выпущен после 2006 года."

Браузер тормозит. Объективно. И очень заметно. Эпоха, когда это было верно закончилась в 2010. Сейчас, если вы попробуете открыть гуглодоксы или gmail на проце 2006 года вас ждёт дивный новый мир.

Реальные рабочие задачи сейчас -цифры милисекунд задержки от получения клика до перерисовки экрана тоннами яваскриптов и тулкитов. Именно так я работаю, и решаю свои задачи. А вычисление, поднятие контейнеров - это происходит на сервере.

Они на самом деле отличаются. По крайне мере режимы простая, рассуждающая и исследования. Каждый имеет свои плюсы и минусы.

1) обычная - не плохо улавливает контекст, но плохо находит подкрепление написанному.

2) рассуждающая - легко теряет контекст, после ответа уже практически не возможно ссылаться на ранние сообщения диалога, даже если они были только что. Может вытащить что то из "памяти" (которую они сделали). Но лучше прорабатывает конкретный ответ.

3) исследование - хорошо собирает материалы по вопросу, но практически бесполезен в плане рассуждений и связей внутри них. Зато отлично анализирует множество источников исследований и даёт по ним выжимку и ссылки, что можно посмотреть. Из минусов: надо смотреть историю его исследования, там порой такой бред (может взять срач с какого то форума или же древние). Использую его как поисковик.

Проблема в том, что эти режимы практически не совместимы. После исследования, у меня часто перестают работать другие режимы. Не может порой обобщить или зависает.

В плане выбора самих моделей, то я увидел только разницу в стиле оформления ответа.

Поэтому самой частой практикой у меня является откатить ответ. Получил, учел, перегенерировал с другим сообщением.

В целом они все страдают удержанием контекста. Но продвинутые режимы, приводят к тому, что контекст прежних сообщений теряется ещё быстрее. И помогает только откат к старым для продолжение диалога с них.

Но надо отдать должное, тот же qween вообще несёт полную пургу. Гораздо хуже deepseek. Сегодня спрашивал про неокортекс, он путает слои 5 и 6, утверждает о наличии связей которых нет. При этом если спрашиваешь его, ты уверен? Пишешь правильно ему, просишь сказать есть ли ошибка. Он снова гнет свою линию. И лишь приведя ему исследования, он извиняется и корректирует свой ответ. Какой толк от такого бредо-генератора я не знаю. В том что он уверено несёт бред и даже просьба проверить свой ответ на основе исследований или перепроверить его не помогает и даже написание правильного.

Deepseek в этом плане гораздо лучше. Но из за того что они оптимизировали матрицы внимания, это явно проявляется в деталях. Например, в тех же слоя неокортекса, он может писать верно и в какой то момент одна галлюцинация и он уже перепутал слои мозга. Указываешь ему на ошибку и он забыл важный контекст в прежних сообщениях.

Но в целом у всех моделей проблемы с контекстом. Так как они берут только самые яркие детали. У того же ChatGPT обсуждали мозг человека, через несколько сообщений "человека" уже не важная деталь и он в ответе подсовывает редкий случай отличия мозга какого-нибудь редкого животного (у которого что то обнаружили по этой теме). И если сам не знаешь, то понять что "человек" уже не учитывается не сможешь. Все таки люди держат в голове в гиппокамп несколько контекстов сразу.

На практике: все подряд 4o, пока не упираюсь в откровенно плохой результат, тогда в зависимости от задачи переключаюсь в 4.5 или о3

Вот бы они еще точные лимиты для каждого тарифа указали сразу, а то каждый раз приходится искать.

Ни в личном Plus, ни в корпоративном Teams, не вижу у себя нигде o1-pro.

А вообще использую 4o для любых запросов, кроме кода. Для этого о3.

Ни в личном Plus, ни в корпоративном Teams, не вижу у себя нигде o1-pro

o1-pro доступна в Pro-подписке.

Кэп

А ведь и правда, спасибо

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости