Комментарии 19
Сегодня тоже думал. Google в своей gemini тоже несколько моделей предлагает. С разбегу не разберешь, какую использовать, а ведь какая то жрет больше процессорного времени, какая то меньше. Им же самим наверное не выгодно, если из пушки по воробьям.
Жаль, что от их "объяснений" понятнее не становится.
Вообще ощущение от всего этого зоопарка, как от "разных" процессоров в одной линейке: просто продукт искуственно разделён на немного разные. И пользователь, если не сраборало с одним, попробовал бы другие, потратил бы больше своего внимания. А потом, уже поиграв с сетками пару часов, ему жалко этого времени и он начинает считать результат "удовлетворительным"
С процессорами то очевидно. Они частотой и количеством ядер отличаются, которые напрямую влияют на производительность. Хх400 интел всегда будет слабее чем хх600 в рамках одного поколения.
А вот со 100% уверенностью сказать какая нейронка лучше уже не получится.
"слабее"? Что такое "слабее"? Насколько это скажется на работе браузера, старте ОС? Как в повседневной работе заметить это "слабину"?
Довольно странная полемика. Это всё равно что пытаться понять какой человек сильнее по тому как они поднимают пустой стакан.
Для того чтобы браузер тыкать мощный процессор не нужен. Просто желательно чтобы он был. И хотя-бы был выпущен после 2006 года.
Сравнивают производительность в реальных рабочих задачах. Вычисления какие-нибудь, поднятие докер контейнеров, скорость выполнения кода, Ну или в игрушках на крайний раз. Разница будет очевидна в цифрах. И видна будет скорее всего невооружённым глазом.
Нет, это всё равно, что понимать, какой стакан удобнее, поднимая его с привязанной гирей.
"Для того чтобы браузер тыкать мощный процессор не нужен. Просто желательно чтобы он был. И хотя-бы был выпущен после 2006 года."
Браузер тормозит. Объективно. И очень заметно. Эпоха, когда это было верно закончилась в 2010. Сейчас, если вы попробуете открыть гуглодоксы или gmail на проце 2006 года вас ждёт дивный новый мир.
Реальные рабочие задачи сейчас -цифры милисекунд задержки от получения клика до перерисовки экрана тоннами яваскриптов и тулкитов. Именно так я работаю, и решаю свои задачи. А вычисление, поднятие контейнеров - это происходит на сервере.
Ну может быть. В любом случае, это вполне себе измеримые величины и чем отличаются процессоры более чем понятно.
Нейронки измеряются только синтетическими тестами от самих OpenAI, в реальных задачах от кейса к кейсу результат будет сильно отличаться.
Мой поинт в том ,что лет 20 назад процессоры отличались. Это было заметно и не требовало синтетических тестов и тонких измерений. Сейчас, чтобы отличить xx600 и xx600k надо вот прямо вот долго и тщательно изучать тесты и их разновидности.
А с выходом новых уязвимостей и, соответственно, фиксов, эти езультаты ещё и не стабильны во времени. Как и с нейронками.
Всё ещё не понимаю ваш поинт. Процы как раз таки сильно отличаются. K линейка - специализированы под разгон, для тех кто знает что это и умеет в него. В стоке у него разница с обычным процом действительно будет невелика, но это не вина процессора.
F - без встроенного ГП. T - с низким энергопотреблением (соответственно и производительностью). KF - без ГП, под разгон.
Там этих букв на пол алфавита, но для массового маркета это самые основные. И тут не та же проблема что с ИИ, ибо зная что означают маркировки можно достоверно понимать какой процессор берёшь и как он будет себя вести относительно других процов того же поколения. Разделение не искусственное, а самое что ни на есть аппаратное.
Маркировки ОпенИИ не дают никакого измеримого понимания что там под капотом продают, может это всё файн-тюн одной модели, которую впихивают как разные.
Вот тут ваш ответ настолько похож на ответ маркетологов про нейросети, что просто диву даюсь.
Какая мне разница, для чего в интеле "специализировали" процессор, мне нужно, чтобы меньше тормозил ватсап и гугл документы при 20 открытых вкладках.
Также и маркировка от ОпенИИ не подскажет, какой агент мне лучше для корректирования научной статьи.
Чего? Тут вы объективно не правы. Есть разница между тем когда просто не разбираешься, при этом не хочешь разбираться в какой-то теме и когда пытаешься разобраться, но не имеешь открытых данных, либо эти данные друг другу противоречат.
Если надо чтобы гугл не тормозил - берите 12400 какой-нибудь и не заморачивайтесь. Я не знаю, вы с Эпл пришли или что? Никогда не слышал чтобы кто-то прям подбирал процессор под открытие вкладок в гугле. Там не в процессор, а в ОЗУ всё обычно упирается.
Как я сказал - специализированные процессоры они на то и есть специализированные, что тем кто не знает чего ищет туда лезть не зачем. А мне, например, как компьютерному энтузиасту более чем очевидно что я получу и при какой маркировке. Не один ПК собрал.
Есть разница между тем, когда классификация продуктов для конечного пользователя помогает выбору или мешает.
Судя по тому, что вы в 2025 году советуете в пользовательском сегменте intel, я как-то сомневаюсь в вашем энтузиазме.
Просто если вам классификация интела сложна, то с райзенов вообще глаза на лоб полезут)
Тем более советовать что-то серьёзное под скролл браузера просто смешно. Тут подойдёт что угодно исходя из возможностей материнки, просто интел в бюджетном сегменте самый распространённый, поэтому сказал про него.
Получается вы и сами в процах что-то да понимаете, тогда тем более непонятна претензия к классификации.
В любом случае, ваши комментарии потеряли всякий конструктив и сливаются куда-то в сторону перехода на личности. Предлагаю на этом закончить.
Они на самом деле отличаются. По крайне мере режимы простая, рассуждающая и исследования. Каждый имеет свои плюсы и минусы.
1) обычная - не плохо улавливает контекст, но плохо находит подкрепление написанному.
2) рассуждающая - легко теряет контекст, после ответа уже практически не возможно ссылаться на ранние сообщения диалога, даже если они были только что. Может вытащить что то из "памяти" (которую они сделали). Но лучше прорабатывает конкретный ответ.
3) исследование - хорошо собирает материалы по вопросу, но практически бесполезен в плане рассуждений и связей внутри них. Зато отлично анализирует множество источников исследований и даёт по ним выжимку и ссылки, что можно посмотреть. Из минусов: надо смотреть историю его исследования, там порой такой бред (может взять срач с какого то форума или же древние). Использую его как поисковик.
Проблема в том, что эти режимы практически не совместимы. После исследования, у меня часто перестают работать другие режимы. Не может порой обобщить или зависает.
В плане выбора самих моделей, то я увидел только разницу в стиле оформления ответа.
Поэтому самой частой практикой у меня является откатить ответ. Получил, учел, перегенерировал с другим сообщением.
В целом они все страдают удержанием контекста. Но продвинутые режимы, приводят к тому, что контекст прежних сообщений теряется ещё быстрее. И помогает только откат к старым для продолжение диалога с них.
Но надо отдать должное, тот же qween вообще несёт полную пургу. Гораздо хуже deepseek. Сегодня спрашивал про неокортекс, он путает слои 5 и 6, утверждает о наличии связей которых нет. При этом если спрашиваешь его, ты уверен? Пишешь правильно ему, просишь сказать есть ли ошибка. Он снова гнет свою линию. И лишь приведя ему исследования, он извиняется и корректирует свой ответ. Какой толк от такого бредо-генератора я не знаю. В том что он уверено несёт бред и даже просьба проверить свой ответ на основе исследований или перепроверить его не помогает и даже написание правильного.
Deepseek в этом плане гораздо лучше. Но из за того что они оптимизировали матрицы внимания, это явно проявляется в деталях. Например, в тех же слоя неокортекса, он может писать верно и в какой то момент одна галлюцинация и он уже перепутал слои мозга. Указываешь ему на ошибку и он забыл важный контекст в прежних сообщениях.
Но в целом у всех моделей проблемы с контекстом. Так как они берут только самые яркие детали. У того же ChatGPT обсуждали мозг человека, через несколько сообщений "человека" уже не важная деталь и он в ответе подсовывает редкий случай отличия мозга какого-нибудь редкого животного (у которого что то обнаружили по этой теме). И если сам не знаешь, то понять что "человек" уже не учитывается не сможешь. Все таки люди держат в голове в гиппокамп несколько контекстов сразу.
На практике: все подряд 4o, пока не упираюсь в откровенно плохой результат, тогда в зависимости от задачи переключаюсь в 4.5 или о3
Вот бы они еще точные лимиты для каждого тарифа указали сразу, а то каждый раз приходится искать.
Ни в личном Plus, ни в корпоративном Teams, не вижу у себя нигде o1-pro.
А вообще использую 4o для любых запросов, кроме кода. Для этого о3.
OpenAI объяснила, как выбрать подходящую модель ChatGPT