Да, так и называем))
Да, так и называем))

Если верить презентациям, то каждый новый процессор становится быстрее предыдущего на 15-20%. Иногда на 25%. А в отдельных задачах, как говорят производители, и вовсе до 30%. Проблема только в том, что за этими цифрами обычно стоят либо конкретные конфигурации, либо совсем уж специфические сценарии использования. А реальный прирост производительности зависит от того, чем именно вы занимаетесь и как используете железо. Тем не менее ощущение, что современные CPU действительно стали другими, остается. Сегодня посмотрим, что по-настоящему изменилось в этой сфере за минувшие 5 лет.

Как изменились частоты процессоров за 5 лет

Начнем с самого базового значения, которое бросается в глаза первым делом. С частот. За прошедшие 5 лет они изменились не очень сильно. Да, рост был, но назвать его скачком все-таки нельзя. Если Intel Core i9-10900K выдавал 5.3 ГГц в режиме турбо-буст, то Intel Core i9-14900KS разгонялся до 6.2 ГГц. То есть прирост получается около 17%. Да, у Intel есть процессоры и поновее. Но тот же Core Ultra 9 285K на архитектуре Arrow Lake отметку выше 5.7 ГГц по умолчанию уже не берет. 

У AMD, кстати, картина похожая. Ryzen 9 3950X на архитектуре Zen 2 работал на частотах до 4.7 ГГц, а Ryzen 9 9950X на Zen 5 по умолчанию разгоняется до 5.7 ГГц. Здесь прирост получается чуть больше (в районе 21%), но только за счет более низкой изначальной планки, тогда как в абсолютных цифрах революции не случилось.

Но ведь очевидно, что фактическая производительность за эти годы выросла гораздо сильнее обозначенных выше значений. И это правда, за что спасибо нужно сказать IPC.

Рост производительности процессоров

Именно 12-е поколение процессоров Intel считается переходным
Именно 12-е поколение процессоров Intel считается переходным

Чтобы понять, откуда берутся эти дополнительные десятки процентов, достаточно посмотреть, как за 5 лет поменялось то, что лежит “под капотом”. У Intel самым заметным сдвигом стала линейка Alder Lake. Именно в этом поколении компания перешла на гибридную архитектуру, и производительные ядра Golden Cove получили:

  • более широкие конвейеры

  • увеличенные буферы микроопераций

  • переработанный фронтенд

  • более умный предсказатель ветвлений

По данным самой Intel, таким образом прирост IPC при переходе с 11-го на 12-е поколение процессоров составил около 19%. Raptor Cove в 13-м и 14-м поколениях добавила еще 2-3%. Lion Cove в Arrow Lake должна была принести еще 9%, хотя реальные тесты показали более скромные цифры.

AMD пошла своим путем. Поэтому в ее случае рост производительности случился за счет изменения не архитектуры ядер, а архитектуры кэша. Оно заключалось в том, что теперь вместо двух отдельных пулов L3 по 16 МБ на четыре ядра стали использовать один общий пул объемом 32 МБ на все восемь ядер в чиплете. Из-за этого номинальная латентность отдельных операций внутри L3 выросла (условно с ~39 до ~46 тактов), но ядра стали реже обращаться к «чужому» кэшу или памяти, так что в итоге прирост производительности получился вполне реальным.

То есть и в том, и в другом случае за пять лет суммарный прирост IPC составил около 30-35%, если верить бенчмаркам. А вместе с увеличением частот это и дало +40-50% производительности в однопоточных задачах, которые фиксирует синтетика.

Вот только бесконечно эксплуатировать тот подход оказалось невозможно. Потому что каждое следующее улучшение архитектуры дается все труднее:

  • Расширять конвейер можно только до определенного предела, а дальше начинаются проблемы с предсказанием ветвлений и штрафами за промахи.

  • Увеличивать буферы бесконечно тоже нельзя, так как они занимают место на кристалле и дают плюс к латентности.

  • Изменение архитектуры кэша уже дало прирост, и выжать из этого что-то не так-то просто.

В результате в какой-то момент производители упираются в стену, когда следующий процент производительности требует слишком больших усилий, ну и денег, конечно. И тогда приходится искать другие пути.

Как вырос кэш процессоров и что дает 3D V-Cache

Помимо архитектуры кэш-памяти, ставку на изменение которой сделали в AMD, произошло и ее увеличение. Это хорошо видно, если сравнить спецификации процессоров разных поколений. Если у Intel Core 10-го поколения объем L2 на ядро составлял всего 256 КБ, то у Arrow Lake на производительное ядро стало уже 3 МБ. Рост в 12 раз. У Ryzen L2 за то же время вырос не так драматично: всего вдвое, с 512 КБ до 1 МБ. Но зато AMD порадовала фанатов кое-чем другим. А именно – технологией 3D V-Cache, которая изменила представление о том, сколько кэша вообще нужно процессору.

Да, 32 МБ L3 в процессорах Ryzen 7000 – это вполне себе солидный объем. Но AMD решила, что рынку нужно больше и в 2022 году выпустила Ryzen 7 5800X3D с технологией 3D V-Cache. Компания у��удрилась расположить дополнительный слой в 64 МБ поверх основного кристалла процессора и получила на выходе 96 МБ. Это дало невероятные результаты. В некоторых играх прирост производительности составил 15-20% при той же архитектуре ядер, тех же частотах и том же техпроцессе. И это только за счет кэша.

В Ryzen 9 7950X3D разработчики решили закрепить результат. В новом процессоре один из двух CCD получил дополнительные 64 МБ кэша, а второй – остался с базовыми 32 МБ. Как итог – 128 МБ. Безумные цифры, если вдуматься. По данным Tom's Hardware, в среднем по 25 играм это дало прирост относительно обычного Ryzen 9 7950X в районе 26%. Правда, такие показатели удалось получить не везде. В Far Cry 6, например, разница оказалась всего 7%, зато в Microsoft Flight Simulator достигала 53%. 

Почему нельзя было сделать еще больше кэша, нарастив дополнительный слой и на втором чиплете? Да потому что 3D V-Cache способствует большему нагреву. Поэтому ему просто взяли и обрезали частоту. А чтобы процессор покупали не только для игр, второму CCD частоту дали максимальную, но уже без дополнительного слоя кэша. Компромисс, а куда деваться?

Наслоение кэша дало свои результаты
Наслоение кэша дало свои результаты

Но, как говорится, чем бы дитя ни тешилось, лишь бы производительность росла.

Вот где большой кэш дает реально ощутимый прирост:

  • Игры с открытыми мирами и большим количеством ассетов

  • Компиляция крупных проектов — парсинг тысяч исходных файлов, построение дерева зависимостей, оптимизация кода

  • Работа с большими базами данных (индексы, промежуточные результаты сложных запросов, кэширование часто используемых данных)

  • Рендеринг и трассировка лучей

  • Научные вычисления с большими массивами данных (симуляции, обработка изображений, анализ данных)

Само собой, для обычных офисных задач вроде набора текста или работы с электронными таблицами 3D V-Cache практически ничего не даст. Слишком невелик объем одновременно обрабатываемых данных. Но в играх и сложных профессиональных проектах дополнительный слой кэша точно даст положительный результат.

Гибридная архитектура процессоров: E- и P-ядра

Нельзя сказать, что эксперименты с кэшем – это исключительная вотчина AMD. Intel действительно не проводила опытов с 3D V-Cache, просто основную ставку на гибридную архитектуру. Это та же концепция, что до этого использовалась в мобильных чипах. Ее суть – в использовании сразу двух типов ядер: производительных для тяжелых задач и энергоэффективных для фоновой работы. 

Ключевую роль здесь сыграл Intel Thread Director — аппаратный блок прямо в процессоре, который непрерывно отслеживает каждый поток с точностью до наносекунд. Он смотрит, какие инструкции поток использует, и на основе этого подсказывает операционной системе, что вот этот процесс надо отдать P-ядру, а этот можно оставить за E-ядром. При этом все может и поменяться. Один и тот же поток может стартовать на производительном ядре, а потом перейти на энергоэффективное.

Но все бывает идеально только в теории. На практике же вылезла одна неприятная штука. Оказалось, что E-ядра в Alder Lake и Raptor Lake совсем не умеют в AVX-512. А Intel, не будь дурой, взяла да и отключила эти инструкции для всего процессора целиком, даже несмотря на то что P-ядра их исправно поддерживали.

Первое время способы вернуть AVX-512 были. Например, через отключение E-ядер в BIOS, но через какое-то время Intel закрыла эту лазейку, а в 2022 году окончательно заблокировала инструкции через fuse. Поэтому для тех, кому их присутствие было важно, были вынуждены либо вернуться на 11-е поколение, что весьма сомнительно, либо рассмотреть переход на AMD.

Тем более, что подобие гибридной архитектуры предлагают и чипы Ryzen. Хоть и с нюансами. Технически все ядра тут одинаковые, а для разделения используется технология CPPC2, которая отмечает те ядра, что удачнее получились на производстве и лучше разгоняются.

Внутренний биннинг – это не так уж и плохо. Скорее даже хорошо
Внутренний биннинг – это не так уж и плохо. Скорее даже хорошо

То есть по факту это всего-навсего биннинг, просто на более низовом уровне. Поэтому, с одной стороны, у планировщика просто не возникает ситуаций, когда поток внезапно улетает на архитектурно слабое ядро. А с другой – в фоновых сценариях Ryzen все равно потребляет больше энергии, чем мог бы, если бы архитектура была по-настоящему гибридной.

Все-таки разница в энергопотреблении между типами ядер существенная. В типичных тяжелых нагрузках одно P-ядро может потреблять в разы больше, чем E-ядро. В фоновых сценариях — браузер, мессенджер, пара офисных программ — почти все висит на E-ядрах, а P-ядра простаивают или работают на минимальных частотах.

Многопоточность в 2020 vs 2025: ядер больше, выгоды не всегда

Пять лет назад флагманский десктопный процессор имел 10 ядер у Intel и 16 у AMD. Сейчас Intel Core Ultra 9 285K предлагает 24 ядра (8P+16E), а AMD Ryzen 9 9950X по-прежнему 16. То есть на бумаге Intel вырвалась вперед по количеству.​

Но есть нюанс. E-ядра у Intel архитектурно слабее P-ядер. Они, как мы упоминали выше, не умеют в AVX-512, имеют меньше кэша и работают на более низких частотах. В многопотоке конфигурация 8P+16E дает примерно столько же производительности, сколько 14–16 полноценных больших ядер. То есть прирост есть, но он не двукратный.​

Проще говоря, в хорошо распараллеливаемых задачах 8P+16E по суммарной производительности действительно тянут на 14–16 «полноценных» ядер. Но в сценариях с сильной связностью между потоками все упирается в латентность между кластерами и разные характеристики ядер. 

У AMD все 16 ядер одинаковые и полнофункциональные. Поэтому в задачах, которые хорошо масштабируются на много потоков тот же Ryzen 9 9950X часто оказывается или быстрее, или как минимум не хуже Intel, несмотря на меньшее количество ядер.

Для тех, кто выбирает процессор, это означает одно: просто смотреть на количество ядер больше не работает. Нужно понимать, какие это ядра, как они работают и под какие задачи заточены.

Энергопотребление процессоров: рост вместе с производительностью

С энергопотреблением ситуация еще более неоднозначная и зависит от сегмента. Но топовые процессоры как потребляли огромное количество энергии, так потребляют и до сих пор. 

Вот как это выглядит с разбивкой по поколениям:

Процессор

Год

Ядра

Заявленный TDP

Реальное потребление

Особенности

Intel Core i9-10900K

2020

10

125 Вт

До 250 Вт

Базовая архитектура без гибрида

Intel Core i9-14900K

2023

24 (8P+16E)

125 Вт

До 253 Вт (PL2)

Гибридная архитектура

Intel Core Ultra 9 285K

2024

24 (8P+16E)

125 Вт

До 250 Вт

Arrow Lake, без AVX-512

Intel Core i9-14900KS

2024

24 (8P+16E)

150 Вт

До 409 Вт

Разгон до 6,2 ГГц

AMD Ryzen 9 3950X

2020

16

105 Вт

До 142 Вт

Zen 2, все ядра одинаковые

AMD Ryzen 9 7950X

2022

16

170 Вт

До 230 Вт

Zen 4, все ядра одинаковые

AMD Ryzen 9 7950X3D 

2023

16

120 Вт

До 200 Вт

3D V-Cache снижает потребление

AMD Ryzen 9 9950X

2024

16

170 Вт

До 230 Вт

Zen 5

Из таблицы видно, что за 5 лет ситуация с потреблением – если не считать единичные эксперименты производителей типа Intel Core i9-14900KS – по верхней планке особо не поменялась. Плохо ли это? Да, в общем, нет. Просто производители сделали ставку не на снижение абсолютного энергопотребления, а на рост производительности при тех же значениях.

Например, базовый Intel Core Ultra 9 285K имеет 24 ядра (8P+16E) против 10 у 10900K и может показывать кратный прирост в тяжелых многопоточных задачах вроде рендера и компиляции. В общем, производительность на ватт все-таки выросла, просто дополнительная эффективность была использована для увеличения абсолютной производительности, а не для снижения потребления.

У AMD история другая: Ryzen 9 9950X при тех же 230 Вт обгоняет Ryzen 9 3950X на 71%, хотя количество ядер осталось тем же, а TDP вырос с 105 Вт до 170 Вт. Но и отдача с каждого ватта тоже выросла, а это важно. Зато 7950X3D – это тот редкий случай, когда производителю удалось одновременно поднять производительность в играх и снизить энергопотребление. 

В итоге получается, что прогресс по энергоэффективности есть. Но в десктопах его направили в производительность, а в ноутбуках — в автономность. Разные сегменты, разные приоритеты.

Новые инструкции и специализированные блоки процессоров

Не AVX-512 единым, как говорится
Не AVX-512 единым, как говорится

Несмотря на то что процессоры Intel лишились поддержки AVX-512, за прошедшие 5 лет и они, и процессоры Ryzen получили множество новых инструкций и встроенных ускорителей для специализированных задач. Те, кто просто сидит в браузере, их появление вряд ли заметят. Но для профессиональных задач некоторые нововведения могут быть реально критичны.

Вот что добавилось за последнее время:

  • AVX-VNNI-INT16 в Arrow Lake — инструкции под инференс нейросетей.

  • SHA512, SM3, SM4 — аппаратные ускорители криптографии. 

  • NPU (Neural Processing Unit) — Intel встроила их в Meteor Lake и Arrow Lake, AMD добавила в Ryzen AI. Это отдельные блоки под нейросетевые вычисления, которые потребляют в разы меньше энергии, чем CPU или встроенная графика.

  • AES-XTS — ускорение шифрования дисков. Актуально для BitLocker и других систем полнодискового шифрования.

Несмотря на то что далеко не все профессионалы работают с ИИ, NPU несут пользу даже для бытовых, казалось бы, задач. Шумоподавление в Zoom, автообработка фото, распознавание речи, генерация субтитров в реальном времени — все это можно скинуть на NPU и разгрузить основные ядра. В ноутбуках такая возможность дает заметный прирост автономности, особенно когда в фоне работают сразу несколько процессов с AI. В десктопах эффект будет скромнее, но будет. Главное – чтобы сам софт поддерживал работу с NPU. 

Техпроцессы: меньше нанометров, больше транзисторов

Ну, и вишенка на торте – техпроцесс. Пожалуй, самый неоднозначный показатель из тех, на которые вообще можно ориентироваться. Хотя сами производители делают на него очень большую ставку.

За эти годы Intel прошла путь от 14 нм до тайловых конструкций на базе TSMC, AMD — от 7 нм до N4. Правда, как видно из актуальных обозначений, эти цифры давно превратились в маркетинговые обещания, а не реальные размеры элементов. Потому что даже N4 – это никакие не 4 нм, а всего-навсего улучшенные 5 с оптимизированными библиотеками и более плотной упаковкой. Хотя, конечно, какой-то результат за этими цифрами все же есть: а именно рост плотности транзисторов на кристалле.

Например, Core Ultra 9 285K использует тайловую компоновку: вычислительный блок производится на TSMC N3B, GPU — на N5P, а блоки SoC и IO — на N6. Зачем такая мозаика? Потому что производить все на N3B безумно дорого, а для IO-блоков это вообще бессмысленно — там плотность не критична. В итоге получается конструктор, в котором каждый кусок делается на оптимальном для него узле, а Intel собирает все воедино уже на финальной стадии.

У AMD подход похожий, но не совсем такой же. Ryzen 9 9950X использует два CPU-чиплета на TSMC N4 и отдельный IO-die на N6. Вычислительные ядра — самое дорогое и плотное, поэтому их делают на передовом узле. А IO-die с контроллерами памяти, PCIe и прочей периферией спокойно живет на более старом и дешевом N6. Главное, что дает этот подход, – гибкость: один и тот же CCD можно воткнуть в младшую модель с одним чиплетом или в топовую с двумя. Меняется только IO-die и компоновка.

Что все это дает на практике:

  • Паразитная емкость затворов снизилась, а значит, каждое переключение транзистора требует меньше энергии

  • Токи утечки упали, и процессор в простое стал потреблять в разы меньше

  • Межсоединения между блоками стали короче, из-за чего задержки сократились, можно поднять частоты без роста латентности

  • Появилось backside power delivery: подача питания через обратную сторону кристалла, что помогает держать температурные градиенты под контролем

Именно это, кстати, позволило Intel впихнуть в Core Ultra 9 285K те самые 24 ядра при том же тепловом пакете 250 Вт, что у десятиядерного 10900K, а AMD – поднять частоты Ryzen 9 9950X до 5,7 ГГц на N4 при TDP 170 Вт.

Что изменилось в процессорах: главное

Процессоры за последние пять лет действительно стали быстрее. Но не за счет какого-то одного прорыва, а благодаря комбинации улучшений. Вот что реально изменилось:

  • Частоты выросли на 15-20%, но это не главное. IPC вырос на 30–35% благодаря более широким конвейерам, улучшенным предсказателям ветвлений и переработанному фронтенду. Суммарно однопоточная производительность выросла на 40–50% у обоих производителей.

  • L2 на ядро вырос с 256 КБ до 3 МБ у Intel — в 12 раз. L3 вырос с 32 МБ до 96–128 МБ у процессоров с 3D V-Cache. В играх и профессиональных задачах это дает прирост до 20–25%.​

  • Intel перешла на гибридную архитектуру: 24 ядра (8P+16E) против 10 ядер пять лет назад. AMD оставила 16 одинаковых ядер, но улучшила их архитектуру. В многопотоке прирост производительности может достигать 200% у Intel и 71%+ у AMD.​

  • Десктопы остались на 200–250 Вт, но делают в 1,7–3 раза больше работы. Ноутбуки при той же производительности потребляют в 2–3 раза меньше энергии. Автономность выросла с 6–8 часов до 15–20 часов в офисных задачах.​

  • Плотность транзисторов выросла в несколько раз. Это позволило упаковать больше ядер и кэша при том же тепловом пакете. Закон Мура замедлился: каждый новый шаг дает 20–30% вместо прежних двукратных приростов.​

  • Появились NPU для нейросетевых вычислений, аппаратные ускорители криптографии (SHA512, SM3, SM4, AES-XTS), новые инструкции AVX-VNNI-INT16 для AI-задач. Все это работает только в софте, который явно их поддерживает.​

Если пять лет назад выбор процессора был относительно простым — бери больше ядер и выше частоту, и будешь счастлив — то сейчас всё сложнее. Приходится смотреть на тип ядер (P или E, и сколько каких), объём кэша и его архитектуру, наличие 3D V-Cache, поддержку специализированных инструкций вроде AVX-512 или NPU, а ещё думать, под какие именно задачи берёшь железо. Универсального решения больше нет. Зато есть процессоры под конкретные задачи — для игр одно, для рендера другое, для компиляции третье. И это, пожалуй, главное изменение за последние годы.