Intel подробно рассказывает о Granite Rapids и Sierra Forest Xeon

Intel подробно рассказывает о Granite Rapids и Sierra Forest Xeon

На этой неделе проходит ежегодная конференция Hot Chips, на которой присутствуют многие крупнейшие в отрасли фирмы-разработчики микросхем, рассказывающие о своих последних и/или будущих продуктах. Для Intel это последний случай, поскольку компания находится на Hot Chips, чтобы рассказать о своих процессорах Xeon следующего поколения, Granite Rapids и Sierra Forest, выпуск которых запланирован на 2024 год. Intel ранее раскрывала эти процессоры в своих данных. Дорожная карта центра – последний раз обновлялась в марте этого года – а для Hot Chips компания предлагает немного больше технических подробностей для чипов и их общей платформы.

Хотя для процессоров Intel Xeon не существует такого понятия, как «неважное» поколение, Granite Rapids и Sierra Forest обещают стать одними из самых важных обновлений Intel в аппаратной экосистеме Xeon Scalable благодаря внедрению E-ядер с эффективным использованием площади. Уже является основой потребительских процессоров Intel с 12 года.й Core (Alder Lake) с грядущей масштабируемой платформой Xeon следующего поколения наконец-то перенесет E-ядра на серверную платформу Intel. Хотя в отличие от потребительских компонентов, где оба типа ядер смешаны в одном чипе, Intel придерживается чисто однородной стратегии, предоставляя нам все ядра Granite Rapids с P-ядерами и Sierra Forest только с ядрами E.

Sierra Forest — первый масштабируемый чип Intel Xeon Scalable с E-core для использования в центрах обработки данных, возможно, самый важный из двух чипов. Соответственно, это ведущий продукт Intel для их технологического узла Intel 3 на базе EUV, и это первый выпущенный процессор Xeon. По словам компании, выпуск запланирован на первое полугодие 2024 года. Между тем, Granite Rapids «вскоре» будет позади этого, на том же технологическом узле Intel 3.

Поскольку Intel планирует выпустить два довольно разных процессора Xeon в одном поколении, важным элементом платформы Xeon Scalable следующего поколения является то, что оба процессора будут использовать одну и ту же платформу. Это означает тот же сокет(ы), ту же память, ту же философию проектирования на основе чиплетов, одну и ту же прошивку и т. д. Несмотря на то, что различия все еще существуют, особенно когда речь идет о поддержке AVX-512, Intel пытается сделать эти чипы максимально взаимозаменяемы.

Как было объявлено Intel еще в 2022 году, и Granite, и Sierra представляют собой конструкции на основе чиплетов, основанные на сочетании вычислительных микросхем и чиплетов ввода-вывода, объединенных вместе с использованием технологии активного моста Intel EMIB. Хотя это не первый танец Intel с чипсетами в пространстве Xeon (эту честь удостаивается XCC Sapphire Rapids), это явная эволюция конструкции чиплетов за счет использования отдельных вычислительных чиплетов/чипсетов ввода-вывода вместо объединения в противном случае «полных» чиплетов Xeon. Помимо прочего, это означает, что Granite и Sierra могут использовать общий чиплет ввода-вывода (построенный на базе процесса Intel 7), и с точки зрения производства вопрос о том, является ли Xeon Granite или Sierra, «всего лишь» зависит от типа процессора. вычислительный чиплет расположен внизу.

Примечательно, что Intel впервые подтверждает, что масштабируемая платформа Xeon следующего поколения получит возможности самозагрузки, что делает ее настоящей SoC. Поскольку Intel размещает все необходимые функции ввода-вывода, необходимые для работы, внутри чиплетов ввода-вывода, для работы этих процессоров не требуется внешний набор микросхем (или FPGA). Это приближает линейку Intel Xeon по функциональности к линейке AMD EPYC, которая уже некоторое время загружается аналогичным образом.

В целом масштабируемая платформа Xeon следующего поколения будет поддерживать до 12 каналов памяти, масштабируясь в зависимости от количества и возможностей имеющихся вычислительных кристаллов. Как ранее сообщала Intel, эта платформа будет первой, которая будет поддерживать новый модуль DIMM мультиплексора комбинированного ранга (MCR), который по сути объединяет два набора/ранга микросхем памяти, чтобы удвоить эффективную пропускную способность входящего и исходящего от модуля DIMM. Intel заявляет, что благодаря сочетанию более высоких скоростей шины памяти и большего количества каналов памяти платформа может предложить в 2,8 раза большую пропускную способность, чем нынешние Sapphire Rapids Xeon.

Что касается ввода-вывода, Xeon в максимальной конфигурации сможет предложить до 136 линий общего ввода-вывода, а также до 6 каналов UPI (всего 144 полосы) для подключения к нескольким сокетам. Что касается ввода-вывода, платформа поддерживает PCIe 5.0 (почему нет PCIe 6.0? Нам сказали, что время не подошло), а также новый стандарт CXL 2.0. Как это традиционно бывает с процессорами Intel Xeon с большим ядром, чипы Granite Rapids смогут масштабироваться в общей сложности до 8 сокетов. С другой стороны, Sierra Forest сможет масштабироваться только до двух сокетов из-за количества задействованных ядер ЦП, а также различных вариантов использования, которые Intel ожидает от своих клиентов.

Наряду с подробностями об общей платформе, Intel также впервые предлагает общий обзор архитектур, используемых для ядер E и P. Как и в случае со многими поколениями Xeon, Intel использует ту же базовую архитектуру ЦП, которая используется в их потребительских компонентах. Таким образом, Granite и Sierra можно рассматривать как деконструированный процессор Meteor Lake, где Granite получит P-ядра Redwood Cove, а Sierra получит E-Cores Crestmont.

Как отмечалось ранее, это первая попытка Intel предложить E-ядра на рынке Xeon. Для Intel это означало настройку конструкции E-core для рабочих нагрузок центров обработки данных, в отличие от рабочих нагрузок, ориентированных на потребителя, которые определяли конструкцию E-core предыдущего поколения.

Не углубляясь в саму архитектуру, Intel сообщает, что Crestmont предлагает путь декодирования инструкций с шестью модулями, а также бэкэнд с выходом на пенсию из восьми. Хотя ядро ​​E не такое мощное, как P-ядра Intel, оно ни в коем случае не является легким ядром, и проектные решения Intel отражают это. Тем не менее, он спроектирован так, чтобы быть гораздо более эффективным как с точки зрения занимаемого кристалла, так и с точки зрения энергопотребления, чем ядра P, которые войдут в Granite.

Кэш инструкций L1 (I-кэш) для Crestmont будет иметь размер 64 КБ, такой же размер, как и в Gracemont. Между тем, что является новым для линейки E-core от Crestmont, ядра могут быть упакованы в 2- или 4-ядерные кластеры, в отличие от сегодняшнего Gracemont, который доступен только в виде 4-ядерного кластера. По сути, именно так Intel собирается регулировать соотношение кэша L2 и ядер ЦП; с 4 МБ общего L2 независимо от конфигурации двухъядерный кластер предоставляет каждому ядру вдвое больше L2 на ядро, чем в противном случае. По сути, это дает Intel еще один рычаг для регулировки производительности чипа; клиенты, которым нужна немного более производительная конструкция Sierra (а не просто максимальное количество ядер ЦП), могут вместо этого получить меньше ядер с более высокой производительностью, обеспечиваемой фактически более крупным кэшем L2.

И, наконец, для Sierra/Crestmont чип будет максимально приближен к паритету команд с Granite Rapids. Это означает поддержку типа данных BF16, а также поддержку различных наборов инструкций, таких как AVX-IFMA и AVX-DOT-PROD-INT8. Единственное, чего вы здесь не найдете, кроме матричного движка AMX, — это поддержки AVX-512; Сверхширокий векторный формат Intel не входит в набор функций Crestmont. В конечном счете, AVX10 поможет решить эту проблему, но на данный момент это настолько близко, насколько Intel может достичь паритета между двумя процессорами.

Между тем, для Granite Rapids у нас есть P-ядро Redwood Cove. Традиционное сердце процессора Xeon, Redwood/Granite, не является таким большим изменением для Intel, как Sierra Forest. Но это не значит, что они сидят сложа руки.

Что касается микроархитектуры, Redwood Cove получает тот же I-кэш объемом 64 КБ, который мы видели на Crestmont, который, в отличие от E-ядер, в два раза превышает емкость своего предшественника. Intel редко касается емкости I-кэша (из-за баланса между частотой попаданий и задержкой), так что это заметное изменение, и будет интересно увидеть последствия, когда Intel подробнее расскажет об архитектуре.

Но самое главное здесь то, что Intel удалось еще больше сократить задержку умножения с плавающей запятой, сократив ее с 4/5 тактов до всего лишь 3 тактов. Подобные фундаментальные улучшения задержки инструкций встречаются редко, поэтому их всегда можно увидеть.

В остальном, оставшимися особенностями микроархитектуры Redwood Cove являются прогнозирование ветвей и предварительная выборка, которые являются типичными целями оптимизации для Intel. Все, что они могут сделать для улучшения прогнозирования ветвлений (и снижения стоимости редких промахов), обычно приносит относительно большие дивиденды с точки зрения производительности.

Матричный движок AMX для Redwood Cove, более применимый, в частности, к семейству Xeon, получает поддержку FP16. FP16 не так широко используется, как уже поддерживаемые BF16 и INT8, но в целом это улучшение гибкости AMX.

Поддержка шифрования памяти также улучшается. Версия Redwood Cove от Granite Rapids будет поддерживать 2048 256-битных ключей памяти по сравнению со 128 ключами на Sapphire Rapids. Технология распределения кэша (CAT) и функции приоритезации кода и данных (CDP) также получают некоторые улучшения: Intel расширяет их, чтобы иметь возможность контролировать то, что поступает в кеш L2, а не только кеш LLC/L3 в предыдущих версиях. реализации.

В конечном счете, само собой разумеется, что Intel считает, что у них хорошие шансы на 2024 год и последующие годы со своими предстоящими Xeon. Повышая производительность топовых процессоров Xeon с P-ядером и представляя Xeon с E-core для клиентов, которым просто нужно много более легких процессорных ядер, Intel считает, что они смогут охватить весь рынок с помощью двух типов процессорных ядер, использующих одну общую платформу.

Хотя еще слишком рано говорить об отдельных SKU для Granite Rapids и Sierra Forest, Intel сообщила нам, что общее количество ядер растет. Детали Granite Rapids будут предлагать больше ядер ЦП, чем Sapphire Rapids (по сравнению с 60 для SPR XCC), и, конечно же, со 144 ядрами Sierra предложит даже больше. Примечательно, однако, что Intel не будет сегментировать две линейки процессоров по количеству ядер — Sierra Forest также будет доступна с меньшим количеством ядер (в отличие от чипов AMD EPYC Zen4c Bergamo). Это отражает разные возможности производительности ядер P и E, и, без сомнения, Intel стремится полностью реализовать масштабируемость, обеспечиваемую использованием чиплетов.

И хотя Sierra Forest уже перейдет на 144 ядра процессора, Intel также сделала интересный комментарий в нашем предварительном брифинге о том, что они могли бы увеличить количество ядер для своего первого масштабируемого процессора Xeon E-core. Но компания решила уделять больше внимания производительности каждого ядра, в результате чего количество чипов и ядер мы увидим в следующем году.

Прежде всего – и, возможно, позволив маркетингу слишком долго держать руль в отношении Hot Chips – Intel подчеркивает тот факт, что их процессоры Xeon следующего поколения останутся на правильном пути к выпуску в 2024 году. Само собой разумеется, что Intel только сейчас восстанавливается после огромных задержек с выпуском Sapphire Rapids (и сопутствующего эффекта для Emerald Rapids), поэтому компания стремится заверить клиентов, что именно в Granite Rapids и Sierra Forest Intel снова возвращает время в нужное русло. . Из-за предыдущих задержек с Xeon и столь длительного времени, которое потребовалось для вывода на рынок масштабируемого чипа Xeon E-core, Intel уже не доминирует на рынке центров обработки данных, как раньше, поэтому Granite Rapids и Sierra Forest собираются обозначить важный переломный момент для Предложения Intel для центров обработки данных будут развиваться.

[ad_1]
www.anandtech.com

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *