Стройте больше и двигайтесь быстрее с помощью CSS

Стройте больше и двигайтесь быстрее с помощью CSS

Чуть более пяти лет назад компания Arm объявила о своей инициативе Neoverse в отношении процессорных ядер серверов, облаков и инфраструктуры. Удвоив усилия по широкому проникновению на рынок инфраструктурных процессоров, компания приступила к амбициозному многолетнему плану по разработке того, что впоследствии станет тремя линейками процессорных ядер для различных сегментов рынка – от мощная серия V и миниатюрное ядро ​​серии E. И хотя дела пошли немного иначе, чем первоначально прогнозировало Arm, им вряд ли стоит жаловаться, поскольку линейка процессорных ядер Neoverse никогда не была такой успешной, как сейчас. Специализированные конструкции процессоров на основе ядер Neoverse сейчас в моде у облачных провайдеров, и на более широком рынке инфраструктуры наблюдается собственный всплеск.

Теперь, когда компания и ее клиенты приближаются к 2024 году, а вычислительный рынок переживает очередные трансформационные изменения из-за ненасытного спроса на оборудование для искусственного интеллекта, Arm готовится выпустить для своих клиентов следующее поколение процессорных ядер Neoverse. И в процессе компания достигает кульминации первоначальной дорожной карты Neoverse.

Сегодня утром компания раскрывает подробности об архитектуре ЦП V3 (кодовое имя Poseidon) для высокопроизводительных систем, а также о архитектуре ЦП N3 (кодовое имя Hermes) для сбалансированных систем. Эти конструкции теперь готовы для того, чтобы клиенты могли начать интегрировать их в свои собственные конструкции микросхем, при этом доступны как отдельные конструкции ядер ЦП, так и более крупные вычислительные подсистемы (CSS). Среди различных комбинаций IP-конфигураций Arm стремится предложить что-то для каждого, и особенно для разработчиков микросхем, которые хотят интегрировать готовые IP-конфигурации для быстрой разработки своих собственных чипов.

С учетом вышесказанного следует отметить, что сегодняшний анонс также более легкий, чем то, что мы ожидали от предыдущих анонсов Neoverse. Arm не раскрывает сегодня каких-либо глубоких архитектурных подробностей новых платформ Neoverse, поэтому, хотя у нас есть общие сведения об оборудовании и некоторые базовые оценки производительности, основные детали о ядрах ЦП и связанных с ними соединениях — это нечто Arm. держится при себе до более позднего времени.

Neoverse V3: до 128 ядер, с CXL 3.0 и HBM3, плюс дизайн CSS

Начнем с высококлассной архитектуры платформы Neoverse — ядра ЦП V3. Neoverse V3, ранее указанный в дорожных картах Arm как «V-Next» и под кодовым названием Poseidon, является окончательным архитектурным проектом в оригинальной дорожной карте Neoverse Arm, и Arm собирается наконец реализовать то, что они предполагали так давно.

Ядра Neoverse V традиционно создаются на основе конструкций Cortex-X, и хотя Arm сегодня не раскрывает этот уровень детализации, нет никаких оснований полагать, что это изменилось. Я подозреваю, что мы рассматриваем конструкцию ядра ЦП, которая во многом заимствована у Cortex-X5 — конструкции Cortex-X от Arm следующего поколения — в соответствии с использованием X1 и X3 для V1 и V2 соответственно. Но это, конечно, презумпция с моей стороны.

В любом случае, как и предыдущие ядра ЦП серии V, V3 нацелен на самые высокопроизводительные приложения, обеспечивая высочайшую однопоточную производительность среди всех ядер ЦП Arm Neoverse. А благодаря наличию до 64 ядер на одном кристалле (и двух кристаллов по 128 ядер на одном процессоре) V3 призван конкурировать на уровне high-end процессоров, как это делал до него V2.

Компания Arm не предоставила обобщенную оценку производительности ядра ЦП, но в симуляциях они видят от 10% до 20% для большинства рабочих нагрузок, за исключением крайнего случая анализа данных ИИ (акцент на «аналитике», а не на «аналитике», а не на «аналитике»). «ИИ»). Возвращаясь к самым ранним дорожным картам Arm, это ниже, чем 30% улучшений при переходе от поколения к поколению, к которым они изначально стремились, но опять же, V2 в то время даже не был в этих дорожных картах, поэтому шаги Arm стали меньше и немного чаще.

Опять же, у нас нет каких-либо глубоких архитектурных подробностей, но у нас есть несколько общих подробностей об изменениях, которые появятся в V3. Например, компания Arm сосредоточила значительную часть своих усилий на сетчатой ​​ткани в нескольких точках. Сам V3 имеет улучшенный способ соединения с сетчатой ​​тканью Arm, чтобы снизить там давление. А сама сетчатая ткань является новой, заменяя проверенную временем CMN-700 от Arm на новую CMN-S3 – хотя у нас нет никаких дополнительных подробностей о том, что влечет за собой последняя.

В противном случае V3 и его аналог CSS будут поддерживать все новейшие форматы ввода-вывода и памяти. Что касается ввода-вывода, поддержка CXL была увеличена с CXL 2.0 до CXL 3.0, которая по-прежнему находится поверх PCIe 5.0. Между тем, что касается памяти, LPDDR5, DDR5 и HBM3 поддерживаются IP-адресом Arm.

И впервые для ядра ЦП серии V компания Arm предлагает готовую CSS-версию этого IP для быстрой интеграции в конструкции чипов клиентов. Хотя сама инициатива CSS все еще довольно нова, Арм говорит, что эта стратегия оказалась очень успешной: голодные, хорошо финансируемые поставщики облачных услуг, такие как Microsoft (Cobalt 100), быстро приняли ее, чтобы быстро собрать воедино свои собственные проекты чипов и оборудование введено в эксплуатацию. Поэтому Arm стремится обеспечить такой же уровень простоты для высокопроизводительных клиентов, особенно для тех, кому просто нужен проверенный IP-блок ЦП для сопряжения с их собственными разработками ускорителей. для дальнейшей оптимизации процесса.

И хотя технически об этом было объявлено ранее в этом месяце, дизайн V3 CSS идет рука об руку с усилиями Arm по созданию собственной экосистемы чиплетов — Arm Chiplet System Architecture (CSA). Инициатива CSA призвана позволить клиентам более легко смешивать и сочетать чиплеты в своих продуктах, при этом CSA выходит за рамки простой совместимости протоколов и решает такие вопросы, как управление системой, DMA, безопасность и совместимость программного обеспечения.

Наконец, подчеркивая быстрые сроки выполнения работ, которые Arm предполагает с V3 CSS IP, компания уже объявляет о победе в проектировании с Socionext, которая разрабатывает 32-ядерный чиплет V3 CSS для производства в TSMC.

Arm Neoverse N3: производительность на ватт выше на 20%, до 32 ядер

Другая половина сегодняшнего анонса Neoverse IP — это Neoverse N3 (кодовое имя Hermes), новейшая линейка сбалансированных и энергоэффективных процессорных ядер Arm для широкого спектра рынков.

На этот раз, уделяя еще больше внимания CSS IP, конструкция N3 CSS поддерживает диапазон ядер ЦП от 8 до 32. В случае последнего, Arm заявляет, что их конструкция может работать с TDP всего 40 Вт. или чуть более 1 Вт на ядро ​​ЦП – хотя компания не раскрывает, какой это технологический узел.

В целом, Arm рекламирует улучшение производительности на ватт в среднем на 20% для N3 CSS по сравнению с N2 CSS. Общий прирост производительности обычно составляет от 10% до 30% в зависимости от конкретной рабочей нагрузки.

Как и V3, Arm не предлагает здесь особых архитектурных деталей. Но поскольку конструкции серии N исторически имеют много общих элементов дизайна с серией Cortex-A7xx, я не удивлюсь, если в конечном итоге обнаружу, что то же самое и с N3.

Тем временем Arm дает краткий обзор «под капотом» N3 CSS, чтобы объяснить их большой скачок производительности в анализе данных искусственного интеллекта, который основан на библиотеке XGBoost.

Начнем с того, что размер кэша L2 для CSS N3 теперь составляет 2 МБ на ядро ​​по сравнению с 1 МБ для N2. Фактически, Arm также потратила немало усилий на свою общую подсистему кэша и памяти, включая внесение некоторых нераскрытых настроек в свой согласованный хост-интерфейс для лучшего управления трафиком и пропускной способностью памяти между ядрами ЦП и кешем последнего уровня (и за его пределами). . Хотя неясно, использует ли N3 также новую сетку CMN-S3 от Arm или ограничена ли она V3. Между тем, на внешнем интерфейсе N3 ядро ​​ЦП оснащено еще более точным блоком прогнозирования ветвлений.

В целом эти и многие другие улучшения обеспечивают Arm повышение производительности XGBoost на 196%, а также повышение производительности на 84% для ядра ЦП V3 при той же рабочей нагрузке. В целом это делает анализ данных/XGBoost крайне выдающимся, но это показывает, куда Arm приложила некоторые из своих усилий в этом предстоящем поколении архитектур ЦП.

Помимо этих основных улучшений, N3 также включает многие улучшения ввода-вывода и памяти, которые также есть в V3. Компания Arm не предоставила подробный список, но нам сообщили, что она поддерживает новейшие стандарты PCIe и CXL — предположительно, это PCIe 5.0 и CXL 3.0 соответственно. Примечательно, что в предыдущей дорожной карте Arm это поколение оборудования было привязано к поддержке PCIe 6.0, но, поскольку оно не вошло в V3, похоже, что Arm пришлось сделать шаг назад.

Наконец, как и CSS V3, CSS N3 также имеет сквозное соединение. Хотя, как и большинство других аспектов аппаратного обеспечения серии N, он был уменьшен до одного межсоединения. Таким образом, производители микросхем могут интегрировать N3 непосредственно в свои кристаллы или подключить его к внешнему чиплету-ускорителю.

Взгляд в будущее: Адонис, Дионис и Ликий

Наконец, поскольку Arm подошла к концу своей текущей дорожной карты Neoverse, компания предоставляет дорожную карту для будущих выпусков ядер ЦП.

Примечательно, что это менее подробная дорожная карта, чем у Арма. Дорожная карта эпохи V2/N2, который включал некоторые общие заметки о том, какие технологии, как ожидается, будут присутствовать. Вместо этого в этой дорожной карте представлены кодовые имена и многое другое.

Подтверждая, что Arm работает над версиями процессоров E, N и V четвертого поколения, у нас есть несколько новых кодовых названий. Lycius станет следующим ядром Neoverse E-серии (E4?), Dionysus станет следующим ядром N-серии, а Adonis — следующим ядром V-серии. Между тем, их подсистемы вычислений также получили кодовые названия: CSS Ranger и CSS Vega для CSS N-серии и CSS V-серии соответственно.

В настоящее время Arm не дает никаких указаний о том, когда эти разработки будут готовы для клиентов. Но поскольку V3/N3 IP только сейчас поступает к клиентам, Neoverse IP четвертого поколения, вероятно, появится через пару лет.


www.anandtech.com

Comments

No comments yet. Why don’t you start the discussion?

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *