AMD расширяет линейку продуктов AI/HPC за счет флагманского Instinct MI300X только с графическим процессором и 192 ГБ памяти

AMD расширяет линейку продуктов AI/HPC за счет флагманского Instinct MI300X только с графическим процессором и 192 ГБ памяти

Наряду с обновлениями ЦП сервера EPYC, в рамках сегодняшнего мероприятия AMD Data Center, компания также предлагает обновленную информацию о статусе своего почти законченного семейства ускорителей AMD Instinct MI300. Процессоры нового поколения HPC-класса компании, в которых используются как ядра ЦП Zen 4, так и ядра графического процессора CDNA 3 в одном корпусе, теперь стали семейством XPU с несколькими SKU.

Вместе с ранее анонсированным гибридным процессором MI300 емкостью 128 ГБ, который теперь называется MI300A, AMD также производит чистую часть графического процессора с использованием той же конструкции. Этот чип, получивший название MI300X, использует только фрагменты графического процессора CDNA 3, а не сочетание фрагментов ЦП и графического процессора в MI300A, что делает его чистым высокопроизводительным графическим процессором, который работает в паре со 192 ГБ памяти HBM3. MI300X, ориентированный непосредственно на рынок моделей с большими языками, разработан для клиентов, которым требуется весь объем памяти, который они могут получить, для запуска самых больших моделей.

AMD Instinct MI300, впервые анонсированный в июне прошлого года и более подробно описанный на выставке CES 2023, — это большая игра AMD на рынке ИИ и высокопроизводительных вычислений. Уникальный гибридный процессор серверного класса объединяет ядра ЦП Zen 4 и ядра графического процессора CDNA 3 в один чипсет на основе чипсета. Ни у одного из конкурентов AMD нет (и не будет) комбинированного продукта ЦП + ГП, такого как серия MI300 в этом году, поэтому это дает AMD интересное решение с действительно объединенной архитектурой памяти и большой пропускной способностью между плитками ЦП и ГП.

MI300 также включает встроенную память через HBM3, используя 8 стеков материала. На момент презентации CES максимальная емкость стеков HBM3 составляла 16 ГБ, что давало дизайн чипа с максимальным пулом локальной памяти 128 ГБ. Однако благодаря недавнему выпуску 24-гигабайтных стеков HBM3 AMD теперь сможет предложить версию MI300 с на 50% больше памяти — или 192 ГБ. Которые, наряду с дополнительными чипсетами графического процессора, установленными на MI300X, предназначены для того, чтобы сделать его мощным инструментом для обработки самых больших и сложных LLM.

Под капотом MI300X на самом деле является немного более простым чипом, чем MI300A. AMD заменила три чиплета ЦП MI300A всего двумя чиплетами CDNA 3 GPU, в результате чего общая конструкция состоит из 12 чиплетов — 8 чиплетов GPU и еще 4 чиплета памяти ввода-вывода. В остальном, несмотря на удаление ядер ЦП (и удаление APU из APU), MI300X только с графическим процессором очень похож на MI300A. И ясно, что AMD стремится воспользоваться синергией, предлагая APU и флагманский процессор в одном корпусе.

Помимо производительности графического процессора (сейчас у нас нет точных цифр), небольшой частью истории AMD с MI300X будет объем памяти. Просто предложить 192-гигабайтный чип сам по себе — большое дело, учитывая, что объем памяти является сдерживающим фактором для текущего поколения больших языковых моделей (LLM) для ИИ. Как мы видели в последних разработках NVIDIA и других компаний, пользователи ИИ скупают графические процессоры и другие ускорители так быстро, как только могут, при этом требуя больше памяти для запуска еще более крупных моделей. Таким образом, возможность предложить массивный графический процессор объемом 192 ГБ, который использует 8 каналов памяти HBM3, станет значительным преимуществом для AMD на текущем рынке — по крайней мере, после того, как MI300X начнет поставляться.

Семейство MI300 все еще находится на пути к поставке в конце этого года. По данным AMD, APU MI300A на 128 ГБ уже представлен покупателям. Тем временем 192-гигабайтный графический процессор MI300X будет представлен клиентам в третьем квартале этого года.

Также само собой разумеется, что этим объявлением AMD подтвердила, что они делают гибкую конструкцию XPU как минимум на 3 года раньше, чем конкурент Intel. В то время как Intel отказалась от своего комбинированного продукта Falcon Shores CPU+GPU в пользу чистого GPU Falcon Shores, AMD теперь планирует предложить гибкий продукт только CPU+GPU/GPU уже в конце этого года. В этот период он будет конкурировать с такими продуктами, как суперчип NVIDIA Grace Hopper, который, хотя и не является APU/XPU, очень близок к этому, связывая процессор NVIDIA Grace с графическим процессором Hopper через высокоскоростную сеть NVLink. Так что, пока мы ждем дальнейших подробностей о MI300X, это должно стать очень интересной битвой между двумя титанами графических процессоров.

В целом, давление на AMD в отношении семейства MI300 является значительным. Спрос на ускорители искусственного интеллекта был зашкаливающим на протяжении большей части прошлого года, и MI300 станет первой возможностью AMD сыграть значительную роль на рынке. MI300 не станет решающим продуктом для компании, но помимо получения технического преимущества в виде первой поставки одночипового серверного APU (и прав хвастовства, связанных с этим), он также даст им свежий продукт для продажи на рынке, который скупает все аппаратное обеспечение, которое может получить. Короче говоря, ожидается, что MI300 будет лицензией AMD на печатание денег (аналог NVIDIA H100), по крайней мере, на это надеются нетерпеливые инвесторы AMD.

Платформа архитектуры AMD Infinity

Наряду с сегодняшними новостями о 192 ГБ MI300X AMD также кратко объявляет о том, что они называют архитектурной платформой AMD Infinity. Это 8-процессорная конструкция MI300X, позволяющая объединить до 8 высокопроизводительных графических процессоров AMD для работы с большими рабочими нагрузками.

Как мы видели на примере 8-процессорных плат HGX от NVIDIA и собственной платы Intel x8 UBB для Ponte Vecchio, конфигурация с 8-процессорными процессорами в настоящее время является оптимальным решением для высокопроизводительных серверов. Это связано как с физическими причинами дизайна — пространством для размещения чипов и пространством для прохождения через них охлаждения — так и с лучшими топологиями, которые доступны для соединения большого количества чипов без слишком большого количества переходов между ними. Если AMD собирается конкурировать с NVIDIA и захватить часть рынка графических процессоров для высокопроизводительных вычислений, то это еще одна область, в которой им потребуется соответствовать аппаратным предложениям NVIDIA.

AMD называет платформу архитектуры Infinity архитектурой «отраслевого стандарта». По словам AMD, они используют серверную платформу OCP в качестве своей базы; и хотя это подразумевает, что MI300X использует форм-фактор OAM, мы все еще ждем явного подтверждения этого.


www.anandtech.com

Comments

No comments yet. Why don’t you start the discussion?

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *