Новые ИИ-ускорители Ascend и серверные платформы Huawei: детали и перспективы
В IV квартале 2025 года Huawei планирует представить новое поколение ИИ-ускорителей Ascend 910C и серверных платформ на их основе. Эти решения ориентированы на высокопроизводительные вычисления, машинное обучение и обработку больших данных, конкурируя с продуктами NVIDIA в сегменте ИИ-инфраструктуры. Ascend 910C, созданный по 7-нм техпроцессу SMIC, демонстрирует производительность до 320 TFLOPS (FP16) и оснащается памятью HBM2/HBM2E с пропускной способностью до 3.2 ТБ/с. Чип оптимизирован для задач инференса и обучения нейросетей, включая трансформеры и смешанные экспертные модели (Mixture of Experts).
Ключевые инновации Ascend 910C
Ускоритель использует архитектуру Da Vinci 3D Cube, которая обеспечивает высокую энергоэффективность (TDP 310 Вт) и поддержку тензорных операций. В отличие от GPU NVIDIA, Ascend 910C фокусируется исключительно на ИИ-нагрузках, исключая рендеринг графики. Huawei также анонсировала Ascend 920 — следующий шаг в эволюции линейки, созданный по 6-нм техпроцессу SMIC. Этот чип обещает достичь 900 TFLOPS (FP16) и 4 ТБ/с пропускной способности памяти благодаря HBM3, что делает его потенциальным конкурентом NVIDIA H20 в Китае.
Серверные платформы: CloudMatrix 384
Huawei представила масштабируемую систему CloudMatrix 384, объединяющую 384 чипа Ascend 910C в единый кластер. Это решение обеспечивает 300 PFLOPS вычислительной мощности (BF16) и 49.2 ТБ памяти HBM, что почти вдвое превышает показатели NVIDIA GB200 NVL72. Однако система требует в 4.1 раза больше энергии, что компенсируется использованием оптических соединений (800G LPO) для минимизации задержек. CloudMatrix развертывается в 16 стойках, включая 12 вычислительных и 4 сетевых, и ориентирована на крупные дата-центры и государственные проекты КНР.
