NVIDIA Tesla H100 SXM 80GB (артикул H100SXM80GB) — флагманский ускоритель для дата-центров на архитектуре NVIDIA Hopper. Оснащён 80 ГБ памяти HBM3 с пропускной способностью 3,35 ТБ/с и обеспечивает до 989 TFLOPS при вычислениях TF32 с тензорными ядрами. Форм-фактор SXM предназначен для установки в серверные платформы с поддержкой NVLink 900 ГБ/с и PCIe Gen5. Идеально подходит для тренировки больших языковых моделей, научных симуляций и HPC-задач.
Рекордная производительность для AI и HPC
Графический процессор H100 построен на 4-нм техпроцессе и содержит 80 млрд транзисторов. Благодаря новым тензорным ядрам четвёртого поколения и поддержке форматов FP8, INT8, FP16, BF16, TF32 и FP64, ускоритель обеспечивает кратный прирост скорости в обучении и инференсе нейросетей.
Ключевые показатели производительности
- FP64 (двойная точность): 34 TFLOPS — для научных расчётов с высокой точностью.
- TF32 с тензорными ядрами: 989 TFLOPS — эффективное обучение моделей без потери точности.
- BFLOAT16 / FP16: 1979 TFLOPS — стандарт для тренировки нейросетей.
- INT8: 3958 TOPS — ускорение инференса и квантованных моделей.
Объём и пропускная способность памяти
- 80 ГБ HBM3 — достаточно для моделей с сотнями миллиардов параметров.
- Пропускная способность 3,35 ТБ/с — быстрая загрузка данных и весов.
- Multi-Instance GPU (MIG): до 7 изолированных экземпляров по 10 ГБ каждый для максимальной утилизации GPU.
Передовая архитектура Hopper
NVIDIA H100 SXM включает ряд инноваций, недоступных в предыдущих поколениях:
Соединения и масштабирование
- NVLink 4.0: 900 ГБ/с двунаправленной пропускной способности на GPU — объединяйте до 256 ускорителей в кластер.
- PCIe Gen5: 128 ГБ/с на линию — совместимость с современными серверами.
- NVSwitch: для создания полносвязной топологии в суперкомпьютерах.
Тензорные ядра и Transformer Engine
Поддержка динамического переключения точности (FP8/FP16) в каждом блоке Transformer Engine ускоряет обработку моделей трансформеров до 9 раз по сравнению с A100.
Безопасность и изоляция
Аппаратная защита конфиденциальных вычислений (Confidential Computing) и поддержка MIG для безопасного разделения ресурсов между задачами.
Совместимые серверные платформы и аксессуары
Для работы H100 SXM требуется сервер с разъёмом SXM5 и поддержкой NVLink. Ниже приведены основные совместимые компоненты.
| Тип оборудования | Рекомендуемые модели / спецификации | Примечание |
|---|---|---|
| Серверные платформы (SXM5) | NVIDIA DGX H100, HGX H100, Dell PowerEdge XE9680, HPE Cray XD670, Lenovo ThinkSystem SR675 V3 | Требуется материнская плата с разъёмом SXM5 и NVSwitch |
| Системы охлаждения | Жидкостное охлаждение (прямое или иммерсионное) или высокопроизводительное воздушное (для серверов с активным обдувом) | Типичное TDP 700 Вт |
| Межсоединительные кабели NVLink | NVIDIA NVLink Bridge для SXM (входят в комплект HGX) | Для объединения GPU в кластер |
| Блоки питания сервера | От 3000 Вт и выше, 80+ Titanium | Рекомендуется резервирование 1+1 |
| Программное обеспечение | CUDA 12.0+, NVIDIA AI Enterprise, TensorRT, Triton Inference Server | Полная поддержка всех библиотек |
Аналоги NVIDIA Tesla H100 SXM 80GB
Если модель недоступна или требуется сравнение, рассмотрите следующие альтернативы, близкие по производительности и назначению.
| Производитель | Модель | Ключевые отличия / сходство |
|---|---|---|
| NVIDIA | H100 PCIe 80GB | Аналогичные ядра и память, но форм-фактор PCIe, меньшее количество MIG (до 4), ниже пропускная способность NVLink (600 ГБ/с) |
| NVIDIA | H200 SXM 141GB | Увеличенный объём памяти HBM3e (141 ГБ), пропускная способность 4,8 ТБ/с, обратно совместим по разъёму SXM5 |
| NVIDIA | A100 SXM 80GB | Предыдущее поколение, до 312 TFLOPS TF32, 2 ТБ/с памяти, 7 MIG (по 10 ГБ). Более доступный вариант для задач, не требующих FP8 |
| AMD | Instinct MI250X (OAM) | 128 ГБ HBM2e, 3,2 ТБ/с, до 383 TFLOPS FP16. Отличается программной экосистемой ROCm |
| Intel | Data Center GPU Max 1550 | 128 ГБ HBM2e, до 164 TFLOPS FP16, поддержка oneAPI. Ограниченная поддержка фреймворков AI |
Рекомендация: Для задач, требующих максимальной производительности в обучении LLM и HPC, H100 SXM остаётся оптимальным выбором. Если нужен больший объём памяти — обратите внимание на H200.
Кому подойдёт NVIDIA Tesla H100 SXM 80GB
Рекомендуется, если вам нужно:
- Обучать большие языковые модели (GPT, LLaMA) с сотнями миллиардов параметров.
- Запускать сложные научные симуляции (молекулярная динамика, гидродинамика, квантовая химия).
- Развернуть масштабируемый кластер с NVLink для распределённого обучения.
- Использовать Multi-Instance GPU для изоляции задач на одном ускорителе.
- Получить максимальную производительность на ватт (FP8/TF32).
Вероятно, не подойдёт, если:
- Вы используете готовые облачные решения (API), нет необходимости в физическом оборудовании.
- Бюджет ограничен — рассмотрите A100 или H100 PCIe.
- Требуется компактное решение для одной рабочей станции (тогда лучше H100 PCIe или RTX 6000 Ada).
- Нужно исключительно FP64 для кода без тензорных ядер — возможно, будет достаточно A100 или AMD.
Конструкция и условия эксплуатации
Форм-фактор SXM5
GPU устанавливается в специальный разъём SXM5 на системной плате HGX. Размеры 117?130?30 мм, вес около 1,5 кг. Требуется принудительное охлаждение (жидкостное или воздушное с высоким расходом).
Энергопотребление и охлаждение
- TDP (типичное): 700 Вт (пиковое до 750 Вт).
- Температура корпуса: до 85°C (при нормальной вентиляции).
- Температура хранения: от -40°C до +85°C.
- Влажность: 10-90% (без конденсата) при работе, 5-95% при хранении.
Устанавливается только в серверные корпуса с достаточным охлаждением, не предназначен для домашних ПК.
Технические характеристики
| Тип устройства | Видеокарта (ускоритель для дата-центров) |
| Базовая единица | шт |
| Производитель | NVIDIA |
| Модель | Tesla H100 SXM 80GB |
| Артикул | H100SXM80GB |
| Архитектура | NVIDIA Hopper |
| Форм-фактор | SXM (SXM5) |
| Техпроцесс | 4 нм |
| Количество тензорных ядер | 640 (четвёртого поколения) |
| Количество ядер CUDA | 18432 |
| Объем видеопамяти | 80 ГБ HBM3 |
| Пропускная способность видеопамяти | 3,35 ТБ/с |
| Межсоединение NVLink | 900 ГБ/с (двунаправленный) |
| Межсоединение PCIe | Gen5 128 ГБ/с |
| Multi-Instance GPU (MIG) | До 7 экземпляров по 10 ГБ |
| FP64 (двойная точность) | 34 TFLOPS |
| Тензорное ядро для FP64 | 67 TFLOPS |
| FP32 (одинарная точность) | 67 TFLOPS |
| Тензорное ядро для TF32 | 989 TFLOPS |
| Тензорное ядро для BFLOAT16 | 1979 TFLOPS |
| Тензорное ядро для FP16 | 1979 TFLOPS |
| Тензорное ядро для INT8 | 3958 TOPS |
| Форматы точности | FP64, FP32, TF32, FP16, BF16, FP8, INT8, INT4 |
| Поддержка Transformer Engine | Да (FP8) |
| Энергопотребление (TDP) | 700 Вт |
| Система охлаждения | Пассивное (требуется жидкостное или активное воздушное) |
| Требования к питанию | Через серверный блок питания (3000 Вт+ на систему) |
| Размеры | 117 x 130 x 30 мм |
| Краткое описание | Видеокарта NVIDIA TESLA H100 SXM 80GB |
| Гарантия | 3 года (производителя) |
Часто задаваемые вопросы
В чём разница между H100 SXM и H100 PCIe?
SXM-версия имеет больший объём памяти (80 ГБ против 80 ГБ, но у PCIe тоже 80 ГБ), более высокую пропускную способность NVLink (900 против 600 ГБ/с), поддержку 7 экземпляров MIG (у PCIe до 4) и более высокое TDP (700 Вт против 350/400 Вт). SXM требует специальной серверной платформы.
Можно ли установить H100 SXM в обычный ПК?
Нет. Физический разъём SXM5 несовместим с PCIe слотами. Для использования необходим сервер с поддержкой HGX или DGX H100. Для ПК подойдёт версия H100 PCIe.
Какое охлаждение требуется для H100 SXM?
При TDP 700 Вт рекомендуется жидкостное охлаждение (прямое на чип) или эффективное воздушное с большим объёмом продува. Серверные системы обычно оснащаются высокоскоростными вентиляторами или контуром СЖО.
Поддерживает ли H100 SXM MIG и как это работает?
Да, до 7 изолированных GPU-экземпляров, каждый с 10 ГБ памяти, собственным кешем и контроллером. Позволяет запускать независимые нагрузки на одном физическом GPU.
Какие библиотеки NVIDIA поддерживаются?
CUDA 12.0+, cuDNN, TensorRT, NCCL, cuBLAS, Triton Inference Server и все основные фреймворки (PyTorch, TensorFlow, JAX).
Можно ли использовать H100 для рендеринга или игр?
Технически — да, но драйверы оптимизированы для вычислений и серверных нагрузок. Для игр и рабочих станций больше подходят GeForce RTX или RTX A6000.
Какой форм-фактор и размер?
Форм-фактор SXM5, размеры 117 x 130 x 30 мм. Устанавливается только в специальный разъём на плате HGX.
Чем отличается H100 от H200?
H200 имеет 141 ГБ HBM3e с пропускной способностью 4,8 ТБ/с, остальная архитектура аналогична. H200 также совместим с SXM5.
Сколько GPU можно объединить по NVLink?
До 8 GPU в одном узле HGX (с помощью NVSwitch), и до 256 GPU в кластерной конфигурации через InfiniBand/EDR.
Какая гарантия предоставляется?
Стандартная гарантия NVIDIA для ускорителей дата-центров — 3 года. Дополнительно можно приобрести расширенную поддержку.
Основные характеристики
Нет вопросов об этом товаре.
