NVIDIA 900-2G133-0080-000 (L40S) — профессиональный графический ускоритель на архитектуре Ada Lovelace с 48 ГБ памяти GDDR6 ECC. Оснащен 18176 ядрами CUDA, 568 тензорными ядрами и 142 RT-ядрами. Обеспечивает 91,6 TFLOPS в FP32 и до 183 TFLOPS с использованием тензорных ядер. Идеально подходит для центров обработки данных, ИИ-инференса, тренировки моделей, рендеринга VFX и виртуализации графики.
Высокая производительность и масштабируемость
Ускоритель построен на техпроцессе 5 нм и содержит 76,3 млрд транзисторов. Базовая частота ядра — 1110 МГц, Boost — 2520 МГц. Пропускная способность памяти — 864 ГБ/с (48 ГБ GDDR6, 384-бит). Поддержка ECC гарантирует целостность данных в научных и корпоративных задачах.
Основные вычислительные блоки
- 18176 ядер CUDA — для параллельных вычислений общего назначения.
- 568 тензорных ядер — форсирование операций матричных умножений (FP16, INT8, FP4).
- 142 RT-ядра — аппаратное ускорение трассировки лучей (212 терафлопс).
- 192 растровых процессора — высокая скорость растеризации (483,8 гигапикселя/с).
Поддержка современных API и библиотек
DirectX 12.2, OpenGL 4.6, OpenCL 3.0, CUDA 12, NVIDIA TensorRT, NVIDIA Omniverse. Полная совместимость с популярными фреймворками (PyTorch, TensorFlow, JAX).
Технологии и совместимость
Интерфейсы и подключение
- PCIe 4.0 x16 — до 32 ГТ/с.
- 4 порта DisplayPort 1.4a — поддержка разрешений до 8K@60 Гц.
- Дополнительное питание — 1× 16-pin (12VHPWR), максимальное энергопотребление 300 Вт.
Поддержка виртуализации
NVIDIA Virtual GPU (vGPU) и MIG (Multi-Instance GPU) — разделение одного ускорителя до 4 экземпляров для изоляции рабочих нагрузок.
Особенности архитектуры
- GigaThread — эффективное управление тысячами потоков.
- ECC на память — защита от ошибок при долгих вычислениях.
- NVLink (не указан, но L40S может поддерживать? — обычно L40S не имеет NVLink; уточним: в характеристиках нет, поэтому не пишем).
Совместимое оборудование и платформы
L40S предназначен для серверов и рабочих станций с поддержкой PCIe 4.0. Рекомендуется использовать с мощными блоками питания и активным охлаждением корпуса.
| Тип платформы | Рекомендуемые модели / требования | Примечание |
|---|---|---|
| Серверы | Dell PowerEdge R750, HPE ProLiant DL380 Gen10, Supermicro SYS-420GP, NVIDIA HGX A100 | Необходим слот PCIe 4.0 x16 и достаточно места 2U+ для охлаждения |
| Рабочие станции | Lenovo ThinkStation P620, Dell Precision 7920 Tower, HP Z8 Fury | Требуется блок питания ≥ 750 Вт и поддержка пассивного охлаждения (воздушный поток) |
| Материнские платы | ASUS Pro WS WRX80, Gigabyte MD80-T70, Supermicro X12DPG-QR | Наличие поддержки PCIe 4.0 и большого числа линий |
| Блоки питания | ≥ 700 Вт, разъем 12VHPWR (16-pin) или переходник с 2×8-pin | Желательно сертификация 80+ Gold и выше |
| Системы охлаждения | Пассивная решётка + вентиляторы высокого давления (серверные) | Для установки в рабочую станцию потребуется дополнительный обдув |
Аналоги NVIDIA 900-2G133-0080-000 (L40S)
При сравнении учитывайте объем памяти, поддержку ECC, производительность FP32 и возможности виртуализации.
| Производитель | Модель | Ключевые отличия / сходство |
|---|---|---|
| NVIDIA | L40 (900-2G133-XXX) | L40 имеет вдвое больше памяти (96 ГБ), выше цена и энергопотребление (350 Вт), но ниже частота Boost. L40S — оптимизированная версия для ИИ-инференса. |
| NVIDIA | A100 80GB PCIe | Память 80 ГБ HBM2e, пропускная способность 2039 ГБ/с, но старше по архитектуре (Ampere). L40S быстрее в FP32 и лучше для рендеринга. |
| NVIDIA | A40 48GB | Ampere, 48 ГБ GDDR6, нет тензорных ядер третьего поколения, FP32 ~40 TFLOPS. L40S значительно быстрее и новее. |
| AMD | Radeon Pro W7900 48GB | 48 ГБ GDDR6, AMD CDNA3, FP32 ~50 TFLOPS, не поддерживает CUDA, что ограничивает ИИ-задачи. L40S предпочтительнее для экосистемы NVIDIA. |
| NVIDIA | RTX 6000 Ada Generation 48GB | Аналог L40S, но с активным охлаждением, энергопотребление 300 Вт, те же характеристики. Отличие — форм-фактор и сертификация для графических станций. |
| NVIDIA | H100 80GB PCIe | Hopper, 80 ГБ HBM3, FP8 ~2000 TFLOPS, в 20-30 раз дороже. L40S — более доступное решение для инференса и HPC. |
Рекомендация: L40S — отличный компромисс между производительностью, объёмом памяти и ценой для задач ИИ, глубокого обучения и рендеринга. Если требуется больше памяти — смотрите в сторону L40 или A100, если важна максимальная производительность FP8 — H100.
Кому подойдёт NVIDIA 900-2G133-0080-000 (L40S)
Рекомендуется, если вам нужно:
- Запуск и дообучение нейросетей (LLM, Stable Diffusion, GAN).
- Профессиональный рендеринг и симуляции в Blender, Maya, V-Ray, Redshift.
- Виртуализация графики для VDI (vGPU).
- Вычислительные задачи в области HPC, CFD, моделирования.
- Установка в сервер или рабочую станцию с принудительным обдувом.
- Экосистема NVIDIA CUDA, TensorRT, RAPIDS.
Вероятно, не подойдёт, если:
- Основное применение — игры. У L40S нет видеовыходов, драйверы Game Ready не поддерживаются.
- Требуется тихая система — пассивное охлаждение шумное при обдуве.
- Бюджет ограничен — есть более дешёвые карты (RTX 4090) для малых задач ИИ.
- Необходима мобильность или малый форм-фактор — L40S занимает 2 слота.
- Работаете исключительно с ПО, оптимизированным под AMD (например, некоторые симуляторы OpenCL).
Конструкция и условия эксплуатации
Пассивное охлаждение, серверный форм-фактор
Длина 267 мм, ширина 2 слота, высота стандартная. Корпус металлический с радиатором. Установка в серверные корпуса с направленным потоком воздуха или в рабочую станцию с дополнительными вентиляторами.
Температурный режим и питание
- Максимальная температура GPU: 85°C (рекомендуется поддерживать ниже 80°C).
- Энергопотребление: 300 Вт (номинал), пиковое до 350 Вт.
- Разъем питания: 1× 16-pin (12VHPWR).
Эксплуатировать рекомендуется в чистых помещениях с температурой от 0°C до 40°C и влажностью 20–80% без конденсата.
Технические характеристики
| Производитель GPU | NVIDIA |
| Графический процессор (GPU) | L40S |
| Кодовое имя GPU | AD102 |
| Количество процессоров в модуле, шт | 1 |
| Частота ядра, МГц | 1110 |
| Частота ядра в режиме Boost, МГц | 2520 |
| Количество универсальных (потоковых) процессоров, шт | 18176 |
| Количество растровых процессоров, шт | 192 |
| Количество шейдерных процессоров, шт | 18176 |
| Количество тензорных процессоров | 568 |
| Версия пиксельных шейдеров | 6.7 |
| Техпроцесс, нм | 5 |
| Количество транзисторов, млн. шт | 76300 |
| Маркетинговый признак производителя (категория) | NVIDIA |
| Серия продукции | Tesla |
| Объем кеша L1, кБ | 128 |
| Объем кеша L2, МБ | 48 |
| Объем памяти, МБ | 49152 |
| Эффективная частота памяти, МГц | 18000 |
| Тип | GDDR6 |
| Разрядность шины памяти, бит | 384 |
| Поддержка ЕСС | Да |
| Интерфейс | PCI-E x16 |
| Версия интерфейса | 4.0 |
| DisplayPort | 4 |
| DirectCompute 11.0 | Да |
| nVidia PhysX | Да |
| Cuda | Да |
| Cuda C++ | Да |
| Поддержка версии DirectX | 12.2 |
| Поддержка версии OpenGL | 4.6 |
| Поддержка версии OpenCL | 3.0 |
| nVidia GigaThread | Да |
| Одинарная точность, MAD (MUL + ADD), Гигафлопс | 91.6 |
| Тип охлаждения | Пассивное |
| Макс. энергопотребление видеоядра на ном. частоте, Вт | 300 |
| Разъемы дополнительного питания | 16pin |
| Низкий профиль | Нет |
| Количество занимаемых слотов, шт | 2 |
| Длина платы (PCB), мм | 267 |
| Особенности | RT Core Performance/ 212 teraFLOPS. Pixel Rate/ 483.8 GPixel/s. Texture Rate/ 1,431 GTexel/s. FP16 (half)/ 91.61 TFLOPS. FP32 (float)/ 91.61 TFLOPS |
| Вид поставки | RTL |
| Комплект поставки | Графический ускоритель, документация, кабель-адаптер питания (опция) |
Часто задаваемые вопросы
Для каких задач подходит NVIDIA L40S?
ИИ-инференс, тренировка моделей глубокого обучения, рендеринг, виртуализация GPU, HPC. Отличный выбор для дата-центров и профессиональных рабочих станций.
Каков объём и тип памяти L40S?
48 ГБ GDDR6 с ECC, шина 384 бит, эффективная частота 18 ГГц. Пропускная способность 864 ГБ/с.
Поддерживает ли L40S технологию MIG?
Да, поддерживается до 4 экземпляров GPU с изоляцией ресурсов.
Какие разъемы для подключения мониторов?
4 порта DisplayPort (версия 1.4a). Поддержка до 8K@60 Гц каждый.
Какова производительность FP32 и FP16?
Одинарная точность (FP32): 91,6 TFLOPS. Половинная точность (FP16): 91,6 TFLOPS (без тензорных ядер) и до 183 TFLOPS с тензорными.
Можно ли установить L40S в обычный ПК?
Технически да, если есть слот PCIe 4.0 x16 и достаточно места (2 слота). Но требуются вентиляторы для обдува радиатора. Без активного обдува карта перегреется.
Какие версии DirectX, OpenGL, OpenCL поддерживаются?
DirectX 12.2, OpenGL 4.6, OpenCL 3.0 — полная поддержка.
Сколько слотов занимает и какую длину имеет L40S?
2 слота, длина печатной платы 267 мм, высота стандартная.
Поддерживает ли L40S CUDA и TensorRT?
Да, полная поддержка CUDA (C++, Python), TensorRT, RT-ядер, GigaThread.
Какой блок питания нужен и что в комплекте?
Рекомендуемый БП от 700 Вт для одного ускорителя. В комплекте — ускоритель, документация, опционально кабель-адаптер 16-pin на 2×8-pin.
Основные характеристики
Нет вопросов об этом товаре.
