NVIDIA Tesla L40 PCI-E 48GB (L40 PCI-E 48GB) — ускоритель на архитектуре Ada Lovelace, предназначенный для центров обработки данных, облачных вычислений, машинного обучения и высокопроизводительных вычислений (HPC). 48 ГБ памяти GDDR6 с ECC, 18 176 ядер CUDA, 564 тензорных ядер и 142 RT-ядра обеспечивают рекордную производительность для задач искусственного интеллекта, рендеринга и виртуализации. Интерфейс PCIe 4.0 x16, поддержка Multi-Instance GPU (MIG) и NVLink для масштабирования.
Архитектура NVIDIA Ada Lovelace
Tesla L40 построена на том же GPU AD102, что и флагманские графические карты, но оптимизирована для серверного использования: пассивное охлаждение, строгий контроль температуры, поддержка ECC и виртуализации.
Основные вычислительные блоки
- 18 176 ядер CUDA — для параллельных вычислений и традиционных HPC-задач.
- 564 тензорных ядра 4-го поколения — ускорение тренировки и инференса нейросетей (FP16, BF16, TF32, INT8).
- 142 RT-ядра 3-го поколения — трассировка лучей в реальном времени для визуализации и симуляции.
- 48 ГБ памяти GDDR6 с ECC, пропускная способность 864 ГБ/с.
Производительность
- FP32: 91,6 TFLOPS
- TF32 (тензорные): 362 TFLOPS
- INT8 (тензорные): 724 TOPS
- Трассировка лучей: 212 Giga Rays/s (GIPS)
Технологии и возможности
Multi-Instance GPU (MIG)
Позволяет разделить GPU на до 7 независимых экземпляров, каждый с изолированной памятью, кэшами и вычислительными ресурсами. Идеально для мультитенантных сред и виртуализации.
NVLink 4.0
Соединение GPU с пропускной способностью 900 ГБ/с (в двунаправленном режиме) для кластеризации и работы с большими моделями ИИ, превышающими объём памяти одного ускорителя.
Поддержка виртуализации
- NVIDIA vGPU (vWS, vPC, vAPP)
- GPU Pass-Through и SR-IOV
- Сертификация для VMware, Hyper-V, KVM
Энергоэффективность
Максимальное энергопотребление (TDP) — 300 Вт. Пассивное охлаждение с направленным воздушным потоком (требуется обдув от серверных вентиляторов).
Совместимые платформы и аксессуары
Для полноценной работы NVIDIA Tesla L40 требуется сервер с поддержкой PCIe 4.0 x16, достаточным охлаждением и блоком питания. Рекомендуемые компоненты:
| Тип | Рекомендуемые модели | Примечание |
|---|---|---|
| Серверные платформы | Dell PowerEdge R750xa, HPE ProLiant DL380 Gen11, Lenovo ThinkSystem SR650 V3, Supermicro SYS-420GP | Обязательно с GPU-брекетом и поддержкой TDP 300+ Вт |
| Блоки питания (PSU) | 2000 Вт+ (2+1), 80+ Platinum/Titanium | Для систем с несколькими L40 |
| NVLink Bridge (опционально) | NVIDIA NVLink Bridge для L40 / A100 (4- или 8-шинный) | Необходимо для объединения нескольких L40 в кластер |
| Адаптеры для пассивного охлаждения | GPU RevB, задняя панель вентилятора (в зависимости от корпуса) | Обеспечивают дополнительный обдув пассивного радиатора |
| Кабели питания GPU (12+4 pin, 12-pin) | Стандартный 8-pin PCIe (через переходник) или прямой 12VHPWR | В комплекте обычно не входят |
Аналоги NVIDIA Tesla L40
Если модель недоступна или требуется сравнение, рассмотрите следующие альтернативы для задач ИИ и HPC.
| Производитель | Модель | Ключевые отличия / сходство |
|---|---|---|
| NVIDIA | Tesla A100 (80 GB) | Предыдущее поколение Ampere, 80 ГБ HBM2e, MIG до 7 инстансов, медленнее в FP8/INT8, ниже пропускная способность тензорных ядер. |
| NVIDIA | NVIDIA H100 (80 GB / 94 GB) | Архитектура Hopper, значительно выше производительность в трансформерах, поддержка FP8, MIG до 7, бюджет обычно выше. |
| NVIDIA | NVIDIA L40S (48 GB) | Тот же GPU AD102, но с увеличением производительности FP32 и тензорных ядер (566 TFLOPS TF32). Отличается TDP 350 Вт. |
| AMD | AMD Instinct MI210 (64 GB) | Архитектура CDNA 2, 64 ГБ HBM2e, поддержка ROCm, ниже производительность в CUDA-зависимых задачах (переход на HIP). |
| NVIDIA | RTX 6000 Ada Generation (48 GB) | Аналогичный GPU, но форм-фактор двухслотовый, активное охлаждение, дополнительно поддерживает виртуализацию и профессиональную графику. |
Рекомендация: Для задач глубокого обучения с большими моделями (LLM, Vision) H100 опережает L40. Если бюджет ограничен, но требуется поддержка MIG и 48 ГБ – L40 оптимален. Для рабочих станций вместо сервера – RTX 6000 Ada.
Кому подойдёт NVIDIA Tesla L40 PCI-E 48GB
Рекомендуется, если:
- Разрабатываете и обучаете модели машинного обучения (CNN, Transformer, LLM).
- Требуется 48 ГБ памяти с ECC для инференса больших моделей.
- Используете виртуализацию (vGPU, MIG) в ЦОД или корпоративном облаке.
- Занимаетесь рендерингом и трассировкой лучей в VFX, CAD, Digital Twin.
- Планируете масштабирование через NVLink для работы с моделями >48 ГБ.
Вероятно, не подойдёт, если:
- Вам нужна карта для игр или обычного ПК – нет видео-выходов, пассивное охлаждение.
- Достаточно одной карты для лёгкого ИИ (обычно хватает RTX 4090).
- Отсутствует сервер с обдувом для пассивного радиатора.
- Требуется официальная поддержка ROCm/AMD, а не CUDA.
- Критически важна низкая латность GPU-инференса – можно рассмотреть H100.
Конструкция и условия эксплуатации
Форм-фактор и крепление
Двухслотовый, пассивное охлаждение (алюминиевый радиатор с тепловыми трубками), длина PCIe-карты 267 мм, ширина — 111 мм, высота — 40 мм. Требует направленного воздушного потока (от передних вентиляторов сервера). Крепится в стандартный слот PCIe x16 4.0.
Температурные ограничения
- Рабочая температура: 0°C – 50°C (температура воздуха на входе).
- Температура хранения: -40°C – 85°C.
- Относительная влажность: 5% – 90% (без конденсата).
Устанавливается только в серверные корпуса с достаточным обдувом. Допускается монтаж в рабочие станции при условии установки дополнительных вентиляторов.
Технические характеристики
| Модель | NVIDIA Tesla L40 |
| Артикул | L40 PCI-E 48GB |
| Архитектура | Ada Lovelace |
| Интерфейс | PCIe 4.0 x16 |
| Объём памяти | 48 ГБ GDDR6 |
| Тип памяти | GDDR6 с ECC |
| Шина памяти | 384-бит |
| Пропускная способность памяти | 864 ГБ/с |
| Ядра CUDA | 18 176 |
| Тензорные ядра (4-е поколение) | 564 |
| RT-ядра (3-е поколение) | 142 |
| Производительность FP32 | 91,6 TFLOPS |
| Производительность TF32 (тензорные) | 362 TFLOPS |
| Производительность INT8 (тензорные) | 724 TOPS |
| Multi-Instance GPU (MIG) | Да, до 7 инстансов |
| NVLink | Да (NVLink 4.0, 900 ГБ/с двунаправленная) |
| Поддержка виртуализации | vGPU (vWS, vPC, vAPP), GPU Pass-Through, SR-IOV |
| Тип охлаждения | Пассивное (требуется обдув) |
| TDP (макс.) | 300 Вт |
| Питание | 1 x 8-pin PCIe (через переходник) или 1 x 12-pin 12VHPWR |
| Поддержка ECC | Да |
| Размеры (Д x Ш x В) | 267 x 111 x 40 мм |
| Вес нетто | ~1150 г |
| Диапазон рабочих температур | 0°C … 50°C |
| Диапазон температур хранения | -40°C … 85°C |
| Влажность (рабочая) | 5% – 90% (без конденсата) |
| Производитель | NVIDIA |
Часто задаваемые вопросы
Для каких задач подходит Tesla L40?
Основные сценарии: обучение и инференс моделей ИИ (Large Language Models, компьютерное зрение), рендеринг VFX/3D в облаке, виртуализация графических рабочих столов (vGPU), научные вычисления (HPC).
Сколько памяти у L40 и какая пропускная способность?
48 ГБ GDDR6 с ECC, пропускная способность 864 ГБ/с. Память поддерживает коррекцию ошибок (ECC) – критично для ЦОД.
Что такое MIG и сколько инстансов поддерживается?
Multi-Instance GPU позволяет разделить GPU на до 7 независимых виртуальных ускорителей. Каждый получает часть памяти, кэшей и ядер. Полезно для мультитенантных серверов.
Нужен ли обдув для пассивного охлаждения?
Да. L40 не имеет вентилятора – отвод тепла обеспечивается радиатором и направленным потоком воздуха от передних серверных вентиляторов. Требуется корпус с хорошей вентиляцией.
Поддерживает ли L40 NVLink и для чего это нужно?
Да, NVLink 4.0 обеспечивает прямое соединение GPU с пропускной способностью 900 ГБ/с. Это позволяет объединять несколько L40 в кластер для работы с моделями, превышающими 48 ГБ.
Можно ли установить L40 в обычную рабочую станцию?
Да, если материнская плата имеет слот PCIe 4.0 x16, блок питания 300 Вт+ и достаточный обдув. Однако для стабильной работы рекомендуются серверы с горячей заменой вентиляторов.
Какие аналоги дешевле, но близки по производительности?
NVIDIA RTX 6000 Ada (та же архитектура, активное охлаждение, меньше NVLink) или NVIDIA A100 (предыдущее поколение, но с HBM2e). Для начального уровня – RTX 4090 (без ECC и MIG).
В чем отличие L40 от L40S?
L40S имеет более высокие тактовые частоты и TDP (350 Вт), больше вычислительных модулей (18 176 CUDA, 566 тензорных ядер), что увеличивает производительность FP32 и TF32 до 95,3 TFLOPS и 376 TFLOPS соответственно.
Какой блок питания нужен для сервера с одним L40?
Рекомендуется блок на 1000 Вт+ для одного ускорителя с учётом работы CPU и других компонентов. Для 4-х L40 – от 2000 Вт с поддержкой GPU Power Cable.
Где посмотреть совместимость с моим сервером?
Официальный список совместимости на сайте NVIDIA: GPU Compatibility Matrix. Также обратитесь к документации производителя сервера. Наиболее популярны Dell, HPE, Supermicro, Lenovo.
Основные характеристики
Нет вопросов об этом товаре.
