В марте 2026 года на конференции NVIDIA GTC 2026 произошёл важный сдвиг в архитектуре ИИ-систем: компания NVIDIA представила инициативу NVIDIA Storage-Next, а партнёры — прежде всего KIOXIA и Samsung — анонсировали SSD нового поколения с прямым доступом GPU к флеш-памяти. Новые накопители снимают ключевое ограничение современных ИИ-систем — дефицит памяти HBM — и открывают путь к обработке контекстных окон в миллионы токенов и LLM-моделей с триллионами параметров.
Ключевые цифры анонса NVIDIA GTC 2026
Проблема: ограничение памяти в ИИ-системах
Современные ИИ-модели упираются в «узкое место»: объём высокоскоростной памяти HBM (High Bandwidth Memory) на чипах NVIDIA ограничен 80–144 ГБ, тогда как контекстные окна LLM и KV-кеш растут экспоненциально. Традиционная архитектура копирует данные через CPU, добавляя задержки и снижая утилизацию GPU. NVIDIA Storage-Next превращает SSD из пассивного хранилища в активное расширение памяти GPU с прямым доступом через DMA.
| Параметр | Традиционная архитектура | NVIDIA Storage-Next + KIOXIA GP Series |
|---|---|---|
| Путь данных | SSD → CPU → RAM → GPU | SSD → GPU (прямой DMA) |
| Мин. размер блока | 4 КБ (стандарт NVMe) | 512 байт |
| Латентность | Высокая (через CPU) | Низкая (GPU-initiated I/O) |
| Доступный объём памяти | До 144 ГБ HBM | До нескольких ТБ (флеш-расширение) |
| Энергия на операцию | Базовый уровень | До 40% ниже |
| Целевой сценарий | Обучение, инференс | Агентный ИИ, длинный контекст, RAG |
KIOXIA GP Series: первый SSD для NVIDIA Storage-Next
KIOXIA представила семейство GP Series Super High IOPS SSD — первые коммерческие накопители, оптимизированные под архитектуру NVIDIA Storage-Next. Ключевые характеристики:
- XL-FLASH Storage Class Memory — скорость, близкая к DRAM, при плотности флеш-памяти
- GPU-initiated I/O — поддержка прямого доступа через NVIDIA GPUDirect Storage и SCADA
- Гранулярность 512 байт — эффективная работа с KV-кешем и векторными базами данных
- До 40% экономии энергии на операцию по сравнению с обычными TLC SSD
- Форм-фактор E3.S — высокая плотность монтажа в серверах следующего поколения
Сравнение: KIOXIA GP Series vs CM9 Series
| Параметр | KIOXIA GP Series (Super High IOPS) | KIOXIA CM9 Series (для KV-кеша) |
|---|---|---|
| Тип памяти | XL-FLASH (Storage Class Memory) | TLC 3D NAND (BiCS FLASH) |
| Интерфейс | PCIe 5.0 x4, NVMe 2.0 | PCIe 5.0, E3.S |
| Ёмкость | Оптимизирован под IOPS | до 25,6 ТБ |
| Выносливость | Высокая (intensive workloads) | 3 DWPD |
| Гранулярность | 512 байт | 4 КБ (стандарт NVMe) |
| Применение | Расширение HBM, GPU-initiated I/O | KV-кеш, контекстная память (CMX) |
| Доступность | Оценочные образцы — Q4 2026 | Поставки — Q3 2026 |
Источник: пресс-релиз KIOXIA, NVIDIA GTC 2026. GP Series — первое коммерческое решение класса «память-как-хранилище» для прямого доступа GPU.
Ищете серверные SSD для ИИ-инфраструктуры? Мы поможем подобрать решение
Каталог серверных SSD Оставить заявкуNVIDIA Storage-Next: архитектура нового поколения
Инициатива Storage-Next определяет требования к накопителям для ИИ-систем будущего. Пять ключевых принципов:
- GPU-initiated I/O — накопитель принимает команды напрямую от GPU, минуя CPU
- Тонкая гранулярность 512 байт — эффективная работа с метаданными и векторами
- Низкая латентность — задержка доступа сопоставима с оперативной памятью
- Масштабируемость — объединение накопителей в пулы для ИИ-кластеров
- Энергоэффективность — минимизация энергии на I/O-операцию для снижения TCO
Сравнение решений для расширения памяти GPU
| Решение | Технология | Задержка | Ёмкость | Энергия/оп | Статус |
|---|---|---|---|---|---|
| HBM3E / HBM4 | 3D-stacked DRAM | ~100 нс | до 144 ГБ | Высокая | Массовое |
| KIOXIA GP Series | XL-FLASH SCM | ~1–5 мкс | до 8 ТБ | ↓ 40% | Образцы Q4'26 |
| KIOXIA CM9 Series | TLC 3D NAND | ~10–50 мкс | 25,6 ТБ | Средняя | Поставки Q3'26 |
| Samsung PM1743 | QLC 3D NAND | ~50–100 мкс | до 64 ТБ | Базовая | Массовое |
Почему это важно для агентного ИИ
Агентные ИИ-системы (планирование задач, оркестрация субагентов, RAG) генерируют огромные объёмы промежуточных данных: KV-кеш, векторные индексы, контекстные окна. Традиционная архитектура не справляется из-за ограниченного HBM. Прямой доступ GPU к флеш-памяти через GP Series кардинально меняет картину:
Дорожная карта: сроки поставок
Динамика: рост требований к памяти в ИИ (2024–2028)
Помогаем подобрать серверные SSD и ИИ-инфраструктуру под ваши задачи
Серверные SSD в каталоге Серверные платформы