Телеграм Чат
NVIDIA GTC 2026: SSD с прямым доступом GPU к флеш-памяти для расширения возможностей ИИ

Март 2026 года на NVIDIA GTC ознаменовался важным сдвигом в архитектуре ИИ-систем: компания представила инициативу Storage-Next, а партнёры — в первую очередь KIOXIA и Samsung — анонсировали SSD нового поколения, позволяющие графическому процессору напрямую обращаться к флеш-памяти для расширения возможностей высокоскоростной памяти HBM. Это решение снимает ключевое ограничение современных ИИ-систем — дефицит доступной для GPU памяти — и открывает путь к обработке контекстных окон в миллионы токенов и моделей с триллионами параметров.

Ключевые цифры анонса на NVIDIA GTC 2026
Гранулярность доступа
512 байт
вместо 4 КБ у обычных NVMe
Технология памяти
XL-FLASH
Storage Class Memory, низкая латентность
Сроки поставки
Q4 2026
оценочные образцы для избранных клиентов
Энергоэффективность
↓ до 40%
потребление на операцию ввода-вывода
Проблема: ограничение памяти в ИИ-системах

Современные ИИ-модели сталкиваются с «узким местом»: объём высокоскоростной памяти HBM (High Bandwidth Memory) на графических процессорах NVIDIA ограничен 80–144 ГБ на чип, тогда как контекстные окна LLM и KV-кеш растут экспоненциально. Традиционная архитектура требует копирования данных через CPU, что добавляет задержки и снижает утилизацию GPU. NVIDIA Storage-Next решает эту проблему, превращая SSD из пассивного хранилища в активное расширение памяти, доступное для прямого доступа со стороны GPU.

ПараметрТрадиционная архитектураNVIDIA Storage-Next + GP Series
Путь данныхSSD → CPU → RAM → GPUSSD → GPU (прямой DMA)
Мин. размер блока4 КБ (стандарт NVMe)512 байт (тонкая гранулярность)
Латентность доступаВысокая (через CPU)Низкая (GPU-initiated I/O)
Доступный объём памятиОграничен HBM (до 144 ГБ)Расширен флеш-памятью (до ТБ)
Энергия на операциюБазовый уровеньДо 40% ниже
СценарийОбучение, инференсАгентный ИИ, длинный контекст, RAG
KIOXIA GP Series: первый коммерческий продукт для Storage-Next

KIOXIA представила семейство GP Series Super High IOPS SSD — первые накопители, оптимизированные для архитектуры NVIDIA Storage-Next. Ключевые особенности:

  • XL-FLASH Storage Class Memory: технология, сочетающая скорость, близкую к DRAM, с плотностью и стоимостью флеш-памяти
  • Прямой доступ с GPU: поддержка GPU-initiated I/O через NVIDIA GPUDirect Storage и SCADA
  • Гранулярность 512 байт: эффективная работа с мелкими блоками данных, характерными для KV-кеша и векторных баз
  • Сниженное энергопотребление: до 40% меньше энергии на операцию ввода-вывода по сравнению с обычными TLC SSD
  • Форм-фактор E3.S: высокая плотность монтажа в серверах следующего поколения
Параметр KIOXIA GP Series (Super High IOPS) KIOXIA CM9 Series (для KV-кеша)
Тип памяти XL-FLASH (Storage Class Memory) TLC 3D NAND (BiCS FLASH)
Интерфейс PCIe 5.0 x4, NVMe 2.0 PCIe 5.0, E3.S форм-фактор
Ёмкость Оптимизирован под производительность до 25,6 ТБ
Выносливость Высокая для интенсивных операций 3 DWPD (полная перезапись в день)
Гранулярность 512 байт (мин. размер доступа) 4 КБ (стандарт NVMe)
Целевое применение Расширение HBM, GPU-initiated I/O KV-кеш, контекстная память (CMX)
Доступность Оценочные образцы — конец 2026 Поставки — Q3 2026

Источник: KIOXIA Press Release, NVIDIA GTC 2026. GP Series — первое коммерческое решение класса «память-как-хранилище» для прямого доступа GPU.

NVIDIA Storage-Next: архитектура нового поколения

Инициатива Storage-Next от NVIDIA определяет требования к накопителям для ИИ-систем будущего. Ключевые принципы:

  1. GPU-initiated I/O: накопитель должен принимать команды напрямую от GPU, минуя CPU
  2. Тонкая гранулярность: поддержка блоков размером 512 байт для эффективной работы с метаданными и векторами
  3. Низкая латентность: задержка доступа должна быть сопоставима с оперативной памятью
  4. Масштабируемость: возможность объединения накопителей в пулы для распределённых ИИ-кластеров
  5. Энергоэффективность: минимизация энергии на операцию ввода-вывода для снижения TCO дата-центра
Сравнение решений для расширения памяти GPU
Решение Технология Задержка Пропускная способность Ёмкость Энергия/оп Статус
HBM3E / HBM4 3D-stacked DRAM ~100 нс до 4,0 ТБ/с до 144 ГБ Высокая Массовое
KIOXIA GP Series XL-FLASH SCM ~1–5 мкс Высокий IOPS до 8 ТБ ↓ 40% Образцы Q4'26
KIOXIA CM9 Series TLC 3D NAND ~10–50 мкс Высокая пропускная 25,6 ТБ Средняя Поставки Q3'26
Samsung PM1743 QLC 3D NAND ~50–100 мкс Стандартная до 64 ТБ Базовая Массовое
Почему это важно для агентного ИИ

Агентные ИИ-системы (планирование задач, вызов инструментов, оркестрация субагентов) генерируют огромные объёмы промежуточных данных: KV-кеш, векторные индексы, контекстные окна. Традиционная архитектура не справляется с такими нагрузками из-за ограниченного объёма HBM. Прямой доступ GPU к флеш-памяти через GP Series позволяет:

Эффективность использования памяти в ИИ-нагрузках
Только HBM (без расширения)
25%
HBM + CPU-буфер (традиц.)
45%
HBM + GP Series (прямой доступ)
85%
Прогноз: полный Storage-Next стек
→ 95%
ℹ️ Контекст: почему 512 байт? Векторные базы данных и KV-кеш LLM оперируют записями размером от 256 до 1024 байт. Традиционные SSD с минимальным блоком 4 КБ вынуждены читать/записывать лишние данные, тратя пропускную способность и энергию. Гранулярность 512 байт в GP Series устраняет этот «налог на выравнивание».
Дорожная карта: что дальше?
Q3 2026
Старт поставок KIOXIA CM9 Series (25,6 ТБ для KV-кеша)
Q4 2026
Оценочные образцы GP Series для избранных партнёров
2027
Массовое внедрение NVIDIA Storage-Next в ИИ-дата-центрах
SCADA
NVIDIA SCADA: безопасная модель программирования для прямого доступа
Динамика: рост требований к памяти в ИИ
⚠️ Что это значит для покупателей ИИ-инфраструктуры. Прямой доступ GPU к флеш-памяти через GP Series и Storage-Next — не просто «ещё один быстрый SSD», а изменение парадигмы: хранилище становится частью иерархии памяти. При проектировании ИИ-систем теперь необходимо учитывать: (1) поддержку GPU-initiated I/O на уровне ПО; (2) совместимость накопителей с NVIDIA SCADA/GPUDirect Storage; (3) баланс между ёмкостью (CM9) и производительностью (GP). Заказывать оценочные образцы следует уже сейчас — сроки поставки ограничены.



0
0