KIOXIA на NVIDIA GTC 2026: SSD нового поколения для GPU

В марте 2026 года на конференции NVIDIA GTC 2026 произошёл важный сдвиг в архитектуре ИИ-систем: компания NVIDIA представила инициативу NVIDIA Storage-Next, а партнёры — прежде всего KIOXIA и Samsung — анонсировали SSD нового поколения с прямым доступом GPU к флеш-памяти. Новые накопители снимают ключевое ограничение современных ИИ-систем — дефицит памяти HBM — и открывают путь к обработке контекстных окон в миллионы токенов и LLM-моделей с триллионами параметров.

Ключевые цифры анонса NVIDIA GTC 2026

Гранулярность доступа

512 байт

вместо 4 КБ у обычных NVMe SSD

Технология памяти

XL-FLASH

Storage Class Memory, низкая латентность

Оценочные образцы

Q4 2026

для партнёров KIOXIA GP Series

Энергоэффективность

↓ 40%

потребление на операцию ввода-вывода

Проблема: ограничение памяти в ИИ-системах

Современные ИИ-модели упираются в «узкое место»: объём высокоскоростной памяти HBM (High Bandwidth Memory) на чипах NVIDIA ограничен 80–144 ГБ, тогда как контекстные окна LLM и KV-кеш растут экспоненциально. Традиционная архитектура копирует данные через CPU, добавляя задержки и снижая утилизацию GPU. NVIDIA Storage-Next превращает SSD из пассивного хранилища в активное расширение памяти GPU с прямым доступом через DMA.

Параметр	Традиционная архитектура	NVIDIA Storage-Next + KIOXIA GP Series
Путь данных	SSD → CPU → RAM → GPU	SSD → GPU (прямой DMA)
Мин. размер блока	4 КБ (стандарт NVMe)	512 байт
Латентность	Высокая (через CPU)	Низкая (GPU-initiated I/O)
Доступный объём памяти	До 144 ГБ HBM	До нескольких ТБ (флеш-расширение)
Энергия на операцию	Базовый уровень	До 40% ниже
Целевой сценарий	Обучение, инференс	Агентный ИИ, длинный контекст, RAG

KIOXIA GP Series: первый SSD для NVIDIA Storage-Next

KIOXIA представила семейство GP Series Super High IOPS SSD — первые коммерческие накопители, оптимизированные под архитектуру NVIDIA Storage-Next. Ключевые характеристики:

XL-FLASH Storage Class Memory — скорость, близкая к DRAM, при плотности флеш-памяти
GPU-initiated I/O — поддержка прямого доступа через NVIDIA GPUDirect Storage и SCADA
Гранулярность 512 байт — эффективная работа с KV-кешем и векторными базами данных
До 40% экономии энергии на операцию по сравнению с обычными TLC SSD
Форм-фактор E3.S — высокая плотность монтажа в серверах следующего поколения

Сравнение: KIOXIA GP Series vs CM9 Series

Параметр	KIOXIA GP Series (Super High IOPS)	KIOXIA CM9 Series (для KV-кеша)
Тип памяти	XL-FLASH (Storage Class Memory)	TLC 3D NAND (BiCS FLASH)
Интерфейс	PCIe 5.0 x4, NVMe 2.0	PCIe 5.0, E3.S
Ёмкость	Оптимизирован под IOPS	до 25,6 ТБ
Выносливость	Высокая (intensive workloads)	3 DWPD
Гранулярность	512 байт	4 КБ (стандарт NVMe)
Применение	Расширение HBM, GPU-initiated I/O	KV-кеш, контекстная память (CMX)
Доступность	Оценочные образцы — Q4 2026	Поставки — Q3 2026

Источник: пресс-релиз KIOXIA, NVIDIA GTC 2026. GP Series — первое коммерческое решение класса «память-как-хранилище» для прямого доступа GPU.

Ищете серверные SSD для ИИ-инфраструктуры? Мы поможем подобрать решение

Каталог серверных SSD Оставить заявку

NVIDIA Storage-Next: архитектура нового поколения

Инициатива Storage-Next определяет требования к накопителям для ИИ-систем будущего. Пять ключевых принципов:

GPU-initiated I/O — накопитель принимает команды напрямую от GPU, минуя CPU
Тонкая гранулярность 512 байт — эффективная работа с метаданными и векторами
Низкая латентность — задержка доступа сопоставима с оперативной памятью
Масштабируемость — объединение накопителей в пулы для ИИ-кластеров
Энергоэффективность — минимизация энергии на I/O-операцию для снижения TCO

Сравнение решений для расширения памяти GPU

Решение	Технология	Задержка	Ёмкость	Энергия/оп	Статус
HBM3E / HBM4	3D-stacked DRAM	~100 нс	до 144 ГБ	Высокая	Массовое
KIOXIA GP Series	XL-FLASH SCM	~1–5 мкс	до 8 ТБ	↓ 40%	Образцы Q4'26
KIOXIA CM9 Series	TLC 3D NAND	~10–50 мкс	25,6 ТБ	Средняя	Поставки Q3'26
Samsung PM1743	QLC 3D NAND	~50–100 мкс	до 64 ТБ	Базовая	Массовое

Почему это важно для агентного ИИ

Агентные ИИ-системы (планирование задач, оркестрация субагентов, RAG) генерируют огромные объёмы промежуточных данных: KV-кеш, векторные индексы, контекстные окна. Традиционная архитектура не справляется из-за ограниченного HBM. Прямой доступ GPU к флеш-памяти через GP Series кардинально меняет картину:

Эффективность использования памяти в ИИ-нагрузках

Только HBM (без расширения)

25%

HBM + CPU-буфер (традиц.)

45%

HBM + GP Series (прямой доступ)

85%

Прогноз: полный Storage-Next стек

→ 95%

ℹ️ Почему именно 512 байт? Векторные базы данных и KV-кеш LLM оперируют записями от 256 до 1024 байт. Стандартные NVMe SSD с минимальным блоком 4 КБ читают и пишут лишние данные, расходуя пропускную способность и энергию. Гранулярность 512 байт в KIOXIA GP Series устраняет этот «налог на выравнивание», напрямую повышая эффективность.

Дорожная карта: сроки поставок

Q3 2026

Старт поставок KIOXIA CM9 Series до 25,6 ТБ для KV-кеша

Q4 2026

Оценочные образцы GP Series для избранных партнёров

2027

Массовое внедрение NVIDIA Storage-Next в ИИ-дата-центрах

SCADA

NVIDIA SCADA: безопасная модель программирования прямого доступа GPU

Динамика: рост требований к памяти в ИИ (2024–2028)

⚠️ Что это означает для покупателей ИИ-инфраструктуры. Прямой доступ GPU к флеш-памяти через KIOXIA GP Series и NVIDIA Storage-Next — не просто быстрый SSD, а смена парадигмы: накопитель становится частью иерархии памяти. При проектировании ИИ-систем необходимо учитывать: (1) поддержку GPU-initiated I/O на уровне ПО и драйверов; (2) совместимость с NVIDIA SCADA и GPUDirect Storage; (3) баланс между ёмкостью (CM9) и производительностью (GP Series). Сроки поставки оценочных образцов ограничены — заявки стоит подать заблаговременно.

Помогаем подобрать серверные SSD и ИИ-инфраструктуру под ваши задачи

Серверные SSD в каталоге Серверные платформы

Часто задаваемые вопросы

▶ Что такое NVIDIA Storage-Next?

NVIDIA Storage-Next — инициатива NVIDIA, задающая стандарт для накопителей нового поколения в ИИ-системах. Ключевое требование: SSD должен поддерживать прямой доступ с GPU (GPU-initiated I/O), минуя CPU, с гранулярностью 512 байт. Это превращает хранилище в активное расширение памяти HBM.

▶ Когда выйдет KIOXIA GP Series?

Оценочные образцы KIOXIA GP Series запланированы на Q4 2026 для избранных партнёров. Серийные поставки ожидаются в 2027 году одновременно с массовым внедрением платформы NVIDIA Storage-Next. KIOXIA CM9 Series (до 25,6 ТБ для KV-кеша) доступна раньше — поставки стартуют в Q3 2026.

▶ Чем XL-FLASH отличается от обычного NVMe SSD?

XL-FLASH — технология Storage Class Memory (SCM) от KIOXIA, занимающая нишу между DRAM и обычной NAND-памятью. Она обеспечивает задержки 1–5 мкс (против 50–100 мкс у стандартных NVMe), гранулярность доступа 512 байт (против 4 КБ у NVMe) и до 40% меньше энергии на операцию I/O. Это делает XL-FLASH оптимальным выбором для расширения памяти GPU в ИИ-нагрузках.

▶ Какой SSD выбрать для серверов с GPU NVIDIA?

Выбор зависит от задач: для максимальной производительности и расширения HBM — KIOXIA GP Series (XL-FLASH, Q4 2026); для хранения KV-кеша и больших объёмов — KIOXIA CM9 Series (до 25,6 ТБ, Q3 2026). Оба решения поддерживают PCIe 5.0 и форм-фактор E3.S. Для уточнения совместимости с вашей платформой обратитесь к нашим специалистам.

664 07.05.2026

Intel Xeon 6 в серверном сегменте 2025–2026: платформы Dell, HPE, Lenovo, Supermicro и структурный сдвиг спроса на фоне агентного ИИ

07.05.2026

Cisco обновляет сертификацию CCNA впервые за 7 лет

02.06.2026