Телеграм Чат

В марте 2026 года на конференции NVIDIA GTC 2026 произошёл важный сдвиг в архитектуре ИИ-систем: компания NVIDIA представила инициативу NVIDIA Storage-Next, а партнёры — прежде всего KIOXIA и Samsung — анонсировали SSD нового поколения с прямым доступом GPU к флеш-памяти. Новые накопители снимают ключевое ограничение современных ИИ-систем — дефицит памяти HBM — и открывают путь к обработке контекстных окон в миллионы токенов и LLM-моделей с триллионами параметров.

Ключевые цифры анонса NVIDIA GTC 2026

Гранулярность доступа
512 байт
вместо 4 КБ у обычных NVMe SSD
Технология памяти
XL-FLASH
Storage Class Memory, низкая латентность
Оценочные образцы
Q4 2026
для партнёров KIOXIA GP Series
Энергоэффективность
↓ 40%
потребление на операцию ввода-вывода

Проблема: ограничение памяти в ИИ-системах

Современные ИИ-модели упираются в «узкое место»: объём высокоскоростной памяти HBM (High Bandwidth Memory) на чипах NVIDIA ограничен 80–144 ГБ, тогда как контекстные окна LLM и KV-кеш растут экспоненциально. Традиционная архитектура копирует данные через CPU, добавляя задержки и снижая утилизацию GPU. NVIDIA Storage-Next превращает SSD из пассивного хранилища в активное расширение памяти GPU с прямым доступом через DMA.

Параметр Традиционная архитектура NVIDIA Storage-Next + KIOXIA GP Series
Путь данныхSSD → CPU → RAM → GPUSSD → GPU (прямой DMA)
Мин. размер блока4 КБ (стандарт NVMe)512 байт
ЛатентностьВысокая (через CPU)Низкая (GPU-initiated I/O)
Доступный объём памятиДо 144 ГБ HBMДо нескольких ТБ (флеш-расширение)
Энергия на операциюБазовый уровеньДо 40% ниже
Целевой сценарийОбучение, инференсАгентный ИИ, длинный контекст, RAG

KIOXIA GP Series: первый SSD для NVIDIA Storage-Next

KIOXIA представила семейство GP Series Super High IOPS SSD — первые коммерческие накопители, оптимизированные под архитектуру NVIDIA Storage-Next. Ключевые характеристики:

  • XL-FLASH Storage Class Memory — скорость, близкая к DRAM, при плотности флеш-памяти
  • GPU-initiated I/O — поддержка прямого доступа через NVIDIA GPUDirect Storage и SCADA
  • Гранулярность 512 байт — эффективная работа с KV-кешем и векторными базами данных
  • До 40% экономии энергии на операцию по сравнению с обычными TLC SSD
  • Форм-фактор E3.S — высокая плотность монтажа в серверах следующего поколения

Сравнение: KIOXIA GP Series vs CM9 Series

ПараметрKIOXIA GP Series (Super High IOPS)KIOXIA CM9 Series (для KV-кеша)
Тип памятиXL-FLASH (Storage Class Memory)TLC 3D NAND (BiCS FLASH)
ИнтерфейсPCIe 5.0 x4, NVMe 2.0PCIe 5.0, E3.S
ЁмкостьОптимизирован под IOPSдо 25,6 ТБ
ВыносливостьВысокая (intensive workloads)3 DWPD
Гранулярность512 байт4 КБ (стандарт NVMe)
ПрименениеРасширение HBM, GPU-initiated I/OKV-кеш, контекстная память (CMX)
ДоступностьОценочные образцы — Q4 2026Поставки — Q3 2026

Источник: пресс-релиз KIOXIA, NVIDIA GTC 2026. GP Series — первое коммерческое решение класса «память-как-хранилище» для прямого доступа GPU.

Ищете серверные SSD для ИИ-инфраструктуры? Мы поможем подобрать решение

Каталог серверных SSD Оставить заявку

NVIDIA Storage-Next: архитектура нового поколения

Инициатива Storage-Next определяет требования к накопителям для ИИ-систем будущего. Пять ключевых принципов:

  1. GPU-initiated I/O — накопитель принимает команды напрямую от GPU, минуя CPU
  2. Тонкая гранулярность 512 байт — эффективная работа с метаданными и векторами
  3. Низкая латентность — задержка доступа сопоставима с оперативной памятью
  4. Масштабируемость — объединение накопителей в пулы для ИИ-кластеров
  5. Энергоэффективность — минимизация энергии на I/O-операцию для снижения TCO

Сравнение решений для расширения памяти GPU

РешениеТехнологияЗадержкаЁмкостьЭнергия/опСтатус
HBM3E / HBM43D-stacked DRAM~100 нсдо 144 ГБВысокаяМассовое
KIOXIA GP SeriesXL-FLASH SCM~1–5 мксдо 8 ТБ↓ 40%Образцы Q4'26
KIOXIA CM9 SeriesTLC 3D NAND~10–50 мкс25,6 ТБСредняяПоставки Q3'26
Samsung PM1743QLC 3D NAND~50–100 мксдо 64 ТББазоваяМассовое

Почему это важно для агентного ИИ

Агентные ИИ-системы (планирование задач, оркестрация субагентов, RAG) генерируют огромные объёмы промежуточных данных: KV-кеш, векторные индексы, контекстные окна. Традиционная архитектура не справляется из-за ограниченного HBM. Прямой доступ GPU к флеш-памяти через GP Series кардинально меняет картину:

Эффективность использования памяти в ИИ-нагрузках
Только HBM (без расширения)
25%
HBM + CPU-буфер (традиц.)
45%
HBM + GP Series (прямой доступ)
85%
Прогноз: полный Storage-Next стек
→ 95%
ℹ️ Почему именно 512 байт? Векторные базы данных и KV-кеш LLM оперируют записями от 256 до 1024 байт. Стандартные NVMe SSD с минимальным блоком 4 КБ читают и пишут лишние данные, расходуя пропускную способность и энергию. Гранулярность 512 байт в KIOXIA GP Series устраняет этот «налог на выравнивание», напрямую повышая эффективность.

Дорожная карта: сроки поставок

Q3 2026
Старт поставок KIOXIA CM9 Series до 25,6 ТБ для KV-кеша
Q4 2026
Оценочные образцы GP Series для избранных партнёров
2027
Массовое внедрение NVIDIA Storage-Next в ИИ-дата-центрах
SCADA
NVIDIA SCADA: безопасная модель программирования прямого доступа GPU

Динамика: рост требований к памяти в ИИ (2024–2028)

⚠️ Что это означает для покупателей ИИ-инфраструктуры. Прямой доступ GPU к флеш-памяти через KIOXIA GP Series и NVIDIA Storage-Next — не просто быстрый SSD, а смена парадигмы: накопитель становится частью иерархии памяти. При проектировании ИИ-систем необходимо учитывать: (1) поддержку GPU-initiated I/O на уровне ПО и драйверов; (2) совместимость с NVIDIA SCADA и GPUDirect Storage; (3) баланс между ёмкостью (CM9) и производительностью (GP Series). Сроки поставки оценочных образцов ограничены — заявки стоит подать заблаговременно.

Помогаем подобрать серверные SSD и ИИ-инфраструктуру под ваши задачи

Серверные SSD в каталоге Серверные платформы

Часто задаваемые вопросы

▶ Что такое NVIDIA Storage-Next?
NVIDIA Storage-Next — инициатива NVIDIA, задающая стандарт для накопителей нового поколения в ИИ-системах. Ключевое требование: SSD должен поддерживать прямой доступ с GPU (GPU-initiated I/O), минуя CPU, с гранулярностью 512 байт. Это превращает хранилище в активное расширение памяти HBM.
▶ Когда выйдет KIOXIA GP Series?
Оценочные образцы KIOXIA GP Series запланированы на Q4 2026 для избранных партнёров. Серийные поставки ожидаются в 2027 году одновременно с массовым внедрением платформы NVIDIA Storage-Next. KIOXIA CM9 Series (до 25,6 ТБ для KV-кеша) доступна раньше — поставки стартуют в Q3 2026.
▶ Чем XL-FLASH отличается от обычного NVMe SSD?
XL-FLASH — технология Storage Class Memory (SCM) от KIOXIA, занимающая нишу между DRAM и обычной NAND-памятью. Она обеспечивает задержки 1–5 мкс (против 50–100 мкс у стандартных NVMe), гранулярность доступа 512 байт (против 4 КБ у NVMe) и до 40% меньше энергии на операцию I/O. Это делает XL-FLASH оптимальным выбором для расширения памяти GPU в ИИ-нагрузках.
▶ Какой SSD выбрать для серверов с GPU NVIDIA?
Выбор зависит от задач: для максимальной производительности и расширения HBM — KIOXIA GP Series (XL-FLASH, Q4 2026); для хранения KV-кеша и больших объёмов — KIOXIA CM9 Series (до 25,6 ТБ, Q3 2026). Оба решения поддерживают PCIe 5.0 и форм-фактор E3.S. Для уточнения совместимости с вашей платформой обратитесь к нашим специалистам.

0
0