Durante il GTC 2026, VDURA ha presentato gli aggiornamenti chiave della sua piattaforma dati, progettati per migliorare l'utilizzo della GPU e l'efficienza dello storage negli ambienti AI. L’annuncio presenta tre punti salienti principali: la disponibilità generale di Remote Direct Memory Access (RDMA), un’anteprima della sua innovativa tecnologia Context-Aware Tiering e configurazioni di infrastruttura convalidate costruite attorno alle CPU AMD EPYC Torino e ai componenti di rete NVIDIA ConnectX-7.
Questi aggiornamenti sono progettati per eliminare i colli di bottiglia nello spostamento dei dati tra cluster GPU e sistemi di storage, ottimizzando al contempo il posizionamento dei dati tra i livelli di storage per supportare meglio training AI su larga scala e carichi di lavoro di inferenza, affrontando i punti critici nella moderna infrastruttura AI.
RDMA abilita percorsi dati diretti da GPU
VDURA ha integrato il supporto RDMA nell'intera piattaforma dati, consentendo ai server GPU di accedere allo storage direttamente in rete senza il coinvolgimento della CPU. Questa innovazione consente ai trasferimenti di dati dalla GPU allo storage di bypassare i tradizionali percorsi mediati dal kernel e dalla CPU, riducendo significativamente la latenza e aumentando il throughput, offrendo il percorso dati a bassa latenza e ad alto throughput richiesto dai carichi di lavoro di inferenza e training AI su larga scala.
Spazio dei nomi globale VDURA
L'implementazione RDMA è strettamente integrata con VDURA DirectFlow, il livello di movimento dei dati proprietario dell'azienda, garantendo che tutto il traffico del server GPU sfrutti RDMA. Eliminando il sovraccarico della CPU nel percorso dei dati, le risorse di elaborazione rimangono completamente dedicate alle attività di training e inferenza del modello principale. Questo approccio sostiene tassi di utilizzo della GPU più elevati riducendo al minimo la latenza della pipeline nei cluster IA distribuiti, una priorità chiave per le implementazioni IA su larga scala.
Il tiering sensibile al contesto mira all'efficienza del posizionamento dei dati
VDURA ha inoltre dettagliato la prima fase della sua funzionalità Context-Aware Tiering, il cui rilascio generale è previsto per la fine del 2026. Questa tecnologia introduce il posizionamento intelligente e automatizzato dei dati tra livelli di storage in base al comportamento del carico di lavoro in tempo reale e ai modelli di accesso, andando oltre le policy statiche per garantire che i dati risiedano esattamente dove sono più necessari.
La fase iniziale estende il buffer DirectFlow negli SSD NVMe locali, consentendo ai dati “caldi” a cui si accede di frequente di risiedere più vicino alle risorse di elaborazione. Ciò riduce la dipendenza dallo storage condiviso o collegato alla rete per i dati attivi, migliorando i tempi di risposta per i carichi di lavoro critici e ottimizzando ulteriormente le prestazioni.
Inoltre, la piattaforma introduce controlli di writeback KVCache, che mantengono selettivamente solo i dati di inferenza critici per la persistenza nello storage durevole. Ciò riduce al minimo le attività I/O non necessarie mantenendo al contempo le garanzie di persistenza richieste dalle pipeline di inferenza AI di produzione, raggiungendo un equilibrio tra efficienza e affidabilità.
VDURA sta inoltre implementando un framework unificato di Context Cache Tiering che si estende su DRAM e SSD locale. Questo framework consente un accesso in lettura e scrittura ad alta velocità paragonabile alle prestazioni della classe LMCache, rendendolo particolarmente adatto per casi d'uso come l'inferenza LLM a lungo contesto e la generazione aumentata di recupero (RAG).
VDURA ha osservato che le fasi future del Context-Aware Tiering si espanderanno nel posizionamento dei dati application-aware, in una maggiore coerenza della cache tra i nodi e nel supporto per componenti infrastrutturali emergenti come le DPU NVIDIA BlueField-4, estendendo ulteriormente le capacità della piattaforma man mano che i carichi di lavoro AI si evolvono.
A complemento di questi miglioramenti software, l'azienda ha introdotto configurazioni di piattaforma ottimizzate che accoppiano i processori AMD EPYC Torino con gli adattatori di rete NVIDIA ConnectX-7. Queste configurazioni sono realizzate appositamente per integrare i percorsi dati abilitati per RDMA, supportando comunicazioni a throughput elevato e bassa latenza tra cluster GPU e sistemi di storage, stabilendo un nuovo punto di riferimento per l'infrastruttura AI nativa della GPU.
Focus sulla pipeline di dati AI full-stack
Il CEO di VDURA, Ken Claffey, ha sottolineato l'attenzione dell'azienda nel fornire una piattaforma di storage AI che abbracci l'intera gerarchia dei dati, dalla memoria all'archiviazione a lungo termine, senza compromessi sulle prestazioni. Ha sottolineato che la piattaforma sfrutta RDMA per l'accesso diretto ai dati senza CPU e il tiering sensibile al contesto per posizionare in modo intelligente i dati tra i livelli di storage: innovazioni che aiutano le organizzazioni a supportare modelli di intelligenza artificiale più grandi, gestire più richieste di inferenza e scalare l'infrastruttura di intelligenza artificiale soddisfacendo al tempo stesso i requisiti di affidabilità di livello produttivo.
Questo approccio combinato è specificamente progettato per supportare modelli di dimensioni più grandi, aumentare il throughput di inferenza e migliorare l'efficienza complessiva dell'infrastruttura, il tutto mantenendo gli standard di affidabilità e conformità essenziali per le implementazioni di IA in produzione.
Disponibilità
Il supporto RDMA è ora generalmente disponibile sulle piattaforme VDURA V5000 e V7000, pronto per l'implementazione immediata. Si prevede che la Fase 1 del tiering sensibile al contesto raggiunga la disponibilità generale più avanti nel 2026, con programmi di accesso anticipato attualmente in corso per clienti selezionati per testare e ottimizzare la tecnologia prima del suo rilascio completo.
Pechino Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Direttore della strategia globale
WhatsApp/WeChat: +86 13426366826
E-mail: yangyd@qianxingdata.com
Sito Web: www.qianxingdata.com/www.storagesserver.com
Obiettivo aziendale:
Distribuzione prodotti ICT/Integrazione di sistemi e servizi/Soluzioni infrastrutturali
Con oltre 20 anni di esperienza nella distribuzione IT, collaboriamo con marchi leader a livello mondiale per fornire prodotti affidabili e servizi professionali.
"Utilizzare la tecnologia per costruire un mondo intelligente" Il tuo fornitore di servizi di prodotti ICT di fiducia!
Sandy Yang/Direttore della strategia globale
WhatsApp/WeChat: +86 13426366826
E-mail: yangyd@qianxingdata.com
Sito Web: www.qianxingdata.com/www.storagesserver.com
Obiettivo aziendale:
Distribuzione prodotti ICT/Integrazione di sistemi e servizi/Soluzioni infrastrutturali
Con oltre 20 anni di esperienza nella distribuzione IT, collaboriamo con marchi leader a livello mondiale per fornire prodotti affidabili e servizi professionali.
"Utilizzare la tecnologia per costruire un mondo intelligente" Il tuo fornitore di servizi di prodotti ICT di fiducia!



