logo
Casa Notizie

notizie sull'azienda MinIO aggiunge cache MemKV su scala petabyte per l'inferenza della GPU Nvidia

Certificazione
Cina Beijing Qianxing Jietong Technology Co., Ltd. Certificazioni
Cina Beijing Qianxing Jietong Technology Co., Ltd. Certificazioni
Rassegne del cliente
Il personale di vendita della tecnologia il Co., srl di Pechino Qianxing Jietong è molto professionale e paziente. Possono fornire rapidamente le citazioni. La qualità e l'imballaggio dei prodotti sono inoltre molto buoni. La nostra cooperazione è molto regolare.

—— LLC del》 di Festfing DV del 《

Quando stavo cercando urgentemente il CPU di Intel e lo SSD di Toshiba, sabbioso dalla tecnologia il Co., srl di Pechino Qianxing Jietong mi ha dato molto aiuto e mi ha ottenuto i prodotti che ho avuto bisogno di rapidamente. Realmente la apprezzo.

—— Kitty Yen

Sabbioso della tecnologia il Co., srl di Pechino Qianxing Jietong è un rappresentante molto attento, che può ricordarmi degli errori di configurazione a tempo in cui compro un server. Gli ingegneri sono inoltre molto professionali e possono realizzare rapidamente il processo difficile.

—— Strelkin Mikhail Vladimirovich

Siamo molto soddisfatti della nostra esperienza di lavoro con Beijing Qianxing Jietong. La qualità del prodotto è eccellente e la consegna è sempre puntuale. Il loro team di vendita è professionale, paziente e molto disponibile con tutte le nostre domande. Apprezziamo molto il loro supporto e non vediamo l'ora di una partnership a lungo termine. Altamente raccomandato!

—— Ahmad Navid

Qualità: “Grande esperienza con il mio fornitore. Il MikroTik RB3011 era già usato, ma era in ottime condizioni e tutto funzionava perfettamente.e tutte le mie preoccupazioni sono state affrontate rapidamente- Un fornitore molto affidabile.

—— Geran Colesio

Sono ora online in chat
società Notizie
MinIO aggiunge cache MemKV su scala petabyte per l'inferenza della GPU Nvidia

MinIO ha sviluppato un sistema di caching MemKV su scala petabyte su misura per le GPU Nvidia, implementato sulla sua piattaforma di storage di oggetti AIStor.

I cluster GPU che eseguono l'inferenza richiedono memoria a larghezza di banda elevata (HBM) per archiviare contesto, token vettorizzati e coppie chiave-valore (KV) intermedie. Una volta saturata la GPU HBM, i dati vengono trasferiti alla DRAM della CPU e agli SSD NVMe, gestiti dalle DPU Nvidia BlueField-4 (BF4). Quando questi livelli raggiungono la capacità, MinIO AIStor funge da backup di archiviazione finale. L'architettura STX di Nvidia governa questa gerarchia di cache multistrato e MemKV è conforme allo standard per fornire un contesto persistente e condiviso tra i cluster GPU su scala superiore.

ultime notizie sull'azienda MinIO aggiunge cache MemKV su scala petabyte per l'inferenza della GPU Nvidia  0


AB Periasamy, co-fondatore e co-CEO di MinIO, ha commentato: "Per anni l'industria ha nascosto la perdita di contesto perché, su piccola scala, si potrebbe assorbire la tassa di ricalcolo. Con l'elevata densità di GPU di oggi per hyperscaler e neocloud, questo non è più fattibile.

Il ricalcolo del contesto generato spreca energia; per i cluster con migliaia di GPU, crea un’inefficienza strutturale fondamentale. L’inferenza su larga scala richiede un’infrastruttura appositamente costruita e MemKV è progettato specificamente per questo percorso dati”.

Per la prima volta, MinIO abilita pool di contesti condivisi per interi cluster GPU con flussi di lavoro di inferenza corrispondenti alla latenza di livello microsecondo, evitando ritardi di millisecondi rispetto allo storage esterno convenzionale. Senza livelli di cache sufficienti, le GPU sprecano risorse in ripetuti ricalcoli del contesto.

In un'implementazione da 128 GPU con una lunghezza del contesto di 128.000 token, MemKV ha migliorato il time-to-first-token sotto carichi di produzione e ha aumentato l'utilizzo della GPU dal 50% a oltre il 90%, generando un risparmio sui costi di elaborazione stimato di 2 milioni di dollari all'anno.

Realizzato appositamente per l'architettura Nvidia STX, MemKV supporta gli strumenti di caching Nvidia Dynamo e NIXL. Fornisce petabyte di memoria di contesto condivisa a costi a livello di SSD, disaccoppiando il ridimensionamento della cache dalle risorse di elaborazione della GPU. Le sue caratteristiche principali sono elencate di seguito:
  • Supporto nativo BF4 STX: viene eseguito come binario ARM64 all'interno dell'infrastruttura STX, incorporato nello storage anziché in server di storage x86 separati.
  • Trasporto RDMA end-to-end: trasferisce la cache KV tra la memoria GPU e NVMe tramite RDMA, ignorando i protocolli convenzionali di archiviazione di file e oggetti.
  • Dimensioni del blocco ottimizzate per GPU: utilizza blocchi da 2 a 16 MB per le richieste di throughput della GPU, invece dei blocchi di archiviazione legacy da 4 KB.
  • Prestazioni wire-speed: ottimizzato per Nvidia Spectrum-X Ethernet e PCIe Gen6 per massimizzare il throughput del tessuto fisico.


MemKV trasferisce direttamente i dati dagli SSD NVMe alle pipeline AI su RDMA, eliminando il sovraccarico HTTP, la traduzione del file system e i server di archiviazione intermedi.


ultime notizie sull'azienda MinIO aggiunge cache MemKV su scala petabyte per l'inferenza della GPU Nvidia  1

MinIO classifica le soluzioni di memoria di contesto rivali in due tipi: NVMe locale non condivisibile (G3) e archiviazione condivisa per uso generale (G4). Posiziona MemKV come livello G3.5 appositamente creato, distinguendosi dai prodotti di storage generici.

L'azienda sottolinea che le offerte G3.5 dei fornitori legacy mantengono ancora nodi di protocollo, servizi di metadati e livelli di traduzione di file ridondanti. Questi livelli garantiscono durabilità e coerenza per l'addestramento dei dati e dei pesi del modello, ma non sono necessari per la cache KV effimera e ricalcolabile ottimizzata per blocchi di dati da 2-16 MB.

Il fornitore di hardware RAID GRAID e l'azienda di archiviazione WEKA forniscono anche soluzioni di cache KV compatibili con STX. Un'ampia gamma di fornitori di storage supporta Nvidia STX, tra cui Cloudian, Dell, DDN, Everpure, Hammerspace, Hitachi Vantara, HPE, Lightbits/ScaleFlux, NetApp, Nutanix, Peak:AIO, Pliops e VAST Data.

Pechino Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Direttore della strategia globale
WhatsApp/WeChat: +86 13426366826
E-mail: yangyd@qianxingdata.com
Sito Web: www.qianxingdata.com/www.storagesserver.com
Focus aziendale:
Distribuzione prodotti ICT/Integrazione di sistemi e servizi/Soluzioni infrastrutturali
Con oltre 20 anni di esperienza nella distribuzione IT, collaboriamo con marchi leader a livello mondiale per fornire prodotti affidabili e servizi professionali.
"Utilizzare la tecnologia per costruire un mondo intelligente" Il tuo fornitore di servizi di prodotti ICT di fiducia!
Tempo del pub : 2026-05-14 13:46:14 >> lista di notizie
Dettagli di contatto
Beijing Qianxing Jietong Technology Co., Ltd.

Persona di contatto: Ms. Sandy Yang

Telefono: 13426366826

Invia la tua richiesta direttamente a noi (0 / 3000)