Casa Notizie

notizie sull'azienda MinIO aggiunge cache MemKV su scala petabyte per l'inferenza della GPU Nvidia

Tutti i prodotti

Server di stoccaggio di scaffale
(165)

Server di fusione di Huawei
(31)

Dell Poweredge Server
(59)

Server di H3C
(31)

Commutatori di Datacom
(96)

Dispositivo di WLAN
(21)

Router senza fili astuto
(10)

Disco rigido HDD
(78)

SSD interno del disco rigido
(16)

Carta grafica di Geforce
(27)

Unità di elaborazione del CPU di INTEL
(20)

Memoria RAM del server
(6)

Server ristrutturato di stoccaggio
(6)

Modulo del ricetrasmettitore di SFP
(4)

Selettore di canale della fibra
(42)

Certificazione

Cina Beijing Qianxing Jietong Technology Co., Ltd. Certificazioni

Rassegne del cliente

Il personale di vendita della tecnologia il Co., srl di Pechino Qianxing Jietong è molto professionale e paziente. Possono fornire rapidamente le citazioni. La qualità e l'imballaggio dei prodotti sono inoltre molto buoni. La nostra cooperazione è molto regolare.

—— LLC del》 di Festfing DV del 《

Quando stavo cercando urgentemente il CPU di Intel e lo SSD di Toshiba, sabbioso dalla tecnologia il Co., srl di Pechino Qianxing Jietong mi ha dato molto aiuto e mi ha ottenuto i prodotti che ho avuto bisogno di rapidamente. Realmente la apprezzo.

—— Kitty Yen

Sabbioso della tecnologia il Co., srl di Pechino Qianxing Jietong è un rappresentante molto attento, che può ricordarmi degli errori di configurazione a tempo in cui compro un server. Gli ingegneri sono inoltre molto professionali e possono realizzare rapidamente il processo difficile.

—— Strelkin Mikhail Vladimirovich

Siamo molto soddisfatti della nostra esperienza di lavoro con Beijing Qianxing Jietong. La qualità del prodotto è eccellente e la consegna è sempre puntuale. Il loro team di vendita è professionale, paziente e molto disponibile con tutte le nostre domande. Apprezziamo molto il loro supporto e non vediamo l'ora di una partnership a lungo termine. Altamente raccomandato!

—— Ahmad Navid

Qualità: Grande esperienza con il mio fornitore. Il MikroTik RB3011 era già usato, ma era in ottime condizioni e tutto funzionava perfettamente.e tutte le mie preoccupazioni sono state affrontate rapidamente- Un fornitore molto affidabile.

—— Geran Colesio

Sono ora online in chat

società Notizie

MinIO aggiunge cache MemKV su scala petabyte per l'inferenza della GPU Nvidia

MinIO ha sviluppato un sistema di caching MemKV su scala petabyte su misura per le GPU Nvidia, implementato sulla sua piattaforma di storage di oggetti AIStor.

I cluster GPU che eseguono l'inferenza richiedono memoria a larghezza di banda elevata (HBM) per archiviare contesto, token vettorizzati e coppie chiave-valore (KV) intermedie. Una volta saturata la GPU HBM, i dati vengono trasferiti alla DRAM della CPU e agli SSD NVMe, gestiti dalle DPU Nvidia BlueField-4 (BF4). Quando questi livelli raggiungono la capacità, MinIO AIStor funge da backup di archiviazione finale. L'architettura STX di Nvidia governa questa gerarchia di cache multistrato e MemKV è conforme allo standard per fornire un contesto persistente e condiviso tra i cluster GPU su scala superiore.

AB Periasamy, co-fondatore e co-CEO di MinIO, ha commentato: "Per anni l'industria ha nascosto la perdita di contesto perché, su piccola scala, si potrebbe assorbire la tassa di ricalcolo. Con l'elevata densità di GPU di oggi per hyperscaler e neocloud, questo non è più fattibile.

Il ricalcolo del contesto generato spreca energia; per i cluster con migliaia di GPU, crea un’inefficienza strutturale fondamentale. L’inferenza su larga scala richiede un’infrastruttura appositamente costruita e MemKV è progettato specificamente per questo percorso dati”.

Per la prima volta, MinIO abilita pool di contesti condivisi per interi cluster GPU con flussi di lavoro di inferenza corrispondenti alla latenza di livello microsecondo, evitando ritardi di millisecondi rispetto allo storage esterno convenzionale. Senza livelli di cache sufficienti, le GPU sprecano risorse in ripetuti ricalcoli del contesto.

In un'implementazione da 128 GPU con una lunghezza del contesto di 128.000 token, MemKV ha migliorato il time-to-first-token sotto carichi di produzione e ha aumentato l'utilizzo della GPU dal 50% a oltre il 90%, generando un risparmio sui costi di elaborazione stimato di 2 milioni di dollari all'anno.

Realizzato appositamente per l'architettura Nvidia STX, MemKV supporta gli strumenti di caching Nvidia Dynamo e NIXL. Fornisce petabyte di memoria di contesto condivisa a costi a livello di SSD, disaccoppiando il ridimensionamento della cache dalle risorse di elaborazione della GPU. Le sue caratteristiche principali sono elencate di seguito:

Supporto nativo BF4 STX: viene eseguito come binario ARM64 all'interno dell'infrastruttura STX, incorporato nello storage anziché in server di storage x86 separati.
Trasporto RDMA end-to-end: trasferisce la cache KV tra la memoria GPU e NVMe tramite RDMA, ignorando i protocolli convenzionali di archiviazione di file e oggetti.
Dimensioni del blocco ottimizzate per GPU: utilizza blocchi da 2 a 16 MB per le richieste di throughput della GPU, invece dei blocchi di archiviazione legacy da 4 KB.
Prestazioni wire-speed: ottimizzato per Nvidia Spectrum-X Ethernet e PCIe Gen6 per massimizzare il throughput del tessuto fisico.

MemKV trasferisce direttamente i dati dagli SSD NVMe alle pipeline AI su RDMA, eliminando il sovraccarico HTTP, la traduzione del file system e i server di archiviazione intermedi.

MinIO classifica le soluzioni di memoria di contesto rivali in due tipi: NVMe locale non condivisibile (G3) e archiviazione condivisa per uso generale (G4). Posiziona MemKV come livello G3.5 appositamente creato, distinguendosi dai prodotti di storage generici.

L'azienda sottolinea che le offerte G3.5 dei fornitori legacy mantengono ancora nodi di protocollo, servizi di metadati e livelli di traduzione di file ridondanti. Questi livelli garantiscono durabilità e coerenza per l'addestramento dei dati e dei pesi del modello, ma non sono necessari per la cache KV effimera e ricalcolabile ottimizzata per blocchi di dati da 2-16 MB.

Il fornitore di hardware RAID GRAID e l'azienda di archiviazione WEKA forniscono anche soluzioni di cache KV compatibili con STX. Un'ampia gamma di fornitori di storage supporta Nvidia STX, tra cui Cloudian, Dell, DDN, Everpure, Hammerspace, Hitachi Vantara, HPE, Lightbits/ScaleFlux, NetApp, Nutanix, Peak:AIO, Pliops e VAST Data.

Pechino Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Direttore della strategia globale
WhatsApp/WeChat: +86 13426366826
E-mail: yangyd@qianxingdata.com
Sito Web: www.qianxingdata.com/www.storagesserver.com
Focus aziendale:
Distribuzione prodotti ICT/Integrazione di sistemi e servizi/Soluzioni infrastrutturali
Con oltre 20 anni di esperienza nella distribuzione IT, collaboriamo con marchi leader a livello mondiale per fornire prodotti affidabili e servizi professionali.
"Utilizzare la tecnologia per costruire un mondo intelligente" Il tuo fornitore di servizi di prodotti ICT di fiducia!

Tempo del pub : 2026-05-14 13:46:14 >> lista di notizie

Dettagli di contatto

Beijing Qianxing Jietong Technology Co., Ltd.

Persona di contatto: Ms. Sandy Yang

Telefono: 13426366826

notizie sull'azienda MinIO aggiunge cache MemKV su scala petabyte per l'inferenza della GPU Nvidia

Server di stoccaggio di scaffale

Server di fusione di Huawei

Dell Poweredge Server

Server di H3C

Commutatori di Datacom

Dispositivo di WLAN

Router senza fili astuto

Disco rigido HDD

SSD interno del disco rigido

Carta grafica di Geforce

Unità di elaborazione del CPU di INTEL

Memoria RAM del server

Server ristrutturato di stoccaggio

Modulo del ricetrasmettitore di SFP

Selettore di canale della fibra

Server di stoccaggio di scaffale

12 server Rackmount dello scaffale di Lenovo ThinkSystem SR630 del server delle baie 1U

Unità di elaborazione di Intel Xeon E-2378G del server di stoccaggio di scaffale di ThinkSystem SR250 V2 4SFF

Server del supporto di scaffale di Inspur NF5180M6 1U del server di stoccaggio di scaffale di Intel C621A

Server di fusione di Huawei

Server 32 DDR4 DIMMs dello scaffale di FusionServer 5288 V6 4U 44 dischi rigidi a 3,5 pollici

Server ultra ad alta densità 1288H V5 di stoccaggio della rete del server 1U di fusione di Huawei

Stoccaggio istantaneo ibrido del nuovo di Gen OceanStor 5310 Huawei server dello scaffale