MIT and Tufts University researchers have developed a performance-enhancing management scheme for pooled SSDs that mitigates performance slowdowns caused by block erase-and-write operations and garbage collection.
Si chiama Sandook,il presente schema separa le caratteristiche a breve e lungo termine che limitano le prestazioni degli SSD che utilizzano una struttura di controllo a due strati alimentata con telemetria da software di agente in esecuzione su server di memorizzazione.
Dato che le scritture richiedono un ciclo di cancellazione e riscrizione a livello di blocco, sono molto più lente delle letture.e pesante traffico di scrittura può degradare le prestazioni di lettura complessiva. Le prestazioni possono anche variare tra le impostazioni di SDS di diversi fornitori, e persino tra gli SSD dello stesso produttore e batch.deve copiare i dati validiQuesta operazione è generalmente gestita in modo indipendente da ciascun controller SSD e può portare a improvvisi,diminuzione significativa delle prestazioni.
I ricercatori immaginano un cluster di calcolo composto da nodi di calcolo e server di archiviazione.insieme al software client sui server di calcolo e al software agente sui server di archiviazioneI server di archiviazione utilizzano SSD standard, disponibili, ognuno dotato del proprio controller nativo.
Il controller Sandook mantiene un registro di tutti gli SSD, avendo profilato ciascuno per stabilire linee di base di prestazione come le capacità IOPS.Assegna modalità di lettura o scrittura a singole unità e riceve aggiornamenti delle prestazioni in tempo reale ogni 200ms da agenti Sandook sui server di archiviazioneUtilizzando questi dati, calcola i pesi di lettura e di scrittura adeguati alla domanda globale di I/O del cluster e condivide queste decisioni di programmazione con il software client Sandook sui server di calcolo.
Per le letture, Sandook sfrutta la replicazione di blocchi esistente - già utilizzata per la tolleranza agli errori - per indirizzare in modo flessibile le richieste di lettura tra le repliche su SSD diversi.utilizza un design strutturato in modo log che consente di indirizzare le scritture a qualsiasi SSD indipendentemente dal posizionamento logico dei blocchiQuesto elevato grado di flessibilità garantisce che le politiche di programmazione possano essere applicate senza restrizioni.
Il software client Sandook espone un'interfaccia standard di blocco dei dispositivi alle applicazioni, indirizzando in modo trasparente le richieste di I/O verso gli SSD più appropriati in base alle regole di programmazione del controller.Riceve anche lo stato SSD in tempo reale da agenti del lato dello storage e può de-priorizzare un SSD durante la raccolta dei rifiutiLe richieste di lettura e scrittura vengono quindi reindirizzate ad altre unità, evitando un'eccessiva latenza della coda nel sistema di archiviazione generale.
Gli agenti Sandook (1) elaborano i comandi di lettura e scrittura dai client e li inoltrano agli SSD di destinazione; (2) forniscono un monitoraggio indipendente dall'hardware,compresi i profili periodici e i segnali di stato in tempo reale, per supportare la programmazione del titolare del trattamento;e (3) trasmettere segnali di congestione SSD ai client in modo che gli eventi a breve termine come la raccolta dei rifiuti possano essere gestiti localmente e immediatamente spostando I / O su altri SSD nel server.
La memoria e la CPU di monitoraggio di dozzine di SSD per server di archiviazione è minima.
I ricercatori hanno valutato Sandook in base a quattro carichi di lavoro:
- LeanStore: un motore di storage OLTP ad alte prestazioni ottimizzato per CPU multi-core e SSD NVMe.
- Machine learning: addestramento di un modello Unet3D CNN con PyTorch su un set di dati da 180 GB.
- LZ4: compressione delle immagini sul set di dati ImageNet ILSVRC2015.
- Server di archiviazione: un server di archiviazione a blocchi open source ad alte prestazioni che serve applicazioni sensibili alla latenza.
Nel complesso, Sandook migliora il throughput I/O grezzo del 30-82% rispetto ai sistemi esistenti che affrontano solo una fonte di variabilità delle prestazioni, mantenendo al contempo una latenza di coda inferiore al millisecondo.Per le applicazioni non modificate che condividono un pool SSD, le prestazioni end-to-end migliorano del 1294%.
In particolare, rispetto ai sistemi precedenti, offre 1,7 volte più elevato throughput di archiviazione, 1,12×1,94 volte più elevato throughput delle applicazioni, 71×88% di latenza inferiore,e un utilizzo della GPU superiore del 23% senza necessità di modifiche di hardware o di applicazioni personalizzate.
L'articolo di Sandook, intitolato "Unleashing The Potential of Datacenter SSDs by Taming Performance Variability", è disponibile come PDF scaricabile.Il lavoro sarà presentato al Simposio USENIX sulla progettazione e implementazione di sistemi in rete (NSDI 2026) a RentonWashington, dal 4 al 6 maggio.
Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang, direttore della strategia globale
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Sito web: www.qianxingdata.com/www.storagesserver.com
Affari:
Distribuzione di prodotti TIC/integrazione di sistemi e servizi/soluzioni infrastrutturali
Con oltre 20 anni di esperienza nella distribuzione IT, collaboriamo con i principali marchi globali per fornire prodotti affidabili e servizi professionali.
Utilizzare la tecnologia per costruire un mondo intelligenteIl vostro fornitore di servizi di prodotti ICT di fiducia!