Qdrant, fornitore di soluzioni di database e ricerca vettoriale componibile, ha implementato prestazioni di indicizzazione migliorate, meccanismi di failover del cluster a tripla zona e funzionalità di registrazione di controllo incentrate sulla conformità.
L'azienda sviluppa un database vettoriale autonomo per l'archiviazione degli incorporamenti richiesti dai modelli linguistici di grandi dimensioni (LLM) e dagli agenti di intelligenza artificiale autonomi, che comunemente alimentano i flussi di lavoro di inferenza dell'intelligenza artificiale come il Retrieval-Augmented Generation (RAG). Secondo Qdrant, i team di procurement aziendale valutano sempre gli strumenti di ricerca vettoriale rispetto a tre criteri fondamentali: scalabilità per carichi di lavoro crescenti, continuità del servizio in caso di guasti dell’infrastruttura e audit operativo tracciabile.
André Zayarni, co-fondatore e CEO di Qdrant, ha commentato: "Le GPU non si limitano più all'inferenza del modello; ottimizzano anche l'indicizzazione dei dati. Abbiamo abilitato la costruzione HNSW accelerata da GPU nella nostra versione open source a partire dalla versione 1.13 e questa funzionalità è ora ufficialmente disponibile su Qdrant Cloud. Combinata con la replica multi-AZ e la registrazione di audit, la suite integrata consente alle aziende di implementare Qdrant per carichi di lavoro di produzione critici."
Gli ultimi aggiornamenti del prodotto Qdrant riguardano tre miglioramenti chiave:
Indicizzazione accelerata dalla GPU: I test di benchmark confermano che le GPU dedicate aumentano la velocità di costruzione dell’indice HNSW fino a quattro volte su Qdrant Cloud. Gli utenti possono montare le risorse GPU sui cluster esistenti per gestire in modo efficiente i burst di indicizzazione ad alta intensità.
Cluster di zone multi-disponibilità (AZ).: il meccanismo di replica tra zone di disponibilità duplica i dati in tre zone di disponibilità in una singola regione. Elimina la latenza del failover manuale, garantendo operazioni di lettura-scrittura ininterrotte anche se una zona di disponibilità subisce un'interruzione.
Registrazione di controllo: la funzione registra tutte le operazioni basate su API, comprese query di dati, inserimenti, eliminazioni, gestione delle raccolte e attività di snapshot. Ogni voce di log adotta il formato JSON strutturato, contrassegnando identità utente, chiavi API, timestamp, raccolte di destinazione e stato di autorizzazione dell'operazione. Quando i sistemi autonomi eseguono attività basate sui dati recuperati, i registri forniscono chiari audit trail per origini delle richieste, tempi di esecuzione e legittimità di accesso. Gli utenti possono personalizzare i cicli di conservazione dei registri ed esportare i record esternamente tramite API per l'archiviazione a lungo termine.
Attualmente, l'indicizzazione accelerata da GPU è accessibile su AWS, con piani in corso per espandere la copertura a più fornitori e regioni cloud. I cluster Multi-AZ appartengono al livello Premium di Qdrant, offrendo un tempo di attività supportato da SLA del 99,95%. La funzionalità di registrazione degli audit è aperta a tutti i cluster Qdrant Cloud a pagamento.
La documentazione ufficiale fornisce ulteriori dettagli sulle tre nuove funzionalità.
Nota
Hierarchical Navigable Small World (HNSW) è un algoritmo progettato per identificare i vettori vicini più vicini. Mappa i vettori in strutture grafiche interconnesse, che si espandono drasticamente con l'aumento del volume dei dati. HNSW impila più livelli di grafici virtuali: il livello sparse superiore contiene vettori minimi per una rapida ricerca preliminare, mentre i livelli inferiori memorizzano sempre più vettori fino a quando il livello inferiore copre tutti i punti dati. Ogni livello funge da punto di ingresso ottimizzato per il successivo, riducendo notevolmente la latenza complessiva della ricerca.
Qdrant deve far fronte alla concorrenza di diversi concorrenti del settore. Pinecone adotta inoltre algoritmi HNSW e sfrutta le GPU NVIDIA per ottimizzare le prestazioni di incorporamento e riclassificazione. Zilliz offre sia compatibilità HNSW che accelerazione GPU; il suo database Milvus sottostante integra Nvidia CUDA-Accelerated Graph Index for Vector Retrieval (CAGRA) dalla libreria RAPIDS cuVS per abilitare l'indicizzazione della GPU.
Pechino Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Direttore della strategia globale
WhatsApp/WeChat: +86 13426366826
E-mail: yangyd@qianxingdata.com
Sito Web: www.qianxingdata.com/www.storagesserver.com
Focus aziendale:
Distribuzione prodotti ICT/Integrazione di sistemi e servizi/Soluzioni infrastrutturali
Con oltre 20 anni di esperienza nella distribuzione IT, collaboriamo con marchi leader a livello mondiale per fornire prodotti affidabili e servizi professionali.
"Utilizzare la tecnologia per costruire un mondo intelligente" Il tuo fornitore di servizi di prodotti ICT di fiducia!