Casa Casi

AMD Instinct MI350P: l'inferenza AI PCIe aziendale ritorna sui server standard

Tutti i prodotti

Server di stoccaggio di scaffale
(165)

Server di fusione di Huawei
(31)

Dell Poweredge Server
(59)

Server di H3C
(31)

Commutatori di Datacom
(96)

Dispositivo di WLAN
(21)

Router senza fili astuto
(10)

Disco rigido HDD
(78)

SSD interno del disco rigido
(16)

Carta grafica di Geforce
(27)

Unità di elaborazione del CPU di INTEL
(20)

Memoria RAM del server
(6)

Server ristrutturato di stoccaggio
(6)

Modulo del ricetrasmettitore di SFP
(4)

Selettore di canale della fibra
(42)

Certificazione

Cina Beijing Qianxing Jietong Technology Co., Ltd. Certificazioni

Rassegne del cliente

Il personale di vendita della tecnologia il Co., srl di Pechino Qianxing Jietong è molto professionale e paziente. Possono fornire rapidamente le citazioni. La qualità e l'imballaggio dei prodotti sono inoltre molto buoni. La nostra cooperazione è molto regolare.

—— LLC del》 di Festfing DV del 《

Quando stavo cercando urgentemente il CPU di Intel e lo SSD di Toshiba, sabbioso dalla tecnologia il Co., srl di Pechino Qianxing Jietong mi ha dato molto aiuto e mi ha ottenuto i prodotti che ho avuto bisogno di rapidamente. Realmente la apprezzo.

—— Kitty Yen

Sabbioso della tecnologia il Co., srl di Pechino Qianxing Jietong è un rappresentante molto attento, che può ricordarmi degli errori di configurazione a tempo in cui compro un server. Gli ingegneri sono inoltre molto professionali e possono realizzare rapidamente il processo difficile.

—— Strelkin Mikhail Vladimirovich

Siamo molto soddisfatti della nostra esperienza di lavoro con Beijing Qianxing Jietong. La qualità del prodotto è eccellente e la consegna è sempre puntuale. Il loro team di vendita è professionale, paziente e molto disponibile con tutte le nostre domande. Apprezziamo molto il loro supporto e non vediamo l'ora di una partnership a lungo termine. Altamente raccomandato!

—— Ahmad Navid

Qualità: Grande esperienza con il mio fornitore. Il MikroTik RB3011 era già usato, ma era in ottime condizioni e tutto funzionava perfettamente.e tutte le mie preoccupazioni sono state affrontate rapidamente- Un fornitore molto affidabile.

—— Geran Colesio

Sono ora online in chat

AMD Instinct MI350P: l'inferenza AI PCIe aziendale ritorna sui server standard

May 11, 2026

AMD ha rilasciato ufficialmente l'Instinct MI350P, un nuovo acceleratore PCIe su misura per gli utenti aziendali che cercano inferenze di IA on-premise senza revisioni della loro infrastruttura di data center esistente.di cilindrata inferiore o uguale a 600 cm3Questa scheda grafica, di altezza e formato completo, è pienamente compatibile con i server convenzionali raffreddati ad aria.Segna anche il primo rilascio di AMD di un chip Instinct di generazione attuale progettato per slot server standard in quasi quattro anni..

AMD Instinct MI350P

La linea di prodotti Instinct basata su PCIe di AMD è rimasta stagnante dopo il lancio del MI210 all'inizio del 2022.moduli con prese OAM adottati montati su tavole base universali dedicateQuesti moduli richiedono un alloggiamento personalizzato con una robusta distribuzione di energia e un flusso d'aria per supportare fino a otto acceleratori di classe 1.000W in un singolo vassoio.Tale architettura hardware si adatta ai fornitori di cloud hyperscale che acquistano rack GPU in massa, ma non è in grado di soddisfare le imprese normali che non vogliono o non sono in grado di implementare rack di IA su misura per le attività di inferenza in loco.NVIDIA non ha un concorrente PCIe di livello server di fascia alta in questo segmento, lasciando temporaneamente esclusiva AMD sul mercato.

Confronto hardware: MI350P contro MI350X OAM

Il MI350P non è una variante ridotta del MI350X; AMD ha progettato un chip automatizzato indipendente per questo nuovo modello.Il MI350X integra due matrici I/O accoppiate con otto matrici complesse acceleratori (XCD), fornendo 256 unità di calcolo in totale. Al contrario, l'MI350P contiene una matrice I/O e quattro XCD, pari a 128 unità di calcolo. Nonostante la dimezzatura della scala del silicio, mantiene un identico 2.Frequenza di clock di picco di 2 GHz come controparte di livello superioreLa configurazione della memoria segue la stessa specifica declassata: quattro stack HBM3E (rispetto a otto), un bus di memoria a 4.096 bit (in calo da 8.192 bit),con capacità di memoria di 144 GB e larghezza di banda di 4 TB/s, rispetto ai MI350X ′ 288GB e 8 TB/s.

AMD Instinct MI350P architettura

Il picco di throughput di calcolo è anche ridotto della metà. Il MI350P raggiunge 4.600 MXFP4 TFLOPS rispetto al MI350X® 9.2 PFLOPS, insieme a 2.300 FP8 TFLOPS rispetto al modello premium® 4.6 PFLOPS.Metrici di prestazione per il BF16, FP16 e altri standard di precisione seguono lo stesso declino proporzionale.299 TFLOPS sotto MXFP4, 1.529 TFLOPS sotto FP8 e 713 TFLOPS sotto BF16.dove i vincoli di potenza e i limiti di larghezza di banda della memoria inevitabilmente riducono le prestazioni teoriche di picco.

Il team editoriale ha precedentemente valutato la piattaforma MI350X tramite il programma Jumpstart di Supermicro e ha riconosciuto le sue robuste capacità di carico di lavoro di inferenza.Il team è desideroso di condurre i test pratici del MI350P, analizzando le prestazioni di questo acceleratore PCIe-form-factor all'interno del telaio del server standard.

Il MI350P non presenta una riduzione della potenza del 50% nonostante la sua scala in silicio dimezzata.Questa potenza di picco raggiunge il limite superiore delle specifiche PCIe CEMPer i server con raffreddamento insufficiente è disponibile una modalità di funzionamento ridotta di 450 W, accompagnata da moderati tagli di prestazione.posizionati nella stessa staffa di potenza, il MI350P è in diretta concorrenza con NVIDIA's H200 NVL e RTX Pro 6000 Server per gli appalti aziendali.

A differenza di NVIDIA H200 con interconnessioni ad alta velocità NVL4, il MI350P disabilita l'esposizione Infinity Fabric.

Implementazione con raffreddamento ad aria di otto GPU

Come scheda PCIe FHFL a doppia fessura standard, il MI350P è compatibile con i server aziendali esistenti.compresi i Dell PowerEdge XE7740 e HPE ProLiant DL380a Gen12 precedentemente recensitiOttimizzate per gli acceleratori da 600W, queste piattaforme non richiedono scaffali personalizzati, raffreddamento liquido o assi OAM.

Una configurazione MI350P da otto schede offre 1.152 GB di HBM3E e 32 TB/s di larghezza di banda aggregata, sufficiente per ospitare modelli da trilioni di parametri in precisione MXFP4 all'interno di un telaio raffreddato ad aria.Sacrifica tessuti dedicati alla scalazioneMentre l'MI350X utilizza Infinity Fabric per la comunicazione inter-module veloce, l'MI350P si basa esclusivamente su PCIe Gen5.Questa architettura si adatta al parallelismo del tensore locale-nodo e al parallelismo dei dati tra nodi per l'inferenza, mentre il MI350X basato su OAM rimane superiore per le attività di addestramento dell'intelligenza artificiale ad alta larghezza di banda.

Formati di precisione

Il MI350P eredita tutti i formati di precisione dal MI350X senza aggiornamenti.consentire una formazione di bassa precisione con un degrado di qualità trascurabile. MXFP4 offre oltre il doppio della velocità di FP8 e quattro volte il throughput di BF16. Casi del mondo reale come OpenAI gpt-oss e Kimi K2.6 dimostrano il valore della quantizzazione nativa a basso bit.Poiché i pesi MXFP4 e INT4 occupano solo il 25% dello spazio di memoria BF16, i modelli a trilioni di parametri possono essere distribuiti all'interno di un singolo server a otto GPU, eliminando ingombranti cluster multi-nodo per le imprese in loco.

Conclusioni

La maggior parte delle aziende di IA on-premise sono limitate da potenza, raffreddamento, densità e budget piuttosto che da capacità di calcolo grezza.Con NVIDIA che manca di una GPU per server PCIe di punta in questo segmento, AMD conserva per il momento un chiaro vantaggio competitivo. Ulteriori dettagli sono disponibili sul sito web ufficiale di AMD Instinct.

Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang, direttore della strategia globale
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Sito web: www.qianxingdata.com/www.storagesserver.com
Affari:
Distribuzione di prodotti TIC/integrazione di sistemi e servizi/soluzioni infrastrutturali
Con oltre 20 anni di esperienza nella distribuzione IT, collaboriamo con i principali marchi globali per fornire prodotti affidabili e servizi professionali.
Utilizzare la tecnologia per costruire un mondo intelligenteIl vostro fornitore di servizi di prodotti ICT di fiducia!

PREV: Google annuncia TPU v8t Sunfish e TPU v8i Zebrafish

NEXT: HPE espande il portafoglio ProLiant per carichi di lavoro Rugged Edge e IA

Dettagli di contatto

Beijing Qianxing Jietong Technology Co., Ltd.

Persona di contatto: Ms. Sandy Yang

Telefono: 13426366826

AMD Instinct MI350P: l'inferenza AI PCIe aziendale ritorna sui server standard

Server di stoccaggio di scaffale

Server di fusione di Huawei

Dell Poweredge Server

Server di H3C

Commutatori di Datacom

Dispositivo di WLAN

Router senza fili astuto

Disco rigido HDD

SSD interno del disco rigido

Carta grafica di Geforce

Unità di elaborazione del CPU di INTEL

Memoria RAM del server

Server ristrutturato di stoccaggio

Modulo del ricetrasmettitore di SFP

Selettore di canale della fibra

AMD Instinct MI350P: l'inferenza AI PCIe aziendale ritorna sui server standard

Confronto hardware: MI350P contro MI350X OAM

Implementazione con raffreddamento ad aria di otto GPU

Formati di precisione

Conclusioni

Server di stoccaggio di scaffale

12 server Rackmount dello scaffale di Lenovo ThinkSystem SR630 del server delle baie 1U

Unità di elaborazione di Intel Xeon E-2378G del server di stoccaggio di scaffale di ThinkSystem SR250 V2 4SFF

Server del supporto di scaffale di Inspur NF5180M6 1U del server di stoccaggio di scaffale di Intel C621A

Server di fusione di Huawei

Server 32 DDR4 DIMMs dello scaffale di FusionServer 5288 V6 4U 44 dischi rigidi a 3,5 pollici

Server ultra ad alta densità 1288H V5 di stoccaggio della rete del server 1U di fusione di Huawei

Stoccaggio istantaneo ibrido del nuovo di Gen OceanStor 5310 Huawei server dello scaffale