NVIDIA Mellanox MCX653106A-HDAT तकनीकी समाधानः आरडीएमए/आरओसीई आधारित कम विलंबता परिवहन और सर्वर
June 16, 2026
यह तकनीकी श्वेतपत्र नेटवर्क आर्किटेक्ट्स, पूर्व-बिक्री इंजीनियरों और संचालन प्रबंधकों के लिए डिज़ाइन किया गया है।NVIDIA Mellanox MCX653106A-HDATसर्वर एडाप्टर और माइक्रोसेकंड के पैमाने पर आरडीएमए/आरओसीई परिवहन और अल्ट्रा-उच्च थ्रूपुट प्रदर्शन के लिए सक्षम डेटा सेंटर नेटवर्क बुनियादी ढांचे का निर्माण कैसे करें।
आधुनिक डेटा केंद्रों को तीन मुख्य चुनौतियों का सामना करना पड़ता हैः वितरित भंडारण में अप्रत्याशित विलंबता, एआई प्रशिक्षण समूहों में बैंडविड्थ भूख,और पारंपरिक नेटवर्क प्रोटोकॉल स्टैक द्वारा अत्यधिक सीपीयू खपतपारंपरिक टीसीपी/आईपी समाधान अब एनवीएम-ओएफ, उच्च आवृत्ति व्यापार और वास्तविक समय विश्लेषण की माइक्रोसेकंड-स्केल विलंबता की मांगों को पूरा नहीं कर सकते हैं। उद्योग को तत्कालMCX653106A-HDAT ईथरनेट एडाप्टर कार्ड समाधानजो सर्वर थ्रूपुट को 200Gbps स्तर तक स्केल करते हुए मानक ईथरनेट बुनियादी ढांचे पर हार्डवेयर-डाउनलोड आरडीएमए परिवहन प्रदान करता है।
यह समाधान एक दो-स्तर वाली लीफ-स्पाइन CLOS वास्तुकला को अपनाता है। सभी कंप्यूटिंग और स्टोरेज नोड्सNVIDIA Mellanox MCX653106A-HDAT25G/100G ToR स्विच के लिए। प्रमुख डिजाइन सिद्धांतों में शामिल हैंः
- पीएफसी (प्राथमिकता प्रवाह नियंत्रण) और ईसीएन (स्पष्ट भीड़ सूचना) द्वारा सक्षम अंत से अंत हानि रहित नेटवर्क
- भंडारण और एचपीसी कार्यभार के लिए आरडीएमए परिवहन लेन
- नियंत्रण विमान (मानक टीसीपी/आईपी) और डेटा विमान (रोसीवी2) का पृथक्करण
- हार्डवेयर आधारित वर्चुअलाइजेशन (SR-IOV, VXLAN/NVGRE/Geneva)
के आधार परMCX653106A-HDAT डेटाशीट, एडाप्टर 600ns से कम पोर्ट-टू-पोर्ट विलंबता प्रदान करता है और प्रति सेकंड 215 मिलियन पैकेट तक का समर्थन करता है, जिससे यह पूर्व-पश्चिम स्टोरेज ट्रैफ़िक और उत्तर-दक्षिण अनुप्रयोग प्रवाह दोनों के लिए आदर्श है।
दMCX653106A-HDAT कनेक्टएक्स एडाप्टर PCIe नेटवर्क कार्डमूलभूत डाटा प्लेन इंजन के रूप में कार्य करता है। इसकी प्राथमिक भूमिकाओं में शामिल हैंः
- आरडीएमए/आरओसीई त्वरण:RoCEv2 का पूर्ण हार्डवेयर ऑफलोड, जिसमें भीड़ प्रबंधन, ऑर्डर से बाहर पैकेट हैंडलिंग, और एप्लिकेशन बफर में तत्काल डेटा प्लेसमेंट शामिल हैं।
- स्टोरेज प्रोटोकॉल ऑफलोडःNVMe-oF (TCP और RoCE दोनों संस्करणों), iSER और SRP के लिए मूल समर्थन, सॉफ्टवेयर-आधारित लक्ष्य प्रसंस्करण को समाप्त करना।
- वर्चुअलाइजेशन और मल्टी-टेंनेंसीःप्रति पोर्ट 1,000 वर्चुअल फंक्शन (वीएफ) तक, ओवरले टनल ऑफलोड के साथ लाइन-रेट इनकैप्सुलेशन/डेकैप्सुलेशन सुनिश्चित करता है।
- सुरक्षा और टेलीमेट्रीः200Gbps पर इनलाइन IPsec/TLS एन्क्रिप्शन, साथ ही हार्डवेयर आधारित प्रवाह ट्रैकिंग (जैसे, कनेक्शन ट्रैकिंग, हिस्टोग्राम) ।
के अनुसारMCX653106A-HDAT विनिर्देश, एडेप्टर पीसीआईई 4.0/5.0 x16 इंटरफेस का समर्थन करता है, जो पूर्ण 200GbE लाइन दर पर भी कोई होस्ट-साइड फ्लैट ग्लॉस सुनिश्चित नहीं करता है।
एक मान्य संदर्भ टोपोलॉजी में निम्नलिखित शामिल हैंः
- गणना परतः48 दो-सोकेट सर्वर, प्रत्येक एक से सुसज्जितMCX653106A-HDAT(डुअल-पोर्ट 100GbE कॉन्फ़िगरेशन) पोर्ट एक सक्रिय-सक्रिय LAG के रूप में बंधे होते हैं।
- भंडारण परतः12 सभी फ्लैश NVMe-oF लक्ष्य सर्वर, प्रत्येक दो के साथMCX653106A-HDAT ईथरनेट एडाप्टर कार्डइकाई ∙ एक फ्रंट-एंड कंप्यूटिंग एक्सेस के लिए, एक बैक-एंड प्रतिकृति के लिए।
- नेटवर्क लेयरःचार 100GbE स्पाइन स्विच और आठ लीफ स्विच, DCBX, PFC (RoCE के लिए वर्ग 3) और ECN सीमाओं के साथ कॉन्फ़िगर किए गए।
200 नोड्स से परे स्केलिंग के लिए आर्किटेक्चर हार्डवेयर ऑफलोड (पूरी तरह से) के साथ EVPN-VXLAN का उपयोग करके मल्टी-पॉड डिजाइन का समर्थन करता हैMCX653106A-HDAT संगतबड़े विक्रेताओं के स्विच के साथ) ।MCX653106A-HDAT कीमतप्रति उपयोग करने योग्य 100GbE पोर्ट तुलनात्मक फाइबर चैनल या InfiniBand समाधानों की तुलना में लगभग 40% कम है।
आरडीएमए/आरओसीई तैनाती के प्रभावी संचालन के लिए विशेष उपकरण की आवश्यकता होती है। निम्नलिखित प्रथाओं की सिफारिश की जाती हैः
| पहलू | अनुशंसित कार्य और उपकरण |
|---|---|
| टेलीमेट्री और दृश्यता | हार्डवेयर काउंटर सक्षम करेंmlx5cmdऔर प्रोमेथियस निर्यातक; पीएफसी विरामों, ईसीएन चिह्नित पैकेटों, और आरओसीई पुनः प्रसारण की निगरानी करें। |
| भीड़ का पता लगाना | प्रयोगएथटूल -Sप्रति कतार आँकड़े के लिए; NVIDIA के डॉकर आधारित भीड़भाड़ टेलीमेट्री किट को तैनात करें। |
| फर्मवेयर और ड्राइवर Mgmt | बनाए रखनाMCX653106A-HDAT संगतफर्मवेयर संस्करण (≥ 26.35.x) DOCA 2.5+ ड्राइवर स्टैक के साथ। |
| अनुकूलन दिशानिर्देश | जंबो फ्रेम के लिए MTU=9000 सेट करें; roce_rx_qos_policy को समायोजित करें; मिश्रित कार्यभार के लिए गतिशील रुकावट मॉडरेशन सक्षम करें. |
समस्या निवारण के लिए, RoCEv2-विशिष्ट मेटाडेटा को कैप्चर करेंरडमाटोलऔरibv_devinfoआम बाधाओं में गलत कॉन्फ़िगर की गई पीएफसी प्राथमिकताएं (सभी नेटवर्क उपकरणों में स्थिरता सुनिश्चित करना) और असंगत पीसीआईई लिंक गति (सही के साथ मान्य करना) शामिल हैं।आईएसपीसीआई -वीवीवी) ।
दNVIDIA Mellanox MCX653106A-HDATमानक ईथरनेट कपड़े को उच्च प्रदर्शन वाले, हानि रहित नेटवर्क में बदलने के लिए एक सिद्ध, उत्पादन के लिए तैयार मंच प्रदान करता है। प्रमुख मूल्य मूल्यांकन में शामिल हैंः
- विलंबताःनिर्धारक उप-10μs NVMe-oF रीड लेटेंसी (P99), वास्तविक समय विश्लेषण और HPC अभिसरण को सक्षम करता है।
- थ्रूपुटःशून्य पैकेट हानि के साथ 200GbE निकट-लाइन दर, के खिलाफ मान्यMCX653106A-HDAT विनिर्देश.
- सीपीयू दक्षताःसीपीयू कोर का 30% तक मुक्त करता है जो पहले नेटवर्क और स्टोरेज स्टैक द्वारा खपत किया जाता था।
- टीसीओःमालिकाना इंटरकनेक्ट की तुलना में,बिक्री के लिए MCX653106A-HDATमूल्य निर्धारण, मानक ईथरनेट स्विचिंग के साथ संयुक्त, अनुमानित 35-50% से तीन साल के परिचालन लागत को कम करता है।
आर्किटेक्ट और ऑपरेशंस लीडर आत्मविश्वास से इस समाधान को एआई फैब्रिक, विघटित भंडारण और अल्ट्रा-लो-लैटेंसी वित्तीय प्रणालियों के लिए तैनात कर सकते हैं।अधिकारी को संदर्भित करेंMCX653106A-HDAT डेटाशीटऔर NVIDIA के DOCA प्रलेखन पुस्तकालय.

