NVIDIA Mellanox MCX653106A-HDAT तकनीकी समाधानः आरडीएमए/आरओसीई आधारित कम विलंबता परिवहन और सर्वर

June 16, 2026

NVIDIA Mellanox MCX653106A-HDAT तकनीकी समाधानः आरडीएमए/आरओसीई आधारित कम विलंबता परिवहन और सर्वर

यह तकनीकी श्वेतपत्र नेटवर्क आर्किटेक्ट्स, पूर्व-बिक्री इंजीनियरों और संचालन प्रबंधकों के लिए डिज़ाइन किया गया है।NVIDIA Mellanox MCX653106A-HDATसर्वर एडाप्टर और माइक्रोसेकंड के पैमाने पर आरडीएमए/आरओसीई परिवहन और अल्ट्रा-उच्च थ्रूपुट प्रदर्शन के लिए सक्षम डेटा सेंटर नेटवर्क बुनियादी ढांचे का निर्माण कैसे करें।

1पृष्ठभूमि और आवश्यकताओं का विश्लेषण

आधुनिक डेटा केंद्रों को तीन मुख्य चुनौतियों का सामना करना पड़ता हैः वितरित भंडारण में अप्रत्याशित विलंबता, एआई प्रशिक्षण समूहों में बैंडविड्थ भूख,और पारंपरिक नेटवर्क प्रोटोकॉल स्टैक द्वारा अत्यधिक सीपीयू खपतपारंपरिक टीसीपी/आईपी समाधान अब एनवीएम-ओएफ, उच्च आवृत्ति व्यापार और वास्तविक समय विश्लेषण की माइक्रोसेकंड-स्केल विलंबता की मांगों को पूरा नहीं कर सकते हैं। उद्योग को तत्कालMCX653106A-HDAT ईथरनेट एडाप्टर कार्ड समाधानजो सर्वर थ्रूपुट को 200Gbps स्तर तक स्केल करते हुए मानक ईथरनेट बुनियादी ढांचे पर हार्डवेयर-डाउनलोड आरडीएमए परिवहन प्रदान करता है।

2समग्र नेटवर्क/सिस्टम आर्किटेक्चर डिजाइन

यह समाधान एक दो-स्तर वाली लीफ-स्पाइन CLOS वास्तुकला को अपनाता है। सभी कंप्यूटिंग और स्टोरेज नोड्सNVIDIA Mellanox MCX653106A-HDAT25G/100G ToR स्विच के लिए। प्रमुख डिजाइन सिद्धांतों में शामिल हैंः

  • पीएफसी (प्राथमिकता प्रवाह नियंत्रण) और ईसीएन (स्पष्ट भीड़ सूचना) द्वारा सक्षम अंत से अंत हानि रहित नेटवर्क
  • भंडारण और एचपीसी कार्यभार के लिए आरडीएमए परिवहन लेन
  • नियंत्रण विमान (मानक टीसीपी/आईपी) और डेटा विमान (रोसीवी2) का पृथक्करण
  • हार्डवेयर आधारित वर्चुअलाइजेशन (SR-IOV, VXLAN/NVGRE/Geneva)

के आधार परMCX653106A-HDAT डेटाशीट, एडाप्टर 600ns से कम पोर्ट-टू-पोर्ट विलंबता प्रदान करता है और प्रति सेकंड 215 मिलियन पैकेट तक का समर्थन करता है, जिससे यह पूर्व-पश्चिम स्टोरेज ट्रैफ़िक और उत्तर-दक्षिण अनुप्रयोग प्रवाह दोनों के लिए आदर्श है।

3इस समाधान में NVIDIA Mellanox MCX653106A-HDAT की भूमिका और प्रमुख विशेषताएं

MCX653106A-HDAT कनेक्टएक्स एडाप्टर PCIe नेटवर्क कार्डमूलभूत डाटा प्लेन इंजन के रूप में कार्य करता है। इसकी प्राथमिक भूमिकाओं में शामिल हैंः

  • आरडीएमए/आरओसीई त्वरण:RoCEv2 का पूर्ण हार्डवेयर ऑफलोड, जिसमें भीड़ प्रबंधन, ऑर्डर से बाहर पैकेट हैंडलिंग, और एप्लिकेशन बफर में तत्काल डेटा प्लेसमेंट शामिल हैं।
  • स्टोरेज प्रोटोकॉल ऑफलोडःNVMe-oF (TCP और RoCE दोनों संस्करणों), iSER और SRP के लिए मूल समर्थन, सॉफ्टवेयर-आधारित लक्ष्य प्रसंस्करण को समाप्त करना।
  • वर्चुअलाइजेशन और मल्टी-टेंनेंसीःप्रति पोर्ट 1,000 वर्चुअल फंक्शन (वीएफ) तक, ओवरले टनल ऑफलोड के साथ लाइन-रेट इनकैप्सुलेशन/डेकैप्सुलेशन सुनिश्चित करता है।
  • सुरक्षा और टेलीमेट्रीः200Gbps पर इनलाइन IPsec/TLS एन्क्रिप्शन, साथ ही हार्डवेयर आधारित प्रवाह ट्रैकिंग (जैसे, कनेक्शन ट्रैकिंग, हिस्टोग्राम) ।

के अनुसारMCX653106A-HDAT विनिर्देश, एडेप्टर पीसीआईई 4.0/5.0 x16 इंटरफेस का समर्थन करता है, जो पूर्ण 200GbE लाइन दर पर भी कोई होस्ट-साइड फ्लैट ग्लॉस सुनिश्चित नहीं करता है।

4. तैनाती और स्केलिंग अनुशंसाएं (सामान्य टोपोलॉजी के साथ)

एक मान्य संदर्भ टोपोलॉजी में निम्नलिखित शामिल हैंः

  • गणना परतः48 दो-सोकेट सर्वर, प्रत्येक एक से सुसज्जितMCX653106A-HDAT(डुअल-पोर्ट 100GbE कॉन्फ़िगरेशन) पोर्ट एक सक्रिय-सक्रिय LAG के रूप में बंधे होते हैं।
  • भंडारण परतः12 सभी फ्लैश NVMe-oF लक्ष्य सर्वर, प्रत्येक दो के साथMCX653106A-HDAT ईथरनेट एडाप्टर कार्डइकाई ∙ एक फ्रंट-एंड कंप्यूटिंग एक्सेस के लिए, एक बैक-एंड प्रतिकृति के लिए।
  • नेटवर्क लेयरःचार 100GbE स्पाइन स्विच और आठ लीफ स्विच, DCBX, PFC (RoCE के लिए वर्ग 3) और ECN सीमाओं के साथ कॉन्फ़िगर किए गए।

200 नोड्स से परे स्केलिंग के लिए आर्किटेक्चर हार्डवेयर ऑफलोड (पूरी तरह से) के साथ EVPN-VXLAN का उपयोग करके मल्टी-पॉड डिजाइन का समर्थन करता हैMCX653106A-HDAT संगतबड़े विक्रेताओं के स्विच के साथ) ।MCX653106A-HDAT कीमतप्रति उपयोग करने योग्य 100GbE पोर्ट तुलनात्मक फाइबर चैनल या InfiniBand समाधानों की तुलना में लगभग 40% कम है।

5संचालन, निगरानी, समस्या निवारण और अनुकूलन

आरडीएमए/आरओसीई तैनाती के प्रभावी संचालन के लिए विशेष उपकरण की आवश्यकता होती है। निम्नलिखित प्रथाओं की सिफारिश की जाती हैः

पहलू अनुशंसित कार्य और उपकरण
टेलीमेट्री और दृश्यता हार्डवेयर काउंटर सक्षम करेंmlx5cmdऔर प्रोमेथियस निर्यातक; पीएफसी विरामों, ईसीएन चिह्नित पैकेटों, और आरओसीई पुनः प्रसारण की निगरानी करें।
भीड़ का पता लगाना प्रयोगएथटूल -Sप्रति कतार आँकड़े के लिए; NVIDIA के डॉकर आधारित भीड़भाड़ टेलीमेट्री किट को तैनात करें।
फर्मवेयर और ड्राइवर Mgmt बनाए रखनाMCX653106A-HDAT संगतफर्मवेयर संस्करण (≥ 26.35.x) DOCA 2.5+ ड्राइवर स्टैक के साथ।
अनुकूलन दिशानिर्देश जंबो फ्रेम के लिए MTU=9000 सेट करें; roce_rx_qos_policy को समायोजित करें; मिश्रित कार्यभार के लिए गतिशील रुकावट मॉडरेशन सक्षम करें.

समस्या निवारण के लिए, RoCEv2-विशिष्ट मेटाडेटा को कैप्चर करेंरडमाटोलऔरibv_devinfoआम बाधाओं में गलत कॉन्फ़िगर की गई पीएफसी प्राथमिकताएं (सभी नेटवर्क उपकरणों में स्थिरता सुनिश्चित करना) और असंगत पीसीआईई लिंक गति (सही के साथ मान्य करना) शामिल हैं।आईएसपीसीआई -वीवीवी) ।

6. सारांश और मूल्य निर्धारण

NVIDIA Mellanox MCX653106A-HDATमानक ईथरनेट कपड़े को उच्च प्रदर्शन वाले, हानि रहित नेटवर्क में बदलने के लिए एक सिद्ध, उत्पादन के लिए तैयार मंच प्रदान करता है। प्रमुख मूल्य मूल्यांकन में शामिल हैंः

  • विलंबताःनिर्धारक उप-10μs NVMe-oF रीड लेटेंसी (P99), वास्तविक समय विश्लेषण और HPC अभिसरण को सक्षम करता है।
  • थ्रूपुटःशून्य पैकेट हानि के साथ 200GbE निकट-लाइन दर, के खिलाफ मान्यMCX653106A-HDAT विनिर्देश.
  • सीपीयू दक्षताःसीपीयू कोर का 30% तक मुक्त करता है जो पहले नेटवर्क और स्टोरेज स्टैक द्वारा खपत किया जाता था।
  • टीसीओःमालिकाना इंटरकनेक्ट की तुलना में,बिक्री के लिए MCX653106A-HDATमूल्य निर्धारण, मानक ईथरनेट स्विचिंग के साथ संयुक्त, अनुमानित 35-50% से तीन साल के परिचालन लागत को कम करता है।

आर्किटेक्ट और ऑपरेशंस लीडर आत्मविश्वास से इस समाधान को एआई फैब्रिक, विघटित भंडारण और अल्ट्रा-लो-लैटेंसी वित्तीय प्रणालियों के लिए तैनात कर सकते हैं।अधिकारी को संदर्भित करेंMCX653106A-HDAT डेटाशीटऔर NVIDIA के DOCA प्रलेखन पुस्तकालय.