NVIDIA Mellanox MCX653106A-HDAT सर्वर एडॉप्टर एक्शन में: RDMA/RoCE लो-लेटेंसी ट्रांसपोर्ट और सर्वर
April 30, 2026
आधुनिक डाटा सेंटर वातावरण में ढ़ेरों प्रकार के डाटा स्टोरेज और हाई-फ्रीक्वेंसी ट्रेडिंग से लेकर बड़े पैमाने पर एआई ट्रेनिंग क्लस्टर तक पारंपरिक टीसीपी/आईपी प्रोटोकॉल स्टैक एक प्रमुख बाधा बन गए हैं।कर्नेल नेटवर्किंग का ओवरहेड, डेटा कॉपी, और संदर्भ स्विचिंग अप्रत्याशित विलंबता पेश करते हुए महत्वपूर्ण सीपीयू संसाधनों का उपभोग करता है।इस केस स्टडी में इस बात की जांच की गई है कि एक प्रमुख क्लाउड इन्फ्रास्ट्रक्चर प्रदाता ने इन चुनौतियों को कैसे दूर किया।NVIDIA Mellanox MCX653106A-HDATसर्वर एनआईसी, विलंबता और थ्रूपुट दोनों में नाटकीय सुधार प्राप्त करता है।
प्रदाता का मौजूदा 25GbE बुनियादी ढांचा, मानक टीसीपी चलाने, NVMe-oF भंडारण यातायात और वास्तविक समय विश्लेषण कार्यभार के साथ तालमेल रखने के लिए संघर्ष कर रहा था।केवल नेटवर्क प्रसंस्करण के लिए स्टोरेज नोड्स पर सीपीयू उपयोग अक्सर 70% से अधिक था, अनुप्रयोग तर्क के लिए अपर्याप्त हेडरूम छोड़ रहा है। कंप्यूटिंग और स्टोरेज नोड्स के बीच अंत से अंत तक विलंबता 50-150 माइक्रोसेकंड के बीच में भिन्न होती है,सेवा स्तर के समझौतों को प्रभावित करने वाले पूंछ विलंबता स्पाइक का कारण बनता हैइंजीनियरों की टीम ने माना कि नेटवर्किंग आर्किटेक्चर में एक मौलिक बदलाव की आवश्यकता थी, जो कि कर्नेल को दरकिनार करता है और एंडपॉइंट के बीच सीधे मेमोरी एक्सेस को सक्षम करता है।
कई विकल्पों का मूल्यांकन करने के बाद, टीम नेMCX653106A-HDAT ईथरनेट एडाप्टर कार्डअपने नेटवर्क ताज़ा करने के लिए आधारशिला के रूप में. कनेक्टएक्स-6 वास्तुकला पर बनाया, यहMCX653106A-HDAT कनेक्टएक्स एडाप्टर PCIe नेटवर्क कार्डRoCE (RDMA over Converged Ethernet) के लिए देशी हार्डवेयर समर्थन के साथ दो-पोर्ट 100GbE कनेक्टिविटी प्रदान करता है। तैनाती चरणबद्ध दृष्टिकोण का पालन करती हैः
- चरण 1:स्टोरेज नोड्स में पुराने एनआईसी (10 नोड्स जो सीईएफ चला रहे हैं) को नए एडाप्टर से बदलें।
- चरण 2:एनआईसी और टॉप-ऑफ-रैक स्विच दोनों पर डीसीबी (प्राथमिकता प्रवाह नियंत्रण और ईटीएस) का उपयोग करके हानि रहित ईथरनेट कॉन्फ़िगर करें।
- चरण 3:टीसीपी सॉकेट से आरडीएमए-आधारित क्रियाओं और एनवीएमई-ओएफ पर आरओसीई पर एप्लिकेशन ट्रैफ़िक को माइग्रेट करें।
- चरण 4:वास्तविक समय विश्लेषिकी को संभालने वाले कंप्यूटिंग नोड्स के लिए तैनाती का विस्तार करें.
अभियंता परामर्शMCX653106A-HDAT डेटाशीटऔरMCX653106A-HDAT विनिर्देशमौजूदा Mellanox स्विच फैब्रिक और तैनात लिनक्स वितरण (Ubuntu 22.04 MLNX_OFED ड्राइवरों के साथ) के साथ पूर्ण संगतता की पुष्टि की।MCX653106A-HDAT संगतपारिस्थितिकी तंत्र व्यापक साबित हुआ, जिसमें एनआईसी की प्रतिस्थापन के अलावा किसी हार्डवेयर परिवर्तन की आवश्यकता नहीं थी।
तैनाती के बाद के परीक्षणों में सभी प्रमुख मीट्रिक में पर्याप्त सुधार सामने आए। निम्नलिखित तालिका में पहले और बाद की तुलना का सारांश दिया गया हैः
| मीट्रिक | पहले (25GbE TCP) | के बाद (MCX653106A-HDAT RoCE) | सुधार |
|---|---|---|---|
| औसत विलंबता (P99) | 120 μs | 8 μs | 93% की कमी |
| स्टोरेज नोड सीपीयू (नेटवर्क पथ) | ~65% | ~12% | 5.4 गुना कमी |
| NVMe-oF रीड थ्रूपुट (प्रति नोड) | 18 जीबी/सेकंड | 96 जीबी/सेकंड | 5.3 गुना वृद्धि |
| संदेश दर (64B पैकेट) | 15 एमपीपीएस | 215 Mpps | 14.3 गुना वृद्धि |
इन मात्रात्मक लाभों के अलावा, टीम ने कई गुणात्मक लाभ देखे।MCX653106A-HDAT ईथरनेट एडाप्टर कार्ड समाधानएप्लिकेशन मेमोरी और रिमोट स्टोरेज के बीच वास्तविक शून्य-प्रतिलिपि डेटा आंदोलन को सक्षम किया, बफर थकावट के मुद्दों को समाप्त करना जो पहले ट्रैफ़िक फटाफट के दौरान अंतराल से विफलता का कारण बनता था।विश्लेषिकी कार्यभार के लिए, आरडीएमए में पलायन करने से कार्य पूरा करने के समय में 62% की कमी आई, जिससे व्यापार के परिणामों में सीधे सुधार हुआ।MCX653106A-HDAT कीमतस्वामित्व की कुल लागत के मुकाबले, स्टोरेज नोड की संख्या में 30% की कमी (प्रति नोड उच्च दक्षता के कारण) ने नौ महीने के भीतर भुगतान किया।बिक्री के लिए MCX653106A-HDATएनवीआईडीआईए भागीदारों के माध्यम से DOCA फ्रेमवर्क तक पहुंच भी शामिल है, कस्टम नेटवर्क कार्यों के लिए भविष्य की प्रोग्रामेबिलिटी को अनलॉक करता है।
की तैनातीNVIDIA Mellanox MCX653106A-HDATप्रदाता के बुनियादी ढांचे को एक उच्च प्रदर्शन, कम विलंबता वाले कपड़े में बदल दिया है जो आधुनिक कार्यभारों का समर्थन करने में सक्षम है।,पीसीआईई 4.0 इंटरफ़ेस और व्यापक सॉफ्टवेयर पारिस्थितिकी तंत्र आज के डेटा केंद्रों की तीन महत्वपूर्ण मांगों को संबोधित करता हैः कम विलंबता, बढ़ी हुई थ्रूपुट और बेहतर सीपीयू दक्षता।
इसी तरह के उन्नयन का मूल्यांकन करने वाले वास्तुकारों के लिए, यात्रा सत्यापन से शुरू होती हैMCX653106A-HDAT संगतस्विच, केबल और ऑपरेटिंग सिस्टम सहित घटक।MCX653106A-HDAT डेटाशीटएकीकृत योजना के लिए बिजली, तापीय और यांत्रिक विनिर्देश प्रदान करता है। जैसा कि 200GbE कपड़े मानक बन जाते हैं और एआई प्रशिक्षण समूहों को कम से कम विलंबता की आवश्यकता होती है,MCX653106A-HDAT ईथरनेट एडाप्टर कार्डएक सिद्ध, उत्पादन-हार्डन समाधान के रूप में तैयार है। प्रदाता अब एआई अनुमान कार्यभार के लिए जीपीयू प्रत्यक्ष आरडीएमए को शामिल करने के लिए तैनाती का विस्तार कर रहा है,आधुनिक डाटा सेंटर वास्तुकला के आधार के रूप में इस एडाप्टर को और अधिक मान्य करना.

