NVIDIA Mellanox MQM8790-HS2F तकनीकी समाधानः आरडीएमए/एचपीसी/एआई क्लस्टर के लिए कम विलंबता इंटरकनेक्ट अनुकूलन

April 10, 2026

NVIDIA Mellanox MQM8790-HS2F तकनीकी समाधानः आरडीएमए/एचपीसी/एआई क्लस्टर के लिए कम विलंबता इंटरकनेक्ट अनुकूलन

यह तकनीकी समाधान नेटवर्क आर्किटेक्ट्स, पूर्व-बिक्री इंजीनियरों, और संचालन के लिए डिज़ाइन किया गया है। यह आर्किटेक्चर, तैनाती,और उच्च प्रदर्शन InfiniBand कपड़े के चारों ओर केंद्रित संचालितNVIDIA Mellanox MQM8790-HS2F, आरडीएमए-गहन एचपीसी और एआई प्रशिक्षण समूहों को लक्षित करता है।

1पृष्ठभूमि और आवश्यकताओं का विश्लेषण

आधुनिक एआई प्रशिक्षण और वैज्ञानिक कंप्यूटिंग क्लस्टरों में नेटवर्क इंटरकनेक्ट को प्राथमिक प्रदर्शन की बाधा के रूप में तेजी से सामना करना पड़ता है। पारंपरिक ईथरनेट कपड़े भीड़ नियंत्रण के साथ संघर्ष करते हैं,पूंछ विलंबता, और सीपीयू ऑफलोड क्षमताएं, वितरित प्रशिक्षण संचार पैटर्न जैसे कि ऑल-रिड्यूस और ऑल-टू-ऑल की मांगों को पूरा करने में विफल। प्रमुख आवश्यकताओं में शामिल हैंःउप-माइक्रोसेकंड अंत से अंत तक विलंबता,बिना हानि के, बिना बूंदों के परिवहन,जीपीयू डायरेक्ट आरडीएमए समर्थन, और क्षमताहजारों नोड्स के लिए रैखिक पैमानेइन इंटरकनेक्ट दक्षता चुनौतियों को मौलिक रूप से हल करने के लिए एक समर्पित InfiniBand स्विचिंग आर्किटेक्चर की आवश्यकता है।

2समग्र नेटवर्क/सिस्टम आर्किटेक्चर डिजाइन

यह समाधान गैर-अवरोधक, पूर्ण द्वि-खंडीय बैंडविड्थ प्राप्त करने के लिए एक दो-परत फैट-ट्री टोपोलॉजी की सिफारिश करता है।MQM8790-HS2F इन्फिनिबैंड स्विच, जो 200Gb/s HDR QSFP56 के 40 पोर्ट प्रदान करता है। उदाहरण के रूप में 512-नोड क्लस्टर का उपयोग करके, डिजाइन निम्नानुसार हैः

  • पत्ते की परत: प्रत्येक MQM8790-HS2F 20 कंप्यूटिंग नोड्स (डुअल-अपलिंक) और 8 अपलिंक को रीढ़ की परत से जोड़ता है।
  • रीढ़ की परत: 8 MQM8790-HS2F स्विच रीढ़ के समतल को बनाते हैं, प्रत्येक पत्ती और प्रत्येक रीढ़ के स्विच के बीच पूर्ण जाल कनेक्शन के साथ।
  • भंडारण एवं प्रबंधन नेटवर्क: कम्प्यूटिंग यातायात में हस्तक्षेप करने से बचने के लिए एक अलग InfiniBand सबनेट या आउट-ऑफ-बैंड ईथरनेट।

यह आर्किटेक्चर किसी भी दो नोड्स के बीच 200Gb/s बैंडविड्थ की गारंटी देता है, जिसमें कई रिडंडेंट पथ सुनिश्चित करते हैं कि एक एकल विफलता बिंदु वैश्विक कनेक्टिविटी को प्रभावित नहीं करता है।उच्च बंदरगाह घनत्वMQM8790-HS2F 200Gb/s HDR 40-पोर्ट QSFP56पिछली पीढ़ी के ईडीआर समाधानों की तुलना में आवश्यक स्विचों की संख्या 50% कम करता है, जबकि कपड़े की जटिलता को भी कम करता है।

3. NVIDIA Mellanox MQM8790-HS2F की भूमिका और प्रमुख विशेषताएं

NVIDIA Mellanox MQM8790-HS2Fइस समाधान में मुख्य स्विचिंग इकाई के रूप में कार्य करता है, निम्नलिखित महत्वपूर्ण भूमिकाओं को पूरा करता हैः

  • हानि रहित स्विचिंग इंजन: InfiniBand लिंक-लेयर प्रवाह नियंत्रण पैकेट हानि को समाप्त करता है, आरडीएमए परिवहन दक्षता सुनिश्चित करता है।
  • अनुकूली रूटिंग: गतिशील रूप से कई रास्तों पर यातायात को संतुलित करता है, भीड़भाड़ के हॉटस्पॉट से बचता है और प्रभावी थ्रूपुट में सुधार करता है।
  • SHARPv3 इन-नेटवर्क कंप्यूटिंग: स्विच पर कटौती के संचालन को ऑफलोड करता है, ऑल-रिड्यूस को 2 ¢ 3 * से तेज करता है।
  • उच्च घनत्व और कम शक्ति: 40 बंदरगाह 200Gb/s से उद्योग में अग्रणी प्रति-पोर्ट बिजली की खपत के साथ, TCO को कम करते हैं।

के अनुसारMQM8790-HS2F डेटाशीटऔरMQM8790-HS2F विनिर्देश, स्विच 16Tb/s की कुल स्विचिंग क्षमता, सब-130ns पोर्ट-टू-पोर्ट विलंबता प्रदान करता है, और 24/7 उत्पादन वातावरण के लिए गर्म-स्वैप करने योग्य बिजली आपूर्ति और प्रशंसकों का समर्थन करता है। इसके अलावा,डिवाइस पूरी तरह से NVIDIA ConnectX-6/7 HDR एडाप्टर और HDR ऑप्टिकल/कॉपर केबल की एक विस्तृत श्रृंखला के साथ संगत है, परिपक्वता की पुष्टि करता हैMQM8790-HS2F संगतपारिस्थितिकी तंत्र।

4. तैनाती और स्केलिंग अनुशंसाएं (सामान्य टोपोलॉजी के साथ)

समाधान को तैनात करते समय इन चरणों का पालन करेंः

  • सबनेट प्रबंधन: सक्रिय स्टैंडबाय सबनेट प्रबंधकों (एसएम) को तैनात करें; केंद्रीकृत प्रबंधन और टेलीमेट्री के लिए एनवीआईडीआईए यूएफएम प्लेटफॉर्म की सिफारिश की जाती है।
  • विभाजन और सेवा स्तर: किरायेदारों या कार्यभारों को अलग करने के लिए विभाजन कुंजी (P_Key) का उपयोग करें; एआई प्रशिक्षण यातायात को प्राथमिकता देने के लिए SL2VL मैपिंग को कॉन्फ़िगर करें।
  • केबल का चयन: संकेत की अखंडता बनाए रखने के लिए छोटी दूरी (≤3 मीटर) के लिए निष्क्रिय तांबे केबल और लंबी दूरी के लिए सक्रिय ऑप्टिकल केबल या ट्रांससीवर का उपयोग करें।

2,000 नोड्स से अधिक के बड़े क्लस्टरों के लिए, तीन-स्तरीय फैट-ट्री या ड्रैगनफ्लाई + टोपोलॉजी को अपनाया जा सकता है, जिसमें कोर परत का उपयोग करना जारी हैMQM8790-HS2Fअतिरिक्त इकाइयों की खरीद करते समय, जाँच करेंMQM8790-HS2F कीमतऔर अधिकृत वितरकों के माध्यम से उपलब्धता; सत्यापितबिक्री के लिए MQM8790-HS2Fसूची में आम तौर पर नवीनतम फर्मवेयर और वारंटी शामिल है।MQM8790-HS2F InfiniBand स्विच समाधानविभागीय एआई अनुसंधान से लेकर सुपरकंप्यूटिंग केंद्रों तक।

5संचालन, निगरानी, समस्या निवारण और अनुकूलन

इन्फिनीबैंड के प्रभावी संचालन के लिए सक्रिय निगरानी और अनुशासित समस्या निवारण की आवश्यकता होती है:

  • निगरानी: उपयोगइब्नेटडिस्कवरटोपोलॉजी सत्यापन के लिए,परफ्यूमरीबंदरगाह काउंटर के लिए, और वास्तविक समय में भीड़भाड़ दृश्यता के लिए यूएफएम टेलीमेट्री।
  • सामान्य मुद्दे और समाधान:
    • लिंक फ्लैपिंग: केबल सीटों की जांच करें और केबल की नैदानिक जांच करें; दोषपूर्ण ऑप्टिक्स को बदलें।
    • सबनेट प्रबंधक विफलता: सुनिश्चित करें कि एसएम प्राथमिकताएं सही ढंग से कॉन्फ़िगर की गई हैं और कि माध्यमिक एसएम के पास एक वैध डेटाबेस है।
    • असमान अनुकूली रूटिंग: रूटिंग एल्गोरिथ्म पैरामीटर समायोजित करें (जैसे,routing_engine=ftree) और लोड वितरण की अनुमति देता है।
  • अनुकूलन युक्तियाँ: सामूहिक परिचालनों के लिए SHARP एकत्रीकरण सक्षम करें; बड़े संदेश हस्तांतरण के लिए 4096 बाइट्स के लिए MTU को ट्यून करें; नियंत्रण, डेटा और प्रबंधन यातायात को अलग करने के लिए सेवा की गुणवत्ता का उपयोग करें।

NVIDIA समर्थन पोर्टल के माध्यम से नियमित फर्मवेयर उन्नयन सुरक्षा पैच और प्रदर्शन में सुधार सुनिश्चित करते हैं।MQM8790-HS2F डेटाशीटस्वस्थ परिस्थितियों में प्रदर्शन के विस्तृत आधार रेखाओं और अपेक्षित काउंटर मूल्यों के लिए।

6. सारांश और मूल्य निर्धारण

NVIDIA Mellanox MQM8790-HS2Fभविष्य के लिए तैयार इनफिनिबैंड स्विचिंग प्लेटफॉर्म प्रदान करता है जो आरडीएमए/एचपीसी/एआई क्लस्टर इंटरकनेक्ट की मुख्य चुनौतियों को संबोधित करता हैः विलंबता, हानि, सीपीयू ओवरहेड और स्केलेबिलिटी।ऊपर वर्णित दो-परत फैट-ट्री वास्तुकला को लागू करके, संगठन रैखिक प्रदर्शन स्केलिंग, पूर्वानुमानित कार्य पूरा करने के समय, और विरासत ईथरनेट समाधानों की तुलना में महत्वपूर्ण रूप से कम टीसीओ प्राप्त कर सकते हैं।स्विच 200Gb/s HDR गति का संयोजन है, 40-पोर्ट घनत्व, और इन-नेटवर्क कंप्यूटिंग क्षमताएं इसे ग्रीनफील्ड तैनाती या ईडीआर/एचडीआर कपड़े से चरणबद्ध उन्नयन के लिए एक आदर्श विकल्प बनाती हैं।अगली पीढ़ी के समूहों का मूल्यांकन करने वाली वास्तुकला टीमों के लिए,MQM8790-HS2F InfiniBand स्विच समाधानएक सिद्ध, उत्पादन के लिए तैयार संदर्भ डिजाइन प्रदान करता है।