NVIDIA Mellanox MQM9790-NS2F इन्फिनिबैंड स्विच तकनीकी समाधान

April 13, 2026

NVIDIA Mellanox MQM9790-NS2F इन्फिनिबैंड स्विच तकनीकी समाधान

यह तकनीकी श्वेतपत्र नेटवर्क आर्किटेक्ट्स, पूर्व-बिक्री इंजीनियरों और संचालन नेताओं के लिए डिज़ाइन किया गया है।MQM9790-NS2Fएक 400Gb/s NDR InfiniBand स्विच और आर्किटेक्चर डिजाइन, प्रमुख प्रौद्योगिकियों, तैनाती और स्केलिंग, साथ ही संचालन और निगरानी पर विस्तृत मार्गदर्शन प्रदान करता है,विशेष रूप से आरडीएमए/एचपीसी/एआई क्लस्टर कम विलंबता इंटरकनेक्ट अनुकूलन के लिए.

1परियोजना पृष्ठभूमि और आवश्यकताओं का विश्लेषण

आधुनिक एआई प्रशिक्षण और एचपीसी कार्यभार हजारों से लेकर हजारों जीपीयू तक क्लस्टर चला रहे हैं। ऐसे वातावरण में, नेटवर्क इंटरकनेक्ट एक प्राथमिक बाधा बन गया है।पारंपरिक ईथरनेट कपड़े पूंछ विलंबता और सीपीयू ओवरहेड के साथ संघर्ष करते हैं, जबकि विरासत InfiniBand तैनाती में पर्याप्त पोर्ट घनत्व और बैंडविड्थ की कमी हो सकती है। प्रमुख आवश्यकताओं में उप-माइक्रोसेकंड स्विचिंग विलंबता, पैकेट हानि के बिना पूर्ण लाइन दर अग्रेषण शामिल हैं,कुशल आरडीएमए समर्थन, और सैकड़ों स्विच के लिए निर्बाध स्केलेबिलिटी।NVIDIA Mellanox MQM9790-NS2Fयह अपनी एनडीआर 400जीबी/एस क्षमता और उन्नत इन-नेटवर्क कंप्यूटिंग सुविधाओं के साथ इन जरूरतों को सीधे संबोधित करता है।

2समग्र नेटवर्क और सिस्टम आर्किटेक्चर डिजाइन

अनुशंसित आर्किटेक्चर एक दो-परत फैट-ट्री (जिसे फोल्ड क्लोज के रूप में भी जाना जाता है) टोपोलॉजी को अपनाता है, जो बाइसेक्शन बैंडविड्थ, लागत और स्केलेबिलिटी को संतुलित करता है।कनेक्टएक्स-7 एनडीआर एडाप्टर से लैस जीपीयू सर्वर पत्ती स्विच से जुड़ते हैंरीढ़ की परत पर,MQM9790-NS2F InfiniBand स्विचइकाईएं पत्तियों के बीच गैर-ब्लॉकिंग कनेक्टिविटी प्रदान करती हैं। यह डिजाइन पूर्ण bisection बैंडविड्थ सुनिश्चित करता हैः कोई भी पत्ती स्विच तार की गति पर किसी भी अन्य पत्ती के साथ संवाद कर सकता है। बड़े पैमाने पर समूहों के लिए,एक तीन परत टोपोलॉजी (पत्ती-पीठ-सुपर-पीठ) तैनात किया जा सकता है, हजारों जीपीयू नोड्स का समर्थन करता है।

  • पत्ती स्विच:64-पोर्ट ओएसएफपी मॉडल, प्रत्येक 32 सर्वर (डुअल-पोर्ट) के साथ-साथ स्पाइन के अपलिंक से जुड़ता है।
  • रीढ़ की परतः MQM9790-NS2F 400Gb/s NDR 64-पोर्ट OSFPस्विच, प्रत्येक पोर्ट के साथ एक पत्ती से एक अपलिंक के रूप में कार्य करता है। एक पूरी तरह से गैर-अवरोधक डिजाइन के लिए पत्ती स्विच की संख्या के बराबर रीढ़ के हड्डी के बंदरगाहों की आवश्यकता होती है।
  • सबनेट प्रबंधनःएक समर्पित या अतिरेक सबनेट प्रबंधक पथ गणना, अनुकूली रूटिंग और विफलता को संभालता है।

3समाधान में NVIDIA Mellanox MQM9790-NS2F की भूमिका और प्रमुख विशेषताएं

कोर रीढ़ की हड्डी और वैकल्पिक रूप से पत्ता डिवाइस के रूप में,MQM9790-NS2Fकई महत्वपूर्ण क्षमताएं प्रदान करता हैः

  • 400Gb/s एनडीआर लाइन दर प्रदर्शनः64 ओएसएफपी बंदरगाहों में से प्रत्येक पूर्ण डुप्लेक्स 400Gb / s पर काम करता है, जो 51.2Tb / s की कुल स्विचिंग क्षमता प्रदान करता है।
  • अल्ट्रा-लो लेटेंसी और अनुकूली रूटिंगःकट-थ्रू स्विचिंग पोर्ट-टू-पोर्ट विलंबता को 130ns से कम रखता है। अनुकूलन रूटिंग गतिशील रूप से कई रास्तों पर यातायात को संतुलित करता है, हॉट स्पॉट से बचता है।
  • नेटवर्क में कंप्यूटिंग (SHARPv3):स्केलेबल पदानुक्रमित संचलन और कमी का समर्थन करता है, सीपीयू/जीपीयू से सामूहिक संचालन को उतारता है और 10 गुना तक डेटा आंदोलन को कम करता है।
  • आरडीएमए-मूल डिजाइनःहार्डवेयर-एक्सेलेरेटेड आरडीएमए जीपीयू मेमोरी तक सीधी पहुंच को सक्षम करता है, सीपीयू की भागीदारी को समाप्त करता है और संचार ओवरहेड को नाटकीय रूप से कम करता है।
  • व्यापक टेलीमेट्री और QoS:बारीक दानेदार भीड़ नियंत्रण, बफर निगरानी और प्रवाह वर्गीकरण मिश्रित कार्यभार के लिए निर्धारक प्रदर्शन सुनिश्चित करते हैं।

के अनुसारMQM9790-NS2F डेटाशीट, स्विच भी गर्म-स्वैप करने योग्य बिजली आपूर्ति और प्रशंसकों, अतिरेक प्रबंधन बंदरगाहों, और निदान के एक पूर्ण सूट का समर्थन करता है, जिससे यह 7 × 24 उत्पादन वातावरण के लिए उपयुक्त हो जाता है।

4. तैनाती और स्केलिंग अनुशंसाएं (सामान्य टोपोलॉजी के साथ)

एक विशिष्ट 2,048-जीपीयू क्लस्टर 64 पत्ती स्विच और 32 रीढ़ स्विच का उपयोग करके बनाया जा सकता है। प्रत्येक पत्ती 32 जीपीयू सर्वर (डुअल-पोर्ट) से जुड़ती है और रीढ़ों तक 32 अपलिंक प्रदान करती है। रीढ़ की परत में शामिल हैंःMQM9790-NS2F संगतएनडीआर ऑप्टिक्स या डीएसी केबल चलाने वाली इकाइयां। 8,192 जीपीयू तक विस्तार के लिए, एक सुपर-स्पाइन परत जोड़ी जाती है, जो कई पॉडों को आपस में जोड़ती है।

स्केलिंग करते समय, निम्नलिखित पर विचार करें:

  • केबलिंग और ऑप्टिक्स:OSFP-to-OSFP DACs का उपयोग करें, और OSFP-to-4xOSFP ब्रेकआउट केबल या ऑप्टिकल मॉड्यूल लंबी दूरी के लिए।MQM9790-NS2F विनिर्देशपहुंच और बिजली के बजट के बारे में।
  • सबनेट आकारःएक एकल सबनेट प्रबंधक 2,000 नोड्स तक संभाल सकता है; इसके अलावा, कई सबनेटों को तैनात करें या वितरित सबनेट प्रबंधक डिजाइन का उपयोग करें।
  • अपर्याप्तता:डबल-होम सर्वर और रिडंडेंट स्पाइन स्विच विफलता के एकल बिंदुओं को समाप्त करते हैं।MQM9790-NS2F InfiniBand स्विच समाधानउचित एसएम विन्यास के साथ हिटलेस फेलओवर का समर्थन करता है।

5संचालन, निगरानी, समस्या निवारण और अनुकूलन

प्रभावी संचालन के लिए दृश्यता और स्वचालन की आवश्यकता होती है। निम्नलिखित प्रथाओं की सिफारिश की जाती हैः

  • निगरानी:पोर्ट त्रुटियों, तापमान, बिजली की खपत और लिंक उपयोग को ट्रैक करने के लिए NVIDIA के फैब्रिक मैनेजर और टेलीमेट्री एपीआई का उपयोग करें। सीआरसी त्रुटियों या प्रतीक त्रुटियों के लिए अलर्ट सेट करें।
  • समस्या निवारणःMQM9790-NS2Fप्रति-पोर्ट काउंटर, बफर अधिभोग हिस्टोग्राम और भीड़भाड़ लॉग प्रदान करता है। प्रदर्शन गिरावट के मामले में, अनुकूलन रूटिंग विन्यास की जाँच करें, सभी कपड़े लिंक सममित हैं सुनिश्चित करें,और सत्यापित करें कि समर्थित सामूहिकों के लिए SHARP एकत्रीकरण सक्षम है.
  • अनुकूलन:कार्यभार के आधार पर अनुकूली रूटिंग मापदंडों को ट्यून करें (जैसे, विलंबता-संवेदनशील बनाम थ्रूपुट-संवेदनशील) । बड़े एआई मॉडल के लिए, भीड़ नियंत्रण को सक्षम करें और पीएफसी गतिरोधों को रोकने के लिए बफर सीमाएं सेट करें।नियमित रूप से समीक्षाMQM9790-NS2F कीमतजब क्षमता में वृद्धि की योजना बनाई जाती है तो प्रदर्शन व्यापार-बंद ️ अक्सर, अधिक पत्तियों को जोड़ने की तुलना में रीडर्स को अपग्रेड करने से बेहतर आरओआई मिलता है।

मूल्यांकन करने वाले संगठनों के लिएबिक्री के लिए MQM9790-NS2F, सुनिश्चित करें कि आपका सॉफ़्टवेयर स्टैक (जैसे, एनसीसीएल, ओपनएमपीआई) एनडीआर सुविधाओं जैसे SHARPv3 और हार्डवेयर-आधारित कमी का समर्थन करता है।

6. सारांश और मूल्य निर्धारण

MQM9790-NS2F InfiniBand स्विच समाधानइसकी 64-पोर्ट 400Gb/s घनत्व, उप-माइक्रोसेकंड स्विचिंग,और इन-नेटवर्क कंप्यूटिंग क्षमताएं आधुनिक कार्यभारों की स्केलेबिलिटी और प्रदर्शन चुनौतियों को सीधे संबोधित करती हैं. ऊपर उल्लिखित वास्तुकला को अपनाने से Fat-Tree टोपोलॉजी, NDR कोर स्विच, और RDMA-देशी संचालन संगठन रैखिक GPU स्केलिंग प्राप्त कर सकते हैं, कार्य पूरा करने के समय को 30% से अधिक कम कर सकते हैं,और कपड़े प्रबंधन को सरल बनाने के लिए।MQM9790-NS2F डेटाशीटअनुकूलित डिजाइन पर चर्चा करने या प्राप्त करने के लिएMQM9790-NS2F कीमतऔर उपलब्धता, कृपया एक अधिकृत NVIDIA भागीदार से संपर्क करें.