मेलनॉक्स (NVIDIA Mellanox) 920-9B210-00FN-0D0 इनफिनिबैंड स्विच उत्पादन में
April 15, 2026
एक प्रमुख पूर्वी एशियाई एआई अनुसंधान संस्थान एक सामान्य लेकिन महत्वपूर्ण बाधा का सामना कर रहा था। बड़े भाषा मॉडल प्रशिक्षण और आणविक गतिशीलता सिमुलेशन के लिए उपयोग किए जाने वाले उनके 512-जीपीयू क्लस्टर में, नौकरियों के बढ़ने के साथ प्रदर्शन में गंभीर गिरावट आ रही थी। मूल कारण विरासत में मिला 100Gb/s ईथरनेट फैब्रिक था, जहां टीसीपी/आईपी ओवरहेड और इनकास्ट घटनाओं के दौरान पैकेट लॉस के कारण जीपीयू का निष्क्रिय समय 35% तक हो गया था। टीम को एक दोषरहित, अल्ट्रा-लो-लेटेंसी फैब्रिक की आवश्यकता थी जो आरडीएमए का समर्थन कर सके और नियतात्मक प्रदर्शन से समझौता किए बिना हजारों नोड्स तक स्केल कर सके। कई समाधानों का मूल्यांकन करने के बाद, उन्होंने चुना मेलानॉक्स (एनवीडिया मेलानॉक्स) 920-9B210-00FN-0D0 उनके नए स्पाइन-लीफ आर्किटेक्चर के मूल के रूप में इन्फिनिबैंड स्विच।
परिनियोजन 920-9B210-00FN-0D0 को स्पाइन परत के रूप में केंद्रित किया गया था, जिसमें 32 लीफ स्विच कनेक्टएक्स-7 एडेप्टर के माध्यम से 512 एनवीडिया ए100 जीपीयू को जोड़ते थे। प्रत्येक 920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDR स्विच 400Gb/s प्रति पोर्ट प्रदान करता है, जो पिछले एचडीआर समाधानों के बैंडविड्थ को दोगुना करता है जबकि सब-माइक्रोसेकंड स्विचिंग लेटेंसी बनाए रखता है। आधिकारिक 920-9B210-00FN-0D0 इन्फिनिबैंड स्विच OPN ने खरीद को सरल बनाया और सभी इकाइयों में फर्मवेयर स्थिरता सुनिश्चित की। नेटवर्क इंजीनियरों ने विस्तृत 920-9B210-00FN-0D0 डेटाशीट और 920-9B210-00FN-0D0 विनिर्देशों का उपयोग बिजली और थर्मल आवश्यकताओं को मान्य करने के लिए किया, जिससे मौजूदा 19" रैक में निर्बाध एकीकरण संभव हुआ। महत्वपूर्ण रूप से, स्विच पूरी तरह से 920-9B210-00FN-0D0 संगत है, जो मौजूदा एचडीआर इंफ्रास्ट्रक्चर और नए एनडीआर एंडपॉइंट्स दोनों के साथ है, जिससे चरणबद्ध माइग्रेशन की अनुमति मिलती है।
- आरडीएमए दक्षता लाभ: एनवीडिया मेलानॉक्स 920-9B210-00FN-0D0 हार्डवेयर-आधारित कंजेशन कंट्रोल को सक्षम करने के साथ, आरडीएमए राइट लेटेंसी 12µs से 1.2µs तक गिर गई। जीपीयू डायरेक्ट आरडीएमए (जीडीआर) पूरी तरह से प्रभावी हो गया, जिससे सीपीयू मेमोरी बॉटलनेक समाप्त हो गए।
- एचपीसी अनुप्रयोग गति में वृद्धि: एक प्रमुख मौसम मॉडलिंग कोड (एमपीआई-आधारित) ने स्विच के अनुकूली रूटिंग और एसएचएआरपी वी2 कलेक्टिव ऑफलोड के कारण 2.7x प्रदर्शन सुधार देखा।
- एआई प्रशिक्षण थ्रूपुट: 175-बिलियन-पैरामीटर एलएलएम प्रशिक्षण कार्य के लिए, नए फैब्रिक ने ऑल-रिड्यूस समय को 68% कम कर दिया, जिससे समग्र जीपीयू उपयोग 62% से 91% तक बढ़ गया।
- परिचालन सरलता: 920-9B210-00FN-0D0 इन्फिनिबैंड स्विच OPN समाधान एनवीडिया के यूएफएम प्लेटफॉर्म के साथ एकीकृत हुआ, जो वास्तविक समय टेलीमेट्री और भविष्य कहनेवाला विफलता अलर्ट प्रदान करता है। आईटी प्रबंधकों ने नेटवर्क-संबंधित समस्या निवारण समय में 50% की कमी की सूचना दी।
परियोजना का मूल्यांकन करते समय, अनुसंधान संस्थान ने 920-9B210-00FN-0D0 मूल्य की तुलना प्रतिस्पर्धी ईथरनेट समाधानों से की। उच्च अग्रिम लागत के बावजूद, कुल स्वामित्व लागत (टीओसीओ) ने उच्च जीपीयू उपयोग और प्रति जीबी/एस कम बिजली के कारण इन्फिनिबैंड का पक्ष लिया। इकाइयां एनवीडिया के वितरण चैनलों के माध्यम से 920-9B210-00FN-0D0 बिक्री के लिए के रूप में आसानी से उपलब्ध हैं, जिसमें लीड टाइम अन्य एनडीआर स्विच की तुलना में काफी कम है। विस्तृत 920-9B210-00FN-0D0 विनिर्देशों ने 24/7 एआई अनुसंधान संचालन के लिए संस्थान की विश्वसनीयता आवश्यकताओं को पूरा करते हुए, अतिरेक बिजली आपूर्ति और हॉट-स्वैपेबल पंखे के लिए समर्थन की भी पुष्टि की।
| पैरामीटर | विवरण |
|---|---|
| मॉडल | एनवीडिया मेलानॉक्स 920-9B210-00FN-0D0 |
| पोर्ट स्पीड | 400Gb/s NDR (प्रति पोर्ट) |
| बेस OPN | 920-9B210-00FN-0D0 इन्फिनिबैंड स्विच OPN |
| पूर्ण कॉन्फ़िगरेशन | 920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDR |
एआई अनुसंधान संस्थान ने अब भविष्य के सभी क्लस्टर विस्तारों के लिए 920-9B210-00FN-0D0 को मानकीकृत कर दिया है, जिसमें एक नियोजित 2,048-जीपीयू एनडीआर200 फैब्रिक भी शामिल है। यह वास्तविक दुनिया का मामला दर्शाता है कि एनवीडिया मेलानॉक्स 920-9B210-00FN-0D0 सिर्फ एक स्विच नहीं है - यह एआई और एचपीसी वातावरण में रैखिक प्रदर्शन स्केलिंग प्राप्त करने के लिए एक मूलभूत घटक है। आर्किटेक्ट्स और आईटी प्रबंधकों के लिए जो नेटवर्किंग बॉटलनेक को खत्म करना चाहते हैं, 920-9B210-00FN-0D0 इन्फिनिबैंड स्विच OPN समाधान एक सिद्ध, उत्पादन-तैयार मार्ग प्रदान करता है।

