मेलनॉक्स (NVIDIA Mellanox) 920-9B210-00FN-0D0 इन्फिनिबैंड स्विच अनुप्रयोग अभ्यास

January 6, 2026

के बारे में नवीनतम कंपनी की खबर मेलनॉक्स (NVIDIA Mellanox) 920-9B210-00FN-0D0 इन्फिनिबैंड स्विच अनुप्रयोग अभ्यास

पृष्ठभूमि और चुनौतियाँ: आधुनिक कम्प्यूटिंग में नेटवर्क की बाधा

वैज्ञानिक खोज और एआई सफलताओं की दौड़ में, एक अग्रणी अनुसंधान संस्थान की कम्प्यूटेशनल क्षमताओं को कच्ची प्रसंस्करण शक्ति की कमी से नहीं दबाया जा रहा था,लेकिन उनके नेटवर्क के कपड़े द्वाराउनके मौजूदा एचडीआर इन्फिनिबैंड बुनियादी ढांचे, जबकि सक्षम, बड़े पैमाने पर के साथ तालमेल रखने के लिए संघर्ष कर रहा था,अपने नए तैनात एनवीडिया डीजीएक्स क्लस्टर और पारंपरिक एचपीसी वर्कलोड की सिंक्रनाइज़ेड संचार मांगशोधकर्ताओं को कार्य पूरा करने के समय में महत्वपूर्ण देरी का सामना करना पड़ा, जिसमें नेटवर्क विलंबता और सभी-से-सभी संचार पैटर्न के दौरान भीड़ मुख्य बाधा बन गई।

चुनौती दो गुनी थी: पहला, एमपीआई आधारित एचपीसी सिमुलेशन के लिए महत्वपूर्ण रिमोट डायरेक्ट मेमोरी एक्सेस (आरडीएमए) ऑपरेशनों के लिए विलंबता को काफी कम करना। दूसरा, एक निर्बाधएआई प्रशिक्षण नौकरियों के लिए गैर-ब्लॉकिंग कपड़े जिन्हें सैकड़ों जीपीयू में निरंतर पैरामीटर सिंक्रनाइज़ेशन की आवश्यकता थीसंस्थान को भविष्य के लिए एक ऐसे समाधान की आवश्यकता थी जो पूरी तरह से एनडीआर 400 जीबी/एस गति को संभाल सके।संगतअपने मौजूदा पारिस्थितिकी तंत्र के साथ, पूर्ण ओवरहाल के बिना एक लागत प्रभावी उन्नयन पथ सुनिश्चित करना।

समाधान और तैनातीः 920-9B210-00FN-0D0 कपड़े को लागू करना

एक गहन मूल्यांकन के बाद, संस्थान नेNVIDIA Mellanox 920-9B210-00FN-0D0अपने नए उच्च प्रदर्शन वाले कपड़े के आधार के रूप में।920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s एनडीआरउच्च बैंडविड्थ, कम विलंबता वाली रीढ़ की परत बनाने के लिए स्विच करता है, सभी कंप्यूटेशनल और स्टोरेज नोड्स को जोड़ता है।

तैनाती को द्वि-स्तरीय फैट-ट्री टोपोलॉजी के रूप में संरचित किया गया था ताकि द्वि-खंडीय बैंडविड्थ को अधिकतम किया जा सके और हॉप गिनती को कम किया जा सके। कार्यान्वयन के प्रमुख पहलुओं में शामिल थे:

  • कपड़े का कोरःएक रीढ़ की परत पूरी तरह से के साथ बनाया920-9B210-00FN-0D0स्विच, NDR 400Gb/s backbone प्रदान करते हैं।
  • निर्बाध एकीकरण:स्विच की पिछड़ी संगतता का लाभ उठाते हुए, मौजूदा एचडीआर लीफ स्विच और एनआईसी जुड़े हुए थे, जो एनडीआर में वृद्धिशील नोड अपग्रेड की अनुमति देते हुए पहले के निवेश की रक्षा करते थे।
  • उन्नत प्रबंधन:पूरे कपड़े, नए सहित920-9B210-00FN-0D0 InfiniBand स्विच OPNNVIDIA UFM® का उपयोग करके ग्लास के एक ही पैनल के नीचे प्रबंधित किया गया, जो सटीक प्रदर्शन टेलीमेट्री, स्वचालित कपड़े प्रावधान और तेजी से दोष अलगाव को सक्षम करता है।
  • सत्यापनःआईटी टीम ने अधिकारी से सख्ती से परामर्श किया।920-9B210-00FN-0D0 डेटाशीटऔरविनिर्देशअपने डाटा सेंटर में केबल पहुंच, शक्ति और शीतलन आवश्यकताओं को मान्य करने के लिए, इष्टतम प्रदर्शन सुनिश्चित करना।

इस वास्तुकला ने एक एकीकृत920-9B210-00FN-0D0 InfiniBand स्विच ओपीएन समाधान, एक एकल, शक्तिशाली नेटवर्क पर संस्थान के क्लासिक एचपीसी और उभरते एआई वर्कलोड दोनों की सेवा करता है।

प्रभाव और लाभः प्रदर्शन और दक्षता में मात्रात्मक लाभ

इस योजना को लागू करने का प्रभाव920-9B210-00FN-0D0अपने परिचालन के कई आयामों में तुरंत मापने योग्य और परिवर्तनकारी था।

मीट्रिक तैनाती से पहले 920-9B210-00FN-0D0 तैनाती के बाद
औसत एमपीआई विलंबता (राउंड-ट्रिप) ~0.7 माइक्रोसेकंड ~0.5 माइक्रोसेकंड
एआई प्रशिक्षण कार्य पूरा होने का समय (बड़ा मॉडल) 5. 2 दिन 3.8 दिन(27% की कमी)
सभी के लिए पीक के दौरान कपड़े का उपयोग अक्सर 85% से अधिक होता है, जिससे भीड़भाड़ होती है एनडीआर गति पर 60% से कम स्थिर
प्रशासनिक कार्य (फैब्रिक रीकॉन्फिगरेशन) मैनुअल, समय लेने वाली प्रक्रियाएं यूएफएम® एकीकरण के माध्यम से स्वचालित

सबसे महत्वपूर्ण लाभ अनुप्रयोग चलाने के समय में नाटकीय कमी थी। एचपीसी सिमुलेशन, विशेष रूप से जटिल द्रव गतिशीलता से संबंधित,कम और अधिक सुसंगत एमपीआई विलंबता के कारण 20-30% सुधार देखाएआई टीमों के लिए, नए कपड़े पर आरडीएमए के लगभग सैद्धांतिक प्रदर्शन का मतलब है कि जीपीयू संसाधन पूरी तरह से कंप्यूटिंग से संतृप्त थे, नेटवर्क हस्तांतरण की प्रतीक्षा में नहीं रुके थे।कुल का आकलन करते समय920-9B210-00FN-0D0 कीमतइस प्रकार अनुसंधान के परिणामों में तेजी आई, जिससे आरंभिक पूंजीगत व्यय से कहीं अधिक लाभ हुआ।

निष्कर्ष और दृष्टिकोणः भविष्य के लिए तैयार बुनियादी ढांचे के लिए एक खाका

सफलतापूर्वक लागू किया गयाNVIDIA Mellanox 920-9B210-00FN-0D0इस अनुसंधान वातावरण में किसी भी संगठन के लिए एक शक्तिशाली ब्लूप्रिंट के रूप में कार्य करता है जो इसी तरह की इंटरकनेक्ट चुनौतियों का सामना करता है।यह दर्शाता है कि एक अग्रणी नेटवर्क कपड़े में निवेश एक सहायक लागत नहीं है, बल्कि कंप्यूटेशनल निवेश के लिए एक रणनीतिक गुणक है.

संस्था के तैनाती से यह साबित होता है कि920-9B210-00FN-0D0यह सिर्फ एक स्विच से अधिक है; यह अभिसरण के लिए एक सक्षम मंच है। यह एक एकल, अल्ट्रा-रिस्पांस नेटवर्क पर आरडीएमए-संचालित एचपीसी और एआई वर्कलोड को एक साथ जोड़ता है,संचालन को सरल बनाना और खोज में तेजी लानाजैसे-जैसे यह तकनीक व्यापक रूप से उपलब्ध होती जा रही हैबिक्री के लिए, यह उच्च-प्रदर्शन क्लस्टरिंग में क्या संभव है, इसके लिए एक नया मानक निर्धारित करता है।

आगे देखते हुए, एनडीआर 400जीबी/एस फैब्रिक की अंतर्निहित स्केलेबिलिटी और प्रदर्शन हेडरूम का मतलब है कि संस्थान भविष्य में और भी शक्तिशाली कंप्यूटिंग संसाधनों को एकीकृत करने के लिए अच्छी स्थिति में है।द920-9B210-00FN-0D0इसने नेटवर्क को एक बाधा के रूप में प्रभावी ढंग से समाप्त कर दिया है, जिससे शोधकर्ताओं को केवल अपने एल्गोरिदम और कल्पना की सीमाओं पर ध्यान केंद्रित करने की अनुमति मिली है।