Marvell और वह सिलिकॉन जो बैकग्राउंड में क्लाउड इन्फ्रास्ट्रक्चर को चलाता है

Q: Why do cloud providers need specialized infrastructure chips instead of just more CPUs?

क्योंकि जनरल-पर्पज़ CPU भारी मात्रा में दोहराए जाने वाले इंफ्रास्ट्रक्चर कार्यों (जैसे पैकेट प्रोसेसिंग, एन्क्रिप्शन, स्टोरेज प्रोटोकॉल हैंडलिंग) के लिए लचीले होने के बावजूद कुशल नहीं होते। इन कार्यों को समर्पित सिलिकॉन पर ऑफलोड करने से निम्न सुधार होते हैं: - प्रदर्शन की स्थिरता (कम टेल लेटेंसी) - दक्षता (वाट प्रति बेहतर प्रदर्शन) - सर्वर उपयोगिता (एप्लिकेशन के लिए अधिक CPU उपलब्ध रहता है)

Q: How do Ethernet switches (ToR and spine) affect cloud performance?

अधिकांश हाइपरस्केल डेटा सेंटर लीफ़–स्पाइन (ToR + स्पाइन) टोपोलॉजी का उपयोग करते हैं: - Top-of-rack (ToR) / लीफ़ स्विच हर रैक में होते हैं और सीधे उस रैक के सर्वरों से जुड़ते हैं। - स्पाइन स्विच लीफ़ स्विचेज़ को जोड़ते हैं ताकि किसी भी सर्वर से किसी अन्य सर्वर तक एक छोटा, सुसंगत हॉप काउंट में पहुँचा जा सके। स्विच सिलिकॉन को लाइन-रेट पर पैकेट फ़ॉरवर्ड करना, बर्स्ट को बफ़र और शेड्यूल करना, QoS लागू करना और टेलीमेट्री देना होता है—ये सब क्लाउड प्रदर्शन को प्रभावित करते हैं।

लॉग इन शुरू करें

Marvell और वह सिलिकॉन जो बैकग्राउंड में क्लाउड इन्फ्रास्ट्रक्चर को चलाता है | Koder.ai

Marvell क्लाउड डेटा केंद्रों में क्या करता है

ज़्यादातर लोग “क्लाउड” को सिर्फ़ सर्वरों के रूप में समझते हैं। वास्तविकता में, एक क्लाउड डेटा सेंटर एक विशाल सिस्टम है जो तेज़ी से डेटा को मूव, स्टोर और सुरक्षित करता है। डेटा इन्फ्रास्ट्रक्चर सिलिकॉन उन स्पेशलाइज़्ड चिप्स का सेट है जो वो डेटा-भारी काम संभालते हैं ताकि मुख्य CPUs को यह सब न करना पड़े।

Marvell इस “बीच” लेयर पर फोकस करता है: वे चिप्स जो कंप्यूट को नेटवर्क्स और स्टोरेज से जोड़ते हैं, आम डेटा-सेंटर कार्यों को तेज़ करते हैं, और लोड के तहत सब कुछ प्रेडिक्टेबल बनाए रखते हैं।

एक सामान्य क्लाउड स्टैक में Marvell कहाँ बैठता है

यदि आप एक क्लाउड रैक की कल्पना ऊपर से नीचे करें, तो Marvell उपकरण अक्सर बैठते हैं:

सर्वर के नेटवर्क किनारे पर, ट्रैफ़िक को प्रभावी ढंग से भेजने और प्राप्त करने में मदद करते हुए
स्विच और नेटवर्क उपकरणों में, पैकेट्स को सही जगह निर्देशित करते हुए
स्टोरेज के पास, SSDs, स्टोरेज नेटवर्क और सर्वरों के बीच डेटा ले जाने में
मुख्य इंटरकनेक्ट्स के साथ, घटकों के बीच तेज़ संचार सक्षम करते हुए

ये “ऐप” नहीं हैं और सामान्य अर्थ में “सर्वर” भी नहीं—ये हार्डवेयर के बिल्डिंग ब्लॉक्स हैं जो हजारों सर्वरों को एक सुसंगत सेवा की तरह व्यवहार करने देते हैं।

क्यों यह काम अधिकांश उपयोगकर्ताओं के लिए अदृश्य रहता है

जब इन्फ्रास्ट्रक्चर सिलिकॉन अपना काम कर रहा होता है, तो आप इसे नहीं देखते। पेज तेज़ खुलते हैं, वीडियो कम बफ़र होता है, और बैकअप समय पर होते हैं—लेकिन उपयोगकर्ता कभी नेटवर्किंग ऑफलोड इंजन, स्टोरेज कंट्रोलर, या स्विचिंग फैब्रिक को नहीं देखता जो इसे संभव बनाते हैं। ये चिप्स चुपचाप लेटेंसी घटाते हैं, CPU साइकिल्स मुक्त करते हैं, और प्रदर्शन को अधिक सुसंगत बनाते हैं।

एक त्वरित मानचित्र: नेटवर्किंग, स्टोरेज, एक्सेलेरेशन

Marvell की भूमिका को तीन बकेट में समझना आसान है:

नेटवर्किंग: पैकेट्स को तेज़ी और प्रेडिक्टेबिलिटी के साथ भेजना
स्टोरेज: बड़े पैमाने पर सुरक्षित पढ़ना/लिखना
एक्सेलेरेशन: बार-बार होने वाले इंफ्रास्ट्रक्चर कार्यों के लिए स्पेशल-निर्मित कंप्यूट

यही “शांत” सिलिकॉन है जो क्लाउड सर्विसेज़ को सतह पर सरल महसूस कराता है।

क्यों क्लाउड को स्पेशलाइज़्ड इन्फ्रास्ट्रक्चर चिप्स की ज़रूरत है

क्लाउड ऐप्स “सॉफ़्टवेयर-परिभाषित” लगते हैं, पर भौतिक काम अभी भी रैक्स से भरे सर्वरों, स्विचों और स्टोरेज में होता है। मांग बढ़ने पर, क्लाउड हर काम के लिए जनरल-पर्पज़ CPU पर निर्भर नहीं रह सकते बिना लागत और दक्षता की सीमाएँ पार किए।

ट्रैफ़िक CPU हेडरूम से तेज़ी से बढ़ रहा है

AI ट्रेनिंग और इन्फरेंस डेटा सेट्स को डेटा सेंटर में बड़े पैमाने पर घुमाते हैं। वीडियो स्ट्रीम्स, बैकअप, एनालिटिक्स और SaaS प्लेटफॉर्म लगातार बैकग्राउंड लोड जोड़ते हैं। यहां तक कि जब कंप्यूट उपलब्ध है, तो बॉटलनेक अक्सर डेटा को पर्याप्त तेज़ी से मूव, फ़िल्टर, एन्क्रिप्ट और स्टोर करने की तरफ शिफ्ट हो जाता है।

डेटा सेंटर के अंदर ईस्ट–वेस्ट ट्रैफ़िक प्रमुख है

अधिकांश क्लाउड ट्रैफ़िक सार्वजनिक इंटरनेट को नहीं छूता। यह सेवाओं के बीच “ईस्ट–वेस्ट” यात्रा करता है: माइक्रोसर्विस-टू-माइक्रोसर्विस कॉल्स, डेटाबेस रीड्स, कैश अपडेट्स, स्टोरेज रेप्लिकेशन, और वितरित AI वर्कलोड। यह आंतरिक ट्रैफ़िक प्रेडिक्टेबल लेटेंसी और उच्च थ्रूपुट चाहता है, जो नेटवर्किंग और स्टोरेज हार्डवेयर को डेटा पाथ के पास अधिक प्रोसेसिंग करने के लिए मजबूर करता है।

दक्षता अब प्राथमिक आवश्यकता है

पावर और स्पेस अपरिमित नहीं हैं। यदि क्लाउड प्रदाता पैकेट प्रोसेसिंग, एन्क्रिप्शन, कम्प्रेशन या स्टोरेज चेकसम जैसी चीज़ों को समर्पित सिलिकॉन पर ऑफलोड कर सकते हैं, तो CPU कम ओवरहेड में अधिक एप्लिकेशन-केंद्रित कार्य कर सकता है। इससे बेहतर होता है:

वाट पर प्रदर्शन (एक ही पावर बजट में अधिक काम)
सर्वर डेंसिटी (रैक प्रति अधिक उपयोगी कंप्यूट)
ऑपरेटिंग कॉस्ट (कम ऊर्जा और कूलिंग के साथ समान थ्रूपुट)

“एक बड़े CPU” से स्पेशलाइज़्ड हेल्पर्स की ओर

सामान्य-उद्देश्य कोर जोड़कर स्केल करने की बजाय, क्लाउड प्लेटफ़ॉर्म अब उद्देश्य-निर्मित चिप्स—Smart NICs/DPUs, स्विचिंग सिलिकॉन, स्टोरेज कंट्रोलर, और एक्सेलेरेटर्स—का उपयोग कर रहे हैं ताकि बार-बार होने वाले, उच्च-वॉल्यूम इंफ्रास्ट्रक्चर कार्यों को संभाला जा सके। नतीजा: एक तेज़ और सस्ता क्लाउड, भले ही वर्कलोड अधिक डेटा-भूखा हो।

नेटवर्किंग ऑफलोड: स्मार्ट NICs और DPUs समझाएँ

क्लाउड सर्वर अप्रत्याशित रूप से अधिक समय “इन्फ्रास्ट्रक्चर कार्य” में बिताते हैं बजाय आपके एप्लिकेशन को रन कराने के। हर पैकेट को मूव, इंस्पेक्ट, लॉग और कभी-कभी एन्क्रिप्ट करना पड़ता है—अक्सर मुख्य CPU द्वारा। नेटवर्किंग ऑफलोड इन कामों को स्पेशलाइज़्ड हार्डवेयर को सौंप देता है, और यहीं स्मार्ट NICs और DPUs आधुनिक डेटा सेंटरों में (Marvell सिलिकॉन सहित) दिखाई देते हैं।

स्मार्ट NIC बनाम DPU (सहज भाषा में)

एक स्मार्ट NIC वो नेटवर्क इंटरफ़ेस कार्ड है जो बेसिक भेजने/प्राप्त करने से ज़्यादा कर जाता है। सामान्य ईथरनेट पोर्ट्स के साथ, इसमें अतिरिक्त प्रोसेसिंग (अक्सर Arm कोर या प्रोग्रामेबल लॉजिक) होती है ताकि नेटवर्किंग फ़ीचर कार्ड पर ही चल सकें।

एक DPU (डेटा प्रोसेसिंग यूनिट) एक कदम आगे है: यह सर्वर के अंदर एक समर्पित “इन्फ्रास्ट्रक्चर कंप्यूटर” की तरह काम करने के लिए डिज़ाइन किया गया है। DPU में आमतौर पर हाई-परफॉर्मेंस नेटवर्किंग, कई CPU कोर, हार्डवेयर एक्सेलेरेटर्स (क्रिप्टो, पैकेट प्रोसेसिंग), और मजबूत आइसोलेशन फीचर्स होते हैं ताकि यह होस्ट CPU पर निर्भर हुए बिना डेटा मूवमेंट और सिक्योरिटी संभाल सके।

एक व्यावहारिक मानसिक मॉडल:

स्मार्ट NIC: एक NIC जिसमें दिमाग होता है।
DPU: नेटवर्किंग + सिक्योरिटी + टेलीमेट्री संभालने वाला एक समर्पित सिस्टम।

CPU से क्या-क्या ऑफलोड होता है

ऑफलोड उन कार्यों को लक्षित करता है जो दोहराने योग्य और उच्च मात्रा में होते हैं और जो वरना एप्लिकेशन CPU से चुरा लेते:

नेटवर्किंग डेटा पाथ: वर्चुअल स्विचिंग, रूटिंग नियम, एन्कैप/डिकैप (जैसे ओवरले), ट्रैफ़िक शेपिंग
सिक्योरिटी: TLS/IPsec एन्क्रिप्शन, फ़ायरवॉल पॉलिसी प्रवर्तन, माइक्रो-सेगमेंटेशन, सिक्योर बूट और एटेस्टेशन
स्टोरेज ट्रैफ़िक एक्सेलेरेशन: स्टोरेज पैकेट्स को कुशलता से स्टीयर करना, कुछ डिज़ाइनों में स्टोरेज-ओवर-नेटवर्क फ्लोज़ में सहायता
टेलीमेट्री: फ्लो लॉग्स, पैकेट सैम्पलिंग, काउंटर, लेटेंसी माप—वायर स्पीड पर कैप्चर किए जाते हैं

क्यों यह मायने रखता है: प्रेडिक्टेबल प्रदर्शन और कम CPU लोड

जब CPU को नेटवर्किंग की देखभाल करनी पड़ती है, तो एप्लिकेशन प्रदर्शन ट्रैफ़िक स्पाइक्स, noisy neighbors, या सिक्योरिटी वर्क के बर्स्ट के कारण बदल सकता है। ऑफलोड मदद करता है:

CPU को मुक्त करना ताकि आपके वास्तविक वर्कलोड (वेब सर्विसेज, DBs, AI पाइपलाइन्स) के लिए कोर उपलब्ध रहें
लेटेंसी को स्थिर करना क्योंकि पैकेट हैंडलिंग समर्पित हार्डवेयर पाथ्स में होती है
होस्ट डेंसिटी बढ़ाना: इन्फ्रास्ट्रक्चर पर कम CPU संसाधन खर्च होने से प्रति सर्वर अधिक उपयोगी कार्य
आइसोलेशन सुधारना: इंफ्रास्ट्रक्चर कंट्रोल्स को किरायेदार वर्कलोड से अलग चलाया जा सकता है

DPU सर्वर में कहाँ बैठता है (और किससे जुड़ता है)

फिजिकली, DPUs आमतौर पर PCIe ऐड-इन कार्ड या OCP NIC मॉड्यूल के रूप में आते हैं। वे जुड़ते हैं:

टॉप-ऑफ़-रैक नेटवर्क से ईथरनेट पोर्ट्स के माध्यम से (अक्सर हाई-स्पीड लिंक)
होस्ट सर्वर से PCIe के जरिए, नेटवर्क ट्रैफ़िक का गेटवे बनकर

सैद्धांतिक रूप से, DPU नेटवर्क और सर्वर के बीच “ट्रैफ़िक कॉप” बन जाता है—पॉलिसी, एन्क्रिप्शन, और स्विचिंग संभालते हुए ताकि होस्ट OS और CPU एप्लिकेशन चलाने पर ध्यान दे सकें।

क्लाउड नेटवर्किंग के अंदर: ईथरनेट स्विचिंग और पैकेट प्रोसेसिंग

जब आप कोई ऐप खोलते हैं या क्लाउड पर डेटा मूव करते हैं, आपकी रिक्वेस्ट आम तौर पर किसी एक सर्वर तक नहीं जाती—यह हजारों सर्वरों के फ़ैब्रिक से होकर गुजरती है जो उन्हें एक विशाल मशीन की तरह जोड़ता है।

सर्वरों के बीच डेटा कैसे चलता है: ToR और स्पाइन

अधिकांश क्लाउड डेटा सेंटर “लीफ़–स्पाइन” डिज़ाइन उपयोग करते हैं:

Top-of-rack (ToR) / लीफ़ स्विच हर रैक पर होते हैं और सीधे उस रैक के सर्वरों से जुड़े होते हैं।
स्पाइन स्विच सभी ToR स्विचेज़ को जोड़ते हैं, ताकि कोई भी सर्वर किसी भी अन्य सर्वर तक एक प्रेडिक्टेबल छोटे हॉप काउंट में पहुँच सके।

यह डिज़ाइन पाथ्स को छोटा और सुसंगत रखता है, जो बड़े पैमाने पर प्रदर्शन के लिए अहम है।

क्यों कम लेटेंसी और उच्च थ्रूपुट मायने रखते हैं

दो संख्याएँ उपयोगकर्ता अनुभव और लागत को आकार देती हैं:

लेटेंसी (एक पैकेट को लगने वाला समय) इंटरैक्टिव वर्कलोड्स—APIs, डेटाबेस, माइक्रोसर्विसेज़ और रीयल-टाइम एनालिटिक्स—को प्रभावित करती है।
थ्रूपुट (प्रति सेकंड कितना डेटा) बल्क मूवमेंट—स्टोरेज र replication, बैकअप, स्ट्रीमिंग, और बड़े AI डatasets—को प्रभावित करता है।

क्लाउड ऑपरेटर्स का लक्ष्य लेटेंसी को स्थिर रखना है भले ही लिंक व्यस्त हों, जबकि बहुत बड़े ट्रैफ़िक वॉल्यूम को भी प्रोसेस करना।

मुख्य कार्य: स्विचिंग, पैकेट प्रोसेसिंग, QoS

एक ईथरनेट स्विच चिप केवल "पैकेट फ़ॉरवर्ड" नहीं करता। उसे करना होता है:

डेस्टिनेशन्स को लुक अप करना (MAC, VLANs, और अक्सर रूटिंग/ओवरले हेडर्स) लाइन-रेट पर।
बफ़र और शेड्यूल करना ताकि फ़ैब्रिक में कंजेशन फैलने से रोका जा सके।
QoS लागू करना ताकि लेटेंसी-सेंसिटिव फ्लोज़ बैकग्राउंड ट्रांसफर्स से दब न जाएँ।
टेलीमेट्री और कंजेशन कंट्रोल सपोर्ट करना जो ऑपरेटरों को प्रदर्शन ट्यून करने में मदद करें।

वेंडर्स जैसे Marvell ऐसे सिलिकॉन बनाते हैं जो इन कार्यों को बहुत उच्च स्पीड पर प्रेडिक्टेबल तरीके से करने पर केंद्रित होते हैं।

"उच्च स्पीड" क्या सक्षम करता है

25/100G से 200/400/800G लिंक तक जाना सिर्फ़ नंबर नहीं है। उच्च स्पीड का मतलब हो सकता है:

रैक पर और VMs बिना नेटवर्क ओवरसब्सक्रिप्शन के
तेज़ स्टोरेज एक्सेस (विशेषकर डिसअैग्रेगेटेड या नेटवर्क्ड NVMe के लिए)
छोटे AI ट्रेनिंग चक्र GPUs को लगातार डेटा फीड करके

नतीजा एक ऐसा डेटा सेंटर नेटवर्क है जो “वायर” से ज़्यादा साझा इन्फ्रास्ट्रक्चर की तरह महसूस होता है।

स्टोरेज सिलिकॉन: कंट्रोलर, NVMe, और डेटा प्रोटेक्शन

जब लोग क्लाउड प्रदर्शन के बारे में बात करते हैं, वे अक्सर CPU और GPU की कल्पना करते हैं। पर बहुत सारा “स्पीड” (और विश्वसनीयता) स्टोरेज सिलिकॉन से तय होता है जो फ्लैश ड्राइव्स और सिस्टम के बाकी हिस्सों के बीच बैठता है। वह लेयर आम तौर पर एक स्टोरेज कंट्रोलर होता है—उद्देश्य-निर्मित चिप्स जो यह प्रबंधित करते हैं कि डेटा कैसे लिखा, पढ़ा, जांचा और रिकवर किया जाए।

एक स्टोरेज कंट्रोलर वास्तव में क्या करता है

एक स्टोरेज कंट्रोलर स्थायी डेटा के लिए ट्रैफ़िक डायरेक्टर है। यह इनकमिंग राइट्स को मैनेजेबल चंक्स में तोड़ता है, रीड्स को शेड्यूल करता है ताकि हॉट डेटा जल्दी लौटे, और लगातार इंटीग्रिटी चेक चलाता है ताकि करप्ट बिट्स चुपचाप करप्ट फ़ाइलों में न बदलें।

यह स्टोरेज को पैमाने पर प्रेडिक्टेबल बनाए रखने वाली बहीखाता-करीता भी संभालता है: लॉजिकल ब्लॉक्स को फिज़िकल फ्लैश लोकेशंस से मैप करना, वियर बैलेंस करना ताकि ड्राइव्स लंबे चलें, और जब कई एप्लिकेशन एक ही स्टोरेज पूल को हिट करें तो लेटेंसी को स्थिर रखना।

NVMe: क्यों यह हर जगह है

NVMe फ्लैश स्टोरेज के लिए डिज़ाइन किया गया प्रोटोकॉल है। यह सामान्य हुआ क्योंकि यह ओवरहेड घटाता है और पैररेल "क्यूज़" का समर्थन करता है—जिसका मतलब है कि बहुत सारे ऑपरेशंस एक साथ इन-फ्लाइट हो सकते हैं, जो क्लाउड वर्कलोड्स के अनुरूप है जहाँ हजारों छोटी रीड/राइट्स एक साथ होती हैं।

क्लाउड प्रदाताओं के लिए, NVMe सिर्फ़ पीक थ्रूपुट का मामला नहीं है; यह लोड के दौरान लगातार कम लेटेंसी के बारे में है, जो ऐप्स को रिस्पॉन्सिव रखता है।

बिल्ट-इन फीचर्स: एन्क्रिप्शन, कम्प्रेशन, और RAID-जैसी सुरक्षा

आधुनिक कंट्रोलर अक्सर हार्डवेयर फीचर्स शामिल करते हैं जो वरना CPU साइकिल्स खर्च कर देते:

एन्क्रिप्शन/डिक्रिप्शन ताकि डेटा-एट-रेस्ट सुरक्षित रहे बिना बड़े प्रदर्शन गिरावट के
कम्प्रेशन ताकि अधिक स्टोर किया जा सके और कम मूव किया जाए (जब बैंडविड्थ बॉटलनेक हो)
RAID-जैसी पैरीटी और एरेज़र-कोडिंग सहायता ताकि फेल्यर्स को सहा जा सके और डेटा को तेज़ी से रिबिल्ड किया जा सके

क्यों स्टोरेज प्रदर्शन ऐप व्यवहार बदलता है

स्टोरेज एक पृथक सबसिस्टम नहीं है—यह तय करता है कि एप्लिकेशन कैसे व्यवहार करेंगे:

डेटाबेस ट्रांज़ैक्शन्स और ड्यूरेबल लॉग्स के लिए तेज़, सुसंगत राइट्स पर निर्भर होते हैं।
एनालिटिक्स पाइपलाइन्स बड़े डाटासेट पढ़ते समय कतारबद्ध होने पर रुक सकते हैं।
बैकअप और रिस्टोर सीमित थ्रूपुट पर बिजनेस कंटिन्यूइटी इश्यू बन सकते हैं।

संक्षेप में, स्टोरेज सिलिकॉन कच्चे फ्लैश को भरोसेमंद, हाई-थ्रूपुट क्लाउड इन्फ्रास्ट्रक्चर में बदल देता है।

कनेक्टिविटी फाउंडेशंस: PCIe और CXL सहज भाषा में

वेंडर तुलना टूल बनाएं

अपने DPU और स्विच मूल्यांकन चेकलिस्ट को एक सरल वेब ऐप में बदलें जिसे आपकी टीम उपयोग कर सके।

अब बनाएं

जब क्लाउड प्रदाता सर्वरों को अपग्रेड करते हैं, तो वे सिर्फ CPU बदलते नहीं—उन्हें वह "कनेक्टिव टिश्यू" भी चाहिए जो CPU को नेटवर्क कार्ड, स्टोरेज, और एक्सेलेरेटर्स से बिना पूरी redesign के बात करने दे। इसलिए PCIe और CXL जैसे स्टैंडर्ड मायने रखते हैं: ये पार्ट्स को इंटरऑपरेबल रखते हैं, अपग्रेड्स को कम रिस्की बनाते हैं, और डेटा सेंटर को प्रेडिक्टेबल तरीके से स्केल करने में मदद करते हैं।

PCIe: सर्वर के अंदर हाई-स्पीड हाईवे

PCIe (Peripheral Component Interconnect Express) वह मुख्य आंतरिक लिंक है जिसका उपयोग इन कमपोनेंट्स को जोड़ने के लिए होता है:

NICs
SSDs और स्टोरेज कंट्रोलर्स
GPUs और अन्य एक्सेलेरेटर्स
DPUs/स्मार्ट NICs

एक सहायक मानसिक मॉडल: PCIe हाईवे में और लेन जोड़ने जैसा है। नए PCIe जेनरेशन्स प्रति-लेन स्पीड बढ़ाते हैं, और चौड़ा लिंक (x8, x16) कुल क्षमता जोड़ता है। क्लाउड ऑपरेटर्स के लिए यह सीधे प्रभावित करता है कि कंप्यूट और उसे फ़ीड करने वाले डिवाइसेज़ के बीच डेटा कितनी तेज़ी से जा सकता है।

Marvell का इन्फ्रास्ट्रक्चर सिलिकॉन अक्सर इन PCIe कनेक्शनों के एक सिरे पर बैठता है—NIC, DPU, स्टोरेज कंट्रोलर, या स्विच-नज़दीकी कंपोनेंट के अंदर—इसलिए PCIe कैपेबिलिटी परफॉरमेंस अपग्रेड्स के लिए एक व्यावहारिक सीमा (या सुविधा) हो सकती है।

CXL: उसी मार्ग का उपयोग करके मेमोरी को अधिक कुशलतापूर्वक साझा करना

CXL (Compute Express Link) PCIe के फिज़िकल कनेक्शन पर बनता है पर नए तरीके जोड़ता है जिससे डिवाइसेज़ मेमोरी-समान संसाधनों को कम ओवरहेड के साथ शेयर कर सकें। सीधे शब्दों में, CXL सर्वरों को कुछ बाहरी संसाधनों (जैसे मेमोरी विस्तार या पूल की गई मेमोरी) को स्थानीय एक्सटेंशन की तरह ट्रीट करने मदद करता है, न कि दूर-दराज का डिवाइस।

क्लाउड डिज़ाइन के व्यावहारिक नतीजे

मुनाफ़ा सिर्फ़ “तेज़” नहीं है। PCIe और CXL सक्षम करते हैं:

ज्यादा लचीला सिस्टम डिज़ाइन: कंप्यूट, नेटवर्किंग, और स्टोरेज ब्लॉक्स मिक्स-एंड-मैच हो सकते हैं
बेहतर उपयोगिता: स्ट्रैंडेड रिसोर्सेज घटती हैं (उदा. एक सर्वर में मेमोरी जबकि दूसरे में कम)
स्मूथ अपग्रेड: नई कार्ड्स और कंट्रोलर्स मौजूदा सर्वर फैमिली में आसानी से फिट हो सकती हैं

कनेक्टिविटी स्टैंडर्ड्स हेडलाइंस हासिल नहीं करते, पर वे यह तय करते हैं कि क्लाउड कितनी तेज़ी से बेहतर नेटवर्किंग, स्टोरेज और एक्सेलेरेशन अपना सकता है।

कस्टम एक्सेलेरेशन: क्लाउड वर्कलोड्स के लिए उद्देश्य-निर्मित कंप्यूट

क्लाउड इन्फ्रास्ट्रक्चर में “कस्टम एक्सेलेरेशन” का अर्थ हमेशा बड़ा GPU नहीं होता। अक्सर इसका मतलब होता है छोटे, स्पेशलाइज़्ड compute यूनिट जोड़ना जो एक बार-बार आने वाले कार्य को तेज़ कर देते हैं—ताकि CPUs एप्लिकेशन चलाने पर ध्यान दे सकें।

“कस्टम” का असल मतलब

क्लाउड वर्कलोड्स बहुत विविध होते हैं: एक स्टोरेज-हेवी डेटाबेस नोड की बाधाएँ किसी वीडियो स्ट्रीमिंग एज बॉक्स या फ़ायरवॉल अप्लायंस से अलग होंगी। उद्देश्य-निर्मित सिलिकॉन सीधे उन बाधाओं को लक्षित करता है—अक्सर किसी फ़ंक्शन को हार्डवेयर में शिफ्ट करके ताकि वह तेज़, अधिक सुसंगत और कम CPU ओवरहेड के साथ चले।

सामान्य एक्सेलेरेशन उदाहरण जो आप महसूस करेंगे

कई प्रायोगिक श्रेणियाँ अक्सर डेटा सेंटरों में दिखाई देती हैं:

पैकेट प्रोसेसिंग सहायक: हेडर पार्सिंग, फ्लो स्टीयरिंग, ट्रैफ़िक शेपिंग, और लाइन-रेट पर पॉलिसी लागू करना।
सिक्योरिटी एक्सेलेरेशन: क्रिप्टो (IPsec/TLS), की हैंडलिंग, और इनलाइन इंस्पेक्शन टास्क जो वरना CPU जला देते।
स्टोरेज एक्सेलेरेशन: एरेज़र कोडिंग, कम्प्रेशन, डीडूप असिस्ट, RAID पैरीटी, और चेकसम—जहाँ थ्रूपुट और प्रेडिक्टेबल लेटेंसी मायने रखते हैं।
वीडियो/मीडिया: ट्रांसकोडिंग, पैकेजिंग, और कंटेंट कंडीशनिंग
AI इन्फरेंस हेल्पर्स: हमेशा ट्रेनिंग एक्सेलेरेटर्स नहीं—कभी-कभी छोटे इंजन एम्बेडिंग लुकअप्स, प्री/पोस्ट-प्रोसेसिंग, या मॉडल-सर्विंग पाइपलाइन्स के लिए

कंपनियाँ कैसे वर्कलोड के अनुसार चिप्स को टेलर करती हैं

बड़े क्लाउड टीमें आम तौर पर प्रोफाइलिंग से शुरू करती हैं: रिक्वेस्ट कहाँ रुक रहे हैं, और कौन से टास्क प्रति सेकंड करोड़ों बार दोहराते हैं? फिर वे चुनते हैं कि क्या प्रोग्रामेबल इंजन (ज़्यादा अनुकूलनीय) या फिक्स्ड-फंक्शन ब्लॉक्स (ऊच्चतम दक्षता) के माध्यम से एक्सेलेरेट किया जाए। वेंडर्स जैसे Marvell अक्सर नेटवर्किंग, सिक्योरिटी, स्टोरेज इंटरफेसेज़ के बिल्डिंग ब्लॉक्स देते हैं—ताकि “कस्टम” हिस्सा क्लाउड के विशेष हॉट पाथ्स पर केंद्रित रह सके।

ट्रेड-ऑफ: परफॉर्मेंस पर वॉट बनाम लचीलेपन

फिक्स्ड-फंक्शन एक्सेलेरेशन सामान्यतः वाट पर प्रदर्शन और निश्चितता में जीतता है, पर अगर वर्कलोड बदल जाए तो उसे फिर से उपयोग करना कठिन होता है। ज़्यादा प्रोग्रामेबल विकल्प बदलने में आसान होते हैं, पर वे ज्यादा पावर खा सकते हैं और कुछ प्रदर्शन छोड़ सकते हैं। सबसे अच्छे डिज़ाइन्स दोनों का मिक्स करते हैं: जहां ज़रूरी हो हार्डवेयर फास्ट पाथ, और कंट्रोल प्लेन में लचीलापन।

पावर और दक्षता: प्रति-वाट अधिक काम करना

रेफर करें और क्रेडिट कमाएँ

टीममेट्स या सहकर्मियों को आमंत्रित करें और जब वे Koder.ai इस्तेमाल करना शुरू करें तो क्रेडिट कमाएँ।

दोस्तों को रेफर करें

पावर अक्सर डेटा सेंटर की असली सीमा होती है—यह नहीं कि आप कितने सर्वर खरीद सकते हैं, बल्कि कितनी बिजली आप दे और हटाकर कूल कर सकते हैं। जब किसी सुविधा अपनी पावर एंवेलप तक पहुँचती है, तो बढ़ने का एकमात्र तरीका है कि हर वॉट से अधिक उपयोगी काम निकाला जाए।

क्यों “ऑफलोड” ऊर्जा बचाता है

जनरल-पर्पज़ CPU लचीले होते हैं, पर वे बार-बार आने वाले इंफ्रास्ट्रक्चर कार्यों (पैकेट हैंडलिंग, एन्क्रिप्शन, स्टोरेज प्रोटोकॉल प्रोसेसिंग, या टेलीमेट्री) में हमेशा कुशल नहीं होते। उद्देश्य-निर्मित इन्फ्रास्ट्रक्चर सिलिकॉन (जैसे स्मार्ट NICs/DPUs, स्विचेस, और स्टोरेज कंट्रोलर्स) इन कार्यों को कम साइकिल्स और कम बेकार काम के साथ कर सकता है।

ऊर्जा जीत अक्सर अप्रत्यक्ष होती है: अगर ऑफलोड CPU उपयोग घटाता है, तो आप hetzelfde वर्क कम CPU कोर, कम क्लॉक स्पीड, या कम सर्वर के साथ चला सकते हैं। इससे मेमोरी प्रेशर और PCIe ट्रैफ़िक भी घटते हैं, जो और बचत देता है।

कूलिंग और स्पेस चिप निर्णय का हिस्सा हैं

हर वॉट ही हीट बनता है। अधिक हीट मतलब तेज़ पंखे, उच्च कूलेंट फ्लो, और कड़े रैक-स्तर प्लानिंग। उच्च-डेंसिटी रैक्स आकर्षक हो सकते हैं, पर केवल तभी जब आप उन्हें लगातार कूल कर सकें। इसलिए चिप चयन केवल कच्चे थ्रूपुट से आगे मायने रखता है: एक घटक जो कम पावर खाता है (या उच्च लोड पर भी कुशल रहता है) ऑपरेटरों को बिना हॉट स्पॉट बनाए उसी फूटप्रिंट में और क्षमता पैक करने दे सकता है।

दक्षता दावों का मूल्यांकन कैसे करें

दक्षता संख्याएँ मार्केटिंग में आसान और तुलना के लिए कठिन होती हैं। जब आप “बेहतर परफॉर्मेंस पर वॉट” देखते हैं, तो देखें:

मापन संदर्भ: थ्रूपुट, लेटेंसी टार्गेट, पैकेट साइज, और एनेबल्ड फीचर्स (जैसे एन्क्रिप्शन ऑन/ऑफ)
सिस्टम सीमा: सिर्फ चिप-पावर बनाम पूर्ण कार्ड बनाम पूरे सर्वर का असर
लोड कर्व व्यवहार: पीक के बजाय 20–40% उपयोग पर दक्षता अक्सर ज़्यादा मायने रखती है
सेब-से-सेब बेसलाइन: वही वर्कलोड, वही CPU जेनरेशन, समान NIC/स्विच कॉन्फिगरेशन

सबसे विश्वसनीय दावे वॉट्स को किसी विशिष्ट, दोहराने योग्य वर्कलोड के साथ जोड़ते हैं और दिखाते हैं कि सर्वर या रैक स्तर पर क्या बदला—केवल स्पेक शीट पर नहीं।

इन्फ्रास्ट्रक्चर सिलिकॉन में बिल्ट-इन सिक्योरिटी और रिलायबिलिटी फीचर्स

क्लाउड प्रदाता समान भौतिक मशीनों को कई ग्राहकों के साथ साझा करते हैं, इसलिए सिक्योरिटी बाद में “जोड़ी जाने वाली” चीज़ नहीं हो सकती। बहुत सारी सुरक्षा चिप-स्तर पर लागू होती है—स्मार्ट NICs/DPUs, क्लाउड नेटवर्किंग चिप्स, ईथरनेट स्विचिंग सिलिकॉन, और डेटा सेंटर स्टोरेज कंट्रोलर्स के अंदर—जहाँ हार्डवेयर ऑफलोड पूरी लाइन-रेट पर सुरक्षा लागू कर सकता है।

हार्डवेयर रूट ऑफ ट्रस्ट और सिक्योर बूट ("केवल ट्रस्टेड कोड चले")

अधिकांश इन्फ्रास्ट्रक्चर सिलिकॉन में एक हॉर्डवेयर रूट ऑफ ट्रस्ट होता है: एक छोटा, अपरिवर्तनीय लॉजिक और कीज़ का सेट जो फ़र्मवेयर की सत्यापन कर सकता है। सिक्योर बूट के साथ, चिप फ़र्मवेयर पर क्रिप्टोग्राफ़िक सिग्नेचर्स जांचती है और संशोधित या अज्ञात कोड को चलाने से इंकार कर देती है।

यह इसलिए महत्वपूर्ण है क्योंकि एक समझौता किया गया DPU या स्टोरेज कंट्रोलर आपके सर्वरों और नेटवर्क/स्टोरेज फैब्रिक के बीच "बीच" में बैठ सकता है। सिक्योर बूट उस स्तर पर छिपी हुई परसिस्टेंस के जोखिम को घटाता है।

इनलाइन एन्क्रिप्शन: ट्रांज़िट और एट-रेस्ट दोनों के लिए

एन्क्रिप्शन अक्सर सीधे सिलिकॉन में एक्सेलेरेट किया जाता है ताकि यह CPU समय न चुरा ले:

डेटा इन ट्रांज़िट: DPUs और स्मार्ट NICs IPsec/TLS जैसी प्रोसेसिंग और की हैंडलिंग ऑफलोड कर सकते हैं जबकि थ्रूपुट ऊँचा रखा जाता है।
डेटा एट रेस्ट: स्टोरेज सिलिकॉन लिखते समय इनलाइन एन्क्रिप्शन कर सकता है और पढ़ते समय डिक्रिप्ट कर सकता है, NVMe पाथ में इंटीग्रेट होकर हर I/O को CPU-भारी नहीं बनाता।

क्योंकि यह इनलाइन है, सिक्योरिटी का मतलब धीमी स्टोरेज नेटवर्किंग नहीं होना चाहिए।

साझा इन्फ्रास्ट्रक्चर में टेनेंट आइसोलेशन

मल्टी-टेनेंट क्लाउड्स कड़े पृथक्करण पर निर्भर करते हैं। इन्फ्रास्ट्रक्चर चिप्स हार्डवेयर क्यूज़, मेमोरी प्रोटेक्शन, वर्चुअल फ़ंक्शंस, और पॉलिसी एनफोर्समेंट के साथ आइसोलेशन लागू कर सकते हैं—ताकि एक टेनेंट के ट्रैफिक या स्टोरेज रिक्वेस्ट दूसरे के डेटा को न देख सकें। यह खासकर महत्वपूर्ण है जब DPUs वर्चुअल नेटवर्किंग संभालते हैं और PCIe डिवाइसेज़ वर्कलोड्स में शेयर होते हैं।

बीहतर ऑब्ज़र्वबिलिटी जो समस्याओं को जल्दी उजागर करे

रिलायबिलिटी सिर्फ "फेल्यर न होना" नहीं है—यह जल्दी डिटेक्शन और रिकवरी भी है। कई डेटा इन्फ्रास्ट्रक्चर सिलिकॉन डिज़ाइन्स टेलीमेट्री काउंटर, एरर रिपोर्टिंग, पैकेट ट्रेसिंग हुक्स, और हेल्थ मैट्रिक्स शामिल करते हैं जिन्हें क्लाउड टीमें मॉनिटरिंग में फीड कर सकती हैं। जब कुछ गलत होता है (ड्रॉप्स, लेटेंसी स्पाइक्स, लिंक एरर्स), ये बिल्ट-इन संकेत बताने में मदद करते हैं कि मुद्दा ईथरनेट स्विचिंग, DPU, या स्टोरेज कंट्रोलर में है—जिससे रिसॉल्यूशन टाइम कटता है और कुल अपटाइम बेहतर होता है।

एक एंड-टू-एंड उदाहरण: कैसे एक क्लाउड रिक्वेस्ट तेज़ बनती है

कल्पना कीजिए: आप एक शॉपिंग ऐप खोलते हैं और "View order history" टैप करते हैं। उस एक रिक्वेस्ट को कई सिस्टम्स से गुजरना पड़ता है—और हर कदम पर देरी का मौका होता है।

चरण-दर-चरण: रिक्वेस्ट → डेटाबेस → रिस्पॉन्स

आपकी रिक्वेस्ट क्लाउड एज और लोड बैलेंसर तक पहुँचती है। पैकेट एक हेल्दी एप्लिकेशन सर्वर तक रूट किया जाता है।
यह एप्लिकेशन होस्ट तक पहुँचती है। पारंपरिक तरीक़े से, होस्ट CPU बहुत सारा “प्लम्बिंग” संभालता है: एन्क्रिप्शन, फ़ायरवॉल नियम, वर्चुअल नेटवर्किंग, और क्यू प्रबंधन।
अप्प डेटाबेस से क्वेरी करता है। वह क्वेरी डेटा सेंटर नेटवर्क के माध्यम से डेटाबेस क्लस्टर तक जाती है, फिर स्टोरेज से डेटा फ़ेच होता है।
रिस्पॉन्स वापस उसी रास्ते आता है। परिणाम पैक किए जाते हैं, एन्क्रिप्ट होते हैं, और आपके फोन पर भेज दिए जाते हैं।

जहाँ लेटेंसी छिपती है

नेटवर्क हॉप्स और पैकेट प्रोसेसिंग: हर हॉप माइक्रो-डिले जोड़ता है, पर बड़ा लागत प्रति-पैकेट काम हो सकता है—रूटिंग निर्णय, टनल एन्कैप्सुलेशन, ACL चेक।
स्टोरेज I/O: तेज NVMe के साथ भी, कतारें बनने पर, मेटाडेटा हैंडलिंग में नहीं-इफिशिएंसी या स्टोरेज पाथ का होस्ट CPU साइकिल्स जलाना देरी पैदा कर सकता है।
CPU कंटेन्शन: अगर वही CPU कोर आपके एप्लिकेशन और इन्फ्रास्ट्रक्चर कार्य दोनों चलाते हैं, तो बर्स्टी ट्रैफ़िक noisy neighbor समस्याएँ पैदा कर सकता है।

ऑफलोड और एक्सेलेरेशन कैसे बाधाओं को हटाते हैं

स्मार्ट NICs/DPUs और स्पेशलाइज़्ड इन्फ्रास्ट्रक्चर सिलिकॉन (Marvell जैसे वेंडर्स के समाधान सहित) दोहराए जाने वाले कार्यों को जनरल-पर्पज़ CPUs से हटाते हैं:

नेटवर्किंग ऑफलोड टनेलिंग, स्विचिंग/स्टीयरिंग, और पॉलिसी एन्फोर्समेंट वायर के नजदीक संभाल सकता है।
क्रिप्टो एक्सेलेरेशन TLS/IPsec की लागत घटाती है ताकि एन्क्रिप्शन एप्लिकेशन साइकिल्स न चुरा ले।
स्टोरेज एक्सेलेरेशन NVMe क्यू हैंडलिंग, RAID/डेटा प्रोटेक्शन टास्क तेज़ करता है और होस्ट को भारी I/O बहीखाता-कार्य से मुक्त करता है।

वास्तविक जीवन में क्या सुधरता है

कम टेल लेटेंसी: ट्रैफ़िक स्पाइक्स के दौरान "कभी-कभी बहुत धीमे" रिक्वेस्ट कम होते हैं।
उच्च थ्रूपुट: प्रति सर्वर अधिक रिक्वेस्ट सर्व किए जाते हैं क्योंकि CPUs एप्लिकेशन लॉजिक पर ध्यान देते हैं।
बेहतर स्थिरता: प्रदर्शन अधिक सुसंगत होता है क्योंकि इन्फ्रास्ट्रक्चर कार्य अलग और प्रेडिक्टेबल रहते हैं।

क्लाउड टीमें अपने इन्फ्रास्ट्रक्चर के लिए सिलिकॉन कैसे चुनती हैं

स्टोरेज बेंचमार्क लॉगर बनाएं

NVMe क्यू डेप्थ और टेल लेटेंसी परिणाम लॉग करने के लिए एक स्टोरेज टेस्ट हार्नेस ऐप जनरेट करें।

ऐप बनाएं

क्लाउड ऑपरेटर्स सिर्फ़ इसलिए चिप्स नहीं चुनते कि वे "कागज़ पर तेज़" हैं—वे उन्हें तब चुनते हैं जब काम बड़ा, दोहराने योग्य और समर्पित हार्डवेयर में बदलने योग्य हो। विशेष सिलिकॉन सबसे ज़्यादा मूल्यवान होता है जब यह मिलियनों समान रिक्वेस्ट पर स्केल करता है, प्रदर्शन अपेक्ष्यनीय हो, और छोटी दक्षता सुधार बड़े बेड़े में असली बचत में बदल जाए।

वर्कलोड से शुरू करें, नहीं कि डाटाशीट से

टीमें आमतौर पर अपने सबसे बड़े बॉटलनेक्स को विशिष्ट फ़ंक्शंस से मैप करती हैं: नेटवर्क पाथ में पैकेट प्रोसेसिंग और सिक्योरिटी, I/O पाथ में स्टोरेज ट्रैन्सलेशन और डेटा प्रोटेक्शन, या एक्सेलेरेशन ब्लॉक्स में कम्प्रेशन/क्रिप्टो/AI प्रिमिटिव्स। एक प्रमुख सवाल यह है कि क्या काम को ऑफलोड किया जा सकता है बिना सॉफ़्टवेयर मॉडल तोड़े। अगर आपका प्लेटफ़ॉर्म कुछ Linux फीचर्स, वर्चुअल स्विचिंग व्यवहार, या स्टोरेज सेमांटिक्स पर निर्भर है, तो चिप को उन मान्यताओं में फिट होना चाहिए।

वेंडर से पूछने के लिए प्रश्न (PoC से पहले)

आज सिलिकॉन किस वर्कलोड के लिए ट्यून है (और किसके लिए नहीं)
रोडमैप स्थिरता: नेक्स्ट-जेन पिन/बोर्ड कम्पैटिबिलिटी, फ़र्मवेयर सपोर्ट विंडो, और फीचर डिलीवरी कैडेंस
कम्पैटिबिलिटी: ड्राइवर्स, हाइपरवाइज़र सपोर्ट, Kubernetes/CNI इंटीग्रेशन, और ऑब्ज़र्वबिलिटी हुक्स
सप्लाई और लाइफसाइकल: लीड टाइम, सेकंड-सोर्स रणनीति, और लॉन्ग-टर्म उपलब्धता

टीमें विकल्पों का मूल्यांकन कैसे करती हैं

बेंचमार्क महत्वपूर्ण हैं, पर तब ही उपयोगी होते हैं जब वे प्रोडक्शन को प्रतिबिंबित करें: वास्तविक पैकेट मिक्स, वास्तविक स्टोरेज क्यू गहराई, और यथार्थपरक टेनेंट आइसोलेशन। पॉवर को "वाट पर काम" के रूप में मापा जाता है, न कि सिर्फ़ पीक थ्रूपुट—खासकर जब रैक्स पावर-कैप्ड हों।

इंटीग्रेशन प्रयास अक्सर निर्णायक कारक होते हैं। कागज़ पर 10% बेहतर चिप वह हार सकती है जो बड़े पैमाने पर प्रोविजन, मॉनिटर और पैच करने में आसान है।

लॉक-इन से बचाव

क्लाउड टीमें रिस्क घटाने के लिए स्टैंडर्ड्स (ईथरनेट, NVMe, PCIe/CXL), अच्छी तरह दस्तावेज़ित APIs, और इंटरऑपरेबल मैनेजमेंट टूलिंग को प्राथमिकता देती हैं। यहाँ तक कि जब वे वेंडर फीचर्स (Marvell और समकक्षों सहित) का उपयोग करते हैं, वे उच्च-स्तर के कंट्रोल प्लेन्स को पोर्टेबल रखने की कोशिश करते हैं ताकि हार्डवेयर बदलने पर प्लेटफ़ॉर्म को पूरी तरह से री-राइट न करना पड़े।

सॉफ़्टवेयर पक्ष पर यही सिद्धांत लागू होता है: जब आप ऐसे सर्विसेज़ बना रहे हैं जो अंततः इस इन्फ्रास्ट्रक्चर पर चलेंगी, तो आर्किटेक्चर को पोर्टेबल रखना मददगार होता है। प्लेटफ़ॉर्म जैसे Koder.ai वेब बैकेंड (Go + PostgreSQL) और React फ्रंटएंड को चैट-ड्रिवन वर्कफ़्लो के जरिए प्रोटोटाइप तथा इंटीग्रेट करने में तेजी ला सकते हैं, जबकि टीमें सोर्स कोड एक्सपोर्ट और अपनी क्लाउड/कम्प्लायंस ज़रूरतों के अनुरूप डिप्लॉय कर सकती हैं।

डेटा इन्फ्रास्ट्रक्चर सिलिकॉन के लिए आगे क्या है

क्लाउड इन्फ्रास्ट्रक्चर सिलिकॉन "नाइस-टू-हैव एक्सेलेरेशन" से बेसलाइन प्लंबिंग की ओर बदल रहा है। जैसे-जैसे और सेवाएँ लेटेंसी-सेंसिटिव बनती हैं (AI इन्फरेंस, रीयल-टाइम एनालिटिक्स, सिक्योरिटी इंस्पेक्शन), नेटवर्किंग, स्टोरेज और डेटा मूवमेंट को कुशलता से संभालने वाले चिप्स CPUs जितने ही महत्वपूर्ण होंगे।

उच्च बैंडविड्थ डिफ़ॉल्ट बनेगा

उच्च बैंडविड्थ नेटवर्क अब विशेष स्तर नहीं रहे—यह अपेक्षा बन रही है। यह ईथरनेट स्विचिंग, पैकेट प्रोसेसिंग, और DPUs/स्मार्ट NICs को तेज़ पोर्ट्स, कम लेटेंसी, और बेहतर कंजेशन कंट्रोल की ओर धकेलेगा। वेंडर्स जैसे Marvell उस प्रतिस्पर्धा में रहेंगे कि कितना काम हार्डवेयर में ऑफलोड किया जा सकता है (एन्क्रिप्शन, टेलीमेट्री, वर्चुअल स्विचिंग) बिना ऑपरेशनल जटिलता बढ़ाए।

CXL और कम्पोज़ेबल इन्फ्रास्ट्रक्चर व्यावहारिक होंगे

PCIe और CXL कनेक्टिविटी बढ़कर डिसअैग्रेगेशन को सक्षम करेगी: मेमोरी और एक्सेलेरेटर्स को पूल करना ताकि रैक्स वर्कलोड के अनुसार "कम्पोज" किए जा सकें। सिलिकॉन का अवसर सिर्फ़ CXL PHY नहीं है—बल्कि वे कंट्रोलर्स, स्विचिंग, और फ़र्मवेयर हैं जो पूल किए गए संसाधनों को क्लाउड टीमों के लिए प्रेडिक्टेबल, सिक्योर और ऑब्ज़र्वेबल बनाते हैं।

बड़े प्लेटफ़ॉर्म्स के अंदर और अधिक कस्टम सिलिकॉन

बड़े प्रदाता भेदभाव और टाइट इंटीग्रेशन चाहते हैं—नेटवर्किंग चिप्स, डेटा सेंटर स्टोरेज कंट्रोलर्स, और कस्टम एक्सेलेरेशन में। अपेक्षा करें कि और सेमी-कस्टम प्रोग्राम होंगे जहाँ एक स्टैण्डर्ड बिल्डिंग ब्लॉक (SerDes, ईथरनेट स्विचिंग, NVMe) प्लेटफ़ॉर्म-विशेष फीचर्स, डिप्लॉयमेंट टूलिंग और लंबी सपोर्ट विंडो के साथ जोड़ा जाएगा।

नेक्स्ट-जन पार्ट्स का मूल्यांकन करते समय क्या देखें

परफॉर्मेंस पर वॉट हेडलाइन मीट्रिक होगा, खासकर जब पावर कैप विस्तार को constrain करे। सिक्योरिटी फीचर डाटा पाथ के और करीब आएँगे (इनलाइन एन्क्रिप्शन, सिक्योर बूट, एटेस्टेशन)। अंत में, अपग्रेड पाथ मायने रखेगा: क्या आप नई बैंडविड्थ, CXL रिवीजन, या ऑफलोड फीचर्स को अपनाए बिना पूरे प्लेटफ़ॉर्म को री-डिज़ाइन किए बिना ला सकते हैं—या क्या यह मौजूदा रैक्स के साथ कम्पैटिबिलिटी तोड़ देगा?

अक्सर पूछे जाने वाले प्रश्न

What does Marvell actually do in a modern cloud data center?

Marvell मुख्य रूप से क्लाउड डेटा सेंटर के “डेटा पाथ” लेयर को लक्षित करता है: नेटवर्किंग (NICs/DPUs, स्विच सिलिकॉन), स्टोरेज कंट्रोलर (NVMe और संबंधित कार्य), और विशेषत: एक्सेलेरेशन ब्लॉक्स (क्रिप्टो, पैकेट प्रोसेसिंग, कम्प्रेशन, टेलीमेट्री)। उद्देश्य यह है कि बड़े पैमाने पर डेटा को स्थानांतरित, संरक्षित और प्रबंधित किया जाए बिना मुख्य CPU साइकिल्स जला दिए।

Why do cloud providers need specialized infrastructure chips instead of just more CPUs?

क्योंकि जनरल-पर्पज़ CPU भारी मात्रा में दोहराए जाने वाले इंफ्रास्ट्रक्चर कार्यों (जैसे पैकेट प्रोसेसिंग, एन्क्रिप्शन, स्टोरेज प्रोटोकॉल हैंडलिंग) के लिए लचीले होने के बावजूद कुशल नहीं होते। इन कार्यों को समर्पित सिलिकॉन पर ऑफलोड करने से निम्न सुधार होते हैं:

प्रदर्शन की स्थिरता (कम टेल लेटेंसी)
दक्षता (वाट प्रति बेहतर प्रदर्शन)
सर्वर उपयोगिता (एप्लिकेशन के लिए अधिक CPU उपलब्ध रहता है)

What’s the difference between a Smart NIC and a DPU?

एक स्मार्ट NIC एक ऐसा नेटवर्क इंटरफ़ेस कार्ड है जो केवल भेजने/प्राप्त करने से ज़्यादा कर सकता है। इसमें आमतौर पर अतिरिक्त प्रोसेसिंग (अक्सर Arm कोर या प्रोग्रामेबल लॉजिक) होती है ताकि नेटवर्किंग फ़ीचर कार्ड पर ही रन हो सकें।

एक DPU (डेटा प्रोसेसिंग यूनिट) एक कदम आगे जाता है: यह सर्वर के अंदर एक समर्पित “इन्फ्रास्ट्रक्चर कंप्यूटर” की तरह काम करने के लिए डिज़ाइन किया गया है। सामान्यतः DPU में हाई-प्रदर्शन नेटवर्किंग, कई CPU कोर, हार्डवेयर एक्सेलेरेटर्स (क्रिप्टो, पैकेट प्रोसेसिंग) और मजबूत आइसोलेशन फीचर्स होते हैं ताकि यह होस्ट CPU पर निर्भर हुए बिना डेटा मूवमेंट और सिक्योरिटी संभाल सके।

एक प्रैक्टिकल मानसिक मॉडल:

What kinds of tasks get offloaded from the CPU in cloud servers?

सामान्य तौर पर ऑफलोड में वे कार्य शामिल हैं जो बार-बार और उच्च मात्रा में होते हैं और जो वरना एप्लिकेशन CPU साइकिल्स खा लेते:

वर्चुअल स्विचिंग और ओवरलेज़ (एन्कैप/डिकैप, फ्लो स्टीयरिंग)
सिक्योरिटी प्रोसेसिंग (TLS/IPsec क्रिप्टो, फ़ायरवॉल/ACL लागू करना)
लाइन-रेट टेलीमेट्री (काउंटर, फ्लो लॉग, पैकेट सैम्पलिंग)
स्टोरेज ट्रैफ़िक स्टीयरिंग (जिन डिज़ाइनों में स्टोरेज नेटवर्क पर चलता है)

इससे CPU ओवरहेड घटता है और लोड के दौरान लेटेंसी अधिक स्थिर रहती है।

What is east–west traffic, and why does it matter for infrastructure silicon?

अधिकांश ट्रैफ़िक डेटा सेंटर के अंदर “ईस्ट–वेस्ट” होता है: सर्विस-टू-सर्विस कॉल्स, स्टोरेज रेप्लिकेशन, डेटाबेस/कैश ट्रैफ़िक और वितरित AI वर्कलोड। यह आंतरिक ट्रैफ़िक पूर्वानुमेय लेटेंसी और उच्च थ्रूपुट चाहता है, इसलिए प्रदर्शन स्थिर रखने के लिए अधिक प्रोसेसिंग NICs/DPUs और स्विच सिलिकॉन की तरफ शिफ्ट होती है।

How do Ethernet switches (ToR and spine) affect cloud performance?

अधिकांश हाइपरस्केल डेटा सेंटर लीफ़–स्पाइन (ToR + स्पाइन) टोपोलॉजी का उपयोग करते हैं:

Top-of-rack (ToR) / लीफ़ स्विच हर रैक में होते हैं और सीधे उस रैक के सर्वरों से जुड़ते हैं।
स्पाइन स्विच लीफ़ स्विचेज़ को जोड़ते हैं ताकि किसी भी सर्वर से किसी अन्य सर्वर तक एक छोटा, सुसंगत हॉप काउंट में पहुँचा जा सके।

स्विच सिलिकॉन को लाइन-रेट पर पैकेट फ़ॉरवर्ड करना, बर्स्ट को बफ़र और शेड्यूल करना, QoS लागू करना और टेलीमेट्री देना होता है—ये सब क्लाउड प्रदर्शन को प्रभावित करते हैं।

What does a storage controller do, and why is it important in the cloud?

एक स्टोरेज कंट्रोलर फ्लैश और सिस्टम के बाकी हिस्सों के बीच ट्रैफ़िक डायरेक्टर की तरह काम करता है। इसके कामों में शामिल हैं:

लॉजिकल ब्लॉक्स को फिज़िकल फ्लैश लोकेशंस से मैप करना (FTL)
पढ़/लिख शेड्यूलिंग और क्यूज़ का प्रबंधन
इंटीग्रिटी चेक (चेकसम, एरर हैंडलिंग)
वियर लेवलिंग और एन्ड्यूरेंस प्रबंधन

आधुनिक कंट्रोलर अक्सर , , और भी करते हैं ताकि स्टोरेज होस्ट CPU समय को monopolize न करे।

Why is NVMe so common in cloud storage designs?

NVMe (Non-Volatile Memory Express) फ्लैश के लिए डिजाइन किया गया प्रोटोकॉल है जो कम ओवरहेड और उच्च पैरेललिज़्म (कई क्यूज़) प्रदान करता है। क्लाउड में NVMe का बड़ा लाभ लोड के दौरान लगातार कम लेटेंसी है—जब हजारों छोटी I/O एक साथ होती हैं तो यह स्थिरता बनाए रखता है, न सिर्फ़ पीक थ्रूपुट।

In plain English, what do PCIe and CXL change for cloud server design?

PCIe सर्वर के अंदर NICs, DPUs, SSDs, GPUs और एक्सेलेरेटर्स को जोड़ने के लिए मुख्य हाई-स्पीड इंटरकनेक्ट है। CXL वही फिज़िकल लेयर इस्तेमाल करता है पर अतिरिक्त तरीके जोड़ता है जिससे डिवाइस स्मृति-समान संसाधनों को कम ओवरहेड के साथ शेयर कर सकें।

व्यवहारिक रूप से, PCIe/CXL से मिलता है:

ड्रॉप-इन अपग्रेड्स across सर्वर जेनरेशन्स
कम्पोज़ेबल डिजाइन (मेमोरी/एक्सेलेरेटर्स पूल करना)
बेहतर उपयोगिता और कम स्ट्रैंडेड रिसोर्सेज

What kinds of custom acceleration are used in data centers?

कस्टम एक्सेलेरेशन ज़रूरी रूप से बड़ा GPU नहीं होता—अक्सर छोटे, स्पेशलाइज़्ड compute ब्लॉक्स होते हैं जो किसी बार-बार आने वाले कार्य को तेज़ करते हैं ताकि CPU एप्लिकेशन पर फोकस कर सके। सामान्य उदाहरण:

पैकेट प्रोसेसिंग सहायक: हेडर पार्सिंग, फ्लो स्टीयरिंग, ट्रैफ़िक शेपिंग

How does offload improve power efficiency in data centers?

ऑफलोड से अक्सर अप्रत्यक्ष ऊर्जा बचत होती है: अगर CPU उपयोग घट जाए तो वही वर्क कम CPU कोर के साथ, कम क्लॉक स्पीड पर या कम सर्वरों में चल सकता है। इससे मेमोरी और PCIe ट्रैफ़िक भी घट सकता है, जो और बचत देता है।

चिप चुनते समय कूलिंग और स्पेस भी मायने रखते हैं—हर वॉट ही हीट बनता है, और वही कूलिंग डिज़ाइन और रैक-लेवल प्लानिंग को प्रभावित करता है।

What security and reliability features are built into infrastructure silicon?

अधिकांश इन्फ्रास्ट्रक्चर सिलिकॉन में हॉर्डवेयर रूट ऑफ ट्रस्ट और सिक्योर बूट शामिल होते हैं: एक छोटा, अपरिवर्तनीय लॉजिक/कुंजी सेट जो फ़र्मवेयर की क्रिप्टोग्राफ़िक सत्यापन करता है। इससे कस्टमर-लेवल डिवाइस पर अनाधिकारित कोड चलने का जोखिम घटता है।

इसके अलावा, DPU/स्मार्ट NIC में IPsec/TLS जैसी प्रोसेसिंग ऑफलोड करके डेटा इन-ट्रांज़िट और स्टोरेज सिलिकॉन में इनलाइन एन्क्रिप्शन करके डेटा एट-रेस्ट की सुरक्षा भी होती है।

इन्फ्रास्ट्रक्चर चिप्स से टेनेंट आइसोलेशन, हार्डवेयर क्यूज़, मेमोरी प्रोटेक्शन और पॉलिसी एनफोर्समेंट भी बेहतर होते हैं। अंततः, बिल्ट-इन टेलीमेट्री और एरर रिपोर्टिंग फेलियर डिटेक्शन और रिकवरी को तेज़ करते हैं।

How does infrastructure silicon speed up a simple cloud request end-to-end?

Load balancer और क्लाउड एज तक आपकी रिक्वेस्ट पहुंचती है।
यह एप्लिकेशन होस्ट तक पहुँचती है; पारंपरिक रूप में होस्ट CPU प्लंबिंग जैसे एन्क्रिप्शन, फ़ायरवॉल, वर्चुअल नेटवर्किंग संभालता है।
एप्लिकेशन डेटाबेस से क्वेरी करता है; यह ट्रैफ़िक नेटवर्क और स्टोरेज के माध्यम से जाता है।
रिस्पॉन्स वापस आता है, पैक किया और एन्क्रिप्ट किया जाता है।

जहाँ लेटेंसी जोड़ती है: नेटवर्क हॉप्स, पैकेट प्रोसेसिंग, स्टोरेज I/O, और CPU कंटेन्शन। स्मार्ट NICs/DPUs और विशेष सिलिकॉन इन बॉटलनेक्स को हटाकर—नेटवर्किंग/क्रिप्टो/स्टोरेज कार्यों को ऑफलोड करके—टेल लेटेंसी घटाते, थ्रूपुट बढ़ाते और प्रदर्शन को अधिक स्थिर बनाते हैं।

How do cloud teams choose silicon for their infrastructure?

क्लाउड ऑपरेटर्स तब सिलिकॉन चुनते हैं जब काम बड़ा, बार-बार होने वाला और समर्पित हार्डवेयर के रूप में बदलने योग्य हो। विशेष सिलिकॉन तब सबसे उपयोगी होता है जब:

लाखों समान रिक्वेस्ट हों (स्केल)
प्रदर्शन की ज़रूरतें पूर्वानुमेय हों
छोटी दक्षता बढ़ोतरी बड़े बेड़े में बड़े बचत में बदले

वेंडर्स से पहले PoC के लिए पूछने योग्‍य चीज़ें: