Marvell ও সেই সিলিকন যা ক্লাউড ইনফ্রাস্ট্রাকচারকে নীরবে চালায়

Q: Ethernet সুইচ (ToR এবং spine) ক্লাউড পারফরম্যান্সকে কীভাবে প্রভাবিত করে?

বেশি বড় স্কেল ডেটা সেন্টারগুলো সাধারণত লিফ-স্পাইন (ToR + spine) টপোলজি ব্যবহার করে: - Top-of-rack (ToR / leaf) সুইচ প্রতিটি র্যাকের সার্ভারগুলোর সাথে সরাসরি কানেক্ট করে। - Spine সুইচ সব ToR-কে সংযুক্ত করে, যাতে যেকোনো সার্ভার অন্য সার্ভারে নির্দিষ্ট সংখ্যক হপে পৌঁছাতে পারে। সুইচ সিলিকনকে লাইন রেটে প্যাকেট ফরওয়ার্ড, বাফারিং, QoS প্রয়োগ এবং টেলিমেট্রি প্রদান করতে হয়—এসবই ক্লাউড পারফরম্যান্সকে প্রভাবিত করে।

লগ ইন শুরু করুন

Marvell ও সেই সিলিকন যা ক্লাউড ইনফ্রাস্ট্রাকচারকে নীরবে চালায় | Koder.ai

Marvell ক্লাউড ডেটা সেন্টারে কীভাবে কাজ করে\n\nঅধিকাংশ লোকই “ক্লাউড” বলতে শুধু সার্ভারই ভাবেন। বাস্তবে, একটি ক্লাউড ডেটা সেন্টার হল উচ্চ গতিতে ডেটা পাঠানো, রাখা এবং রক্ষা করার একটি বিশাল সিস্টেম। ডেটা ইনফ্রাস্ট্রাকচার সিলিকন হলো সেই বিশেষায়িত চিপগুলোর সেট যা এই ভারী-ডেটা কাজগুলো করে দেয় যাতে প্রধান CPU-গুলোকে এসব নিয়ে ভোগা না লাগে।\n\nMarvell এই “মধ্যবর্তী” স্তরটিতে কাজ করে: সেই চিপগুলো যা কনপিউটকে নেটওয়ার্ক ও স্টোরেজের সঙ্গে যুক্ত করে, সাধারণ ডেটা সেন্টার টাস্কগুলোকে দ্রুততর করে এবং লোডে সবকিছু পূর্বানুমিতভাবে চলতে রাখে।\n\n### একটি সাধারণ ক্লাউড স্ট্যাক-এ Marvell কোথায় বসে\n\nআপনি যদি একটি ক্লাউড র‍্যাককে উপরে থেকে নিচ পর্যন্ত কল্পনা করেন, Marvell ডিভাইসগুলো প্রায়ই বসে:\n\n- সার্ভারের নেটওয়ার্ক এজে, ট্র্যাফিক দ্রুত ও দক্ষভাবে পাঠাতে ও গ্রহণ করতে সহায়তা করে\n- সুইচ ও নেটওয়ার্ক সরঞ্জামে, প্যাকেটগুলো সঠিক জায়গায় পাঠানোর দায়িত্বে\n- স্টোরেজের কাছাকাছি, SSD, স্টোরেজ নেটওয়ার্ক ও সার্ভারের মধ্যে ডেটা সরানোর কাজে\n- কী ইন্টারকনেক্টে, উপাদানগুলোর মধ্যে দ্রুত যোগাযোগ সক্ষম করে\n\nএগুলো সাধারণভাবে “অ্যাপ” বা “সার্ভার” নয়—এগুলো হার্ডওয়্যার ব্লক যা হাজার হাজার সার্ভারকে একসঙ্গে একটা সেবা হিসেবে কাজ করার যোগ্য করে তোলে।\n\n### কেন এই কাজগুলোর অধিকাংশই ইউজারের কাছে অদৃশ্য থাকে\n\nযখন ইনফ্রাস্ট্রাকচার সিলিকন ঠিকভাবে কাজ করে, আপনি তা লক্ষ্য করেন না। পেজ দ্রুত লোড হয়, ভিডিও কম বাফার করে, ব্যাকআপসময় মতো শেষ হয়—কিন্তু ব্যবহারকারী কখনই সেই নেটওয়ার্ক অফলোড ইঞ্জিন, স্টোরেজ কন্ট্রোলার বা সুইচিং ফ্যাব্রিককে দেখেন না যেগুলো এসবকে সম্ভব করেছে। এই চিপগুলো নীরবে লেটেন্সি কমায়, CPU সাইকেল ফ্রি করে এবং পারফরম্যান্সকে বেশি ধারাবাহিক করে।\n\n### দ্রুত মানচিত্র: নেটওয়ার্কিং, স্টোরেজ, অ্যাক্সিলারেশন\n\nMarvell-এর ভূমিকা তিনটি ভাগে সহজে গ্রুপ করা যায়:\n\n- নেটওয়ার্কিং: প্যাকেটগুলো দ্রুত এবং পূর্বাভাসযোগ্যভাবে সরানো\n- স্টোরেজ: মাত্রায় ডেটা নিরাপদে পড়া/লিখা\n- অ্যাক্সিলারেশন: পুনরাবৃত্তি হওয়া ইনফ্রাস্ট্রাকচার কাজের জন্য উদ্দেশ্যনির্দিষ্ট কনপিউট\n\nএই হলো সেই “নীরব” সিলিকন যা ক্লাউড সার্ভিসকে বাইরের দিকে সহজ মনে করায়।\n\n## কেন ক্লাউডগুলোর জন্য বিশেষায়িত ইনফ্রাস্ট্রাকচার চিপ দরকার\n\nক্লাউড অ্যাপগুলোকে সফটওয়্যার-পরিভাষায় দেখা যায়, কিন্তু বাস্তব কাজগুলো সার্ভার, সুইচ ও স্টোরেজ ভর্তি র‍্যাকে ঘটে। চাহিদা বাড়ার সঙ্গে সঙ্গে, ক্লাউডগুলো সব কাজই জেনারেল-পারপোজ CPU-তে ছেড়ে দিলে খরচ ও দক্ষতার কঠোর সীমায় পৌঁছায়।\n\n### ট্র্যাফিক CPU হেডরুমের চেয়ে দ্রুত বাড়ছে\n\nAI ট্রেনিং ও ইনফারেন্স বিশাল ডেটাসেটগুলো ডেটা সেন্টারের চারদিকে সরায়। ভিডিও স্ট্রীম, ব্যাকআপ, অ্যানালিটিক্স, এবং SaaS প্ল্যাটফর্মও ধারাবাহিক ব্যাকগ্রাউন্ড লোড যোগ করে। এমনকি যখন কনপিউট আছে, বাধা প্রায়ই হয়ে দাঁড়ায় ডেটা যথাযথভাবে সরানো, ফিল্টার করা, এনক্রিপ্ট করা এবং সংরক্ষণ করার ক্ষেত্রেই।\n\n### ডেটা সেন্টারের ভিতরে ইস্ট–ওয়েস্ট ট্র্যাফিক আধিক্যশালী\n\nঅধিকাংশ ক্লাউড ট্র্যাফিক পাবলিক ইন্টারনেটে যায় না। এটি সার্ভিস-টু-সার্ভিস ভাবে যায়: মাইক্রোসার্ভিস কল, ডেটাবেস রিড, ক্যাশ আপডেট, স্টোরেজ রেপ্লিকেশন, এবং ডিস্ট্রিবিউটেড AI ওয়ার্কলোড—এই অভ্যন্তরীণ ট্র্যাফিককে পূর্বাভাসযোগ্য লেটেন্সি ও উচ্চ থ্রুপুট দরকার, যা নেটওয়ার্কিং ও স্টোরেজ হার্ডওয়্যারকে ডেটা পাথের নিকটে আরো প্রসেসিং করতে বাধ্য করে।\n\n### দক্ষতা এখন প্রথম শ্রেণির চাহিদা\n\nপাওয়ার ও স্থান সীমিত। যদি ক্লাউড প্রদানকারী প্যাকেট প্রসেসিং, এনক্রিপশন, কম্প্রেশন বা স্টোরেজ চেক্সাম মতো কাজ ডেডিকেটেড সিলিকনে অফলোড করতে পারে, CPU কম ওভারহেড নেবে। এর ফলে উন্নতি হয়:\n\n- পারফরম্যান্স প্রতি ওয়াট (একই পাওয়ারে বেশি কাজ)\n- সার্ভার ঘনত্ব (একই র‍্যাকে বেশি ব্যবহারযোগ্য কনপিউট)\n- অপারেটিং খরচ (কম শক্তি ও কুলিং-এর জন্য একই থ্রুপুটে কম খরচ)\n\n### “একটি বড় CPU” থেকে বিশেষায়িত সহায়কগুলিতে রূপান্তর\n\nসাধারণ-উদ্দেশ্যের কোর বাড়িয়ে স্কেল করার বদলে, ক্লাউড প্ল্যাটফর্মগুলো ক্রমে উদ্দেশ্যনির্দিষ্ট চিপগুলো ব্যবহার করছে—Smart NICs/DPUs, সুইচিং সিলিকন, স্টোরেজ কন্ট্রোলার, এবং অ্যাক্সিলারেটর—যেগুলো পুনরাবৃত্তি ও উচ্চ-ভলিউম ইনফ্রাস্ট্রাকচার কাজগুলো সামলাতে পারে। ফলাফল হলো আরও দ্রুত এবং সস্তায় চালনাযোগ্য ক্লাউড, এমনকি ওয়ার্কলোড আরো ডেটা-সামর্থ্যশালী হলে।\n\n## নেটওয়ার্কিং অফলোড: Smart NICs ও DPUs ব্যাখ্যা\n\nক্লাউড সার্ভারগুলি অবাক করে দিয়ে অনেক সময় “ইনফ্রাস্ট্রাকচার কাজ” করছে আপনার অ্যাপ্লিকেশন চালানোর বদলে। প্রতিটি প্যাকেটকে চালানো, পরীক্ষা, লগ করা, এবং কখনো কখনো এনক্রিপ্ট করা লাগে—এগুলো প্রায়ই প্রধান CPU করে থাকে। নেটওয়ার্কিং অফলোড সেই কাজগুলোকে বিশেষায়িত হার্ডওয়্যারের দিকে সরায়—এখানেই Smart NICs ও DPUs আধুনিক ডেটা সেন্টারে গুরুত্বপূর্ণ ভূমিকা নেয় (Marvell সিলিকনসহ)।\n\n### Smart NIC বনাম DPU (সরাসরি ভাষায়)\n\nএকটি Smart NIC এমন একটি নেটওয়ার্ক ইন্টারফেস কার্ড যা শুধু সেন্ড/রিসিভের চেয়েও বেশি করে। সাধারণ ইথারনেট পোর্টগুলোর পাশাপাশি এতে অতিরিক্ত প্রসেসিং (প্রায়ই Arm কোর এবং/বা প্রোগ্রামেবল লজিক) থাকে যাতে কার্ডেই নেটওয়ার্কিং ফিচার চালানো যায়।\n\nএকটি DPU (Data Processing Unit) এক ধাপ এগিয়ে যায়: এটি সার্ভারের ভিতরে একটি ডেডিকেটেড “ইনফ্রাস্ট্রাকচার কম্পিউটার” হিসেবে কাজ করার জন্য ডিজাইন করা। একটি DPU সাধারণত উচ্চ-পারফরম্যান্স নেটওয়ার্কিং, বহু CPU কোর, হার্ডওয়্যার অ্যাক্সিলারেটর (ক্রিপ্টো, প্যাকেট প্রসেসিং), এবং শক্তিশালী আইসোলেশন বৈশিষ্ট্য মিলায় যাতে এটি হোস্ট CPU-র উপর নির্ভর না করেই ডেটা মুভমেন্ট ও সিকিউরিটি পরিচালনা করতে পারে।\n\nএকটি ব্যবহারিক মানসিক মডেল:\n\n- Smart NIC: কার্ডে একটু বুদ্ধি যুক্ত NIC।\n- DPU: একটি NIC প্লাস ডেডিকেটেড সিস্টেম ইনফ্রাস্ট্রাকচার কাজগুলো সামলায়।\n\n### CPU-থেকে কী কী অফলোড করা হয়\n\nঅফলোডের লক্ষ্যগুলো হলো নকল করা, উচ্চ-ভলিউম কাজগুলো যা না করলে অ্যাপ্লিকেশন CPU-র সাইকেল ছিনিয়ে নেয়। সাধারণ উদাহরণগুলো:

নেটওয়ার্কিং ডেটাপাথ: ভার্চুয়াল সুইচিং, রাউটিং রুল, এনক্যাপ/ডেক্যাপ (উদাহরণ: ওভারলে), ট্র্যাফিক শেপিং
সিকিউরিটি: TLS/IPsec এনক্রিপশন, ফায়ারওয়াল নীতি প্রয়োগ, মাইক্রো-সেগমেন্টেশন, সিকিউর বুট ও অ্যাটেস্টেশন
স্টোরেজ ট্রাফিক অ্যাক্সেল: স্টোরেজ প্যাকেটগুলো দক্ষভাবে স্টিয়ার করা, কিছু ডিজাইনে স্টোরেজ-ওভার-নেটওয়ার্ক ফ্লো সহায়তা
টেলিমেট্রি: ফ্লো লগ, প্যাকেট স্যাম্পলিং, কাউন্টার, লেটেন্সি মাপ—ওয়্যার-স্পিডে ক্যাপচার করা হয়

কেন এটা গুরুত্বপূর্ণ: পূর্বানুমিত পারফরম্যান্স ও কম CPU লোড\n\nযখন CPU-কে নেটওয়ার্কিং “শিশু-নিয়ন্ত্রক” হিসেবে ব্যবহার করা হয়, অ্যাপ্লিকেশন পারফরম্যান্স ট্র্যাফিক স্পাইক, নয়জি নেবর, বা সিকিউরিটি কাজের কারণে ওঠানামা করতে পারে। অফলোড সহায়তা করে:\n\n- যাতে আপনার অ্যাপ্লিকেশনগুলো (ওয়েব সার্ভিস, ডেটাবেস, AI পাইপলাইন) চালাতে পারে\n- কারণ প্যাকেট হ্যান্ডলিং ডেডিকেটেড হার্ডওয়্যার পাথেই হয়\n- ইনফ্রাস্ট্রাকচার কাজে কম CPU লাগলে সার্ভারে বেশি ব্যবহারিক কাজ করানো যায়\n- ইনফ্রাস্ট্রাকচার কন্ট্রোলগুলো টেন্যান্ট ওয়ার্কলোড থেকে আলাদা করে চালানো যায়\n\n### DPU সার্ভারে কোথায় বসে (এবং কী সঙ্গে যুক্ত থাকে)\n\nভৌতভাবে, DPU সাধারণত বা মডিউল হিসেবে আসে। এগুলো সংযুক্ত থাকে:

টপ-অফ-র্যাক নেটওয়ার্কে ইথারনেট পোর্টের মাধ্যমে (সাধারণত উচ্চ-গতির লিঙ্ক)
হোস্ট সার্ভারের সাথে PCIe এর মাধ্যমে, নেটওয়ার্ক ট্র্যাফিকের গেটওয়ে হিসেবে কাজ করে CPU ও মেমোরির সাথে

ধারণাগতভাবে, DPU নেটওয়ার্ক ও সার্ভারের মধ্যে একটি “ট্রাফিক কপ” হয়ে ওঠে—পলিসি, এনক্রিপশন, সুইচিং হ্যান্ডল করে যাতে হোস্ট OS ও CPU অ্যাপ্লিকেশন চালাতে পারে।\n\n## ক্লাউড নেটওয়ার্কিংয়ের ভিতরে: ইথারনেট সুইচিং ও প্যাকেট প্রসেসিং\n\nযখন আপনি কোনো অ্যাপ খুলেন বা ক্লাউডে ডেটা সরান, আপনার অনুরোধ সাধারণত কেবল একটি সার্ভারে যায় না—এটি হাজার হাজার সার্ভারকে সংযুক্ত একটি ইথারনেট ফ্যাব্রিকের মধ্য দিয়ে যায় যেন তারা একক বিশাল মেশিনের মতো আচরণ করে।\n\n### সার্ভারগুলোর মধ্যে ডেটা কীভাবে চলে: ToR এবং স্পাইন\n\nঅধিকাংশ ক্লাউড ডেটা সেন্টার “লিফ-স্পাইন” ডিজাইন ব্যবহার করে:

কেন স্টোরেজ পারফরম্যান্স অ্যাপ আচরণ বদলে দেয়\n\nস্টোরেজ আলাদা সাবসিস্টেম নয়—এটি অ্যাপ্লিকেশনকে প্রভাবিত করে:

ডাটাবেসগুলো লেনদেন ও স্থায়ী লগের জন্য দ্রুত, ধারাবাহিক রাইট নির্ভর করে।
অ্যানালিটিকস পাইপলাইন বড় dataset পড়ার সময় কিউয়িং হলে স্লো হয়ে পড়ে।
ব্যাকআপ ও রিস্টোর সীমিত থ্রুপুট হলে ব্যবসায়িক অব্যাহততার সমস্যা সৃষ্টি করে।

সংক্ষেপে, স্টোরেজ সিলিকনই কাঁচা ফ্ল্যাশকে নির্ভরযোগ্য, উচ্চ-থ্রুপুট ক্লাউড অবকাঠামোতে পরিণত করে।\n\n## সংযোগের ভিত্তি: PCIe এবং CXL সরল ভাষায়\n\nক্লাউড প্রদানকারীরা সার্ভার আপগ্রেড করলে কেবল CPU বদলায় না—তারা সেই “কানেক্টিভ টিস্যু” ও চায় যা CPU-কে নেটওয়ার্ক কার্ড, স্টোরেজ ও অ্যাক্সিলারেটরের সঙ্গে কথা বলার সুযোগ দেয় בלי পুরো সিস্টেম রিডিজাইন করতে। এ কারণেই PCIe ও CXL-এর মতো স্ট্যান্ডার্ডগুলো গুরুত্বপূর্ণ: এগুলো অংশগুলিকে ইন্টারঅপারেবল রাখে, আপগ্রেড ঝুঁকি কমায়, এবং ডেটা সেন্টারকে পূর্বানুমিতভাবে স্কেল করতে সাহায্য করে।\n\n### PCIe: সার্ভারের ভিতরের উচ্চ-গতি হাইওয়ে\n\nPCIe (Peripheral Component Interconnect Express) হলো মূল অভ্যন্তরীন লিংক যা সংযুক্ত করে:

NICs (নেটওয়ার্ক ইন্টারফেস কার্ড)
SSDs ও স্টোরেজ কন্ট্রোলার
GPUs ও অন্যান্য অ্যাক্সিলারেটর
DPUs/Smart NICs

একটি সহায়ক মানসিক মডেল: PCIe হাইওয়েতে আরও লেন যোগ করার মতো। নতুন PCIe জেনারেশন প্রতি লেইনের গতি বাড়ায়, এবং x8, x16 ইত্যাদি লিংকগুলো মোট ধারণ ক্ষমতা বাড়ায়। ক্লাউড অপারেটরদের জন্য এটি প্রায়শই নির্ধারণ করে যে কত দ্রুত কনপিউট এবং ডিভাইসগুলোর মধ্যে ডেটা চলবে।\n\nMarvell-এর ইনফ্রাস্ট্রাকচার সিলিকন প্রায়ই এই PCIe কানেকশনের এক প্রান্তে থাকে—NIC, DPU, স্টোরেজ কন্ট্রোলার বা সুইচ-নিকট উপকরনে—তাই PCIe সক্ষমতা পারফরম্যান্স আপগ্রেডের জন্য সীমা (বা সহায়ক) হতে পারে।\n\n### CXL: একই রাস্তায় মেমোরি ভাগাভাগি করার উপায় যোগ করে\n\nCXL (Compute Express Link) PCIe-এর ফিজিক্যাল সংযোগ ব্যবহার করে কিন্তু ডিভাইসগুলোকে কম ওভারহেডে মেমরি-সদৃশ রিসোর্স শেয়ার করার নতুন উপায় যোগ করে। সরল কথায়, CXL সার্ভারগুলোকে নির্দিষ্ট বাহ্যিক রিসোর্স (মেমরি এক্সপ্যানশন বা পুলড মেমোরি) কিছুকাল লোকাল এক্সটেনশনের মত ব্যবহার করতে সাহায্য করে, দূরের ডিভাইসের মতো নয়।\n\n### ক্লাউড ডিজাইনের প্রায়োগিক ফলাফল\n\nফলাফল কেবল “দ্রুত” নয়। PCIe ও CXL দেয়:

বেশি নমনীয় সিস্টেম ডিজাইন: কনপিউট, নেটওয়ার্কিং ও স্টোরেজ ব্লক মিক্স-ম্যাচ করা যায়
ভাল ব্যবহারকারিতা: স্ট্র‍্যান্ডেড রিসোর্স কমানো (উদাহরণ: এক সার্ভারে অতিরিক্ত মেমোরি থাকা আর অন্য সার্ভারে অভাব)\n- সুশৃঙ্খল আপগ্রেড: নতুন কার্ড ও কন্ট্রোলার পুরোনো সার্ভার পরিবারের মধ্যে সহজে বসে

কানেক্টিভিটি স্ট্যান্ডার্ডগুলো শিরোনাম পায় না, কিন্তু তারা দ্রুত ক্লাউডকে উন্নত নেটওয়ার্কিং, স্টোরেজ ও অ্যাক্সিলারেশন গ্রহণের ধরনকে কড়াকড়ি ভাবে নির্ধারণ করে।\n\n## কাস্টম অ্যাক্সিলারেশন: ক্লাউড ওয়ার্কলোডের জন্য উদ্দেশ্য-নির্দিষ্ট কনপিউট\n\nক্লাউড অবকাঠামোতে “কাস্টম অ্যাক্সিলারেশন” সবসময় মানে বিশাল GPU নয়। প্রায়ই তা ছোট, বিশেষায়িত ব্লক যোগ করা যা একক পুনরাবৃত্তি কাজকে দ্রুত করে—তাহলে CPU অ্যাপ্লিকেশন চালাতে পারে।\n\n### “কাস্টম” আসলে কী মানে\n\nক্লাউড ওয়ার্কলোড ভিন্নধর্মী: একটি স্টোরেজ-ওজনবহ ডাটাবেস নোডের বটলনেক আলাদা, আর একটি ভিডিও স্ট্রিমিং এজ বক্সের আলাদা। উদ্দেশ্য-নির্দিষ্ট সিলিকন সেই বটলনেকগুলো সরাসরি লক্ষ্য করে—প্রায়ই কোনো ফাংশনকে হার্ডওয়্যারে স্থানান্তর করে যাতে তা দ্রুত, ধারাবাহিক এবং কম CPU-ওভারহেডে চলে।\n\n### প্রচলিত অ্যাক্সিলারেশন উদাহরণগুলো যা আপনি অনুভব করবেন\n\nকিছুঃ

প্যাকেট প্রসেসিং হেল্পার: হেডার পার্সিং, ফ্লো স্টিয়ারিং, ট্র্যাফিক শেপিং, পলিসি লাইন রেটে প্রয়োগ
সিকিউরিটি অ্যাক্সিলারেশন: ক্রিপ্টো (IPsec/TLS), কী হ্যান্ডলিং, ইনলাইন ইনস্পেকশন
স্টোরেজ অ্যাক্সিলারেশন: ইরেজার কোডিং, কম্প্রেশন, ডিডুপ অ্যাসিস্ট, রেইড প্যারিটি, চেকসাম—বিশেষ করে যেখানে থ্রুপুট ও পূর্বানুমিত লেটেন্সি জরুরি
ভিডিও/মিডিয়া: ট্রান্সকোডিং, প্যাকেজিং ও কনটেন্ট কন্ডিশনিং
AI ইনফারেন্স হেল্পার: সব সময় প্রশিক্ষণ নয়—কখনো ছোট ইঞ্জিন এমবেডিং লুকআপ, প্রি/পোস্ট-প্রসেসিং বা সার্ভিং পাইপলাইনের জন্য

কোম্পানিগুলো কীভাবে ওয়ার্কলোড অনুযায়ী চিপ কাস্টমাইজ করে\n\nবড় ক্লাউড দলগুলো সাধারণত প্রোফাইলিং দিয়ে শুরু করে: কোথায় অনুরোধ আটকে যাচ্ছে, এবং কোন কাজগুলো প্রতিদিন লক্ষ লক্ষ বার হচ্ছে? তারপর তারা সিদ্ধান্ত নেয় প্রোগ্রামেবল ইঞ্জিন (অধিক অভিযোজ্য) ব্যবহার করবে না কি ফিক্সড-ফাংশন ব্লক (সর্বোচ্চ দক্ষতা)। ভেন্ডররা (Marvell সহ) সাধারণত নেটওয়ার্কিং, সিকিউরিটি, স্টোরেজ ইন্টারফেসের বিল্ডিং ব্লক দেয়—তাই “কাস্টম” অংশটি ক্লাউডের নির্দিষ্ট হট-পাথগুলোর উপর ফোকাস করতে পারে।\n\n### ট্রেড-অফ: পারফরম্যান্স প্রতি ওয়াট বনাম নমনীয়তা\n\nফিক্সড-ফাংশন অ্যাক্সিলারেশন সাধারণত ও সিদ্ধান্তক্ষমতায় জয়ী, কিন্তু ওয়ার্কলোড বদলে গেলে পুনঃব্যবহার কঠিন। প্রোগ্রামেবল অপশনগুলো সহজে পরিবর্তনযোগ্য, তবু শক্তি খরচ বেশি ও কিছু পারফরম্যান্স পাহাড়ে পড়ে। সেরা ডিজাইনে উভয় মিশ্রিত: ফ্লেক্সিবল কন্ট্রোল প্লেনের সঙ্গে যেখানে দরকার হার্ডওয়্যার ফাস্ট-পাথ।\n\n## পাওয়ার ও দক্ষতা: প্রতি ওয়াটে বেশি কাজ করা\n\nপাওয়ার প্রায়ই ডেটা সেন্টারের প্রকৃত সীমা—না কত সার্ভার কেনা যাবে, বরং কত বিদ্যুৎ সরবরাহ ও তাপ অপসারণ করা যাবে তা নির্ধারণ করে। একটি সুবিধা-if-ফ্যাসিলিটি পাওয়ার কেপে পৌঁছায়, বাড়তি করার একমাত্র উপায় হলো প্রতি ওয়াটে বেশি কাজ বের করা।\n\n### কেন “অফলোড” শক্তি বাঁচায়\n\nসাধারণ-উদ্দেশ্যের CPU নমনীয় হলেও পুনরাবৃত্তি হওয়া ইনফ্রাস্ট্রাকচার কাজগুলোতে তারা সর্বোত্তম নয়—প্যাকেট হ্যান্ডলিং, এনক্রিপশন, স্টোরেজ প্রোটোকল প্রসেসিং, টেলিমেট্রি ইত্যাদি ক্ষেত্রে। উদ্দেশ্য-নির্দিষ্ট সিলিকন (যেমন Smart NICs/DPUs, সুইচ, স্টোরেজ কন্ট্রোলার) এসব কাজ কম সাইকেল ও কম অপচয় দিয়ে করতে পারে।\n\nশক্তির সঞ্চয় প্রায়শই বদলের মাধ্যমে আসে: যদি অফলোড CPU ব্যবহার কমায়, একই ওয়ার্কলোড কম CPU কোরে চালানো যায়, ক্লক স্পিড নেমে যায়, বা সার্ভার সংখ্যা কমে। এটি মেমরি চাপ ও PCIe ট্রাফিকও কমায়, যা আরও শক্তি কেটে দেয়।\n\n### কুলিং ও স্পেসও চিপ-নির্বাচনের অংশ\n\nপ্রতি ওয়াট তাপ। বেশি তাপ মানে ফ্যান দ্রুতবেগে, বেশি কুল্যান্ট প্রবাহ, এবং কড়া র‍্যাক-পরিকল্পনা। উচ্চ-ঘনত্ব র‍্যাকে ক্যাপিটাল হলেও, কেবল তখনই কার্যকর যখন কনসিসটেন্ট কুলিং নিশ্চিত করা যায়। এজন্য কম পাওয়ার বা উচ্চ লোডে দক্ষ উপাদান বেছে নেওয়াই কেবল থ্রুপুট নয় অপারেশনাল স্থিতিশীলতা নিশ্চিত করে।\n\n### দক্ষতা দাবিগুলো মূল্যায়ন করার উপায়\n\n“বেটার পারফরম্যান্স প্রতি ওয়াট” বললে তা তুলনা করা কঠিন। দেখুন:

পরিমাপের প্রসঙ্গ: থ্রুপুট, লেটেন্সি লক্ষ্য, প্যাকেট সাইজ, এবং কোন ফিচার সক্রিয় (উদাহরণ: এনক্রিপশন অন/অফ)
সিস্টেম সীমানা: কেবল চিপ-পাওয়ার না কি পুরো কার্ড বা সম্পূর্ণ সার্ভারে প্রভাব দেখা হচ্ছে
লোড কার্ভ আচরণ: 20–40% ব্যবহারেও দক্ষতা কেমন—শীর্ষ নয় কেবল পিক হিসাবেই না\n- আপেল-টু-আপেল বেইসলাইন: একই ওয়ার্কলোড, একই CPU জেনারেশন, অনুরূপ NIC/সুইচ কনফিগারেশন

সর্বাধিক বিশ্বাসযোগ্য দাবিগুলো ওয়াটকে নির্দিষ্ট, পুনরাবৃত্তিযোগ্য ওয়ার্কলোডে বাঁধে এবং বলে দেয় সার্ভার বা র‍্যাক স্তরে কী বদল এসেছে—কেবল স্পেক শিট নয়।\n\n## ইনফ্রাস্ট্রাকচার সিলিকনে নির্মিত নিরাপত্তা ও নির্ভরযোগ্যতা বৈশিষ্ট্য\n\nক্লাউড প্রদানকারীরা একই ফিজিক্যাল মেশিন বহু গ্রাহকের সঙ্গে ভাগ করে, তাই নিরাপত্তা পরে যোগ করা যায় না—অনেকটা চিপ স্তরে প্রয়োগ করা হয়—Smart NICs/DPUs, ক্লাউড নেটওয়ার্কিং চিপ, ইথারনেট সুইচিং সিলিকন, এবং ডেটা সেন্টার স্টোরেজ কন্ট্রোলারে—যেখানে হার্ডওয়্যার অফলোড পূর্ণ লাইনের গতি বজায় রেখে সুরক্ষা দিতে পারে।\n\n### হার্ডওয়্যার রুট অফ ট্রাস্ট ও সিকিউর বুট (শৃঙ্খল “শুধু বিশ্বাসযোগ্য কোড চলে”) \nবেশিরভাগ ইনফ্রাস্ট্রাকচার সিলিকনে একটি হার্ডওয়্যার রুট অফ ট্রাস্ট থাকে: একটি ছোট, অপরিবর্তনীয় লজিক ও কী সেট যা ফার্মওয়্যার যাচাই করে। সিকিউর বুট চিপটি তার ফার্মওয়্যারের ক্রিপ্টোগ্রাফিক স্বাক্ষর চেক করে (কখনও কখনও হোস্টের বুট উপাদানও), এবং পরিবর্তিত বা অজানা কোড চালাতে অস্বীকার করে।\n\nএটি গুরুত্বপূর্ণ কারণ একটি কম্প্রোমাইজড DPU বা স্টোরেজ কন্ট্রোলার আপনার সার্ভার ও নেটওয়ার্ক/স্টোরেজ ফ্যাব্রিকের মধ্যবর্তী অবস্থানে লুকিয়ে থাকতে পারে। সিকিউর বুট সেই স্তরে লুকানো স্থায়িত্বের ঝুঁকি কমায়।\n\n### ইনলাইন এনক্রিপশন: ডেটা ট্রানজিট ও অ্যাট-রেস্ট\n\nএনক্রিপশন প্রায়শই সরাসরি সিলিকনে অ্যাক্সিলারেট করা হয় যাতে এটি CPU সময় চর্বাই না করে:

সাধারণ প্রশ্ন

Marvell বাস্তবে আধুনিক ক্লাউড ডেটা সেন্টারে কী কাজ করে?

Marvell প্রধানত ক্লাউড ডেটা সেন্টারের “ডেটা পাথ” স্তরকে লক্ষ্য করে: নেটওয়ার্কিং (NICs/DPUs, সুইচ সিলিকন), স্টোরেজ কন্ট্রোলার (NVMe ও সম্পর্কিত ফাংশন), এবং বিশেষায়িত অ্যাক্সিলারেশন ব্লক (ক্রিপ্টো, প্যাকেট প্রসেসিং, কম্প্রেশন, টেলিমেট্রি)। লক্ষ্য হলো প্রধান CPU-কে অতিরিক্ত কাজ না করতে দিয়ে বড় পরিমাণে ডেটা পরিচালনা, সুরক্ষা এবং ব্যবস্থাপনা করা।

কেন ক্লাউড প্রদানকারীরা শুধু CPU বাড়িয়ে কাজ চালায় না—বিশেষায়িত ইনফ্রাস্ট্রাকচার চিপের দরকার কেন?

কারণ সাধারণ-উদ্দেশ্যের CPUগুলো নমনীয় হলেও, উচ্চ-পরিমাণ এবং পুনরাবৃত্তি ইন্সফ্রাস্ট্রাকচার কাজগুলো (প্যাকেট প্রসেসিং, এনক্রিপশন, স্টোরেজ প্রোটোকল হ্যান্ডলিং) করতে অদক্ষ। এই কাজগুলোকে ডেডিকেটেড সিলিকনে অফলোড করলে পাওয়া যায়:

পারফরম্যান্স কন্সিস্টেন্সি (কম টেইল লেটেন্সি)
দক্ষতা (ওটুকু পাওয়ারে বেশি কাজ)
সার্ভার ব্যবহারকারিতা (অ্যাপ্লিকেশনের জন্য বেশি CPU অবশিষ্ট থাকে)

Smart NIC এবং DPU-এর মধ্যে পার্থক্য কী?

Smart NIC হচ্ছে একটি NIC যা সাধারণ সেন্ড/রিসিভ ছাড়াও কার্ডেই নেটওয়ার্কিং ফিচার চালাতে আসে—প্রায়ই Arm কোর বা প্রোগ্রামেবল লজিক থাকে। DPU (Data Processing Unit) একটি ধাপ এগিয়ে: এটি সার্ভারের ভিতরে একটি সমরূপ “ইনফ্রাস্ট্রাকচার কম্পিউটার” হিসেবে কাজ করার জন্য ডিজাইন; উচ্চ-পারফরম্যান্স নেটওয়ার্কিং, একাধিক CPU কোর, হার্ডওয়্যার অ্যাক্সিলারেটর (ক্রিপ্টো, প্যাকেট প্রসেসিং) এবং শক্তিশালী আইসোলেশন ফিচার থাকে, যাতে হোস্ট CPU-র উপর নির্ভর না করে ডেটা মুভমেন্ট ও সিকিউরিটি পরিচালনা করা যায়।

Smart NIC: “বুদ্ধিমান NIC”
DPU: “ইনফ্রাস্ট্রাকচার সিস্টেম” (নেটওয়ার্কিং + সিকিউরিটি + টেলিমেট্রি, প্রায় বেশি স্বাধীনভাবে হোস্ট থেকে)

কোন ধরনের কাজগুলো CPU থেকে অফলোড করা হয় ক্লাউড সার্ভারে?

সাধারণত অপলোড করা হয় সেই কাজগুলো যা বারবার এবং বেশি ভলিউমের—যেগুলো না করলে অ্যাপ্লিকেশন CPU থেকে সাইকেল ছেঁড়ে নেবে। পরিচিত উদাহরণগুলো:

নেটওয়ার্কিং ডেটাপাথ: ভার্চুয়াল সুইচিং, রাউটিং রুল, এনক্যাপ/ডেক্যাপ (যেমন ওভারলে), ট্র্যাফিক শেপিং
সিকিউরিটি: TLS/IPsec এনক্রিপশন, ফায়ারওয়াল নীতি প্রয়োগ, মাইক্রো-সেগমেন্টেশন, সিকিউর বুট ও অ্যাটেস্টেশন
স্টোরেজ ট্রাফিক অ্যাকসেলারেশন: স্টোরেজ প্যাকেটগুলি দক্ষভাবে স্টিয়ার করা, কিছু ডিজাইনে স্টোরেজ-ওভার-নেটওয়ার্ক ফ্লো সহায়তা

ইস্ট–ওয়েস্ট (east–west) ট্র্যাফিক কী এবং ইনফ্রাস্ট্রাকচার সিলিকনের জন্য কেন এটি গুরুত্বপূর্ণ?

অধিকাংশ ট্র্যাফিক ডেটা সেন্টারের ভিতরেই থাকে—সার্ভিস-টু-সার্ভিস কল, ডেটাবেস রিড, ক্যাশ আপডেট, স্টোরেজ রেপ্লিকেশন এবং ডিস্ট্রিবিউটেড AI ওয়ার্কলোড। এই অভ্যন্তরীণ ট্র্যাফিককে পূর্বাভাসযোগ্য লেটেন্সি ও উচ্চ থ্রুপুট দরকার, তাই NICs/DPUs এবং সুইচ সিলিকনে বেশি প্রসেসিং চলে যাতে পারফরম্যান্স স্কেলে কনসিস্টেন্ট থাকে।

Ethernet সুইচ (ToR এবং spine) ক্লাউড পারফরম্যান্সকে কীভাবে প্রভাবিত করে?

বেশি বড় স্কেল ডেটা সেন্টারগুলো সাধারণত লিফ-স্পাইন (ToR + spine) টপোলজি ব্যবহার করে:

Top-of-rack (ToR / leaf) সুইচ প্রতিটি র‍্যাকের সার্ভারগুলোর সাথে সরাসরি কানেক্ট করে।
Spine সুইচ সব ToR-কে সংযুক্ত করে, যাতে যেকোনো সার্ভার অন্য সার্ভারে নির্দিষ্ট সংখ্যক হপে পৌঁছাতে পারে।

সুইচ সিলিকনকে লাইন রেটে প্যাকেট ফরওয়ার্ড, বাফারিং, QoS প্রয়োগ এবং টেলিমেট্রি প্রদান করতে হয়—এসবই ক্লাউড পারফরম্যান্সকে প্রভাবিত করে।

স্টোরেজ কন্ট্রোলার কী কাজ করে, এবং ক্লাউডে কেন এটি গুরুত্বপূর্ণ?

স্টোরেজ কন্ট্রোলার ফ্ল্যাশ ড্রাইভ এবং সিস্টেমের বাকি অংশের মধ্যে ট্রাফিক ডিরেক্টর হিসেবে কাজ করে। এটি ইনকমিং রাইটগুলোকে ছোট অংশে ভাগ করে, রিড-শিডিউল করে যাতে হট ডেটা দ্রুত ফেরত আসে, এবং স্থায়ীভাবে ডেটা লেখার সময় ইন্টেগ্রিটি চেক চালায় যাতে ক্ষতিগ্রস্ত বিট ফাইল লেভেলে পৌঁছায় না।

এছাড়াও এটি লজিকাল ব্লক থেকে ফিজিক্যাল ফ্ল্যাশ লোকেশনে ম্যাপিং, ওয়্যার-লেভেলিং, এবং লেটেন্সি স্থিতিশীল রাখার মত 'বুককিপিং' করে—যা বড় স্কেলে স্টোরেজকে প্রেডিক্টেবল করে তোলে।

কেন NVMe ক্লাউড স্টোরেজ ডিজাইনে এত প্রচলিত?

NVMe (Non-Volatile Memory Express) ফ্ল্যাশ স্টোরেজের জন্য ডিজাইন করা একটি প্রোটোকল। এটি ওভারহেড কমায় এবং প্যারালাল ‘কিউ’-সমর্থন করে—অর্থাৎ অনেক অপারেশন একসাথে চলতে পারে—যা ক্লাউড ওয়ার্কলোডে যেখানে হাজার হাজার ছোট রিড/রাইট একই সময়ে ঘটে, সেখানে কার্যকর।

ক্লাউড পরিবেশে NVMe-এর আসল লাভ হলো লোডে ধারাবাহিকভাবে কম লেটেন্সি প্রদান করা, কেবলই উচ্চ পিক থ্রুপুট নয়।

সরল ভাষায় PCIe এবং CXL ক্লাউড সার্ভার ডিজাইনকে কীভাবে বদলে দেন?

PCIe হচ্ছে সার্ভারের ভিতরের উচ্চ-গতি ইন্টারকানেক্ট যা NICs, SSDs, GPUs, এবং অ্যাক্সিলারেটর সংযুক্ত করে। CXL একই ফিজিক্যাল লেয়ার ব্যবহার করে কিন্তু ডিভাইসগুলোকে মেমরি-সদৃশ রিসোর্স শেয়ার করার আরও কার্যকর উপায় যোগ করে।\n\nপ্রায়োগিকভাবে PCIe/CXL দেয়:

ড্রপ-ইন আপগ্রেডস (নতুন কার্ড পুরনো সার্ভারে ফিট করতে পারে)
কম্পোজেবল ডিজাইন (মেমরি/অ্যাক্সিলারেটর পুল করা)
ভাল ব্যবহারকারিতা (স্ট্র্যান্ডেড রিসোর্স কমে যায়)

কাস্টম অ্যাক্সিলারেশন বলতে কী বোঝানো হয়, এবং এর সুবিধা কী?

কাস্টম অ্যাক্সিলারেশন মানে সব সময় বড় GPU নয়—এটি ছোট, বিশেষায়িত কম্পিউট ব্লক যোগ করা যাতে যে হট টাস্ক বারবার হয় তা দ্রুত করা যায়—তাহলে CPU অ্যাপ্লিকেশন চালাতে কেন্দ্রীভূত থাকতে পারে।\n\nপ্রচলিত অ্যাক্সিলারেশন ক্যাটাগরি:

হেডার পার্সিং, ফ্লো স্টিয়ারিং, ট্র্যাফিক শেপিং, পলিসি বাস্তবায়ন

কেন পাওয়ার এবং দক্ষতা ডেটা সেন্টারে এত গুরুত্বপূর্ণ?

বিদ্যুৎই প্রায়শই ডেটা সেন্টারের বাস্তব সীমানা—কত সার্ভার কেনা যাবে নয়, বরং কত বিদ্যুৎ সরবরাহ ও কুলিং করা যাবে তা নির্ধারণ করে। অফলোড করলে CPU ব্যবহার কমে, যার ফলে একই পাওয়ারে বেশি কাজ করা যায়—কম কোরে, নীচু ক্লক-স্পিডে বা কম সার্ভার ব্যবহার করে।

চিপ নির্বাচন কেবল থ্রুপুট নয়—তাই যে কম্পোনেন্ট কম পাওয়ার নেয় বা উচ্চ লোডে দক্ষ থাকে, তা অপারেটরদের একই ফুটপ্রিন্টে বেশি ক্যাপাসিটি প্যাক করতে দেবে।

ইনফ্রাস্ট্রাকচার সিলিকনে নিরাপত্তা ও নির্ভরযোগ্যতার ফিচারগুলো কী?

অনেক ইনফ্রাস্ট্রাকচার সিলিকনে হার্ডওয়্যার রুট অফ ট্রাস্ট থাকে: ছোট, অপরিবর্তনীয় লজিক ও কী যা ফার্মওয়্যার যাচাই করে। সিকিউর বুট চেক করে ফার্মওয়্যারের ক্রিপ্টোগ্রাফিক স্বাক্ষর, কখনও কখনও হোস্ট বুট উপাদানও—অপরিচিত বা পরিবর্তিত কোড চালাতে চায় না।

DPUs বা স্টোরেজ কন্ট্রোলার কম্প্রোমাইজ হলে তারা সার্ভার ও নেটওয়ার্ক/স্টোরেজ ফ্যাব্রিকের মধ্যে 'মধ্যস্থ' হয়ে থাকতে পারে—সিকিউর বুট এই ধরনের লুকানো প্রত্যয়িত কন্ট্রোল হ্রাস করে।

একটি অনুরোধ কীভাবে দ্রুত হয়—এন্ড-টু-এন্ড উদাহরণ

একটি সাধারণ অনুরোধ কিভাবে দ্রুত হয়—ধরা যাক আপনি একটি শপিং অ্যাপ খুলে “View order history” চাপালেন। এই রিকোয়েস্ট অনেক ধাপে যায়—প্রত্যেক ধাপেই বিলম্বের সুযোগ আছে।\n\nযেখানে লেটেন্সি আসে:

ক্লাউড টিমেরা কীভাবে তাদের ইনফ্রাস্ট্রাকচারের জন্য সিলিকন বেছে নেয়?

ক্লাউড অপারেটররা সাধারণত সিলিকন তখনই বেছে নেন যখন কাজটি বড়, পুনরাবৃত্তিমূলক, এবং ডেডিকেটেড হার্ডওয়্যারে পরিণত করার যোগ্য। হাজার হাজার অনুরোধের ক্ষেত্রে ছোট দক্ষতা বড় অঙ্কের সাশ্রয় এনে দেয়।\n\nবাছাই করার সময় সাধারণ কৌশল:

ওয়ার্কলোড থেকে শুরু করুন—ডেটাসিটে কোথায় জ্যাম হচ্ছে তা দেখুন, তারপরে সিদ্ধান্ত নিন কাজটি অফলোড করা যাবে কিনা।
ভেন্ডরকে জিজ্ঞেস করুন: কোন ওয়ার্কলোডে সিলিকন টিউন করা আছে, রোডম্যাপ, ড্রাইভার/হাইপারভাইজার সমর্থন, এবং সাপ্লাই লিফটাইম।
বেঞ্চমার্ক বাস্তব প্রোডাকশনের মতো হওয়া উচিত—প্যাকেট মিক্স, কিউ ডেপথ, এবং রিয়েল-ওয়ার্ল্ড টেলিমেট্রি।

ইন্টিগ্রেশন খরচ প্রায়ই কাগজে থাকা 10% পারফরম্যান্স সুবিধার থেকে বেশি গুরুত্ব পায়।

ডেটা ইনফ্রাস্ট্রাকচার সিলিকনের ভবিষ্যৎ কেমন দেখাচ্ছে?

ডেটা ইনফ্রাস্ট্রাকচার সিলিকন এখন ‘বিকল্প সুবিধা’ থেকে বেসলাইন প্লাম্বিং-এ যাচ্ছে। যেমন AI ইনফারেন্স, রিয়েল-টাইম এনালিটিক্স, সিকিউরিটি ইন্সপেকশন আরো লেটেন্সি-সেন্সিটিভ হবে, ততটাই নেটওয়ার্কিং, স্টোরেজ এবং ডেটা মুভমেন্ট দক্ষ করতে চিপগুলো গুরুত্বপূর্ণ হয়ে উঠবে।\n\nদেখার বিষয়গুলো:

উচ্চ ব্যান্ডউইথ ডিফল্ট হবে—ফাস্ট পোর্ট, লো লেটেন্সি, কংজেশন কন্ট্রোল উন্নত হবে।
CXL ও কম্পোজেবল ইনফ্রাস্ট্রাকচার ব্যবহারযোগ্য হবে—মেমরি/অ্যাক্সিলারেটর পুল করে র‍্যাক কম্পোজ করা যাবে।
আরও কাস্টম সিলিকন—বড় ক্লাউড প্ল্যাটফর্মগুলো নিজেদের পার্থক্য ও ইন্টিগ্রেশনের জন্য সেমিকাস্টম প্রোগ্রাম চাইবে।

নতুন অংশ বেছে নেওয়ার সময় পারফরম্যান্স প্রতি ওয়াট, নিরাপত্তা ফিচার (ইনলাইন এনক্রিপশন, সিকিউর বুট, অ্যাটেস্টেশন), এবং আপগ্রেড পথের স্থায়িত্ব খেয়াল করতে হবে—নতুন ব্যান্ডউইথ বা CXL রিভিশন নেওয়া কি পুরো প্ল্যাটফর্ম রিডিজাইনের দরকার করবে না তা দেখুন।

র‍্যাকে আরও VM রাখা নেটওয়ার্ক ওভারসাবস্ক্রাইব না করে\n- দ্রুত স্টোরেজ অ্যাক্সেস (বিশেষ করে ডিসঅ্যাসেম্বল্ড বা নেটওয়ার্কেড NVMe ক্ষেত্রে)\n- AI ট্রেনিং চক্র ছোট করা GPU-কে ডেটা ধারাবাহিকভাবে সরবরাহ করে\n\nফলাফল: একটি নেটওয়ার্ক যা “তারের মতো” না, বরং প্রতিটি ওয়ার্কলোডের জন্য শেয়ার করা অবকাঠামোর মত মনে হয়।\n\n## স্টোরেজ সিলিকন: কন্ট্রোলার, NVMe, এবং ডেটা প্রটেকশন\n\nমানুষ যখন ক্লাউড পারফরম্যান্স নিয়ে কথা বলে, তারা প্রায়ই CPU ও GPU ভাবেন। কিন্তু অনেক "গতি" এবং নির্ভরযোগ্যতা নির্ধারণ করা হয় স্টোরেজ সিলিকন দ্বারা—যা ফ্ল্যাশ ড্রাইভগুলোর ও সার্ভারের বাকি অংশের মধ্যে বসে। এই স্তরটি সাধারণত একটি স্টোরেজ কন্ট্রোলার—উদ্দেশ্যনির্দিষ্ট চিপ যা ডেটা কতভাবে লেখা, পড়া, চেক ও পুনরুদ্ধার করা হয় তা নিয়ন্ত্রণ করে।\n\n### একটি স্টোরেজ কন্ট্রোলার আসলে কী করে\n\nস্টোরেজ কন্ট্রোলার হলো স্থায়ী ডেটার ট্রাফিক পরিচালক। এটি ইনকমিং রাইটগুলোকে ছোট, পরিচালনাযোগ্য টুকরোতে ভাঙে, রিডগুলো শিডিউল করে যাতে হট ডেটা দ্রুত ফিরে আসে, এবং ক্রমাগত ইন্টিগ্রিটি চেক চালায় যাতে ক্ষতিগ্রস্ত বিট ফাইল-স্তরে সমস্যা না করে।\n\nএছাড়াও এটি সেই অনবদ্য বুককিপিং করে যা বড় স্কেলে স্টোরেজকে প্রেডিক্টেবল করে: লজিকাল ব্লককে ফিজিক্যাল ফ্ল্যাশ লোকেশনে ম্যাপ করা, ওয়্যার ব্যালান্স করা যাতে ড্রাইভ বেশি টিকে যায়, এবং অনেক অ্যাপ্লিকেশন একই স্টোরেজ পুলে আঘাত করলে লেটেন্সি স্থির রাখা।\n\n### NVMe: কেন এটি সর্বত্র দেখা যায়\n\nNVMe ফ্ল্যাশ স্টোরেজের জন্য তৈরি করা হয়েছে: কম ওভারহেড এবং উচ্চ প্যারালালিজম (একাধিক কিউ) সরবরাহ করে—অর্থাৎ অনেক অপারেশন একই সময়ে চলতে পারে, যা ক্লাউড ওয়ার্কলোডের জন্য উপযুক্ত যেখানে সহস্রাধিক ছোট I/O একই সঙ্গে ঘটে।\n\nক্লাউড প্রদানকারীদের জন্য NVMe কেবল পিক থ্রুপুট নয়; এটি লোডে ধারাবাহিকভাবে কম লেটেন্সি দেয়—যা অ্যাপ্লিকেশনগুলোকে প্রতিক্রিয়াশীল রাখে।\n\n### বিল্ট-ইন ফিচার: এনক্রিপশন, কম্প্রেশন, RAID-শৈলীর প্রটেকশন\n\nআধুনিক কন্ট্রোলারগুলোতে প্রায়ই হার্ডওয়্যার ফিচার থাকে যা না থাকলে CPU সাইকেল খাবে:

ডেটা অ্যাট-রেস্ট: স্টোরেজ সিলিকন লেখার সময় ইনলাইন এনক্রিপশন করে এবং পড়ার সময় ডিক্রিপ্ট করে, NVMe পথে ইন্টিগ্রেটেডভাবে—যাতে প্রতিটি I/O CPU-গুরুত্বপূর্ণ না হয়।\n\nইনলাইন হওয়ায় নিরাপত্তা ধীরগতি নিয়ে আসে না।\n\n### মাল্টি-টেন্যান্ট আইসোলেশন \nশেয়ার্ড ইনফ্রাস্ট্রাকচারে কড়া আলাদা রাখা জরুরি। ইনফ্রাস্ট্রাকচার চিপগুলি হার্ডওয়্যার কিউ, মেমরি সুরক্ষা, ভার্চুয়াল ফাংশন, এবং পলিসি প্রয়োগের মাধ্যমে আইসোলেশন বাস্তবায়ন করতে পারে—তাতে একটি টেন্যান্টের ট্র্যাফিক বা স্টোরেজ অনুরোধ অন্যটির দিকে দেখতে পাবে না। এটা বিশেষভাবে গুরুত্বপূর্ণ যখন DPUs ভার্চুয়াল নেটওয়ার্কিং হ্যান্ডেল করে এবং PCIe ডিভাইসগুলো শেয়ার করা হয়।\n\n### সমস্যা আগের দিকে তুলে আনার টেলিমেট্রি ফিচার \nনির্ভরযোগ্যতা কেবল “বিফল না হওয়া” নয়—এটি দ্রুত সনাক্ত ও পুনরুদ্ধার করা। অনেক ডেটা ইনফ্রাস্ট্রাকচার সিলিকন ডিজাইনে টেলিমেট্রি কাউন্টার, এরর রিপোর্টিং, প্যাকেট ট্রেসিং হুক, এবং হেলথ মেট্রিক থাকে যা ক্লাউড টিমগুলো মনিটরিং সিস্টেমে পাঠাতে পারে। যখন কিছু ভাঙে (ড্রপ, লেটেন্সি স্পাইক, লিঙ্ক এরর, রিট্রাই স্টর্ম), এই বিল্ট-ইন সিগনালগুলো অপারেটরকে দেখায় সমস্যাটি ইথারনেট সুইচিং, DPU না স্টোরেজ কন্ট্রোলারে—সমস্যা নির্ণয় ও সমাধানের সময় কমে যায় এবং ক্লাউড আপটাইম উন্নত হয়।\n\n## এন্ড-টু-এন্ড উদাহরণ: কীভাবে একটি ক্লাউড অনুরোধ দ্রুত হয়\n\nএকটি সহজ কাজ কল্পনা করুন: আপনি একটি শপিং অ্যাপ খুলে “View order history” চাপালেন। একটি অনুরোধ বহু সিস্টেমের মধ্য দিয়ে যায়—প্রত্যেক ধাপে বিলম্বের সম্ভবনা আছে।\n\n### ধাপে ধাপে: অনুরোধ → ডাটাবেস → প্রতিক্রিয়া\n\n1. আপনার অনুরোধ ক্লাউড এজ ও লোড ব্যালান্সারে পড়ে। প্যাকেট একটি সুস্থ অ্যাপ্লিকেশন সার্ভারে রাউট করা হয়।\n\n2. এটি অ্যাপ হোস্টে পৌঁছায়। ঐখানে প্রচলিতভাবে হোস্ট CPU অনেক “প্লাম্বিং” করে: এনক্রিপশন, ফায়ারওয়াল রুল, ভার্চুয়াল নেটওয়ার্কিং, এবং কিউ ম্যানেজমেন্ট।\n\n3. অ্যাপ ডাটাবেসকে প্রশ্ন করে। কুয়েরি ডেটা সেন্টার নেটওয়ার্ক পেরিয়ে ডাটাবেস ক্লাস্টারে যায়, তারপর স্টোরেজ থেকে ডেটা ফেচ করে।\n\n4. প্রতিক্রিয়া একই পথে ফিরে আসে। রেজাল্ট প্যাকেজ করা, এনক্রিপ্ট করা, এবং আপনার ফোনে পাঠানো হয়।\n\n### কোথায় লেটেন্সি ঢুকে পড়ে\n\n- নেটওয়ার্ক হপ ও প্যাকেট প্রসেসিং: প্রতিটি হপ মাইক্রো-ডিলে যোগ করে; বড় খরচ হতে পারে প্রত-প্যাকেট কাজ: রাউটিং, টানেল এনক্যাপ, ACL চেক।\n- স্টোরেজ I/O: NVMe থাকলেও দেরি আসতে পারে যখন কিউ জমে, মেটাডাটা অকার্যকরভাবে হ্যান্ডেল হয়, বা স্টোরেজ পথ হোস্ট CPU-কে বেশি দায়িত্ব দেয়।\n- CPU প্রতিযোগিতা: যদি একই CPU কোর অ্যাপ ও ইনফ্রাস্ট্রাকচার কাজ চালায়, বর্স্টি ট্র্যাফিক ‘নয়জি নেবর’ ইফেক্ট তৈরি করে।\n\n### কিভাবে অফলোড ও অ্যাক্সিলারেশন বাধা সরায়\n\nSmart NICs/DPUs এবং বিশেষায়িত ইনফ্রাস্ট্রাকচার সিলিকন (Marvell-এর মত সলিউশনসহ) পুনরাবৃত্তি কাজগুলোকে জেনারেল CPU-থেকে সরিয়ে দেয়:

স্টোরেজ অ্যাক্সিলারেশন NVMe কিউ হ্যান্ডলিং, রেইড/ডাটা প্রোটেকশন কাজ দ্রুত করে ও হোস্টকে হালকা করে।\n\n### বাস্তবে কী উন্নতি হয়\n\n- কম টেইল লেটেন্সি: ট্র্যাফিক স্পাইকের সময় কম ‘দীর্ঘ’ অনুরোধ ঘটে।\n- উচ্চ থ্রুপুট: সার্ভার প্রতি বেশি অনুরোধ পরিবেশন করতে পারে কারণ CPU অ্যাপ লজিকে নিবদ্ধ থাকে।\n- ভাল কনসিস্টেন্সি: পারফরম্যান্স ধারাবাহিক হয় কারণ ইনফ্রাস্ট্রাকচার কাজগুলো আলাদা ও পূর্বানুমিত।\n\n## ক্লাউড টিমরা কীভাবে তাদের ইনফ্রাস্ট্রাকচারের জন্য সিলিকন চয়ন করে\n\nক্লাউড অপারেটররা কেবল “তরল” গতি দেখে চিপ বেছে নেয় না—তারা তখন বেছে নেয় যখন কাজ বড়, পুনরাবৃত্তিমূলক, এবং ডেডিকেটেড হার্ডওয়্যারে রূপান্তর করার যোগ্য। বিশেষায়িত সিলিকন বড় ক্ষেত্রে সবচেয়ে মূল্যবান, যখন কাজগুলো পূর্বানুমিত এবং ছোট দক্ষতা সমগ্র ফ্লিটে বড় সাশ্রয় এনে দেয়।\n\n### ওয়ার্কলোড থেকে শুরু করুন, ডেটাশিট থেকে নয়\n\nটিমগুলো সাধারণত তাদের বড় বটলনেকগুলোকে নির্দিষ্ট ফাংশনে ম্যাপ করে: নেটওয়ার্ক পাথে প্যাকেট প্রসেসিং ও সিকিউরিটি, I/O পাথে স্টোরেজ ট্রান্সলেশন ও ডেটা প্রটেকশন, বা অ্যাক্সিলারেশন ব্লকে কনপ্রেশন/ক্রিপ্টো/AI প্রিমিটিভ। একটি মূল প্রশ্ন: কাজটি অফলোড করলে সফটওয়্যার মডেল ভাঙবে না তো? যদি প্ল্যাটফর্ম কিছু লিনাক্স ফিচার, ভার্চুয়াল সুইচিং বা স্টোরেজ সেমান্টিকসের উপর নির্ভর করে, তাহলে চিপটিকে সেই অনুমানগুলো মেনে চলতে হবে।\n\n### PoC-এর আগে ভেন্ডরকে কি জিজ্ঞাসা করবেন\n\nপরিষ্কারভাবে জিজ্ঞাসা করুন:

সাপ্লাই ও লাইফসাইকেল: লীড টাইম, সেকেন্ড-সোর্স কৌশল, এবং দীর্ঘমেয়াদি উপলব্ধতা\n\n### টিমগুলো কিভাবে অপশন মূল্যায়ন করে\n\nবেঞ্চমার্ক মূল্যবান, কিন্তু কেবল তখনই যদি সেগুলো প্রোডাকশনের মিরর হয়: বাস্তব প্যাকেট মিশ্রণ, বাস্তব স্টোরেজ কিউ ডেপথ, এবং বাস্তব টেন্যান্ট আইসোলেশন। পাওয়ারকে “ওয়ার্ক পারি ওয়াট” হিসেবে মূল্যায়ন করা হয়, কেবল শীর্ষ থ্রুপুট নয়—বিশেষ করে যখন র‍্যাকগুলো পাওয়ার-ক্যাপড।\n\nইন্টিগ্রেশন প্রচেষ্টা প্রায়ই চূড়ান্ত সিদ্ধান্ত নির্ধারণ করে। কাগজে 10% ভালো হওয়া চিপ এমনকি হারাতে পারে যদি সেটি প্রোভিশন, মনিটর ও প্যাচ করতে বৃহৎ শ্রম দাবি করে।\n\n### লক-ইন এড়ানো\n\nক্লাউড টিমরা ঝুঁকি কমাতে স্ট্যান্ডার্ড (Ethernet, NVMe, PCIe/CXL), ভাল ডকুমেন্টেড API, ও ইন্টারঅপারেবল ম্যানেজমেন্ট টুলিং পছন্দ করে। এমনকি যখন ভেন্ডর ফিচার ব্যবহার করা হয় (Marvell ও সমকক্ষদের), তারা উচ্চ-স্তরের কন্ট্রোল প্লেনকে পোর্টেবল রাখতে চেষ্টা করে যেন হার্ডওয়্যার পরিবর্তন করলে পুরো প্ল্যাটফর্ম রিরাইট করতে না হয়।\n\nসফটওয়্যার দিকে একই নীতি প্রযোজ্য: আপনি যখন সেবাগুলি তৈরি করছেন যা শেষমেষ এই ইনফ্রাস্ট্রাকচারে চলবে, আর্কিটেকচারগুলোকে পোর্টেবল রাখা সাহায্য করে। প্ল্যাটফর্মগুলো যেমন Koder.ai ওয়েব ব্যাকএন্ড (Go + PostgreSQL) এবং React ফ্রন্টএন্ড প্রোটোটাইপ ত্বরান্বিত করতে পারে চ্যাট-চালিত ওয়ার্কফ্লো দিয়ে, তবু টিমগুলোকে সোর্স কোড এক্সপোর্ট ও তাদের নিজস্ব ক্লাউডে ডিপ্লয় করার স্বাধীনতা দেয়—কম্প্লায়েন্স চাহিদার সঙ্গেও খাপ খাইয়ে।\n\n## ডেটা ইনফ্রাস্ট্রাকচার সিলিকনের ভবিষ্যৎ কি হবে\n\nক্লাউড ইনফ্রাস্ট্রাকচার সিলিকন "পছন্দের অ্যাকসেসরি" থেকে বেসলাইন প্লাম্বিং-এ রূপ নিয়েছে। আরো সার্ভিস লেটেন্সি-সেন্সিটিভ হওয়ার সঙ্গে (AI ইনফারেন্স, রিয়েল-টাইম অ্যানালিটিক্স, সিকিউরিটি ইনস্পেকশন), নেটওয়ার্কিং, স্টোরেজ ও ডেটা মুভমেন্ট দক্ষভাবে পরিচালনা করা চিপগুলো CPU-র সমান গুরুত্ব পাবে।\n\n### উচ্চ ব্যান্ডউইথ ডিফল্ট হবে\n\nউচ্চ ব্যান্ডউইথ নেটওয়ার্ক আর বিশেষ স্তর নয়—এটি একটি প্রত্যাশা। এটি ইথারনেট সুইচিং, প্যাকেট প্রসেসিং, DPUs ও Smart NICs কে দ্রুত পোর্ট, কম লেটেন্সি, এবং ভাল কনজেশন কন্ট্রোলের দিকে ঠেলে দেবে। ভেন্ডররা (Marvell সহ) প্রতিযোগিতা করবে কতো কাজ হার্ডওয়্যারে অফলোড করা যায় (এনক্রিপশন, টেলিমেট্রি, ভার্চুয়াল সুইচিং) অপারেশনাল জটিলতা না বাড়িয়ে।\n\n### CXL ও কম্পোজেবল ইনফ্রাস্ট্রাকচার ব্যবহারিক হবে\n\nPCIe ও CXL কানেকটিভিটি ক্রমে ডিসঅ্যাসেম্বলি সম্ভব করবে: মেমরি ও অ্যাক্সিলারেটর পুল করে র‍্যাকে “কম্পোজ” করা যাবে প্রতিটি ওয়ার্কলোড অনুযায়ী। সিলিকনের সুযোগ শুধু CXL PHY নয়—এটি কন্ট্রোলার, সুইচিং, এবং ফার্মওয়্যারও যাতে পুলড রিসোর্সগুলো ক্লাউড টিমদের জন্য পূর্বানুমিত, সুরক্ষিত ও পর্যবেক্ষণযোগ্য হয়।\n\n### বড় প্ল্যাটফর্মে আরো কাস্টম সিলিকন\n\nবড় প্রদানকারীরা পার্থক্য ও সিস্টেম-স্তরের ইন্টিগ্রেশনের চেয়ে বেশি চান। আশা করুন আরো সেমি-কাস্টম প্রোগ্রাম যেখানে একটি স্ট্যান্ডার্ড বিল্ডিং ব্লক (SerDes, Ethernet সুইচিং, NVMe) প্ল্যাটফর্ম-নির্দিষ্ট ফিচার, ডিপ্লয়মেন্ট টুলিং, এবং দীর্ঘ সাপোর্ট উইন্ডোসহ জোড়া হবে।\n\n### পরবর্তী প্রজন্মের অংশগুলো মূল্যায়নের সময় কী দেখতে হবে\n\nপারফরম্যান্স প্রতি ওয়াট হবে বড় হেডলাইন মেট্রিক, বিশেষ করে পাওয়ার কেপস বৃদ্ধির সাথে। নিরাপত্তা ফিচারগুলো ডেটা পাথে আরো কাছাকাছি যাবে (ইনলাইন এনক্রিপশন, সিকিউর বুট, অ্যাটেস্টেশন)। সবশেষে, আপগ্রেড পথগুলো গুরুত্বপূর্ণ হবে: আপনি কি নতুন ব্যান্ডউইথ, CXL রিভিশন, বা অফলোড ফিচার গৃহীত করতে পারবেন যা পুরো প্ল্যাটফর্ম রিডিজাইন না করে—আর পুরোনো র‍্যাকের সাথে সামঞ্জস্য ভাঙ্গবে না?