كيف تعمل تجزئة قواعد البيانات — ولماذا يصعب فهمها

Q: ما هي المكونات الأساسية لنظام قاعدة بيانات مجزأة؟

نظام مجزأ نموذجي يتضمن: - شاردات: تقسيمات مستقلة مع تخزين وفهارس خاصة - موجّهات/منسقون: يقررون أي شارد يجب استهدافه - خدمة التهيئة/الميتا-داتا: خريطة الشاردات، الملكية، الصحة، العضوية - وظائف خلفية: إعادة التوازن، الهجرات، إجراءات النسخ الاحتياطي/الاستعادة الأداء والصحة يعتمد على بقاء هذه الأجزاء متناسقة.

Q: ما الذي يجعل مفتاح الشارد «سيئًا»، وما المشاكل التي يسببها؟

مفاتيح شاردة سيئة شائعة: - مفاتيح زمنية تصاعدية (طوابع زمنية، معرفات متزايدة): تتكدس البيانات على الشارد الأحدث → نقطة ساخنة - حقول قليلة التعدد (status, plan tier, country): قد تؤدي إلى تحميل غير متساوٍ - معرّفات قابلة للتغيير (البريد الإلكتروني، أسماء المستخدمين القابلة للتعديل): تغيير المفتاح يفرض نقل البيانات ويكون محفوفًا بالمخاطر هذه تؤدي إلى نقاط ساخنة وتحول الاستعلامات الروتينية إلى استعلامات انتشار-جمع (scatter-gather).

Q: ما هي تجزئة النطاق والهاش والدليل، ومتى يستخدم كل منها؟

ثلاث استراتيجيات شائعة: - تجزئة النطاق (Range): كل شارد يملك مدى متجانس من قيم المفتاح؛ سهل التوجيه، لكن عرضة للنِقاط الساخنة؛ ملائم للاستعلامات النطاقية. - التجزئة بالهاش (Hash): يمرر المفتاح عبر دالة هاش ليختار شارد؛ يوزع البيانات بشكل متساوٍ لكن يجعل استعلامات النطاق مكلفة؛ يستخدمون غالبًا هاش متناسق مع عقد افتراضية لتقليص إعادة التوزيع عند إضافة شارد. - تجزئة الدليل (Directory/Lookup): خريطة صريحة من مفتاح→شارد؛ مرنة للهجرات والمواضع المخصصة، لكنها تضيف اعتمادًا على خدمة الدليل لتوجيه صحيح.

تسجيل الدخول ابدأ الآن

كيف تعمل تجزئة قواعد البيانات — ولماذا يصعب فهمها | Koder.ai

ما هي التجزئة (وماذا ليست)

التجزئة (تُعرف أيضًا باسم التقسيم الأفقي) تعني أخذ ما يبدو كـ قاعدة بيانات واحدة لتطبيقك وتقسيم بياناتها عبر آلات متعددة تُسمى شاردات. كل شارد يحتوي على جزء من الصفوف، لكنَّها معًا تمثل مجموعة البيانات الكاملة.

جدول منطقي واحد، عدة أماكن مادية

نموذج ذهني مفيد هو الفرق بين البنية المنطقية والمكان المادي.

منطقي: لا تزال تملك جدول "المستخدمين" واحدًا (نفس الأعمدة، ونفس المعنى).
مادي: تُخزن صفوف هذا الجدول في أماكن مختلفة—ربما المستخدمون بالمعرّفات 1–1,000,000 على الشارد A والمليون التالي على الشارد B.

من وجهة نظر التطبيق، تريد تشغيل استعلامات كما لو كانت على جدول واحد. لكن تحت الغطاء، يجب على النظام أن يقرر أي شارد/شاردات يتواصل معها.

ليست نسخًا ولا "اشترِ صندوقًا أكبر"

التجزئة تختلف عن التكرار. التكرار ينشئ نسخًا من نفس البيانات على عقد متعددة، أساسًا للتوافر ورفع سعة القراءة. التجزئة تقسم البيانات بحيث تكون كل عقدة لديها سجلات مختلفة.

كما أنها تختلف عن التوسيع الرأسي، حيث تحتفظ بقاعدة بيانات واحدة ولكن تنقلها إلى آلة أكبر (مزيد من CPU/RAM/أقراص أسرع). التوسيع الرأسي أبسط أحيانًا لكن له حدود عملية وقد يصبح مكلفًا بسرعة.

ما الذي لا تَصلحه التجزئة سحرًا

التجزئة تزيد السعة، لكنها لا تجعل قاعدة البيانات "سهلة" أو تسريع كل استعلام تلقائيًا.

الانضمامات (joins) قد تصبح مكلفة إذا كانت الصفوف المرتبطة على شاردات مختلفة.
المعاملات عبر الشاردات أصعب؛ التحديثات "الكل أو لا شيء" قد تتطلب تنسيقًا.
التعقيد التشغيلي يزيد: التوجيه، وإعادة الموازنة، وتصحيح الأخطاء، والتعامل مع الفشل تصبح جزءًا من النظام.

إذن من الأفضل فهم التجزئة كطريقة لتوسيع التخزين ومعدل المعاملات—وليست ترقية مجانية لكل سلوك قاعدة البيانات.

لماذا تقوم الفرق بالتجزئة: المشكلات التي تحاول حلها

نادرًا ما تكون التجزئة الخيار الأول. عادة ما تلجأ الفرق إليها بعد أن يصل النظام الناجح إلى حدود فيزيائية—أو بعد أن يصبح الألم التشغيلي متكررًا جدًا ليُتجاهل. الدافع ليس "نريد تجزئة" بقدر "نحتاج طريقة للنمو دون أن تصبح قاعدة واحدة نقطة فشل أو تكلفة كبيرة."

نقاط الألم التي تدفع الفرق نحو التجزئة

قد تنفد سعة عقدة قاعدة بيانات واحدة بطرق مختلفة:

حدود التخزين: تكبر الجداول والفهارس حتى يصبح القرص ضيقًا، وتتباطأ النسخ الاحتياطية، وتصبح عمليات الصيانة خطرة.
حدود معدل الكتابة: CPU أو WAL/redo أو تنازع الأقفال يحد من عدد الكتابات في الثانية.
حدود معدل القراءة: حتى مع التخزين المؤقت والنسخ، بعض الأحمال تطغى على الأساسي (أو يصبح توسيع النسخ مكلفًا).
الجيران المزعجون: عميل واحد أو نمط حمل يستأثر بالموارد ويؤثر على الجميع.

عندما تظهر هذه القضايا بانتظام، غالبًا المشكلة ليست استعلامًا وحيدًا سيئًا—بل أن آلة واحدة تتحمل مسؤولية كبيرة جدًا.

الأهداف: التوسع الأفقي، العزل، والتحكم بالتكلفة

تجزئة قواعد البيانات توزع البيانات وحركة المرور عبر عقد متعددة بحيث تنمو السعة بإضافة آلات بدلًا من ترقية واحدة رأسيًا. إذا نُفذت جيدًا، يمكنها أيضًا عزل أحمال العمل (حتى لا تُفسد قفزة أحد العملاء زمن الاستجابة للآخرين) والتحكم في التكلفة بتجنب الاعتماد على صفحات مترافعة باهظة الثمن.

علامات الإنذار المبكرة بأنك تقترب من السقف

أنماط متكررة تشمل ازدياد ثابت في p95/p99 أثناء الذروة، تأخر نسخ أكبر، نسخ/استعادة يتجاوز نافذة القبول، وتغييرات مخطط "صغيرة" تصبح أحداثًا كبيرة.

لماذا التجزئة عادةً خطوة أخيرة

قبل الالتزام، تستنفد الفرق عادة حلولًا أبسط: الفهرسة وتحسين الاستعلامات، التخزين المؤقت، نسخ القراءة، التقسيم داخل قاعدة بيانات واحدة، أرشفة البيانات القديمة، وترقيات العتاد. التجزئة قد تحل مشكلات السعة، لكنها تضيف تنسيقًا وتعقيدًا تشغيليًا وأنماط فشل جديدة—لذلك يجب أن يكون الحد مرتفعًا.

القطع الأساسية: الشاردات، الموجّهات، والميتا-داتا

قاعدة بيانات مجزأة ليست شيئًا واحدًا—بل نظام صغير من أجزاء متعاونة. سبب شعور التجزئة بأنها "صعبة الفهم" هو أن الصلاحية والأداء يعتمدان على كيفية تفاعل هذه الأجزاء، وليس فقط على محرك قاعدة البيانات.

الشاردات: تقسيمات مستقلة (بفهارسها الخاصة)

الشارد هو مجموعة فرعية من البيانات، عادة محفوظة على خادم أو مجموعة خوادم خاصة بها. كل شارد عادةً لديه:

التخزين (ملفات البيانات)
الفهارس (حتى تكون الاستعلامات سريعة داخل الشارد)
حدود محلية (CPU، الذاكرة، القرص، الاتصالات)

من وجهة نظر التطبيق، غالبًا يحاول الإعداد المجزأ الظهور كقاعدة بيانات منطقية واحدة. لكن تحت الغطاء، استعلام كان سيكون "بحث فهرس واحد" في قاعدة بيانات أحادية قد يصبح "ابحث عن الشارد الصحيح، ثم نفّذ البحث".

الموجّهون/المنسقون: كيف تصل الطلبات إلى الشارد الصحيح

الموجّه (يسمَّى أحيانًا منسق، موجه استعلام، أو وكيل) هو ضابط المرور. يجيب على السؤال العملي: باستناد إلى هذا الطلب، أي شارد يجب أن يتعامل معه؟

هناك نمطان شائعان:

توجيه من جانب العميل: مكتبة التطبيق تعرف خريطة الشاردات وتتصل مباشرة بالشارد الصحيح.
توجيه عن طريق بروكسي: التطبيق يتصل بخدمة موجّهة، التي تعيد توجيه الطلب.

الموجّهون يقللون التعقيد في التطبيق، لكنهم قد يصبحون أيضًا عنق زجاجة أو نقطة فشل جديدة إذا لم يُصمموا بعناية.

خدمة الميتا-داتا/التهيئة: خريطة الشاردات، الملكية، والصحة

التجزئة تعتمد على الميتا-داتا—مصدر الحقيقة الذي يصف:

خريطة الشاردات (أي شارد يملك أي نطاق/حاويات الهاش/معرّفات)
الملكية (خاصة أثناء الهجرات، حيث قد تتداخل الملكيات مؤقتًا)
الصحة والعضوية (أي العقد متاحة، أدوار الأساسي/النسخ، حالة التصريف)

تعيش هذه المعلومات غالبًا في خدمة تهيئة أو قاعدة بيانات "مستوى التحكم" صغيرة. إذا كانت الميتا-داتا قديمة أو غير متناسقة، قد يرسِل الموجّهون الحركة إلى المكان الخطأ—حتى لو كانت كل الشاردات صحيحة.

وظائف خلفية: الموازنة، الهجرات، والنسخ الاحتياطي

أخيرًا، التجزئة تعتمد على عمليات خلفية تحافظ على قابلية النظام بمرور الوقت:

إعادة الموازنة عندما ينمو شارد أسرع من الآخرين
الهجرات عند نقل الملكية بين الشاردات
النسخ/الاستعادة عبر العديد من الشاردات بما يتوافق مع أهداف الاسترداد

هذه الوظائف سهلة التجاهل في البداية، لكنها مصدر العديد من المفاجآت الإنتاجية—لأنها تغيّر شكل النظام أثناء الخدمة.

اختيار مفتاح الشارد: أول مقايضة كبيرة

مفتاح الشارد هو الحقل الذي يحدد أي شارد سيخزن صفًا/وثيقةً. هذا الاختيار الواحد يحدد بهدوء الأداء والتكلفة وحتى أي ميزات ستبدو "سهلة" لاحقًا—لأنه يتحكم فيما إذا كانت الطلبات تُوجَّه إلى شارد واحد أم تحتاج إلى التوسع.

ما الذي يجعل مفتاح الشارد "جيدًا"

مفتاح جيد عادةً ما يحتوي على:

تعدد قيم كبير: قيم كثيرة ممكنة (مثلاً user_id بدلًا من الدولة).
توزيع متساوٍ: القيم توزّع الکتابات والقراءات عبر الشاردات بدلًا من التكدس على واحد.
أنماط وصول مستقرة: يتماشى مع طريقة الاستعلام الأكثر شيوعًا اليوم وماذا تتوقع استعلامه الربع القادم.

مثال شائع هو التجزئة بواسطة tenant_id في تطبيق متعدد المستأجرين: معظم قراءات/كتابات مستأجر تبقى على شارد واحد، والمستأجرون كثيرون بما يكفي لوزع‌ة الحمل.

ما الذي يجعل مفتاح الشارد "سيئًا" (ولماذا يضر)

بعض المفاتيح تكاد تضمن الألم:

مفاتيح مرتبة زمنيًا (طوابع زمنية، معرفات تزايدية): بيانات جديدة تتجمع على الشارد "الأحدث" فتخلق نقطة كتابة ساخنة.
حقول قليلة التعدد (status, plan_tier, country): قيم قليلة جدًا تعني أن بعض الشاردات تؤدي معظم العمل.
معرّفات قابلة للتغيير (email، أسماء مستخدمين قابلة للتعديل): إذا تغيّر المفتاح، يصبح نقل البيانات بين الشاردات مكلفًا ومحفوفًا بالمخاطر.

حتى لو بدا حقل قليل التعدد ملائمًا للتصفية، غالبًا ما يحوّل الاستعلامات الروتينية إلى استعلامات انتشار-جمع لأن الصفوف المطابقة متفرقة.

المقايضة الحقيقية: سهولة الاستعلامات vs جودة التوزيع

أفضل مفتاح شارد لتوزيع الحمل ليس دائمًا الأفضل لسهولة الاستعلامات.

اختر مفتاحًا متوافقًا مع نمط الوصول الأساسي (مثل user_id) فسوف تبطئ بعض الاستعلامات العالمية (التقارير الإدارية) أو تتطلب أنابيب منفصلة.
اختر مفتاحًا متوافقًا مع التقارير (مثل region) فتخاطر بنقاط ساخنة وسعة غير متساوية.

تصاميم الفرق عادةً ما تهيئ نفسها حول هذه المقايضة: تحسين مفتاح الشارد للعمليات الأكثر تكرارًا وحساسية للكمون—ومعالجة الباقي عبر الفهارس، التطبيع العكسي، النسخ، أو جداول تحليلات مخصصة.

استراتيجيات شارد شائعة (نطاق، هاش، دليل)

لا توجد طريقة "أفضل" واحدة لتجزئة قاعدة البيانات. الاستراتيجية التي تختارها تشكل سهولة توجيه الاستعلامات، مدى تساوي توزيع البيانات، ونوعية أنماط الوصول التي ستتأثر.

تجزئة النطاق

في تجزئة النطاق، كل شارد يملك شريحة متصلة من فضاء المفتاح—مثل:

الشارد A: customer_id 1–1,000,000
الشارد B: customer_id 1,000,001–2,000,000

التوجيه بسيط: انظر المفتاح واختر الشارد.

لكن المشكلة هي النقاط الساخنة. إذا كان المستخدمون الجدد دائمًا يحصلون على معرّفات متزايدة، يصبح الشارد "الأخير" عنق زجاجة للكتابة. تجزئة النطاق حساسة أيضًا للنمو غير المتكافئ. الجانب الإيجابي: استعلامات النطاق يمكن أن تكون فعالة لأن البيانات مجمعة ماديًا.

تجزئة الهاش

تجزئة الهاش تمرر مفتاح الشارد عبر دالة هاش وتستخدم النتيجة لاختيار شارد. هذا عادةً ما يوزع البيانات بشكل أكثر تساويًا، مما يساعد على تجنُّب مشكلة "كل شيء يذهب للشارد الأحدث".

المقابل: استعلامات النطاق تصبح مؤلمة. استعلام مثل "العملاء ذوو المعرفات بين X و Y" لم يعد يطابق مجموعة صغيرة من الشاردات؛ قد يلمس العديد منها.

تفصيل عملي كثيرًا ما يستهان به هو الهَش المتناسق: بدلًا من المطابقة المباشرة لعدد الشاردات (التي تعيد توزيع كل المفاتيح عند إضافة شارد)، تستخدم أنظمة كثيرة حلقة هاش مع "عُقَد افتراضية" بحيث تحرّك الإضافة قدرًا محدودًا من المفاتيح.

تجزئة الدليل (Lookup)

تجزئة الدليل تخزن خريطة صريحة (جدول/خدمة بحث) من مفتاح → موقع الشارد. هذه أكثر مرونة: يمكنك وضع مستأجرين محددين على شاردات مخصصة، ونقل عميل دون نقل الجميع، ودعم أحجام شارد غير متساوية.

العيب هو اعتماد إضافي. إذا كان الدليل بطيئًا أو قديمًا أو غير متاح، يتأثر التوجيه—حتى لو كانت الشاردات نفسها صحية.

مفاتيح مركبة وتقسيم فرعي

الأنظمة الحقيقية غالبًا تمزج النهجين. مفتاح شارد مركب (مثل tenant_id + user_id) يعزل المستأجرين ويُوزّع الحمل داخل المستأجر. التقسيم الفرعي مشابه: وجه أولًا حسب المستأجر، ثم هاش داخل مجموعة الشاردات المخصصة لذلك المستأجر لتجنب سيطرة مستأجر كبير على شارد واحد.

كيف تعمل الاستعلامات: التوجيه مقابل الانتشار-الجمع

أنشئ بيئة اختبار للتجزئة

ولّد backend بـ Go وPostgreSQL لاختبار التوجيه والبيانات الوصفية واستعلامات التوزيع.

ابدأ البناء

قاعدة بيانات مجزأة لديها مساران استعلاميان مختلفان جدًا. فهم أي مسار أنت فيه يفسر معظم المفاجآت في الأداء—ولماذا تبدو التجزئة غير متوقعة.

استعلامات شارد واحد: المسار السريع

النتيجة المثالية هي توجيه استعلام لشارد واحد فقط. إذا كان الطلب يتضمن مفتاح الشارد (أو شيء يمكن للموجّه خرائطته للشارد)، يمكن إرساله مباشرة إلى المكان الصحيح.

لهذا السبب تركز الفرق على جعل قراءات الشائع «واعية بمفتاح الشارد». شارد واحد يعني عددًا أقل من الرحلات الشبكية، تنفيذًا أبسط، أقفالًا أقل، وتنسيقًا أقل. الكمون يكون غالبًا عمل قاعدة البيانات نفسها، لا جدال العنقود حول من ينفذ العمل.

قراءات الانتشار-الجمع: التوسع وذيل الكمون

عندما لا يمكن توجيه الاستعلام بدقة (مثلاً يُفلتر بحقل ليس مفتاح الشارد)، قد يبث النظام الاستعلام إلى كل الشاردات أو إلى الكثير منها. كل شارد ينفذ الاستعلام محليًا، ثم يدمج الموجّه النتائج—مرتبًا، مزيلًا التكرار، مطبّقًا حدودًا، ومجمّعًا الأجزاء الجزئية.

هذا التوسع يضخم ذيل الكمون: حتى لو استجابت 9 شاردات بسرعة، شارد واحد بطيء قد يحتجز الطلب بأكمله. كما يضاعف التحميل: طلب مستخدم واحد يصبح N طلبات شارد.

الانضمامات والعمليات المجمعة عبر الشاردات

الانضمامات عبر الشاردات مكلفة لأن بيانات كانت لتلتقي "داخل" قاعدة بيانات واحدة يجب الآن أن تنتقل بين الشاردات (أو إلى منسق). حتى التجميعات البسيطة (COUNT, SUM, GROUP BY) قد تتطلب خطة من مرحلتين: حساب نتائج جزئية على كل شارد ثم دمجها.

حدود الفهرسة: محلي مقابل عالمي

معظم الأنظمة تفترض فهارس محلية: كل شارد يفهرس بياناته فقط. هذه الفهارس رخيصة الصيانة، لكنها لا تساعد التوجيه—لذا قد يستمر الاستعلام بالانتشار.

الفهارس العالمية يمكن أن تمكّن التوجيه المستهدف عبر حقول ليست مفتاح الشارد، لكنها تضيف عبئًا على الكتابة، وتنسيقًا إضافيًا، ومشاكل موازنة واتساق خاصة بها.

الكتابات والمعاملات عبر الشاردات

الكتابات هي النقطة التي تتوقف فيها التجزئة عن كونها "مجرد توسعة" وتبدأ بتغيير كيفية تصميم الميزات. كتابة تمس شاردًا واحدًا يمكن أن تكون سريعة وبسيطة. كتابة تمس عدة شاردات يمكن أن تكون بطيئة، عرضة للفشل، ومن الصعب جعلها صحيحة.

كتابات شارد واحد: المسار السعيد

إذا كان كل طلب يمكن توجيهه لشارد واحد (عادة عبر مفتاح الشارد)، يمكن لقاعدة البيانات استخدام آلية المعاملات العادية. تحصل على الذرية والعزل داخل ذلك الشارد، ومعظم المشاكل التشغلية تبدو مألوفة—مشاكل عقدة مفردة مكررة N مرة.

كتابات متعددة الشاردات: حيث يتصاعد التعقيد

لحظة تحتاج فيها لتحديث بيانات على شاردين أو أكثر في إجراء منطقي واحد (مثل تحويل أموال، نقل طلب بين عملاء، تحديث مجمّع مخزن في مكان آخر)، تدخل في نطاق المعاملات الموزعة.

المعاملات الموزعة صعبة لأنها تتطلب تنسيقًا بين آلات يمكن أن تكون بطيئة، مقطوعة، أو يعاد تشغيلها في أي وقت. بروتوكولات مثل two-phase commit تضيف ذهابًا وإيابًا إضافيًا، قد تحجب التنفيذ أثناء الانتظار، وتجعل حالات الفشل غامضة: هل طبقت الشاردات التغيير أم لا؟ إذا أعاد العميل المحاولة، هل سيتم التطبيق مرتين؟

نماذج لتقليل الكتابات عبر الشاردات

بعض التكتيكات الشائعة تقلل عدد المرات التي تحتاج فيها معاملات عبر الشاردات:

قرب البيانات (Data locality): وضع السجلات المرتبطة على نفس الشارد (مثلاً كل شيء لعميل واحد).
توجيه الطلب: اجعل العملية مملوكة لشارد واحد واعتبر الآخرين مدخلات للقراءة فقط.
التطبيع العكسي (Denormalization): مضاعفة قطع صغيرة من البيانات حتى لا تضطر التحديثات للانتشار.

قابلية إعادة المحاولة وعدم التكرار

في الأنظمة المجزأة، إعادة المحاولة ليست اختيارية—بل حتمية. اجعل الكتابات قابلة للتكرار بلا أثر باستخدام معرفات عملية ثابتة (مثل idempotency key) وجعل قاعدة البيانات تخزن علامات "تم التطبيق بالفعل". هكذا إذا حدث مهلة وأعاد العميل المحاولة، تصبح المحاولة الثانية بلا تأثير بدلًا من إنشاء تطبيق مزدوج أو أمر مكرر أو عداد غير متسق.

الاتساق والتكرار: الحفاظ على صحة البيانات

اكسب أرصدة مقابل المحتوى

اكسب أرصدة بمشاركة ما تعلمته أثناء البناء على Koder.ai.

احصل على أرصدة

التجزئة تقسم بياناتك عبر آلات، لكنها لا تلغي الحاجة للنسخ الاحتياطي. التكرار هو ما يبقي الشارد متاحًا عند سقوط عقدة—وهو أيضًا ما يجعل الإجابة عن "ما هو الصحيح الآن؟" أصعب.

التكرار داخل كل شارد

معظم الأنظمة تكرر ضمن كل شارد: زعيم يقبل الكتابات، ونسخ تنسخ التغييرات. إذا فشل الزعيم، يطرح النظام نائبًا. يمكن للنسخ أيضًا خدمة القراءات لتقليل الحمل.

المقايضة هي التوقيت. قد يتأخر نسخة القراءة ميليًا أو ثوانٍ. هذه الفجوة طبيعية لكنها مهمة عندما يتوقع المستخدم رؤية التحديث فورًا.

نماذج الاتساق بصيغة بسيطة

اتساق قوي: بعد نجاح كتابة، ستعكس القراءات ذلك (عادة عبر القراءة من الزعيم أو انتظار تأكيد النسخ).
اتساق نهائي: سيتقارب النظام، لكن القراءة قد تعطي بيانات أقدم مؤقتًا.

في الإعدادات المجزأة، غالبًا ما تحصل على اتساق قوي داخل الشارد وضمانات أضعف عبر الشاردات، خاصة عند العمليات متعددة الشاردات.

«مصدر واحد للحقيقة» عندما تُقسَّم البيانات

مع التجزئة، «مصدر واحد للحقيقة» يعني عادةً: لكل قطعة من البيانات هناك مكان واحد موثوق للكتابة (عادة زعيم الشارد). لكن على مستوى عالمي لا توجد ماكينة واحدة يمكنها أن تؤكد فورًا أحدث حالة لكل شيء. لديك حقائق محلية يجب مزامنتها عبر التكرار.

القيود العالمية: التفرد، المفاتيح الأجنبية، العدادات

القيود تصبح معقدة عندما تكون البيانات التي يجب فحصها على شاردات مختلفة:

التفرد (مثلاً اسم مستخدم): فرض "لا تكرار في أي مكان" قد يتطلب فهرسًا مركزيًا، شارد قيود مخصص، أو سير عمل حجوزات على مستوى التطبيق.
المفاتيح الأجنبية: إذا كانت الصفوف الأب/الابن على شاردات مختلفة، لا تستطيع قاعدة البيانات فرض التكامل المرجعي بسهولة دون تنسيق عابر.
العدادات (المجاميع العالمية، المعرفات التسلسلية): الطرق البسيطة تخلق عنق زجاجة. حلول شائعة: نطاقات لكل شارد، تجميع دفعات، أو قبول العدادات التقريبية.

هذه الاختيارات ليست تفاصيل تنفيذية فقط—إنها تُعرِّف ماذا يعني "صحيح" للمنتج.

إعادة الموازنة وإعادة التجزئة بلا توقف

إعادة الموازنة تحافظ على قابلية استخدام قاعدة مجزأة مع تغير الواقع. البيانات تنمو بشكل غير متساوٍ، مفتاح شارد كان متوازنًا يتحوّل إلى انحراف، تضيف عقد لسعة، أو تحتاج إلى إيقاف عتاد. أيٌ من ذلك قد يحول شاردًا إلى عنق زجاجة—حتى لو كان التصميم الأصلي مثاليًا.

لماذا هي صعبة

على عكس قاعدة بيانات أحادية، التجزئة تُخزن "موقع" البيانات داخل منطق التوجيه. عندما تنقل البيانات، لا تنسخ البايتات فحسب—أنت تغيّر المكان الذي يجب أن تذهب إليه الاستعلامات. لذا إعادة الموازنة جزء منها عن الميتا-داتا والعملاء بقدر ما هي عن التخزين.

نمط الهجرة على الخط (نسخ → تداخل → قطع)

تسعى الفرق لمعظم الأحيان إلى سير عمل على الخط لتجنب نافذة "إيقاف العالم":

نسخ: تعبئة الشارد الهدف من الشارد المصدر أثناء التشغيل.
الكتابة المزدوجة (أحيانًا القراءة المزدوجة): أثناء الانتقال، اكتب التغييرات الجديدة في الموقعين القديم والجديد. قد تستشير القراءات المكانين (أو تتبع قاعدة "الجديد يفوز") حتى تتأكد.
القطع (Cutover): حدّث خريطة الشاردات حتى توجه الموجّه/العملاء للحالة الجديدة.
التنظيف: أوقف الكتابات المزدوجة، واحذف النسخة القديمة، واحقن/استرجع المساحة.

خرائط الشاردات وسلوك العميل

تغيير خريطة الشاردات حدث قد يكسر العملاء إن كانوا يخزنون قرارات التوجيه مؤقتًا. الأنظمة الجيدة تعامل ميتا-داتا التوجيه كإعداد: عَدِّل النسخ، قم بالتحديث المتكرر، وكن صريحًا حول ماذا يحدث عندما يصادف العميل مفتاحًا تم نقله (إعادة توجيه، إعادة محاولة، أو عبر الوكيل).

مخاطر تشغيلية يجب التخطيط لها

إعادة الموازنة غالبًا تسبب انخفاضًا مؤقتًا في الأداء (كتابات إضافية، تبديل الكاش، حمل النسخ الخلفية). الحركات الجزئية شائعة—بعض النطاقات تُهاجر قبل الأخرى—فمن الضروري وجود مراقبة واضحة وخطة تراجع (مثلاً إعادة تفعيل الخريطة القديمة وتصريف الكتابات المزدوجة) قبل بدء القطع.

النقاط الساخنة والانحراف: عندما يفشل "التقسيم المتساوي"

التجزئة تفترض أن العمل سيتوزع. المفاجأة أن العنقود قد يبدو "متوازنًا" على الورق (نفس عدد الصفوف لكل شارد) بينما يتصرف بشكل مختلف في الإنتاج.

أجزاء ساخنة (مفاتيح ساخنة)

نقطة ساخنة تحدث عندما يحصل جزء صغير من فضاء المفاتيح على معظم الحركة—حساب مشهور، منتج شائع، مستأجر يقوم بعملية مكثفة، أو مفتاح زمني حيث "اليوم" يتلقى كل الكتابات. إذا كانت هذه المفاتيح مخصصة لشارد واحد، يصبح ذلك الشارد عنق زجاجة حتى لو بقي الآخرون خامدين.

الانحراف: حجم البيانات مقابل الحركة

"الانحراف" ليس شيئًا واحدًا:

انحراف البيانات: شارد واحد يحمل المزيد من البايت/الصفوف (ضغط التخزين، نسخ احتياطي أطول، فحص أبطأ).
انحراف الحركة: شارد واحد يتعامل بمزيد من QPS أو استعلامات أثقل (تشبع CPU، تكدس، ارتفاع الكمون).

قد لا يتطابقا دائمًا. شارد ببيانات أقل قد يكون الأكثر حرارة إذا امتلك المفاتيح المطلوبة بكثرة.

كيف تكتشفه سريعًا

ليس مطلوبًا تتبع متقدم لرصد الانحراف. ابدأ بلوحات per-shard:

p95 لكل شارد (انحراف p95 لشارد واحد علمًا بالتحذير)
QPS وكتابات QPS لكل شارد
التخزين المستخدم / حجم الجداول لكل شارد

إذا ارتفعت كمون شارد واحد مع QPS بينما بقيت أخرى ثابتة، فغالبًا لديك نقطة ساخنة.

التخفيفات

الإصلاحات عادة ما تتبادل البساطة مقابل التوازن:

اختر مفتاح شارد يوزع الحركة وليس الصفوف فقط.
أضف تقسيم/تمليح bucketing/salting للمفاتيح الساخنة لتقسيم مفتاح منطقي واحد عبر دلائل متعددة.
استخدم التخزين المؤقت للعناصر الساخنة كثيفة القراءة.
طبّق حدود سرعة أو حصص لكل مستأجر لحماية العنقود.
قسم الشاردات الساخنة أو حرِّك النطاقات الساخنة عندما لا يُمكن تبريد الشارد.

أوضاع الفشل وتصحيح الأخطاء في نظام مجزأ

تعاون في التصميم

أدخل فريقك لمراجعة الخطة، واختبار التغييرات، والرجوع بسرعة.

ادعُ الفريق

التجزئة لا تزيد فقط عدد الخوادم—بل تضيف طرقًا أكثر لحدوث الأخطاء، ومزيدًا من الأماكن للبحث عند وقوعها. كثير من الحوادث ليست "قاعدة البيانات متوقفة" بل "شارد واحد متوقف" أو "النظام لا يتفق على موقع البيانات".

أوضاع فشل شائعة

أنماط متكررة:

شارد غير متاح (تحطم، قرص ممتلئ، توقفات GC الطويلة)، مما يسبب انقطاعات جزئية: بعض العملاء يعملون والبعض يفشل.
الموجّه يخطئ في التوجيه بعد تغيير تهيئة أو نشر سيء. قد تُعيد القراءات نتائج فارغة إذا وُجهت للمكان الخاطئ.
الميتا-داتا قديمة أو متنافرة أثناء الحركات أو الانقسامات؛ مكونات مختلفة قد توجه نفس المفتاح بشكل مختلف.
مشاكل شبكية جزئية: مهلات بين الموجّه وبعض الشاردات تبدو كأخطاء عشوائية وتُثير إعادة محاولات تضخّم الحمل.

كيف يتغير التصحيح

في قاعدة بيانات أحادية، تتابع سجلًا واحدًا وتراجع مجموعة مقاييس. في نظام مجزأ تحتاج ملاحظات تتبع الطلب عبر الشاردات.

استخدم معرّفات ترابط في كل طلب وانقلها من طبقة الـ API عبر الموجّهات إلى كل شارد. اقترن ذلك بتتبّع موزع حتى يظهر استعلام الانتشار-الجمْع أي شارد كان بطيئًا أو فشل. يجب أن تُقسَّم المقاييس لكل شارد (الكمون، عمق الطابور، معدل الخطأ)، وإلا يخفي المتوسط العام شاردًا ساخنًا.

حوادث صحة البيانات

فشل التجزئة يظهر كثيرًا كعيوب صحة:

تكرارات بعد إعادة المحاولة أو عمليات غير قابلة لإعادة التطبيق
صفوف مفقودة عندما نُقلت البيانات لكن التوجيه ما زال يشير للموقع القديم
كتابات انقسام-دماغ إذا قبلت وجهات نظر ميتا متعددة كتابة لنطاق واحد

النسخ الاحتياطي والاستعادة والتعافي من الكوارث

"استعادة قاعدة البيانات" تصبح "استعادة أجزاء عديدة بالترتيب الصحيح". قد تحتاج لاستعادة الميتا-داتا أولًا، ثم كل شارد، ثم التحقق من حدود الشارد والتوجيه لتطابق نقطة الاستعادة. خطط التعافي يجب أن تتضمن تدريبات تثبت أنه يمكنك إعادة تركيب العنقود المتناسق—وليس مجرد استرداد آلات منفردة.

متى لا تُجَزّئ: بدائل عملية وقائمة قرار

غالبًا ما تُعامل التجزئة كمفتاح "التوسيع"، لكنها أيضًا زيادة دائمة في تعقيد النظام. إذا كان بإمكانك تلبية أهداف الأداء والموثوقية دون تقسيم البيانات عبر العقد، ستحصل عادةً على هندسة أبسط، تصحيح أخطاء أسهل، وحواف تشغيلية أقل.

بدائل عملية كثيرًا ما تشتري فترة هامش كبيرة

قبل الالتزام بالتجزئة، جرّب حلولًا تحافظ على منطقية قاعدة واحدة:

فهرسة أفضل + ضبط الاستعلامات: أصلح المسارات البطيئة أولًا—الفهارس المفقودة، الاستعلامات غير المقيدة، الانضمامات المكلفة، وأنماط N+1.
التخزين المؤقت: ضع الاستجابات الثقيلة للقراءة خلف كاش (كاش على مستوى التطبيق، CDN للمحتوى العام، أو كاش ذاكرة للعناصر الساخنة).
نسخ القراءة: أنقل حمل القراءة دون تغيير مسار الكتابة (واقبل تأخر النسخ حيثما كان مقبولًا).
تقسيم الجداول على عقدة واحدة: العديد من قواعد البيانات تدعم تقسيم الجداول الذي يحسن الصيانة والأداء دون توجيه عابر للعقد.

أين تساعد الأدوات: نمذجة خدمات واعية بالشارد دون التزامات مبكرة

طريقة عملية لتقليل المخاطر هي بناء نموذج أولي للأنابيب (التوجيه، مفاتيح عدم التكرار، إجراءات الهجرة، والمراقبة) قبل ربط الإنتاج بالتجزئة.

مثال: مع Koder.ai يمكنك بسرعة إنشاء خدمة صغيرة وواقعية من محادثة—غالبًا واجهة إدارة React مع backend بلغة Go وقاعدة PostgreSQL—ولتجربة واجهات API واعية بمفتاح الشارد، مفاتيح عدم التكرار، وسلوكيات القطع في صندوق آمن. بما أن Koder.ai يدعم وضع التخطيط، لقطات/تراجع، وتصدير الشيفرة، يمكنك تدوير قرارات التصميم المتعلقة بالتجزئة إلى مكدسك الرئيسي عندما تكون واثقًا.

متى تجزّئ ومتى لا

التجزئة مناسبة عندما يتجاوز حجم البيانات أو معدل الكتابة حدود عقدة واحدة و يمكن توجيه معظم الاستعلامات الحرجة بواسطة مفتاح شارد (قليل من الانضمامات/المعاملات عبر الشاردات).

إنها غير مناسبة عندما يحتاج المنتج إلى الكثير من الاستعلامات التكيفية، معاملات متعددة الكيانات بشكل متكرر، قيود تفرد عالمية، أو عندما لا يستطيع الفريق تحمل عبء التشغيل (إعادة الموازنة، إعادة التجزئة، الاستجابة للحوادث).

قائمة قرار سريعة

اسأل نفسك:

الحمولة: هل عنق الزجاجة CPU أم I/O أم الذاكرة أم تنازع الأقفال—وهل يمكن إصلاحه بدون تجزئة؟
أنماط الاستعلام: هل يمكن توجيه أكثر من 90% من الاستعلامات الحرجة بواسطة مفتاح الشارد؟
قدرة الفريق: من سيملك خريطة الشاردات، دفاتر تشغيل الاستدعاء، وسلوك المعاملات عبر الشاردات؟
SLOs: هل يمكنك تحمل تدهورًا جزئيًا (شارد واحد معطل) وزمن ذيول أطول؟

خطط للنمو، وليس مجرد مخطط

حتى لو أجلت التجزئة، صمِّم مسار هجرة: اختر معرّفات لا تمنع مفتاح شارد مستقبليًا، تجنّب افتراضات العقدة الواحدة في الكود، ودرب نفسك كيف ستنقل البيانات بأدنى توقف ممكن. أفضل وقت للتخطيط لإعادة التجزئة هو قبل أن تحتاجها.

الأسئلة الشائعة

ما هي تجزئة قواعد البيانات، وكيف تختلف عن التكرار؟

التجزئة (التقسيم الأفقي) تقسم مجموعة بيانات منطقية واحدة على عدة آلات («شاردات») بحيث يخزن كل شارد صفوفًا مختلفة.

أما التكرار (Replication)، فبدلاً من ذلك يحتفظ بنسخ من نفس البيانات على عدة عقد—بشكل أساسي لتحسين التوافر وتوسيع قراءة البيانات.

لماذا لا نكتفي بترقية خادم قاعدة البيانات بدلاً من التجزئة؟

التوسيع الرأسي يعني ترقية خادم قاعدة بيانات واحد (مزيد من CPU/ذاكرة/أقراص أسرع). إنه أبسط من الناحية التشغيلية، لكنه يصل في النهاية إلى حدود صعبة أو يصبح مكلفًا جدًا.

التجزئة توسع بالاتساع (scale out) عبر إضافة آلات، لكنها تضيف توجيهًا، وإعادة موازنة، وتعقيدات صحة البيانات عبر الشاردات.

ما المشكلات التي تحلها التجزئة فعليًا؟

تقوم الفرق بالتجزئة عندما يصبح عقدة واحدة عنق زجاجة متكررًا، مثل:

نمو الأقراص والفهارس الذي يجعل النسخ الاحتياطي/الصيانة بطيئة جدًا
حد في معدل الكتابة بسبب CPU/WAL/تنازع الأقفال
ضغط قراءة يتجاوز القدرة حتى مع النسخ
«جار مزعج» tenant يستهلك الموارد ويؤثر على الآخرين

التجزئة توزع البيانات والعبء بحيث تزداد السعة بإضافة عقد.

ما هي المكونات الأساسية لنظام قاعدة بيانات مجزأة؟

نظام مجزأ نموذجي يتضمن:

شاردات: تقسيمات مستقلة مع تخزين وفهارس خاصة
موجّهات/منسقون: يقررون أي شارد يجب استهدافه
خدمة التهيئة/الميتا-داتا: خريطة الشاردات، الملكية، الصحة، العضوية
وظائف خلفية: إعادة التوازن، الهجرات، إجراءات النسخ الاحتياطي/الاستعادة

الأداء والصحة يعتمد على بقاء هذه الأجزاء متناسقة.

ما هو مفتاح الشارد ولماذا هو مهم جدًا؟

مفتاح الشارد هو الحقل (أو مجموعة الحقول) التي تُستخدم لتحديد مكان تخزين الصف. إنه يحدد إلى حد كبير ما إذا كانت الطلبات تصل إلى شارد واحد (سريع) أم إلى عدة شاردات (بطيء).

مفاتيح جيدة عادةً ما تكون ذات تعدد قيم كبير، توزيع متساوٍ، وتتماشى مع أنماط الوصول الشائعة (مثل tenant_id أو user_id).

ما الذي يجعل مفتاح الشارد «سيئًا»، وما المشاكل التي يسببها؟

مفاتيح شاردة سيئة شائعة:

مفاتيح زمنية تصاعدية (طوابع زمنية، معرفات متزايدة): تتكدس البيانات على الشارد الأحدث → نقطة ساخنة
حقول قليلة التعدد (status, plan_tier, country): قد تؤدي إلى تحميل غير متساوٍ
معرّفات قابلة للتغيير (البريد الإلكتروني، أسماء المستخدمين القابلة للتعديل): تغيير المفتاح يفرض نقل البيانات ويكون محفوفًا بالمخاطر

هذه تؤدي إلى نقاط ساخنة وتحول الاستعلامات الروتينية إلى استعلامات انتشار-جمع (scatter-gather).

ما هي تجزئة النطاق والهاش والدليل، ومتى يستخدم كل منها؟

ثلاث استراتيجيات شائعة:

تجزئة النطاق (Range): كل شارد يملك مدى متجانس من قيم المفتاح؛ سهل التوجيه، لكن عرضة للنِقاط الساخنة؛ ملائم للاستعلامات النطاقية.
التجزئة بالهاش (Hash): يمرر المفتاح عبر دالة هاش ليختار شارد؛ يوزع البيانات بشكل متساوٍ لكن يجعل استعلامات النطاق مكلفة؛ يستخدمون غالبًا هاش متناسق مع عقد افتراضية لتقليص إعادة التوزيع عند إضافة شارد.
تجزئة الدليل (Directory/Lookup): خريطة صريحة من مفتاح→شارد؛ مرنة للهجرات والمواضع المخصصة، لكنها تضيف اعتمادًا على خدمة الدليل لتوجيه صحيح.

لماذا تبطئ بعض الاستعلامات بعد التجزئة (انتشار-جمع)؟

إذا تضمن الاستعلام مفتاح الشارد (أو ما يمكن خرائطته إليه)، يرسل الموجّه الطلب لشارد واحد—المسار السريع.

إذا لم يمكن توجيه الاستعلام بدقة، قد يُبثّ إلى العديد أو كل الشاردات؛ كل شارد ينفذ الاستعلام محليًا ثم يدمج المنسق النتائج—هذا التوسع (fan-out) يضخم زمن الذيل: شارد بطيء واحد قد يؤخر الاستجابة كلها.

كيف تعمل المعاملات والكتابات عبر الشاردات؟

كتابات شارد واحد تستخدم آلية المعاملات العادية لذلك الشارد—سريع وبسيط.

الكتابات عبر شاردات تتطلب تنسيقًا موزعًا (بروتوكولات شبيهة بـ two-phase commit)، مما يزيد زمن الاستجابة ويجعل حالات الفشل غامضة: هل طبق الشارد B التغيير قبل وفاة المنسق؟ هل سيكرر العميل العملية ويؤدي إلى تطبيق مزدوج؟

تخفيفات عملية شائعة: توطين البيانات، جعل العملية مملوكة لشارد واحد، التكرار المتعمد (denormalization)، واستخدام مفاتيح عدم التكرار (idempotency keys) لجعل عمليات إعادة المحاولة آمنة.

ماذا عن الاتساق والتكرار للحفاظ على صحة البيانات؟

داخل كل شارد توجد عادة آلية تكرار: رئيسي يقبل الكتابات ونسخ تستنسخ التغييرات. عند فشل الرئيس، يُرفَع نائب.

المشكلة أن القراءات من النسخ قد تكون متأخرة ميلي أو ثوانٍ؛ لذلك تحصل غالبًا على اتساق قوي داخل الشارد وضمانات أضعف عبر الشاردات. فرض قيود عالمية (تفرد أسماء المستخدمين، مفاتيح أجنبية عبر شاردات، عدادات عالمية) يتطلب عملًا مركزيًا أو حلولًا تطبيقية بخيارات تنازلية.

كيف تُعاد موازنة الشاردات وإعادة تقسيمها من دون توقف الخدمة؟

إعادة التوازن صعبة لأنك تغيّر «مكان» البيانات، وليس مجرد نسخها. لذلك الهجرة تؤثر على التوجيه والعميل وخريطة الشاردات.

نمط هجرة على الخط الشائع: نسخ → تداخل/كتابة مزدوجة → تغير الخريطة (cutover) → تنظيف. يحتاج هذا إلى إصدار لخريطة الشاردات، سلوك واضح عند وصول العميل لمفتاح مُحول (إعادة توجيه، إعادة محاولة، أو خطأ)، وخطة تراجُع.

عمليات إعادة التوازن تسبب تحميلًا إضافيًا (كتابات مزدوجة، تبديل الكاش)، لذا يجب مراقبتها جيدًا ووجود خطة للتراجع.

ما هي النقاط الساخنة والانحراف (skew)؟ وكيف تُكتشف وتُعالَج؟

النقاط الساخنة تحدث عندما يحصل جزء صغير من فضاء المفاتيح على معظم الطلبات—حساب مشهور، منتج شائع، tenant يقوم بتحميل كبير، أو مفتاح زمني حيث «اليوم» يجمع كل الكتابات. إذا خُصص ذلك لمجموعة شاردات قليلة، ستصبح عنق زجاجة.

الكشف بسرعة عبر لوحات مؤشرات per-shard: p95 لكل شارد، QPS لكل شارد، التخزين المستخدم لكل شارد. المعالجات: اختيار مفتاح يوزع الحِمل، تطبيق bucketing/salting للمفاتيح الساخنة، التخزين المؤقت، تحديد حدود/حصص، أو تقسيم الشارد الساخن.

ما هي أوضاع الفشل وكيف يتغير أسلوب التصحيح في نظام مجزأ؟

أنماط الفشل تتعدد: شارد غير متاح، موجّه يرسل للحقل الخطأ بعد تغيير تهيئة، ميتا-داتا قديمة أو متنافرة أثناء النقل، أو مشاكل شبكية جزئية تؤدي إلى مهلات وزيادة إعادة المحاولات.

للتصحيح، تحتاج إلى تتبع يربط الطلب عبر الشاردات: معرفات ترابط (correlation IDs)، تتبّع موزع (distributed tracing)، ومقاييس مفصَّلة per-shard. استعادة النسخ الاحتياطية تصبح استعادة أجزاء متعددة بالترتيب الصحيح—غالبًا الميتا-داتا أولًا ثم الشاردات.

حوادث صحة البيانات تظهر كاستنساخات بعد إعادة المحاولة، صفوف مفقودة بعد هجرة، أو كتابات انقسام-دماغ إذا قبلت نظرات ميتا متعددة الكتابات لنطاق واحد.

متى يجب تجنب التجزئة، وما البدائل العملية؟

قبل التجزئة، جرّب حلولًا تحافظ على منطقية قاعدة بيانات واحدة:

تحسين الفهارس والاستعلامات
التخزين المؤقت للقراءات الثقيلة
نسخ قراءة لإزاحة الحمل (مع قبول تأخر النسخ)
تقسيم الجداول داخل عقدة واحدة
أرشفة البيانات القديمة

يمكن تجريب بنية تساندية للتجزئة (التوجيه، أمان إعادة المحاولة، إجراءات القطع) في بيئة اختبار قبل الالتزام الفعلي. التجزئة مناسبة عندما تتجاوز القيود عقدة واحدة و يمكن توجيه معظم الاستعلامات عبر مفتاح شارد بحيث تقل حاجة للانضمامات/المعاملات عبر الشاردات.