07 أغسطس 2025·8 دقيقة

قواعد بيانات موزعة: المقايضة بين الاتساق والتوافر

Q: هل يعني مبدأ CAP حقًا أنه يمكنك اختيار اثنين فقط من الثلاثة؟

لا يعني ذلك "اختر اثنين إلى الأبد". المعنى أن عند حدوث انقسام لا يمكنك ضمان كل من: - الاتساق (كل القراءات ترى آخر كتابة معترفة)، و - التوافر (كل طلب يحصل على استجابة) خارج الانقسامات، قد تبدو الأنظمة أنها توفر كلاهما معظم الوقت—إلى أن تخطئ الشبكة.

Q: كيف تساعد الحشود (N, R, W) في موازنة الاتساق والتوافر؟

الحشد يعتمد على التصويت بين النسخ: - N = عدد النسخ - W = عدد النسخ التي يجب أن تؤكد الكتابة - R = عدد النسخ المستعلمَة للقراءة قاعدة شائعة: R + W N لتقليل احتمال قراءة بيانات قديمة. الحشود لا تلغي الانقسامات؛ لكنها تحدد أي جانب مسموح له بالتقدم (مثلاً الجانب الذي يملك الأغلبية).

تعلم لماذا تُرخّص قواعد البيانات الموزعة غالبًا الاتساق لتظل متاحة أثناء الأعطال، كيف يعمل مبدأ CAP والحشود، ومتى تختار كل نهج.

ماذا يعني الاتساق والتوافر عمليًا

عندما تُوزع قاعدة بيانات عبر عدة آلات (نسخ)، تحصل على سرعة ومتانة—لكنك تُدخل أيضًا فترات حيث تلك الآلات لا تتفق تمامًا أو لا تتواصل بشكل موثوق.

الاتساق (المعنى البسيط)

الاتساق يعني: بعد كتابة ناجحة، كل القراءات تُرجع نفس القيمة. إذا حدّثت بريدك الإلكتروني في الملف الشخصي، فالقراءة التالية—بغض النظر عن النسخة التي ترد—تعيد البريد الجديد.

عمليًا، الأنظمة التي تُعطي أولوية للاتساق قد تؤخر أو ترفض بعض الطلبات أثناء الأعطال لتجنب إرجاع إجابات متضاربة.

التوافر (المعنى البسيط)

التوافر يعني: النظام يرد على كل طلب، حتى لو كانت بعض الخوادم متوقفة أو منفصلة. قد لا تحصل على أحدث البيانات، لكنك تحصل على إجابة.

عمليًا، الأنظمة التي تفضل التوافر قد تقبل الكتابات وتخدم القراءات حتى بينما تختلف النسخ، ثم تُصالح الاختلافات لاحقًا.

ماذا تعني المقايضة لتطبيقات العالم الحقيقي

المقايضة تعني أنك لا تستطيع تعظيم الهدفين في نفس الوقت في كل سيناريو فشل. إذا لم تستطع النسخ التنسيق، يجب على قاعدة البيانات إما:

الانتظار/فشل بعض الطلبات لحماية حقيقة متفق عليها (تفضيل الاتساق)، أو
الاستمرار في الرد على المستخدمين حتى لو كان ذلك يعرض لقراءات قديمة أو بيانات متضاربة (تفضيل التوافر)

مثال بسيط: عربة تسوق مقابل تحويل مصرفي

عربة التسوق: إذا كان عدد عناصر العربة خاطئًا لفترة قصيرة على جهاز آخر، فذلك مزعج لكنه مقبول عادةً. كثير من الفرق يفضلون توافرًا أعلى ويصلحون لاحقًا.
تحويل مصرفي: إذا نقلت 500$ وظهرت رصيدين مختلفين مؤقتًا، هذه مشكلة خطيرة. هنا غالبًا ما يكون الاتساق الأقوى مبررًا حتى لو تسبب ذلك في رسائل "حاول مرة أخرى" أحيانًا.

لا يوجد خيار واحد الأفضل

التوازن الصحيح يعتمد على الأخطاء التي يمكنك تحملها: انقطاع قصير، أم فترة قصيرة من البيانات الخاطئة/القديمة. معظم الأنظمة الحقيقية تختار نقطة وسط—وتجعل المقايضة صريحة.

لماذا يغيّر التوزيع القواعد

تُسمى قاعدة البيانات "موزعة" عندما تخزن وتخدم البيانات من عدة آلات (عقد) تتنسيق عبر الشبكة. للتطبيق، قد تبدو كقاعدة بيانات واحدة—لكن داخليًا، قد تُخدم الطلبات بواسطة عقد مختلفة في أماكن مختلفة.

التكرار: سبب إضافة العقد

معظم قواعد البيانات الموزعة تُكرر البيانات: نفس السجل مخزن على عقد متعددة. تفعل الفرق ذلك لـ:

إبقاء الخدمة تعمل إذا تعطلت آلة
تقليل الكمون عبر خدمة المستخدمين من عقدة قريبة
توسيع قدرة القراءة (وأحيانًا الكتابة) عبر عتاد أكثر

التكرار قوي، لكنه يطرح فورًا سؤالًا: إذا كان لدى عقدتين نسخة من نفس البيانات، كيف تضمن أنهما دائمًا متفقتان؟

الفشل الجزئي أمر طبيعي، لا استثنائي

على خادم واحد، "متوقف" واضح: الآلة تعمل أم لا. في نظام موزع، الفشل غالبًا ما يكون جزئيًا. قد تكون عقدة حية لكنها بطيئة. قد يسقط رابط الشبكة حزمًا. قد يفقد رف كامل الاتصال بينما يستمر باقي العنقود بالعمل.

هذا مهم لأن العقد لا يمكنها أن تعرف فورًا ما إذا كانت العقدة الأخرى متوقفة فعليًا، أو لا يمكن الوصول إليها مؤقتًا، أو مجرد متأخرة. أثناء انتظارهم لمعرفة ذلك، عليهم أن يقرروا ماذا يفعلون مع القراءات والكتابات الواردة.

الضمانات تتغير عندما لا يكون الاتصال مضمونا

مع خادم واحد، هناك مصدر واحد للحقيقة: كل قراءة ترى آخر كتابة ناجحة.

مع عدة عقد، "الأحدث" يعتمد على التنسيق. إذا نجحت كتابة على العقدة A لكن العقدة B لا يمكن الوصول إليها، هل على قاعدة البيانات أن:

تحجب الكتابة حتى تؤكدها B (حماية الاتساق)، أم
تقبل الكتابة على أي حال (حماية التوافر)؟

التوتر هذا—الذي تجلبه الشبكات غير الكاملة—هو سبب تغير القواعد.

انقسامات الشبكة: المشكلة الجوهرية

انقسام الشبكة هو كسر في الاتصال بين عقد يفترض أن تعمل كقاعدة بيانات واحدة. قد تظل العقد تعمل وصحية، لكنها لا تستطيع تبادل الرسائل بثقة—بسبب سويتش معطل، رابط مثقل، تغيير توجيه خاطئ، قاعدة جدار ناري خاطئة، أو حتى جار صاخب في شبكة سحابية.

لماذا الانقسامات لا مفر منها على نطاق واسع

بمجرد أن ينتشر النظام عبر آلات متعددة (غالبًا عبر رفوف، مناطق، أو مناطق إقليمية)، لم تعد تتحكم في كل قفزة بينهما. الشبكات تفقد حزمًا، تُدخل تأخيرات، وأحيانًا تتقسم إلى "جزر". على نطاق صغير تكون هذه الأحداث نادرة؛ على نطاق كبير تصبح روتينية. حتى اضطراب قصير يكفي لأن يؤثر، لأن قواعد البيانات تحتاج تنسيقًا مستمرًا للاتفاق على ما حدث.

كيف تخلق الانقسامات بيانات "أحدث" متضاربة

أثناء الانقسام، يستمر كلا الجانبين في تلقي الطلبات. إذا سمح للمستخدمين بالكتابة على كلا الجانبين، قد يقبل كل جانب تحديثات لا يراها الآخر.

مثال: العقدة A تحدّث عنوان المستخدم إلى "الشارع الجديد". في نفس الوقت، العقدة B تحدّثه إلى "الشارع القديم شقة 2". كل جانب يعتقد أن كتابته هي الأحدث—لأنه لا يستطيع المقارنة في الوقت الحقيقي.

أعراض مرئية للمستخدم

الانقسامات لا تظهر كرسائل خطأ مرتبة؛ تظهر كسلوك محير:

انتهاء المهلة: قاعدة البيانات تنتظر تأكيدًا من عقدة أخرى لكتابة أو قراءة.
قراءات قديمة: تحدّث الصفحة وتظل ترى بيانات قديمة لأنك وصلت إلى نسخة فاتتك التحديث.
سلوك "انقسام-الدماغ": مستخدمون مختلفون يرون "حقائق" مختلفة، تبعًا لأي جانب وصلوا إليه.

هذه هي نقطة الضغط التي تُجبر الاختيار: عندما لا تضمن الشبكة الاتصال، يجب على قاعدة البيانات الموزعة أن تختار بين إعطاء الأولوية للاتساق أو للتوافر.

مبدأ CAP بدون المصطلحات الفنية

CAP هي طريقة موجزة لوصف ما يحدث عندما تُوزع قاعدة البيانات عبر عدة آلات.

المصطلحات الثلاثة (بالعربي البسيط)

الاتساق (C): بعد كتابة قيمة، أي قراءة لاحقة تُرجع تلك القيمة نفسها.
التوافر (A): كل طلب يحصل على استجابة غير خطأ، حتى لو كانت بعض الخوادم تواجه مشاكل.
تحمّل الانقسام (P): يبقى النظام يعمل حتى لو انقسمت الشبكة ولم تعد الرسائل مضمونة.

الخلاصة الأساسية

عندما لا يوجد انقسام، كثير من الأنظمة يمكن أن تبدو متسقة ومُتاحة.

عندما يوجد انقسام، عليك اختيار ما تُعطيه الأولوية:

اختيار الاتساق: ترفض أو تؤخر بعض الطلبات حتى تتفق الخوادم.
اختيار التوافر: تقبل الطلبات على كل جانب من الانقسام حتى لو اختلفت الإجابات مؤقتًا.

جدول زمني بسيط تتخيله

10:00 العميل يكتب balance = 100 إلى الخادم A.
10:01 انقسام الشبكة: الخادم A لا يستطيع الوصول إلى الخادم B.
10:02 العميل يقرأ من الخادم B.
- إذا فضّلت الاتساق، يجب على الخادم B الرفض أو الانتظار.
- إذا فضّلت التوافر، يرد الخادم B، لكنه قد يقول balance = 80.

مفهوم خاطئ شائع

CAP لا يعني "اختر اثنين" كقاعدة دائمة. يعني أثناء الانقسام لا يمكنك ضمان كلا:

الاتساق و
التوافر

في الخارج عن الانقسامات، يمكنك غالبًا الاقتراب من كلتيهما—حتى تخطئ الشبكة.

اختيار الاتساق: ماذا تكسب وماذا تخسر

اختيار الاتساق يعني أن قاعدة البيانات تُعطي أولوية لأن "الجميع يرى نفس الحقيقة" بدلًا من "الاستجابة دائمًا". عمليًا، هذا يشير غالبًا إلى الاتساق القوي، وغالبًا ما يُوصف بأنه سلوك قابل للتسلسل الخطي (linearizable): بمجرد أن تُعترف بكتابة، أي قراءة لاحقة (من أي مكان) تُرجع تلك القيمة، كما لو كان هناك نسخة واحدة حديثة.

ماذا يحدث أثناء الانقسام

عندما تنقسم الشبكة ولا تستطيع النسخ التنسيق بأمان، لا يمكن لنظام متسق بقوة أن يقبل تحديثات مستقلة على كلا الجانبين. لحماية الصحة، عادةً ما:

يحجب الطلبات أثناء الانتظار للتنسيق، أو
يرفض الطلبات (يعيد أخطاء/انتهاء مهلة) إذا لم يتم الوصول إلى النسخ/القائد المطلوب.

من منظور المستخدم، قد يبدو هذا كتعطل رغم أن بعض الآلات لا تزال تعمل.

ما الذي تكسبه

الفائدة الرئيسية هي تبسيط التفكير. يمكن لكود التطبيق أن يتصرف كما لو أنه يتعامل مع قاعدة بيانات واحدة، لا عدة نسخ قد تختلف. هذا يقلل من "اللحظات الغريبة" مثل:

قراءة بيانات قديمة بعد تحديث ناجح
رؤية قيمتين مختلفتين لنفس السجل اعتمادًا على النسخة
فقدان ثوابت (مثل البيع الزائد للمخزون) بسبب كتابات متضاربة

كما تحصل على نماذج عقلية أنظف للتدقيق والفوترة وكل ما يجب أن يكون صحيحًا من المرة الأولى.

ما الذي تخسره

للتمسك بالاتساق تكلفة حقيقية:

كمون أعلى: كثير من العمليات يجب أن تنتظر التنسيق (غالبًا عبر آلات أو مناطق).
أخطاء أكثر أثناء الأعطال: الانقسامات، النسخ البطيئة، أو مشاكل القائد يمكن أن تتحول إلى انقضاء مهلات أو "حاول لاحقًا".

إذا كان منتجك لا يتحمل طلبات فاشلة أثناء انقطاعات جزئية، قد يبدو الاتساق القوي مكلفًا—حتى لو كان الخيار الصحيح للصحة.

اختيار التوافر: ماذا تكسب وماذا تخسر

صمّم إعادة محاولات آمنة بسرعة

أنشئ نقطة كتابة متكررة التأثير (idempotent) وتدفق عميل آمن لإعادة المحاولة دون إعادة بناء البنية.

ابنِ الآن

اختيار التوافر يعني أنك تُحسّن من وعد بسيط: النظام يرد، حتى عندما تكون أجزاء البنية التحتية غير صحية. عمليًا، "التوفر العالي" ليس "لا أخطاء أبدًا"—بل أن معظم الطلبات لا تزال تتلقى إجابة أثناء فشل العقد، التحميل الزائد، أو روابط الشبكة المعطوبة.

ماذا يحدث أثناء انقسام الشبكة

عندما تنقسم الشبكة، لا تستطيع النسخ التواصل بثقة. قاعدة بيانات تفضل التوافر عادةً تستمر في خدمة الحركة من الجانب الذي يمكن الوصول إليه:

القراءات تُجاب محليًا من البيانات الموجودة لدى النسخة.
الكتابات تُقبل محليًا وتُطوَّق/تُكرر لاحقًا عند عودة الاتصال.

هذا يُبقي التطبيقات تتحرك، لكنه يعني أيضًا أن نسخًا مختلفة قد تقبل حقائق مختلفة مؤقتًا.

ما الذي تكسبه

تحصل على توفر أفضل: المستخدمون ما زالوا يتصفحون، يضعون عناصر في العربة، ينشرون تعليقاتًا، أو يسجلون أحداثًا حتى لو عزلت منطقة.

تحصل أيضًا على تجربة مستخدم أنعم تحت الضغط. بدلًا من انتهاء المهلات، يمكن لتطبيقك أن يستمر بسلوك معقول ("تم حفظ التحديث") ثم يُزامن لاحقًا. لعدة أحمال استهلاكية وتحليلية، تستحق هذه المقايضة.

ما الذي تخسره

الثمن هو أن قاعدة البيانات قد تُرجع قراءات قديمة. قد يحدث أن يحدث مستخدم تحديثًا على نسخة ثم يقرأ فورًا من نسخة أخرى فيرى القيمة القديمة.

كما أنك تُعرِّض نفسك لخطر نزاعات الكتابة. قد يقبل مستخدمان تحديثات متضاربة على جانبي الانقسام. عند شفاء الانقسام، يجب على النظام مصالحة التواريخ المتباينة: حسب القواعد قد "يفوز" أحدهما، أو تُدمج الحقول، أو تتطلب المصالحة منطق التطبيق.

تصميم بنية تفضّل التوافر يعني قبول الخلافات مؤقتًا حتى يظل المنتج مستجيبًا—ثم الاستثمار في اكتشاف وإصلاح الخلاف لاحقًا.

الحشود والتصويت: أرضية وسطى

الحشود هي تقنية تصويت عملية تستخدمها كثير من قواعد البيانات المكررة لموازنة الاتساق والتوافر. بدلاً من الوثوق بنسخة واحدة، يطلب النظام من عدد كافٍ من النسخ الموافقة.

فكرة (N, R, W)

سترى غالبًا الحشود موصوفة بثلاثة أرقام:

N: عدد النسخ لقطعة بيانات
W: كم من النسخ يجب أن تؤكد الكتابة قبل اعتبارها ناجحة
R: كم من النسخ يتم الرجوع إليها للقراءة

قاعدة إبهام شائعة: إذا كانت R + W > N، فكل قراءة تتقاطع مع كتابة ناجحة على الأقل في نسخة واحدة، مما يقلل احتمال قراءة بيانات قديمة.

أمثلة بديهية

لو كان لديك N=3 نسخ:

نهج نسخة واحدة (R=1, W=1): سريع ومتاح جدًا، لكن من السهل قراءة نسخة قديمة.
تصويت الأغلبية (R=2, W=2): يجب أن تصل الكتابة إلى نسختين، وتقارن القراءة نسختين. هذا يزيد احتمالات رؤية القيمة الأحدث لأن مجموعتي القراءة والكتابة تتقاطع.

بعض الأنظمة تذهب أبعد وتضع W=3 (كل النسخ) لاتساق أقوى، لكن ذلك قد يسبب مزيدًا من فشل الكتابة عندما تكون أي نسخة بطيئة أو معطلة.

ماذا تفعل الحشود أثناء الانقسامات

الحشود لا تقضي على مشاكل الانقسام—بل تعرّف من المسموح له بالتقدم. إذا انقسمت الشبكة 2–1، الجانب الذي يملك 2 نسخ ما زال يستطيع تلبية R=2 وW=2، بينما النسخة المعزولة الفردية لا تستطيع. هذا يقلل من التحديثات المتعارضة، لكنه يعني أن بعض العملاء سيواجهون أخطاء أو انتهاء مهلات.

المقايضات

الحشود عادةً تعني كمون أعلى (مزيد من العقد للتواصل)، تكلفة أعلى (حركة بين العقد)، وسلوك فشل أكثر دقة (انتهاء المهلة قد يبدو كعدم توفر). الفائدة أنها أرضية وسطى قابلة للضبط: يمكنك تغيير R وW لتقريب القراءات من الأحدث أو لرفع نجاح الكتابة حسب الأهمية.

الاتساق النهائي والشذوذات الشائعة

الاتساق النهائي يعني أن النسخ مسموح لها أن تكون غير متزامنة مؤقتًا، طالما أنها تتقارب لنفس القيمة لاحقًا.

تشبيه ملموس

تخيل سلسلة مقاهي تحدث لافتة "نفد المنتج" لكعكة مشتركة. متجر واحد يعلّمها "نفدت"، لكن التحديث يصل للمتاجر الأخرى بعد دقائق. خلال تلك النافذة، قد يظل متجر آخر يعرض "متاحة" ويبيع القطعة الأخيرة. النظام ليس "معطّلاً"—التحديثات فقط تتأخر في الوصول.

الشذوذات الشائعة التي ستلاحظها

بينما تنتشر البيانات، قد يلاحظ العملاء سلوكًا مفاجئًا مثل:

قراءات قديمة: قراءة بيانات قديمة من نسخة لم تستلم التحديث بعد.
فجوات "قراءة-ما-كتبت": كتبت تحديثًا ثم لم تره فورًا عند القراءة من نسخة أخرى.
تحديثات بترتيب مختلف: يصل تحديثان بترتيب مختلف إلى نسخ مختلفة، مُنتجًا مشاهد متضاربة مؤقتًا.

تقنيات تساعد النسخ على التقارب

أنظمة الاتساق النهائي تضيف آليات خلفية لتقليل نوافذ عدم التناسق:

تصليح عند القراءة (Read repair): إذا كشفت قراءة عن اختلاف بين النسخ، يقوم النظام بتحديث النسخ القديمة في الخلفية.
تلميحات مؤقتة (Hinted handoff): إذا كانت نسخة متوقفة، يخزن عقدة أخرى "تلميحات" عن الكتابات لترسلها عند عودة النسخة.
مكافحة التعادل (Anti-entropy): مُصالحة دورية (غالبًا عبر شجرات مركل أو مجموعات تحقق) لاكتشاف وإصلاح الانحراف.

متى يعمل الاتساق النهائي جيدًا

يناسب عندما يكون التوفر أهم من الحداثة التامة: خلاصات النشاط، عدادات المشاهدات، التوصيات، الملفات المؤقتة، السجلات/التليمتري، وبيانات أخرى غير حاسمة حيث أن "تصحيحها بعد لحظة" مقبول.

حل التعارضات: كيف تُصالح الكتابات المتباعدة

اختبر أوضاع القراءة والكتابة

شغّل تطبيق React وواجهة API بـ Go لاختبار عمليات كتابة صارمة وقراءات متساهلة.

ابدأ البناء

عندما تقبل قاعدة بيانات كتابات على نسخ متعددة، قد ينتهي بها الأمر بنزاعات: تحديثان (أو أكثر) لنفس العنصر حدثا بشكل مستقل على نسخ مختلفة قبل مزامنتها.

مثال كلاسيكي: مستخدم يحدّث عنوان الشحن على جهاز، وفي الوقت نفسه يغيّر رقم هاتفه على جهاز آخر. إذا هبط كل تحديث على نسخة مختلفة أثناء فصل مؤقت، يجب على النظام أن يقرر ما هو السجل "الحقيقي" عندما تتبادل النسخ البيانات مرة أخرى.

آخر كتابة تفوز (LWW): بسيط لكنه محفوف بالمخاطر

تبدأ كثير من الأنظمة بـآخر كتابة تفوز: التحديث ذو الطابع الزمني الأحدث يطغى على البقية.

جاذبيته أنه سهل التنفيذ وسريع الحساب. العيب أنه يمكن أن يفقد البيانات بصمت. إذا "الأحدث" يفوز، قد يُلغى تحديث أقدم لكنه مهم—حتى لو لمس الحقول مختلفة.

كما يفترض أن الساعات موثوقة. انحراف الساعة بين الآلات (أو العملاء) قد يجعل التحديث «الخطأ» يفوز.

الاحتفاظ بالتاريخ: متجهات الإصدارات وأفكار ذات صلة

التعامل الأكثر أمانًا يتطلب عادة تتبع التاريخ السببي.

مفاهيميًا، تُلحق متجهات الإصدارات (وأشباهها الأبسط) قطعة بيانات صغيرة بكل سجل تلخص "أية نسخة رأت أية تحديثات". عندما تتبادل النسخ النسخ، يمكن لقاعدة البيانات اكتشاف ما إذا كانت نسخة واحدة تشمل الأخرى (لا تعارض) أو أنها تفرعت (تعارض يحتاج حل).

تستخدم بعض الأنظمة طوابعًا منطقية (مثل ساعات لامبورت) أو ساعات هجينة منطقية لتقليل الاعتماد على وقت الحائط وفي نفس الوقت إعطاء تلميح لترتيب الأحداث.

الدمج بدلًا من الكتابة فوق

عند اكتشاف تعارض، لديك خيارات:

الدمج على مستوى التطبيق: يقرر تطبيقك كيفية دمج الحقول، مطالبة المستخدم، أو الاحتفاظ بالإصدارات للمراجعة.
CRDTs (هياكل بيانات متسارعة لا تتعارض): هياكل بيانات صممت لتندمج تلقائيًا وبحتمية ومحددة (مفيدة للعدادات والمجموعات والنصوص التعاونية، إلخ). غالبًا تتجنب سلوك "الفائز يأخذ الكل" وتبقى متاحة بدرجة عالية.

النهج الأفضل يعتمد على ما يعنيه "الصحيح" لبياناتك—أحيانًا فقدان كتابة مقبول، وأحيانًا يكون خطأً حرجًا للأعمال.

كيف تختار لحالتك

اختيار وضع الاتساق/التوافر ليس نقاشًا فلسفيًا—إنه قرار منتج. ابدأ بالسؤال: ما تكلفة الخطأ للحظة، وما تكلفة إظهار "حاول لاحقًا"؟

طابق مخاطرة الأعمال مع احتياجات الاتساق

بعض المجالات تحتاج إجابة موحدة فورًا لأن "شبه صحيح" لا يكفي:

المال والفواتير: الشحن المزدوج، السحب الزائد، والاستردادات عادة تتطلب اتساقًا قويًا.
الهوية والصلاحيات: تسجيل الدخول، إعادة تعيين كلمات المرور، والتحكم بالوصول يجب أن تتجنب سلوك الانقسام.
المخزون والقدرة: إذا كان البيع الزائد غير مقبول (تذاكر، مخزون محدود)، اتجه للاتساق—أو صمم نظام حجز صريح.

إذا كان أثر عدم التناسق مؤقتًا منخفضًا أو قابلًا للتراجع، يمكنك الميل أكثر للتوافر.

قرّر مدى قبولك للبيانات القديمة

العديد من تجارب المستخدم تعمل جيدًا مع قراءات متأخرة قليلًا:

الخلاصات والجداول الزمنية: ظهور منشور بعد ثوانٍ غالبًا مقبول.
التحليلات ولوحات المعلومات: الأرقام الدفعية أو المؤجلة متوقعة.
الكاش وفهارس البحث: يقبل المستخدمون "لم يتم التحديث بعد" إذا كان الأداء سريعًا ومستقرًا.

كن صريحًا بشأن كم من التأخير مقبول: ثوانٍ، دقائق، أم ساعات. تلك الميزانية الزمنية توجه اختياراتك في التكرار والحشود.

اختر وضع الفشل الذي سيكرهه المستخدمون أقل

عندما لا تستطيع النسخ الاتفاق، عادةً تواجه أحد ثلاثة نتائج في تجربة المستخدم:

دولاب الانتظار / انتظار (تفضيل الصحة، قد يبدو بطيئًا)
خطأ / إعادة محاولة (صريح لكنه مزعج)
نتيجة قديمة (سلسة لكن مفاجِئة أحيانًا)

اختر الخيار الأقل ضررًا لكل ميزة، لا بشكل عام.

قائمة سريعة

امِل للاتساق إذا: نتائج خاطئة تُسبب خطرًا ماليًا/قانونيًا، مسائل أمنية، أو إجراءات لا رجعة فيها.

امِل للتوافر إذا: المستخدمون يقدّرون الاستجابة، والبيانات القديمة مقبولة، ويمكن حل التعارضات بأمان لاحقًا.

عند الشك، قسّم النظام: احتفظ بالسجلات الحيوية متسقة بقوة، ودع العروض المشتقة (الخلاصات، الكاش، التحليلات) تميل نحو التوافر.

أنماط تصميم لتقليل الألم الناتج عن المقايضة

حوّل الأمثلة إلى عرض توضيحي

نمذج سلات التسوق والأرصدة وآليات إعادة المحاولة لتكتشف حالات الفشل الحقيقية مبكرًا.

أنشئ تطبيقًا

نادراً ما تضطر لاختيار إعداد اتساق واحد للنظام كله. كثير من قواعد البيانات الموزعة الحديثة تتيح اختيار الاتساق لكل عملية—والتطبيقات الذكية تستفيد من ذلك للحفاظ على تجربة مستخدم سلسة دون تجاهل المقايضة.

استخدم مستويات اتساق لكل عملية

عامل الاتساق كقرص يتم تضييقه حسب ما يفعله المستخدم:

تحديثات حرجة (المدفوعات، تخفيضات المخزون، تغيير كلمة المرور): استخدم اتساقًا أقوى (مثلاً كتابة بحشد/قابل للتسلسل).
قراءات غير حرجة (الخلاصات، لوحات القيادة، "آخر ظهور"): اقبل قراءات أضعف (محلية/نسخة واحدة/نهج نهائي) للسرعة والمرونة.

هذا يجنب دفع تكلفة الاتساق الأقصى على كل شيء بينما يحمي العمليات المهمة.

اخلط القوي والضعيف في تدفق واحد

نمط شائع هو قوي للكتابة، أضعف للقراءة:

اكتب بمستوى صارم ليكون لدى النظام سجل موثوق.
اقرأ بمستوى أرخَص، وإذا اكتشفت شيئًا "مشتبهًا" (عنصر مفقود، عدّاد قديم)، فقم بتحديث بقراءة أقوى أو أظهر مؤشر "لا يزال يتحدث".

في حالات أخرى، يعمل العكس: كتابات سريعة (مُؤجلة/نهائية) بالإضافة إلى قراءات قوية عند التأكيد ("هل تم تقديم طلبي؟").

صمم لإعادة المحاولة: قابلية التكرار (idempotency)

عندما تتذبذب الشبكات، يعيد العملاء المحاولة. اجعل المحاولات آمنة بمفاتيح عدم التكرار حتى لا ينشأ أمران عند تنفيذ "إرسال الطلب" مرتين. خزّن وأعد استخدام النتيجة الأولى عند رؤية نفس المفتاح مرة أخرى.

تدفقات طويلة: Sagas والتعويض

للإجراءات متعددة الخطوات عبر خدمات، استخدم Saga: كل خطوة لها إجراء تعويضي مقابِل (استرداد، إرجاع حجز، إلغاء شحن). هذا يحافظ على إمكانية استرداد النظام حتى عندما تختلف أجزاء مؤقتًا أو تفشل.

الاختبار والمراقبة بالنسبة للاتساق مقابل التوافر

لا يمكنك إدارة المقايضة إذا لم ترها. مشاكل الإنتاج غالبًا تبدو كـ"أخطاء عشوائية" حتى تضيف القياسات والاختبارات المناسبة.

ماذا تقيس (ولماذا)

ابدأ بمجموعة صغيرة من المقاييس التي ترتبط مباشرة بتأثير المستخدم:

الكمون (p50/p95/p99): راقب القفزات أثناء التحويلات، تغييرات القائد، أو محاولات الحشد.
معدل الأخطاء: فصل "الأخطاء الصلبة" (انتهاء مهلة، 5xx) عن "أخطاء ناعمة" (مُخدَّم من بديل، نتائج جزئية).
معدل القراءات القديمة: نسبة القراءات التي تُرجع بيانات أقدم من هدفك (مثلاً أقدم من 2 ثانية).
معدل التعارضات: مدى تواتُر الكتابات المتزامنة التي تتطلب مصالحة (بما في ذلك الكتابات التي تُلطَّخ عبر LWW).

إذا استطعت، صنّف المقاييس حسب وضع الاتساق (حشد مقابل محلي) والمنطقة/المنطقة الفرعية لرصد أين يتباين السلوك.

اختبر الانقسامات عمدًا

لا تنتظر الانقطاع الحقيقي. في بيئة الاختبار، نفذ تجارب فوضى تحاكي:

إسقاط الحزم وزيادة الكمون بين النسخ
عدم القدرة على الوصول لمنطقة كاملة
انقسامات جزئية حيث بعض العقد فقط تستطيع التحدث

تحقق ليس فقط من "النظام يبقى شغّالًا"، بل ما الضمانات التي تبقى: هل القراءات تبقى طازجة، هل الكتابات تُحجب، هل العملاء يحصلون على أخطاء واضحة؟

التنبيه الذي يكتشف المقايضة مبكرًا

أضف تنبيهات لـ:

تأخر التكرار عن نافذة القِدم المقبولة
فشل الحشود (لا يمكن الوصول لعدد كافٍ من النسخ) وازدياد محاولات الإعادة
ارتفاع معدل التعارضات أو تراكم أعمال المصالحة

وأخيرًا، اجعل الضمانات صريحة: وثق ما يَعِد به نظامك أثناء التشغيل الطبيعي وأثناء الانقسامات، ودرّب فرق المنتج والدعم على ماذا قد يراه المستخدمون وكيفية الرد.

بناء نماذج سريعة لخيارات CAP بدون إعادة البناء الكامل

إذا كنت تستكشف هذه المقايضات في منتج جديد، من المفيد التحقق من الفرضيات مبكرًا—خصوصًا حول أوضاع الفشل، سلوك الإعادة، وكيف تبدو "القديمة" في واجهة المستخدم.

نهج عملي هو بناء نموذج أصغر لمسار العمل (مسار الكتابة، مسار القراءة، الإعادة/قابلية التكرار، ومهمة المصالحة) قبل الالتزام بهندسة كاملة. مع أدوات مثل Koder.ai، يمكن للفرق إطلاق تطبيقات ويب وخوادم عبر واجهة دردشة، التكرار بسرعة على نماذج البيانات وواجهات برمجة التطبيقات، واختبار أنماط اتساق مختلفة (مثلاً كتابات صارمة + قراءات مسترخية) بدون تكلفة تطوير تقليدية. عندما يطابق النموذج السلوك المطلوب، يمكنك تصدير الشيفرة المصدرية وتطويرها للإنتاج.

الأسئلة الشائعة

لماذا تواجه قواعد البيانات الموزعة مقايضة بين الاتساق والتوافر؟

في قاعدة بيانات مكررة، يعيش «نفس» البيانات على عدة آلات. هذا يعزز المتانة ويمكنه تقليل الكمون، لكنه يطرح مشاكل تنسيق: قد تكون العقد بطيئة، غير قابلة للوصول، أو مقطوعة بسبب الشبكة، لذا لا يمكنها دائمًا الاتفاق فورًا على آخر كتابة.

ماذا يعني «الاتساق» بالمصطلح البسيط؟

الاتساق يعني: بعد كتابة ناجحة، أي قراءة لاحقة تُرجع تلك القيمة نفسها—بغض النظر عن أي نسخة تُخدم. عمليًا، تُطبق الأنظمة ذلك عبر تأخير أو رفض قراءات/كتابات حتى تؤكد عدد كافٍ من النسخ (أو القائد) التحديث.

ماذا يعني «التوافر» بالمصطلح البسيط؟

التوافر يعني أن النظام يُرجع استجابة غير خطأ لكل طلب، حتى لو كانت بعض العقد غير متاحة أو لا تتواصل. قد تكون الاستجابة قديمة أو جزئية أو مبنية على معرفة محلية، لكن النظام يتجنب حظر المستخدمين أثناء الأعطال.

ما هو انقسام الشبكة، ولماذا يهم كثيرًا؟

انقسام الشبكة هو كسر في الاتصال بين عقد كان من المفترض أن تعمل كنظام واحد. قد تظل العقد تعمل صحياً، لكن الرسائل لا تعبر الانقسام بثقة، وهذا يُجبر قاعدة البيانات على الاختيار بين:

حظر/رفض الطلبات للحفاظ على حقيقة واحدة (الاتساق)، أو
الإجابة على الطلبات على كل جانب ثم المصالحة لاحقًا (التوافر).

ماذا يختبر المستخدمون فعليًا أثناء الانقسام أو اختلاف النسخ؟

أثناء الانقسام، قد يقبل كل جانب تحديثات لا يستطيع مشاركتها فورًا. هذا يمكن أن يؤدي إلى:

انتهاء المهلات (انتظار نسخ لا تُستجاب)
قراءات قديمة (قراءة من نسخة متأخرة)
سلوك انقسام-الدماغ (مستخدمون مختلفون يرون «حقيقتين» مختلفتين)

هذه هي النتائج المرئية للمستخدم عندما تعجز النسخ عن التنسيق مؤقتًا.

هل يعني مبدأ CAP حقًا أنه يمكنك اختيار اثنين فقط من الثلاثة؟

لا يعني ذلك "اختر اثنين إلى الأبد". المعنى أن عند حدوث انقسام لا يمكنك ضمان كل من:

الاتساق (كل القراءات ترى آخر كتابة معترفة)، و
التوافر (كل طلب يحصل على استجابة)

خارج الانقسامات، قد تبدو الأنظمة أنها توفر كلاهما معظم الوقت—إلى أن تخطئ الشبكة.

كيف تساعد الحشود (N, R, W) في موازنة الاتساق والتوافر؟

الحشد يعتمد على التصويت بين النسخ:

N = عدد النسخ
W = عدد النسخ التي يجب أن تؤكد الكتابة
R = عدد النسخ المستعلمَة للقراءة

قاعدة شائعة: R + W > N لتقليل احتمال قراءة بيانات قديمة. الحشود لا تلغي الانقسامات؛ لكنها تحدد أي جانب مسموح له بالتقدم (مثلاً الجانب الذي يملك الأغلبية).

ما هو الاتساق في النهاية، وما الاستثناءات الشائعة؟

الاتساق في النهاية تسمح بأن تكون النسخ غير متزامنة مؤقتًا شريطة أن تتقارب لاحقًا. المشكلات الشائعة:

قراءات قديمة
فجوات "قراءة-ما-كتبت" (لا ترى تحديثك فورًا)
تحديثات بترتيب مختلف

تُخفف الأنظمة ذلك بآليات مثل ، ، وعمليات الدورية.

كيف تُحل الكتابات المتعارضة بعد شفاء الانقسام؟

النزاعات تظهر عندما تقبل نسخ مختلفة كتابات متضاربة على نفس العنصر أثناء الانقطاع. استراتيجيات الحل:

آخر كتابة تفوز (LWW): بسيط لكنه قد يفقد بيانات بصمت ويعتمد على الساعات
متجهات الإصدارات / بيانات سببية: تكشف التعارض الحقيقي مقابل التحديثات المتسلسلة
الدمج / CRDTs: هياكل بيانات تُدمج تلقائيًا وبحتمية لبعض أنواع البيانات

اختر الاستراتيجية بناءً على معنى "الصحيح" لبياناتك.

كيف أختار وضع الاتساق مقابل التوافر لتطبيقي؟

قرّر بناءً على مخاطرة الأعمال وما الذي يكرهه المستخدمون أكثر: نتيجة خاطئة للحظة، أم رسالة "حاول مرة أخرى لاحقًا"؟

فضّل الاتساق القوي للمال، الفواتير، الهوية، الأذونات، والمخزون الحساس.
فضّل التوافر للـFeeds، التحليلات، الكاش، والسجلات حيث التأخير مقبول.

نماذج عملية: مستويات اتساق لكل عملية، مفاتيح عدم التكرار (idempotency)، وSagas للتعويض في تدفقات طويلة.

07 أغسطس 2025·8 دقيقة

قواعد بيانات موزعة: المقايضة بين الاتساق والتوافر

ماذا يعني الاتساق والتوافر عمليًا

الاتساق (المعنى البسيط)

التوافر (المعنى البسيط)

ماذا تعني المقايضة لتطبيقات العالم الحقيقي

الانتظار/فشل بعض الطلبات لحماية حقيقة متفق عليها (تفضيل الاتساق)، أو
الاستمرار في الرد على المستخدمين حتى لو كان ذلك يعرض لقراءات قديمة أو بيانات متضاربة (تفضيل التوافر)

مثال بسيط: عربة تسوق مقابل تحويل مصرفي

عربة التسوق: إذا كان عدد عناصر العربة خاطئًا لفترة قصيرة على جهاز آخر، فذلك مزعج لكنه مقبول عادةً. كثير من الفرق يفضلون توافرًا أعلى ويصلحون لاحقًا.
تحويل مصرفي: إذا نقلت 500$ وظهرت رصيدين مختلفين مؤقتًا، هذه مشكلة خطيرة. هنا غالبًا ما يكون الاتساق الأقوى مبررًا حتى لو تسبب ذلك في رسائل "حاول مرة أخرى" أحيانًا.

لا يوجد خيار واحد الأفضل

لماذا يغيّر التوزيع القواعد

التكرار: سبب إضافة العقد

معظم قواعد البيانات الموزعة تُكرر البيانات: نفس السجل مخزن على عقد متعددة. تفعل الفرق ذلك لـ:

إبقاء الخدمة تعمل إذا تعطلت آلة
تقليل الكمون عبر خدمة المستخدمين من عقدة قريبة
توسيع قدرة القراءة (وأحيانًا الكتابة) عبر عتاد أكثر

التكرار قوي، لكنه يطرح فورًا سؤالًا: إذا كان لدى عقدتين نسخة من نفس البيانات، كيف تضمن أنهما دائمًا متفقتان؟

الفشل الجزئي أمر طبيعي، لا استثنائي

الضمانات تتغير عندما لا يكون الاتصال مضمونا

مع خادم واحد، هناك مصدر واحد للحقيقة: كل قراءة ترى آخر كتابة ناجحة.

تحجب الكتابة حتى تؤكدها B (حماية الاتساق)، أم
تقبل الكتابة على أي حال (حماية التوافر)؟

التوتر هذا—الذي تجلبه الشبكات غير الكاملة—هو سبب تغير القواعد.

انقسامات الشبكة: المشكلة الجوهرية

لماذا الانقسامات لا مفر منها على نطاق واسع

كيف تخلق الانقسامات بيانات "أحدث" متضاربة

أعراض مرئية للمستخدم

الانقسامات لا تظهر كرسائل خطأ مرتبة؛ تظهر كسلوك محير:

انتهاء المهلة: قاعدة البيانات تنتظر تأكيدًا من عقدة أخرى لكتابة أو قراءة.
قراءات قديمة: تحدّث الصفحة وتظل ترى بيانات قديمة لأنك وصلت إلى نسخة فاتتك التحديث.
سلوك "انقسام-الدماغ": مستخدمون مختلفون يرون "حقائق" مختلفة، تبعًا لأي جانب وصلوا إليه.

مبدأ CAP بدون المصطلحات الفنية

CAP هي طريقة موجزة لوصف ما يحدث عندما تُوزع قاعدة البيانات عبر عدة آلات.

المصطلحات الثلاثة (بالعربي البسيط)

الاتساق (C): بعد كتابة قيمة، أي قراءة لاحقة تُرجع تلك القيمة نفسها.
التوافر (A): كل طلب يحصل على استجابة غير خطأ، حتى لو كانت بعض الخوادم تواجه مشاكل.
تحمّل الانقسام (P): يبقى النظام يعمل حتى لو انقسمت الشبكة ولم تعد الرسائل مضمونة.

الخلاصة الأساسية

عندما لا يوجد انقسام، كثير من الأنظمة يمكن أن تبدو متسقة ومُتاحة.

عندما يوجد انقسام، عليك اختيار ما تُعطيه الأولوية:

اختيار الاتساق: ترفض أو تؤخر بعض الطلبات حتى تتفق الخوادم.
اختيار التوافر: تقبل الطلبات على كل جانب من الانقسام حتى لو اختلفت الإجابات مؤقتًا.

جدول زمني بسيط تتخيله

10:00 العميل يكتب balance = 100 إلى الخادم A.
10:01 انقسام الشبكة: الخادم A لا يستطيع الوصول إلى الخادم B.
10:02 العميل يقرأ من الخادم B.
- إذا فضّلت الاتساق، يجب على الخادم B الرفض أو الانتظار.
- إذا فضّلت التوافر، يرد الخادم B، لكنه قد يقول balance = 80.

مفهوم خاطئ شائع

CAP لا يعني "اختر اثنين" كقاعدة دائمة. يعني أثناء الانقسام لا يمكنك ضمان كلا:

الاتساق و
التوافر

في الخارج عن الانقسامات، يمكنك غالبًا الاقتراب من كلتيهما—حتى تخطئ الشبكة.

اختيار الاتساق: ماذا تكسب وماذا تخسر

ماذا يحدث أثناء الانقسام

يحجب الطلبات أثناء الانتظار للتنسيق، أو
يرفض الطلبات (يعيد أخطاء/انتهاء مهلة) إذا لم يتم الوصول إلى النسخ/القائد المطلوب.

من منظور المستخدم، قد يبدو هذا كتعطل رغم أن بعض الآلات لا تزال تعمل.

ما الذي تكسبه

قراءة بيانات قديمة بعد تحديث ناجح
رؤية قيمتين مختلفتين لنفس السجل اعتمادًا على النسخة
فقدان ثوابت (مثل البيع الزائد للمخزون) بسبب كتابات متضاربة

كما تحصل على نماذج عقلية أنظف للتدقيق والفوترة وكل ما يجب أن يكون صحيحًا من المرة الأولى.

ما الذي تخسره

للتمسك بالاتساق تكلفة حقيقية:

كمون أعلى: كثير من العمليات يجب أن تنتظر التنسيق (غالبًا عبر آلات أو مناطق).
أخطاء أكثر أثناء الأعطال: الانقسامات، النسخ البطيئة، أو مشاكل القائد يمكن أن تتحول إلى انقضاء مهلات أو "حاول لاحقًا".

اختيار التوافر: ماذا تكسب وماذا تخسر

صمّم إعادة محاولات آمنة بسرعة

أنشئ نقطة كتابة متكررة التأثير (idempotent) وتدفق عميل آمن لإعادة المحاولة دون إعادة بناء البنية.

ابنِ الآن

ماذا يحدث أثناء انقسام الشبكة

القراءات تُجاب محليًا من البيانات الموجودة لدى النسخة.
الكتابات تُقبل محليًا وتُطوَّق/تُكرر لاحقًا عند عودة الاتصال.

هذا يُبقي التطبيقات تتحرك، لكنه يعني أيضًا أن نسخًا مختلفة قد تقبل حقائق مختلفة مؤقتًا.

ما الذي تكسبه

ما الذي تخسره

الحشود والتصويت: أرضية وسطى

فكرة (N, R, W)

سترى غالبًا الحشود موصوفة بثلاثة أرقام:

N: عدد النسخ لقطعة بيانات
W: كم من النسخ يجب أن تؤكد الكتابة قبل اعتبارها ناجحة
R: كم من النسخ يتم الرجوع إليها للقراءة

أمثلة بديهية

لو كان لديك N=3 نسخ:

نهج نسخة واحدة (R=1, W=1): سريع ومتاح جدًا، لكن من السهل قراءة نسخة قديمة.
تصويت الأغلبية (R=2, W=2): يجب أن تصل الكتابة إلى نسختين، وتقارن القراءة نسختين. هذا يزيد احتمالات رؤية القيمة الأحدث لأن مجموعتي القراءة والكتابة تتقاطع.

ماذا تفعل الحشود أثناء الانقسامات

المقايضات

الاتساق النهائي والشذوذات الشائعة

الاتساق النهائي يعني أن النسخ مسموح لها أن تكون غير متزامنة مؤقتًا، طالما أنها تتقارب لنفس القيمة لاحقًا.

تشبيه ملموس

الشذوذات الشائعة التي ستلاحظها

بينما تنتشر البيانات، قد يلاحظ العملاء سلوكًا مفاجئًا مثل:

قراءات قديمة: قراءة بيانات قديمة من نسخة لم تستلم التحديث بعد.
فجوات "قراءة-ما-كتبت": كتبت تحديثًا ثم لم تره فورًا عند القراءة من نسخة أخرى.
تحديثات بترتيب مختلف: يصل تحديثان بترتيب مختلف إلى نسخ مختلفة، مُنتجًا مشاهد متضاربة مؤقتًا.

تقنيات تساعد النسخ على التقارب

أنظمة الاتساق النهائي تضيف آليات خلفية لتقليل نوافذ عدم التناسق:

تصليح عند القراءة (Read repair): إذا كشفت قراءة عن اختلاف بين النسخ، يقوم النظام بتحديث النسخ القديمة في الخلفية.
تلميحات مؤقتة (Hinted handoff): إذا كانت نسخة متوقفة، يخزن عقدة أخرى "تلميحات" عن الكتابات لترسلها عند عودة النسخة.
مكافحة التعادل (Anti-entropy): مُصالحة دورية (غالبًا عبر شجرات مركل أو مجموعات تحقق) لاكتشاف وإصلاح الانحراف.

متى يعمل الاتساق النهائي جيدًا

حل التعارضات: كيف تُصالح الكتابات المتباعدة

اختبر أوضاع القراءة والكتابة

شغّل تطبيق React وواجهة API بـ Go لاختبار عمليات كتابة صارمة وقراءات متساهلة.

ابدأ البناء

آخر كتابة تفوز (LWW): بسيط لكنه محفوف بالمخاطر

تبدأ كثير من الأنظمة بـآخر كتابة تفوز: التحديث ذو الطابع الزمني الأحدث يطغى على البقية.

كما يفترض أن الساعات موثوقة. انحراف الساعة بين الآلات (أو العملاء) قد يجعل التحديث «الخطأ» يفوز.

الاحتفاظ بالتاريخ: متجهات الإصدارات وأفكار ذات صلة

التعامل الأكثر أمانًا يتطلب عادة تتبع التاريخ السببي.

الدمج بدلًا من الكتابة فوق

عند اكتشاف تعارض، لديك خيارات:

الدمج على مستوى التطبيق: يقرر تطبيقك كيفية دمج الحقول، مطالبة المستخدم، أو الاحتفاظ بالإصدارات للمراجعة.
CRDTs (هياكل بيانات متسارعة لا تتعارض): هياكل بيانات صممت لتندمج تلقائيًا وبحتمية ومحددة (مفيدة للعدادات والمجموعات والنصوص التعاونية، إلخ). غالبًا تتجنب سلوك "الفائز يأخذ الكل" وتبقى متاحة بدرجة عالية.

كيف تختار لحالتك

طابق مخاطرة الأعمال مع احتياجات الاتساق

بعض المجالات تحتاج إجابة موحدة فورًا لأن "شبه صحيح" لا يكفي:

المال والفواتير: الشحن المزدوج، السحب الزائد، والاستردادات عادة تتطلب اتساقًا قويًا.
الهوية والصلاحيات: تسجيل الدخول، إعادة تعيين كلمات المرور، والتحكم بالوصول يجب أن تتجنب سلوك الانقسام.
المخزون والقدرة: إذا كان البيع الزائد غير مقبول (تذاكر، مخزون محدود)، اتجه للاتساق—أو صمم نظام حجز صريح.

إذا كان أثر عدم التناسق مؤقتًا منخفضًا أو قابلًا للتراجع، يمكنك الميل أكثر للتوافر.

قرّر مدى قبولك للبيانات القديمة

العديد من تجارب المستخدم تعمل جيدًا مع قراءات متأخرة قليلًا:

الخلاصات والجداول الزمنية: ظهور منشور بعد ثوانٍ غالبًا مقبول.
التحليلات ولوحات المعلومات: الأرقام الدفعية أو المؤجلة متوقعة.
الكاش وفهارس البحث: يقبل المستخدمون "لم يتم التحديث بعد" إذا كان الأداء سريعًا ومستقرًا.

اختر وضع الفشل الذي سيكرهه المستخدمون أقل

عندما لا تستطيع النسخ الاتفاق، عادةً تواجه أحد ثلاثة نتائج في تجربة المستخدم:

دولاب الانتظار / انتظار (تفضيل الصحة، قد يبدو بطيئًا)
خطأ / إعادة محاولة (صريح لكنه مزعج)
نتيجة قديمة (سلسة لكن مفاجِئة أحيانًا)

اختر الخيار الأقل ضررًا لكل ميزة، لا بشكل عام.

قائمة سريعة

امِل للاتساق إذا: نتائج خاطئة تُسبب خطرًا ماليًا/قانونيًا، مسائل أمنية، أو إجراءات لا رجعة فيها.

امِل للتوافر إذا: المستخدمون يقدّرون الاستجابة، والبيانات القديمة مقبولة، ويمكن حل التعارضات بأمان لاحقًا.

أنماط تصميم لتقليل الألم الناتج عن المقايضة

حوّل الأمثلة إلى عرض توضيحي

نمذج سلات التسوق والأرصدة وآليات إعادة المحاولة لتكتشف حالات الفشل الحقيقية مبكرًا.

أنشئ تطبيقًا

استخدم مستويات اتساق لكل عملية

عامل الاتساق كقرص يتم تضييقه حسب ما يفعله المستخدم:

تحديثات حرجة (المدفوعات، تخفيضات المخزون، تغيير كلمة المرور): استخدم اتساقًا أقوى (مثلاً كتابة بحشد/قابل للتسلسل).
قراءات غير حرجة (الخلاصات، لوحات القيادة، "آخر ظهور"): اقبل قراءات أضعف (محلية/نسخة واحدة/نهج نهائي) للسرعة والمرونة.

هذا يجنب دفع تكلفة الاتساق الأقصى على كل شيء بينما يحمي العمليات المهمة.

اخلط القوي والضعيف في تدفق واحد

نمط شائع هو قوي للكتابة، أضعف للقراءة:

اكتب بمستوى صارم ليكون لدى النظام سجل موثوق.
اقرأ بمستوى أرخَص، وإذا اكتشفت شيئًا "مشتبهًا" (عنصر مفقود، عدّاد قديم)، فقم بتحديث بقراءة أقوى أو أظهر مؤشر "لا يزال يتحدث".

صمم لإعادة المحاولة: قابلية التكرار (idempotency)

تدفقات طويلة: Sagas والتعويض

الاختبار والمراقبة بالنسبة للاتساق مقابل التوافر

ماذا تقيس (ولماذا)

ابدأ بمجموعة صغيرة من المقاييس التي ترتبط مباشرة بتأثير المستخدم:

الكمون (p50/p95/p99): راقب القفزات أثناء التحويلات، تغييرات القائد، أو محاولات الحشد.
معدل الأخطاء: فصل "الأخطاء الصلبة" (انتهاء مهلة، 5xx) عن "أخطاء ناعمة" (مُخدَّم من بديل، نتائج جزئية).
معدل القراءات القديمة: نسبة القراءات التي تُرجع بيانات أقدم من هدفك (مثلاً أقدم من 2 ثانية).
معدل التعارضات: مدى تواتُر الكتابات المتزامنة التي تتطلب مصالحة (بما في ذلك الكتابات التي تُلطَّخ عبر LWW).

اختبر الانقسامات عمدًا

لا تنتظر الانقطاع الحقيقي. في بيئة الاختبار، نفذ تجارب فوضى تحاكي:

إسقاط الحزم وزيادة الكمون بين النسخ
عدم القدرة على الوصول لمنطقة كاملة
انقسامات جزئية حيث بعض العقد فقط تستطيع التحدث

التنبيه الذي يكتشف المقايضة مبكرًا

أضف تنبيهات لـ:

تأخر التكرار عن نافذة القِدم المقبولة
فشل الحشود (لا يمكن الوصول لعدد كافٍ من النسخ) وازدياد محاولات الإعادة
ارتفاع معدل التعارضات أو تراكم أعمال المصالحة

بناء نماذج سريعة لخيارات CAP بدون إعادة البناء الكامل

الأسئلة الشائعة

لماذا تواجه قواعد البيانات الموزعة مقايضة بين الاتساق والتوافر؟

ماذا يعني «الاتساق» بالمصطلح البسيط؟

ماذا يعني «التوافر» بالمصطلح البسيط؟

ما هو انقسام الشبكة، ولماذا يهم كثيرًا؟

حظر/رفض الطلبات للحفاظ على حقيقة واحدة (الاتساق)، أو
الإجابة على الطلبات على كل جانب ثم المصالحة لاحقًا (التوافر).

ماذا يختبر المستخدمون فعليًا أثناء الانقسام أو اختلاف النسخ؟

أثناء الانقسام، قد يقبل كل جانب تحديثات لا يستطيع مشاركتها فورًا. هذا يمكن أن يؤدي إلى:

انتهاء المهلات (انتظار نسخ لا تُستجاب)
قراءات قديمة (قراءة من نسخة متأخرة)
سلوك انقسام-الدماغ (مستخدمون مختلفون يرون «حقيقتين» مختلفتين)

هذه هي النتائج المرئية للمستخدم عندما تعجز النسخ عن التنسيق مؤقتًا.

هل يعني مبدأ CAP حقًا أنه يمكنك اختيار اثنين فقط من الثلاثة؟

لا يعني ذلك "اختر اثنين إلى الأبد". المعنى أن عند حدوث انقسام لا يمكنك ضمان كل من:

الاتساق (كل القراءات ترى آخر كتابة معترفة)، و
التوافر (كل طلب يحصل على استجابة)

خارج الانقسامات، قد تبدو الأنظمة أنها توفر كلاهما معظم الوقت—إلى أن تخطئ الشبكة.

كيف تساعد الحشود (N, R, W) في موازنة الاتساق والتوافر؟

الحشد يعتمد على التصويت بين النسخ:

N = عدد النسخ
W = عدد النسخ التي يجب أن تؤكد الكتابة
R = عدد النسخ المستعلمَة للقراءة

ما هو الاتساق في النهاية، وما الاستثناءات الشائعة؟

الاتساق في النهاية تسمح بأن تكون النسخ غير متزامنة مؤقتًا شريطة أن تتقارب لاحقًا. المشكلات الشائعة:

قراءات قديمة
فجوات "قراءة-ما-كتبت" (لا ترى تحديثك فورًا)
تحديثات بترتيب مختلف

تُخفف الأنظمة ذلك بآليات مثل ، ، وعمليات الدورية.

كيف تُحل الكتابات المتعارضة بعد شفاء الانقسام؟

النزاعات تظهر عندما تقبل نسخ مختلفة كتابات متضاربة على نفس العنصر أثناء الانقطاع. استراتيجيات الحل:

آخر كتابة تفوز (LWW): بسيط لكنه قد يفقد بيانات بصمت ويعتمد على الساعات
متجهات الإصدارات / بيانات سببية: تكشف التعارض الحقيقي مقابل التحديثات المتسلسلة
الدمج / CRDTs: هياكل بيانات تُدمج تلقائيًا وبحتمية لبعض أنواع البيانات

اختر الاستراتيجية بناءً على معنى "الصحيح" لبياناتك.

كيف أختار وضع الاتساق مقابل التوافر لتطبيقي؟

فضّل الاتساق القوي للمال، الفواتير، الهوية، الأذونات، والمخزون الحساس.
فضّل التوافر للـFeeds، التحليلات، الكاش، والسجلات حيث التأخير مقبول.

نماذج عملية: مستويات اتساق لكل عملية، مفاتيح عدم التكرار (idempotency)، وSagas للتعويض في تدفقات طويلة.