لماذا فهارس قواعد البيانات هي أهم تحسين للأداء

Q: ما هو فهرس قاعدة البيانات بكلمات بسيطة؟

هيكل فهرسي منفصل (غالبًا شجرة B) يخزن قيم أعمدة مختارة بشكل مرتَّب وقابل للبحث مع مؤشرات تشير إلى صفوف الجدول. تستخدمه قاعدة البيانات لتجنب قراءة معظم الجدول عند تنفيذ استعلامات انتقائية. ليس نسخة كاملة من الجدول، لكنه يكرر بعض بيانات الأعمدة مع بيانات وصفية، لذا يستهلك مساحة تخزين إضافية.

Q: لماذا تسرع الفهارس الاستعلامات كثيرًا مقارنة بالمسح الكامل للجدول؟

بدون فهرس، قد تضطر قاعدة البيانات لإجراء مسح كامل للجدول: قراءة الكثير (أو كل) الصفوف ومطابقة كل صف مع شرط WHERE. مع فهرس، يمكنها غالبًا القفز مباشرة إلى مواقع الصفوف المطابقة وقراءة تلك الصفوف فقط، ما يقلل عمليات القراءة من القرص/SSD، ووقت المعالجة على CPU، وضغط الذاكرة.

Q: كيف يساعد فهرس B-tree في كل من التطابقات exact ومن استعلامات النطاق؟

يحافظ فهرس شجرة B على القيم مرتبة ومنظمة في صفحات تشير إلى صفحات أخرى، لذلك يمكن لقاعدة البيانات التنقل بسرعة إلى الحيّ الصحيح من القيم. لهذا تعمل أشجار B جيدًا لكل من: - عمليات البحث بالتطابق ( ) - استعلامات النطاق ( )

Q: متى يكون الفهرس الهاشي أفضل من شجرة B؟

يمكن أن تكون الفهارس الهاشية سريعة جدًا في التطابقات الدقيقة ( ) لأنها تقوم بتجزئة القيمة والانتقال مباشرة إلى الدلو المناسب. المقايضات: - لا تفيد عادةً في استعلامات النطاق أو الفرز المرتب - توافرها وسلوكها يختلف باختلاف محرك قاعدة البيانات في كثير من سيناريوهات العالم الحقيقي، تبقى أشجار B هي الافتراضية لأنها تدعم أنماط استعلام أوسع.

Q: أي أنماط الاستعلام تستفيد أكثر من الفهارس؟

تفيد الفهارس عادةً أكثر في: - عوامل تصفية الانتقائية (عندما تطابق عددًا قليلًا من الصفوف) - مفاتيح (المفاتيح الأجنبية والمفتاح المرجعي) - الذي يتوافق مع ترتيب الفهرس (قد يتجنب عملية الفرز) - بعض حالات عندما تقرأ البيانات بترتيب مجموعات يقلل العمل إذا كان الاستعلام يُرجع جزءًا كبيرًا من الجدول، فالفائدة غالبًا ما تكون ضئيلة.

Q: لماذا تخيب الفهارس على الأعمدة المنطقية أو قليلة الانتقائية؟

الانتقائية هي "كم عدد الصفوف التي تطابق قيمة معينة؟". تفيد الفهارس عندما يُضيّق الشرط مجموعة النتائج بشكل كبير. الأعمدة قليلة التمييز (مثل , , أو حالات القليلة) غالبًا ما تطابق نسبة كبيرة من الجدول، وفي هذه الحالة لا يستحق استخدام الفهرس لأنه قد يكون أبطأ من المسح التسلسلي.

Q: لماذا يتجاهل مخطط الاستعلام فهرسًا موجودًا؟

لأن المُحسّن (query planner) يقدر أن استخدامه لن يقلل العمل بما يكفي. أسباب شائعة: - تطابق عدد كبير من الصفوف (قليل الانتقائية) - يحتاج الاستعلام إلى أعمدة كثيرة، مما يجعل الوصول إلى الجدول مكلفًا\n- إحصاءات قديمة تؤدي إلى تقديرات تكلفة خاطئة\n- الاستعلام لا يتوافق مع بادئة الفهرس المركب (قاعدة الأعمدة اليسارية)

Q: ما معنى "ترتيب الأعمدة" في الفهارس المركبة؟

في معظم تطبيقات شجرة B، يُرتب الفهرس أولًا حسب العمود الأول، ثم داخل ذلك حسب العمود الثاني، وهكذا. لذلك يمكن استخدام الفهرس بكفاءة بدءًا من العمود/الأعمدة اليسرى. مثال: - الفهرس ممتاز لعمليات مع تصفية/فرز بالوقت. - عادةً لا يفيد نفس الفهرس للاستعلام الذي يفلتر فقط بـ لأن ذلك ليس العمود الأيسر.

Q: ما هو الفهرس المغطٍّ ومتى يستحق استخدامه؟

الفهرس المغطٍّ يحتوي كل الأعمدة التي يحتاجها الاستعلام بحيث يمكن لقاعدة البيانات إرجاع النتيجة من الفهرس دون الرجوع إلى صفوف الجدول. الفوائد: - قراءات أقل وعمليات I/O عشوائية أقل التكاليف: - حجم فهرس أكبر - تكلفة كتابة أعلى (تحديثات/إدخالات أكبر للفهرس) يُستخدَم الفهرس المغطٍّ لاستعلامات عالية القيمة وليس "فقط تحسُّبًا".

Q: كيف أثبت أن فهرسًا حسّن الأداء بالفعل؟

تحقق من أمرين: - الخطة: استخدم / وتأكد من أن الخطة تغيرت (مثل → , عدد الصفوف المقروءة انخفض، خطوة الفرز اختفت).\n- القياسات الحقيقية: قارن زمن الاستجابة قبل/بعد في نفس الظروف وبحجم بيانات ممثل.\n\nراقب أيضًا تأثيره على عمليات الكتابة، لأن الفهارس الجديدة قد تبطئ / / .

تسجيل الدخول ابدأ الآن

لماذا فهارس قواعد البيانات هي أهم تحسين للأداء | Koder.ai

ماذا تفعل فهارس قواعد البيانات فعلًا

فهرس قاعدة البيانات هو هيكل بحث منفصل يساعد قاعدة البيانات على العثور على الصفوف بشكل أسرع. ليس نسخة ثانية من جدولك. فكّر فيه مثل صفحات الفهرس في كتاب: تستخدم الفهرس للقفز إلى المكان الصحيح تقريبًا، ثم تقرأ الصفحة (الصف) الدقيقة التي تحتاجها.

بدون فهرس، غالبًا ما تملك قاعدة البيانات خيارًا آمنًا واحدًا: قراءة العديد من الصفوف للتحقق أيها يطابق الاستعلام. قد يكون ذلك مقبولًا عندما يحتوي الجدول على بضعة آلاف من الصفوف. مع نمو الجدول إلى ملايين الصفوف، يصبح "التحقق من مزيد من الصفوف" مزيدًا من عمليات القراءة من القرص، ومزيدًا من ضغط الذاكرة، ومزيدًا من عمل CPU—فتصبح نفس الاستعلام التي كانت فورية سابقًا بطيئة.

ما الذي يغيّره الفهرس (وما الذي لا يغيره)

تقلل الفهارس كمية البيانات التي يجب على قاعدة البيانات فحصها للإجابة عن أسئلة مثل "ابحث عن الطلب بالمعرِّف 123" أو "استرجع المستخدمين بهذا البريد الإلكتروني". بدلاً من المسح الكامل، تتبع قاعدة البيانات بنية مدمجة تضيق عملية البحث بسرعة.

لكن الفهرسة ليست حلًّا شاملًا. بعض الاستعلامات لا تزال تحتاج معالجة عدد كبير من الصفوف (تقارير شاملة، عوامل تصفية ذات انتقائية منخفضة، تجميعات مكثفة). وللفهارس تكلفة حقيقية: مساحة تخزين إضافية وبطء في عمليات الكتابة، لأن الإدخالات والتحديثات يجب أن تُحدَّث أيضًا في الفهرس.

ما ستتعلمه في هذا الدليل

سترى:

لماذا تجنُّب المسح الكامل للجدول هو مكسب السرعة الأكبر
كيف تجعل هياكل الفهارس الشائعة (مثل B-tree) عمليات البحث سريعة
أي الاستعلامات تستفيد أكثر، ومتى لا تفيد
كيفية اختيار الفهارس المركبة/المغطّية والتحقق منها باستخدام خطة EXPLAIN
كيفية صيانة الفهارس مع مرور الوقت حتى لا يتدهور الأداء بصمت

المكسب الأساسي في السرعة: تجنُّب المسح الكامل للجدول

عندما تنفذ قاعدة البيانات استعلامًا، أمامها خياران عامان: مسح الجدول صفًا صفًا، أو القفز مباشرة إلى الصفوف المطابقة. معظم مكاسب الفهرسة تأتي من تجنُّب قراءات غير ضرورية.

المسح الكامل للجدول مقابل استخدام الفهرس

المسح الكامل للجدول Full table scan هو بالضبط ما يبدو عليه: تقرأ قاعدة البيانات كل صف، تتحقق مما إذا كان يطابق شرط الـ WHERE، ثم تُرجع النتائج. هذا مقبول للجداول الصغيرة، لكنه يبطئ بطريقة متوقعة مع نمو الجدول—كلما زاد عدد الصفوف زاد العمل.

باستخدام فهرس، يمكن لقاعدة البيانات غالبًا تجنُّب قراءة معظم الصفوف. بدلاً من ذلك، تستشير الفهرس أولًا (هيكل مدمج مُصمَّم للبحث) لتجد أين تعيش الصفوف المطابقة، ثم تقرأ تلك الصفوف فقط.

تشبيه بسيط

تخيَّل كتابًا. إذا أردت كل الصفحات التي تذكر "التمثيل الضوئي" يمكنك قراءة الكتاب صفحة صفحة (مسح كامل). أو يمكنك استخدام فهرس الكتاب، والقفز إلى الصفحات المدرجة وقراءة تلك الأقسام فقط (بحث بالفهرس). الطريقة الثانية أسرع لأنها تتخطى معظم الصفحات.

لماذا تعني قلة القراءات عادةً استعلامات أسرع

تقضي قواعد البيانات وقتًا طويلًا تنتظر عمليات القراءة—خصوصًا عندما لا تكون البيانات في الذاكرة. تقليل عدد الصفوف (والصفحات) التي يجب لمسها يقلل عادةً من:

قراءات القرص/SSD
وقت CPU المستغرق في تقييم الفلاتر
ضغط الذاكرة من جلب بيانات غير ضرورية إلى الكاش

متى يظهر مكسب السرعة

تفيد الفهارس أكثر عندما تكون البيانات كبيرة ونمط الاستعلام انتقائي (مثلًا، استرجاع 20 صفًا مطابِقًا من بين 10 ملايين). إذا كان استعلامك يُرجع معظم الصفوف على أي حال، أو الجدول صغير بما فيه الكفاية ليلائم الذاكرة، فقد يكون المسح الكامل بنفس سرعة الفهرس—أو أسرع.

كيف تجعل هياكل الفهارس عمليات البحث سريعة

تعمل الفهارس لأنها ترتب القيم بحيث يمكن لقاعدة البيانات القفز قريبًا مما تريد بدلًا من فحص كل صف.

فهارس B-tree: الحصان الشغال الافتراضي

أكثر هياكل الفهرس شيوعًا في قواعد بيانات SQL هي B-tree (غالبًا تُكتب "B-tree" أو "B+tree"). من الناحية المفاهيمية:

تُحفظ القيم مرتَّبة
يُقسَّم الفهرس إلى صفحات تشير إلى صفحات أخرى، وفي النهاية إلى صفوف الجدول المطابقة

بسبب الفرز، تكون أشجار B ممتازة لكل من البحث بالتطابق (WHERE email = ...) واستعلامات النطاق (WHERE created_at >= ... AND created_at < ...). يمكن لقاعدة البيانات الانتقال إلى الحي المناسب من القيم ثم المسح للأمام بترتيبها.

ماذا يعني "لوغاريتمي" (بدون رياضيات)

يقول الناس إن عمليات بحث شجرة B "لوغاريتمية". عمليًا، هذا يعني: عندما ينمو جدولك من آلاف إلى ملايين الصفوف، عدد الخطوات للعثور على قيمة ينمو ببطء، وليس بنسبة مباشرة. بدلًا من "ضعف البيانات يعني ضعف العمل"، إنه أقرب إلى "زيادة كبيرة في البيانات تعني بضعة خطوات إضافية فقط"، لأن قاعدة البيانات تتبع مؤشرات عبر عدد قليل من مستويات الشجرة.

الفهارس الهاشية: سريعة للتطابقات الدقيقة (مع حدود)

توفّر بعض المحركات أيضًا فهارس هاش. يمكن أن تكون هذه سريعة جدًا للتطابقات الدقيقة لأن القيمة تُحوَّل إلى هاش وتستخدم للعثور على الإدخال مباشرة.

المقايضة: الفهارس الهاشية عادةً لا تساعد في النطاقات أو المسح المرتب، وتوافرها/سلوكها يختلف بين قواعد البيانات.

تفاصيل المحركات تختلف، لكن الفكرة واحدة

PostgreSQL، MySQL/InnoDB، SQL Server وغيرها تخزن وتستخدم الفهارس بشكل مختلف (حجم الصفحة، التجميع، الأعمدة المضمنة، فحوصات الرؤية). لكن المفهوم الأساسي يصح: الفهارس تخلق بنية مدمجة قابلة للملاحة تتيح لقاعدة البيانات تحديد مواقع الصفوف المطابقة بعمل أقل بكثير من مسح الجدول كله.

الاستعلامات التي تستفيد أكثر من الفهارس

الفهارس لا تسرع "الـ SQL" عمومًا—إنما تسرع أنماط وصول محددة. عندما يتوافق الفهرس مع طريقة تصفية الاستعلام أو ربطه أو فرزه، يمكن لقاعدة البيانات القفز مباشرة إلى الصفوف ذات الصلة بدلًا من قراءة الجدول كله.

أنماط الاستعلام الأكثر ملاءمة للفهرس

1) عوامل WHERE (خاصةً على أعمدة انتقائية)

إذا كان استعلامك يضيّق جدولًا كبيرًا إلى مجموعة صغيرة من الصفوف، فعادةً الفهرس هو أول ما تنظر إليه. مثال كلاسيكي هو البحث عن مستخدم بمعرف.

بدون فهرس على users.email قد تضطر قاعدة البيانات إلى مسح كل الصفوف:

SELECT * FROM users WHERE email = '[email protected]';

مع فهرس على email يمكنها تحديد الصفوف المطابقة بسرعة والتوقف.

2) مفاتيح JOIN (المفاتيح الأجنبية والمفاتيح المرجعية)

الانضمامات هي حيث "الكفاءات الصغيرة" تتحول إلى تكاليف كبيرة. إذا كنت تربط orders.user_id بـ users.id، فإن فهرسة أعمدة الربط (عادة orders.user_id والمفتاح الأساسي users.id) تساعد قاعدة البيانات على مطابقة الصفوف دون المسح المتكرر.

3) ORDER BY (عندما تريد النتائج مرتبة بالفعل)

الفرز مكلف عندما تضطر قاعدة البيانات إلى جمع الكثير من الصفوف وفرزها بعد ذلك. إذا كنت تُشغّل كثيرًا:

SELECT * FROM orders WHERE user_id = 42 ORDER BY created_at DESC;

يمكن أن يسمح فهرس يطابق user_id وعمود الفرز للـ engine بقراءة الصفوف بالترتيب المطلوب بدلًا من فرز نتيجة وسيطة كبيرة.

4) GROUP BY (عندما يتوافق التجميع مع الفهرس)

قد يستفيد التجميع عندما تقرأ قاعدة البيانات البيانات بترتيب المجموعات. ليس ضمانًا، لكن إذا كنت تجمع غالبًا بحسب عمود يُستخدم للتصفية (أو متجمّع بطبيعته في الفهرس)، قد يقل العمل.

عوامل النطاق: فوز شائع لشجرة B

شجر B جيدة جدًا لظروف النطاق—فكر في التواريخ والأسعار واستعلامات "بين":

SELECT * FROM orders
WHERE created_at >= '2025-01-01' AND created_at < '2025-02-01';

لهذا تُستخدم الفهارس على عمود النطاق في لوحات التحكم والتقارير وشاشات "النشاط الأخير" بشكل واسع، وغالبًا ما تنتج تحسينًا فوريًا.

الموضوع بسيط: الفهارس تفيد عندما تعكس طريقة البحث والفرز لديك. إذا كانت استعلاماتك تتماشى مع أنماط الوصول هذه، يمكن لقاعدة البيانات إجراء قراءات مستهدفة بدلًا من المسوح العريضة.

الانتقائية: لماذا بعض الفهارس لا تفيد

يفيد الفهرس أكثر عندما يقلل بشدة عدد الصفوف التي يجب لمسها. هذه الخاصية تُسمى الانتقائية.

ماذا تعني "الانتقائية" عمليًا

الانتقائية هي ببساطة: كم صفًا يطابق قيمة معينة؟ العمود عالي الانتقائية له قيم مميزة كثيرة، لذا كل بحث يطابق عددًا قليلاً من الصفوف.

انتقائية عالية: email, user_id, order_number (غالبًا فريدة أو قريبة من ذلك)
انتقائية منخفضة: is_active, is_deleted, status بقيم قليلة شائعة

مع الانتقائية العالية، يمكن للفهرس القفز إلى مجموعة صغيرة من الصفوف. مع الانتقائية المنخفضة، يشير الفهرس إلى جزء ضخم من الجدول—فتضطر قاعدة البيانات لقراءة وتصفيه الكثير.

لماذا تخيب الفهارس على الأعمدة البوليانية

افترض وجود جدول به 10 ملايين صف وعمود is_deleted حيث 98% قيمته false. فهرس على is_deleted لا يوفر كثيرًا لاستعلام:

SELECT * FROM orders WHERE is_deleted = false;

مجموعة المطابقين لا تزال تقريبًا الجدول كله. وقد يكون استخدام الفهرس أبطأ من المسح التسلسلي لأن المحرك يقوم بمزيد من العمل بين إدخالات الفهرس وصفحات الجدول.

لماذا قد يتجاهل المحسّن الفهرس

مخطط الاستعلام يقدر التكاليف. إذا لم يقلل الفهرس من العمل بما فيه الكفاية—لأن العديد من الصفوف تطابق، أو لأن الاستعلام يحتاج معظم الأعمدة—قد يختار المسح الكامل.

الانتقائية تتغير مع الوقت

توزيع البيانات ليس ثابتًا. قد يبدأ عمود status موزعًا بشكل متساوٍ، ثم ينحرف بحيث يُهيمن عليه قيمة واحدة. إذا لم تُحدَّث الإحصاءات، قد يتخذ المخطط قرارات سيئة، وقد يتوقف فهرس كان مفيدًا عن العطاء.

الفهارس المركبة والمغطّية (وترتيب الأعمدة)

ابنِ نمط الجدول الزمني الكلاسيكي

أنشئ واجهة برمجة لجدول زمني للأحداث وأضف فهارس بنمط (account_id, created_at) خلال دقائق.

أنشئ تطبيقًا

فهارس عمود واحد بداية جيدة، لكن العديد من الاستعلامات الحقيقية تُفلتر بواسطة عمود وتُرتب أو تُفلتر بواسطة آخر. هنا تتألق الفهارس المركبة: فهرس واحد يمكن أن يخدم عدة أجزاء من الاستعلام.

ترتيب الأعمدة: قاعدة "من اليسار إلى اليمين"

تستطيع معظم قواعد البيانات (خصوصًا مع فهارس B-tree) استخدام الفهرس المركب بكفاءة بدءًا من الأعمدة اليسارية. فكر في الفهرس كمرتب أولًا حسب العمود A، ثم ضمنه حسب العمود B.

هذا يعني:

فهرس (account_id, created_at) رائع للاستعلامات التي تُفلتر بـ account_id ثم تُصفّي أو تُرتّب حسب created_at
نفس الفهرس عادةً لا يساعد استعلامًا يفلتر بواسطة created_at فقط (لأنه ليس العمود الأيسر)

نمط عملي: مخططات زمنية لكل حساب

عبء شائع هو "أرني أحدث الأحداث لهذا الحساب". نمط الاستعلام:

SELECT id, created_at, type
FROM events
WHERE account_id = ?
ORDER BY created_at DESC
LIMIT 50;

غالبًا ما يستفيد كثيرًا من:

CREATE INDEX events_account_created_at
ON events (account_id, created_at);

يمكن لقاعدة البيانات القفز مباشرة إلى جزء الحساب في الفهرس وقراءة الصفوف بترتيب الوقت، بدلًا من المسح والفرز لمجموعة كبيرة.

الفهارس المغطّية: عندما يكون الفهرس هو الجواب

الفهرس المغطٍّ يحتوي كل الأعمدة التي يحتاجها الاستعلام بحيث يمكن لقاعدة البيانات إرجاع النتائج من الفهرس دون الرجوع إلى صفوف الجدول (قراءات أقل، I/O عشوائي أقل).

كن حذرًا: إضافة أعمدة إضافية يمكن أن تجعل الفهرس كبيرًا ومكلفًا.

لا تبنِ فهارس مركبة عريضة "تحسبًا" فقط

الفهارس المركبة العريضة يمكن أن تبطئ الكتابة وتستهلك مساحة تخزين كبيرة. أضفها فقط لاستعلامات ذات قيمة عالية محددة، وتحقق باستخدام خطة EXPLAIN وقياسات حقيقية قبل وبعد.

المقايضات: بطء الكتابة ومساحة تخزين إضافية

غالبًا ما يُوصف الفهرس بأنه "سرعة مجانية"، لكنه ليس مجانيًا. يجب صيانة هياكل الفهارس في كل مرة يتغير فيها الجدول، وتستهلك موارد فعلية.

بطء INSERT/UPDATE/DELETE (لأن كل فهرس يجب تحديثه)

عند إجراء INSERT لصف جديد، لا تكتب قاعدة البيانات الصف فقط—بل تُدرَج أيضًا إدخالات مقابلة في كل فهرس على هذا الجدول. ونفس الشيء لـ DELETE والعديد من UPDATE.

لهذا السبب "المزيد من الفهارس" يمكن أن يبطئ أحمال الكتابة بشكل ملحوظ. قد يكون UPDATE الذي يغيّر عمودًا مفهرسًا مُكلِفًا خاصةً: قد تضطر قاعدة البيانات لإزالة إدخال الفهرس القديم وإضافة جديد (وفي بعض المحركات قد يؤدي ذلك إلى انقسام صفحات أو إعادة توازن داخلية).

مساحة تخزين إضافية وضغط الذاكرة

كل فهرس يشغل مساحة على القرص. على الجداول الكبيرة، يمكن أن تنافس الفهارس (أو تتجاوز) حجم الجدول، خاصةً مع فهارس متداخلة.

ويؤثر ذلك أيضًا على الذاكرة. تعتمد قواعد البيانات كثيرًا على التخزين المؤقت؛ إذا كانت مجموعة العمل تشمل عدة فهارس كبيرة، يجب أن يحتفظ الكاش بالمزيد من الصفحات ليظل سريعًا. وإلا سترى مزيدًا من عمليات I/O من القرص وأداءً أقل قابلية للتنبؤ.

التوازن العملي

الفهرسة شأنها شأن اختيار ما نُسرِّع. إذا كان حمل العمل قراءة-ثقيلة، فالفهارس الإضافية قد تستحق التكلفة. إذا كان حمل العمل كتابة-ثقيل، ففضّل الفهارس التي تدعم استعلاماتك الأهم وتجنّب التكرارات. قاعدة مفيدة: أضف فهرسًا فقط عندما تستطيع تسمية الاستعلام الذي يساعده—وتتحقق أن مكسب سرعة القراءة يفوق تكلفة الكتابة والصيانة.

كيف تثبت أن الفهرس مفيد: EXPLAIN والقياسات

جرّب التراجع الآمن

جرّب تغييرًا في الفهرس بأمان، ثم تراجع إذا زاد زمن الكتابة أو تكاليف التخزين.

إنشاء لقطة

إضافة فهرس "يبدو" أنها يجب أن تساعد—لكن يمكنك (ويجب) التحقق فعليًا. الأداتان اللتان تصنعان ذلك ملموسًا هما خطة الاستعلام (EXPLAIN) والقياسات الحقيقية قبل/بعد.

اقرأ الخطة: هل الفهرس مستخدم فعلاً؟

شغّل EXPLAIN (أو EXPLAIN ANALYZE) على نفس الاستعلام الذي يهمك.

نوع المسح: Seq Scan / Full Table Scan يعني أن قاعدة البيانات تقرأ الجدول كله. Index Scan / Index Seek (أو Index Range Scan) يقترح أنها تستخدم فهرسًا لتضييق الصفوف.\n- الصفوف المقدَّرة مقابل الفعلية (خصوصًا في EXPLAIN ANALYZE): إذا خمن المخطط 100 صفًا لكنه لمس فعليًا 100,000، فالمحسّن أخطأ—غالبًا لأن الإحصاءات قديمة أو الفلتر أقل انتقائية مما اعتُقد.\n- خطوات الفرز: إذا رأيت عملية Sort صريحة، فقاعدة البيانات تقوم بترتيب النتائج بعد جلبها. إذا أزال فهرس جديد هذا الفرز لأنه يطابق ORDER BY، فقد يكون ذلك مكسبًا كبيرًا.

قس بشكل صحيح: قبل/بعد، نفس الشروط

قم بقياس الاستعلام بنفس المعلمات، على حجم بيانات ممثل، وسجل زمن الاستجابة (p50/p95)، والصفوف الممسوحة، وتأثير CPU/IO. احفظ خطة الاستعلام الحالية لمقارنتها لاحقًا.

انتبه للتخزين المؤقت: التشغيل الأول قد يكون أبطأ لأن البيانات ليست في الذاكرة؛ وتشغيلات متكررة قد تبدو "مُحلَّاة" حتى بدون فهرس. للمقارنة، شغّل عدة مرات وركّز على ما إذا تغيّرت الخطة (استخدام الفهرس، عدد الصفوف المقروءة) إلى جانب الزمن.

إذا أظهر EXPLAIN ANALYZE صفوفًا أقل ملموسًا وخطوات مكلفة أقل (مثل اختفاء الفرز)، فقد أثبتت أن الفهرس مفيد—ليس مجرد تكهن.

أخطاء شائعة تلغي فوائد الفهرس

يمكنك إضافة الفهرس "الصحيح" وما زلت لا ترى تسارعًا إذا كُتِب الاستعلام بطريقة تمنع قاعدة البيانات من استخدامه. هذه المشكلات غالبًا ما تكون دقيقة؛ لأن الاستعلام ما زال يرجع النتائج الصحيحة—إلا أنه يعمل في خطة أبطأ.

أنماط مضادة تحجب استخدام الفهرس

1) الوايلدكارد في البداية

عندما تكتب:

WHERE name LIKE '%term'

لا يستطيع الفهرس العادي من نوع B-tree معرفة أين يبدأ "%term" في الترتيب، لذلك يعود المسح إلى الكثير من الصفوف.

بدائل:

إن أمكن، استخدم بحثًا بمقدمة: WHERE name LIKE 'term%'.
إذا احتجت حقًا بحث "يحتوي"، ففكر في نوع فهرس متخصص (مثل full-text أو trigram) بدلًا من الاعتماد على فهرس عادي.

2) دوال على الأعمدة المفهرسة

قد يبدو هذا غير ضار:

WHERE LOWER(email) = '[email protected]'

لكن LOWER(email) يغيّر التعبير، لذا لا يمكن استخدام الفهرس على email مباشرة.

بدائل:

خزّن البيانات مُطَبَّعَة (مثلًا: عناوين بريد صغيرة الحروف) واستعلم بـ WHERE email = ....
أو أنشئ فهرسًا معبرًا/مبنيًا على دالة (expression/function-based index) إذا دعمتها قاعدة البيانات.

حاجزون خفيّون آخرون

التحويلات الضمنية للنوع: مقارنة أنواع مختلفة قد تجبر قاعدة البيانات على تحويل أحد الطرفين، مما يعطل استخدام الفهرس (مثال: مقارنة عمود عدد صحيح بسلسلة نصية).

مطابقات/ترميزات مختلفة: إذا استخدمت المقارنة ترتيبًا زمنيًا (collation) مختلفًا عن ذلك الذي بُني به الفهرس، قد يتجنب المحسن استخدام الفهرس.

قائمة فحص سريعة: لماذا لا يُستخدم فهريسي؟

هل الشرط يبدأ بوايلدكارد (LIKE '%x')?
هل تطبّق دالة على العمود المفهرس (LOWER(col), DATE(col), CAST(col))؟
هل الأنواع متطابقة على الطرفين (لا تحويل ضمني)؟
هل التجاهل/الترميز متوافقان للمقارنة؟
هل الشرط انتقائي بما يكفي (لا يطابق جزءًا ضخمًا من الجدول)؟
هل تقوم بالتصفية/الفرز على الأعمدة اليسارية لفهرس مركب؟
هل تحققت من الخطة باستخدام EXPLAIN لتؤكد ما اختاره المحرك؟

صيانة الفهارس: الإحصاءات، التضخُّم، وصحة المدى الطويل

الفهارس ليست "اضبطها وانسها". مع مرور الوقت، تتغير البيانات، تنقلب أنماط الاستعلام، ويتغير الشكل الفيزيائي للجداول/الفهارس. الفهرس الجيّد قد يصبح أقل فاعلية—أو حتى ضارًا—إذا لم تُجرِ صيانته.

الإحصاءات: خريطة المخطط يمكن أن تصبح قديمة

تعتمد معظم قواعد البيانات على مخطط استعلام لاختيار كيفية تنفيذ استعلام: أي فهرس يُستخدم، أي ترتيب للانضمام يُختار، وما إذا كانت عمليات الفهرسة مفيدة. لاتخاذ تلك القرارات، يستخدم المخطط إحصاءات—ملخصات عن توزيع القيم، أعداد الصفوف، والانحراف.

عندما تصبح الإحصاءات قديمة تكون تقديرات الصفوف خاطئة. يؤدي ذلك إلى اختيار خطط سيئة، مثل اختيار فهرس يُرجع صفوفًا أكثر بكثير مما كان متوقعًا، أو تجاهل فهرس كان سيفيد.

إصلاح روتيني: جدولة تحديث الإحصاءات بانتظام (غالبًا يُسمى "ANALYZE" أو ما شابه). بعد تحميل بيانات كبيرة، حذف واسع، أو تغيّر كبير، حدّث الإحصاءات سريعًا.

التضخُّم والتجزُّؤ: عندما تُصبح الهياكل فوضوية

أثناء الإدراج، التحديث، والحذف، يمكن للفهارس أن تتراكم فيها تضخُّم (صفحات إضافية لا تحمل بيانات مفيدة) وتجزؤ (بيانات منتشرة تزيد I/O). النتيجة فهارس أكبر وقراءات أكثر وبطء في المسوح—خصوصًا لاستعلامات النطاق.

إصلاح روتيني: قم بإعادة بناء أو إعادة تنظيم الفهارس المستخدمة بكثافة عندما تنمو بشكل غير متناسب أو يهبط الأداء. الأدوات والتأثير يختلفان حسب قاعدة البيانات، لذا عامل هذا كعملية محكومة وليس قاعدة عامة.

راقب بمرور الوقت، لا مرة واحدة فقط

أعد مراقبة:

الاستعلامات البطيئة (الزمن، التكرار، والمذنبون الأسوأ)
استخدام الفهارس (فهارس لم تُستخدم أبدًا مقابل الفهارس "الساخنة")
نمو حجم الفهارس وتغيرات الخطة المفاجئة

تغذية راجعة كهذه تساعدك على اكتشاف متى تحتاج صيانة—ومتى يجب تعديل الفهرس أو حذفه. للمزيد عن التحقق من التحسينات، انظر /blog/how-to-prove-an-index-helps-explain-and-measurements.

سير عمل عملي لإضافة الفهرس الصحيح

خطط مخططك والفهارس

خطط الجداول والمفاتيح واستراتيجية الفهارس قبل كتابة الميزات، ثم نفّذ من الخطة.

استخدم وضع التخطيط

يجب أن تكون إضافة فهرس تغييرًا مقصودًا، لا تخمينًا. سير عمل خفيف يحافظ على تركيزك على مكاسب قابلة للقياس ويمنع "تشتت الفهارس".

1) عيّن استعلام المشكلة الحقيقي

ابدأ بالأدلة: سجلات الاستعلامات البطيئة، تتبعات APM، أو تقارير المستخدم. اختر استعلامًا بطيئًا ومتكررًا—فالتقرير النادر بمدة 10 ثوانٍ أقل أهمية من عملية بحث شائعة 200 مللي.

احصل على SQL الدقيق ونمط المعاملات (مثال: WHERE user_id = ? AND status = ? ORDER BY created_at DESC LIMIT 50). اختلافات صغيرة تغيّر الفهرس المناسب.

2) قِس الأساس

سجّل زمن الاستجابة الحالي (p50/p95)، الصفوف الممسوحة، وتأثير CPU/IO. احفظ إخراج الخطة الحالي (EXPLAIN / EXPLAIN ANALYZE) للمقارنة لاحقًا.

3) صمِّم أصغر فهرس مفيد

اختر الأعمدة التي تطابق كيفية تصفية الاستعلام وفرزه. فضّل الفهرس الأدنى الذي يجعل الخطة تتوقف عن مسح نطاقات ضخمة.

اختبر في بيئة staging بحجم بيانات شبيه بالإنتاج؛ الفهارس قد تبدو رائعة على بيانات صغيرة وتخيب عند النطاق.

4) أنشئه بأمان

على الجداول الكبيرة استخدم خيارات عبر الإنترنت حيث تتوفر (مثلاً PostgreSQL CREATE INDEX CONCURRENTLY). جدولة التغييرات في فترات حركة أقل إذا كان النظام قد يقفل عمليات الكتابة.

5) تحقق بدليل قبل/بعد

أعد تشغيل الاستعلام ذاته وقارن:

شكل الخطة (هل تحوّل من مسح كامل إلى وصول بالفهرس؟)
زمن التنفيذ والصفوف الممسوحة
تأثيره على عمليات الكتابة (زمن الإدراج/التحديث)

6) جهز خطة تراجع

إذا زاد تكلفة الكتابة أو تسبب الفهرس في تضخُّم الذاكرة، احذفه بأمان (مثلاً DROP INDEX CONCURRENTLY حيثما أمكن). اجعل التغيير قابلًا للعكس.

7) وثّق "السبب"

في المهاجرات أو ملاحظات المخطط، اكتب أي استعلام يخدمه الفهرس وما الذي تحسَّن. سيعرفك أو زميلك المستقبلي لماذا وُجد هذا الفهرس ومتى يمكن حذفه.

أين يناسب Koder.ai هذا المسار

إذا كنت تبني خدمة جديدة وتريد تجنُّب "تشتت الفهارس" مبكرًا، يمكن أن تساعدك Koder.ai على التسريع في الحلقة الكاملة: توليد تطبيق React + Go + PostgreSQL من خلال الدردشة، تعديل مخططات الجداول والـ migrations للفهارس عند تغيّر المتطلبات، ثم تصدير الشيفرة المصدرية عندما تكون جاهزًا للإدارة اليدوية. عمليًا، يسهل الانتقال من "نقطة النهاية هذه بطيئة" إلى "ها هو EXPLAIN، الفهرس الأدنى، ومهاجرة قابلة للتراجع" دون انتظار خطوط أنابيب تقليدية طويلة.

عندما لا تكفي الفهارس (وماذا تفعل بعد ذلك)

الفهارس رافعة قوية، لكنها ليست زرًا سحريًا. أحيانًا جزء الطلب البطيء يحدث بعد أن تجد قاعدة البيانات الصفوف الصحيحة—أو نمط الاستعلام يجعل الفهرسة الخيار الخاطئ أولًا.

حالات يكون فيها الفهرس ليس الحل الأفضل

إذا كان استعلامك يستخدم فهرسًا جيدًا ومع ذلك بطيء، ابحث عن هذه الأسباب الشائعة:

ترقيم صفحات غير فعّال (pagination): جلب الصفحة 1000 مع OFFSET 999000 قد يكون بطيئًا حتى مع الفهارس. فضّل التصفّح بالمفتاح (keyset pagination) مثلًا "أعطني الصفوف بعد آخر id/timestamp مرئي".
إرجاع الكثير من البيانات: اختيار صفوف عريضة (SELECT *) أو إرجاع عشرات الآلاف من السجلات يمكن أن يؤدي إلى عنق زجاجة في الشبكة، أو التسلسل إلى JSON، أو معالجة التطبيق.
عدم توافق المخطط: الانضمامات المبالغ فيها عبر تطبيع مفرط، تخزين قيم قابلة للبحث داخل JSON/نصوص، أو استخدام أنواع بيانات غير مناسبة قد تجبر عمليات مكلفة لا يمكن للفهارس إخفاؤها بالكامل.

تحسينات مكمّلة غالبًا ما تكون أكثر أهمية

أعد كتابة الاستعلام: احذف الانضمامات غير الضرورية، تجنّب الدوال على الأعمدة المفهرسة في WHERE، وبسّط الشروط الثقيلة على OR.
حدِّد الأعمدة والصفوف: اختر ما تحتاجه فقط، أضف LIMIT معقول، وصفّح النتائج عن قصد.
التخزين المؤقت: خزّن القراءات الساخنة في طبقة التطبيق أو استخدم cache read-through للاستعلامات المكلفة المتكررة.
التقسيم (Partitioning): إذا كانت معظم الاستعلامات تضرب "البيانات الحديثة"، قسم الجدول حسب الزمن (أو حد طبيعي آخر) لتقليل مساحة البحث.

إن أردت منهجًا أعمق لتشخيص عنق الزجاجة، اقترن هذا بدليل العمل في /blog/how-to-prove-an-index-helps.

أولويات: اصلح أكبر عنق زجاجة أولًا

لا تخمن. قس أين يقضي الوقت (تنفيذ قاعدة البيانات مقابل الصفوف المرجعة مقابل كود التطبيق). إذا كانت قاعدة البيانات سريعة لكن الـ API بطيء، فالمزيد من الفهارس لن يساعد.

قائمة فحص سريعة

هل الاستعلام يرجع صفوف/أعمدة أكثر من اللازم؟
هل الترقيم فعّال (keyset vs OFFSET كبير)؟
هل تقوم بالفرز/التجميع على تعابير مكلفة؟
هل يجبرك المخطط على انضمامات مكثفة أو مسح داخل JSON/نص؟
هل يمكن للتخزين المؤقت إزالة عمل مكرر؟
هل يمكن للتقسيم تقليل البيانات الممسوحة؟
بعد كل تغيير، أعد القياس وتكرر

الأسئلة الشائعة

ما هو فهرس قاعدة البيانات بكلمات بسيطة؟

هيكل فهرسي منفصل (غالبًا شجرة B) يخزن قيم أعمدة مختارة بشكل مرتَّب وقابل للبحث مع مؤشرات تشير إلى صفوف الجدول. تستخدمه قاعدة البيانات لتجنب قراءة معظم الجدول عند تنفيذ استعلامات انتقائية.

ليس نسخة كاملة من الجدول، لكنه يكرر بعض بيانات الأعمدة مع بيانات وصفية، لذا يستهلك مساحة تخزين إضافية.

لماذا تسرع الفهارس الاستعلامات كثيرًا مقارنة بالمسح الكامل للجدول؟

بدون فهرس، قد تضطر قاعدة البيانات لإجراء مسح كامل للجدول: قراءة الكثير (أو كل) الصفوف ومطابقة كل صف مع شرط WHERE.

مع فهرس، يمكنها غالبًا القفز مباشرة إلى مواقع الصفوف المطابقة وقراءة تلك الصفوف فقط، ما يقلل عمليات القراءة من القرص/SSD، ووقت المعالجة على CPU، وضغط الذاكرة.

كيف يساعد فهرس B-tree في كل من التطابقات exact ومن استعلامات النطاق؟

يحافظ فهرس شجرة B على القيم مرتبة ومنظمة في صفحات تشير إلى صفحات أخرى، لذلك يمكن لقاعدة البيانات التنقل بسرعة إلى الحيّ الصحيح من القيم.

لهذا تعمل أشجار B جيدًا لكل من:

عمليات البحث بالتطابق (WHERE email = ...)
استعلامات النطاق (WHERE created_at >= ... AND created_at < ...)

متى يكون الفهرس الهاشي أفضل من شجرة B؟

يمكن أن تكون الفهارس الهاشية سريعة جدًا في التطابقات الدقيقة (=) لأنها تقوم بتجزئة القيمة والانتقال مباشرة إلى الدلو المناسب.

المقايضات:

لا تفيد عادةً في استعلامات النطاق أو الفرز المرتب
توافرها وسلوكها يختلف باختلاف محرك قاعدة البيانات

في كثير من سيناريوهات العالم الحقيقي، تبقى أشجار B هي الافتراضية لأنها تدعم أنماط استعلام أوسع.

أي أنماط الاستعلام تستفيد أكثر من الفهارس؟

تفيد الفهارس عادةً أكثر في:

عوامل تصفية WHERE الانتقائية (عندما تطابق عددًا قليلًا من الصفوف)
مفاتيح JOIN (المفاتيح الأجنبية والمفتاح المرجعي)
ORDER BY الذي يتوافق مع ترتيب الفهرس (قد يتجنب عملية الفرز)
بعض حالات GROUP BY عندما تقرأ البيانات بترتيب مجموعات يقلل العمل

لماذا تخيب الفهارس على الأعمدة المنطقية أو قليلة الانتقائية؟

الانتقائية هي "كم عدد الصفوف التي تطابق قيمة معينة؟". تفيد الفهارس عندما يُضيّق الشرط مجموعة النتائج بشكل كبير.

الأعمدة قليلة التمييز (مثل is_deleted, is_active, أو حالات status القليلة) غالبًا ما تطابق نسبة كبيرة من الجدول، وفي هذه الحالة لا يستحق استخدام الفهرس لأنه قد يكون أبطأ من المسح التسلسلي.

لماذا يتجاهل مخطط الاستعلام فهرسًا موجودًا؟

لأن المُحسّن (query planner) يقدر أن استخدامه لن يقلل العمل بما يكفي.

أسباب شائعة:

تطابق عدد كبير من الصفوف (قليل الانتقائية)
يحتاج الاستعلام إلى أعمدة كثيرة، مما يجعل الوصول إلى الجدول مكلفًا\n- إحصاءات قديمة تؤدي إلى تقديرات تكلفة خاطئة\n- الاستعلام لا يتوافق مع بادئة الفهرس المركب (قاعدة الأعمدة اليسارية)

ما معنى "ترتيب الأعمدة" في الفهارس المركبة؟

في معظم تطبيقات شجرة B، يُرتب الفهرس أولًا حسب العمود الأول، ثم داخل ذلك حسب العمود الثاني، وهكذا. لذلك يمكن استخدام الفهرس بكفاءة بدءًا من العمود/الأعمدة اليسرى.

مثال:

الفهرس (account_id, created_at) ممتاز لعمليات WHERE account_id = ? مع تصفية/فرز بالوقت.
عادةً لا يفيد نفس الفهرس للاستعلام الذي يفلتر فقط بـ created_at لأن ذلك ليس العمود الأيسر.

ما هو الفهرس المغطٍّ ومتى يستحق استخدامه؟

الفهرس المغطٍّ يحتوي كل الأعمدة التي يحتاجها الاستعلام بحيث يمكن لقاعدة البيانات إرجاع النتيجة من الفهرس دون الرجوع إلى صفوف الجدول.

الفوائد:

قراءات أقل وعمليات I/O عشوائية أقل

التكاليف:

حجم فهرس أكبر
تكلفة كتابة أعلى (تحديثات/إدخالات أكبر للفهرس)

يُستخدَم الفهرس المغطٍّ لاستعلامات عالية القيمة وليس "فقط تحسُّبًا".

كيف أثبت أن فهرسًا حسّن الأداء بالفعل؟

تحقق من أمرين:

الخطة: استخدم EXPLAIN / EXPLAIN ANALYZE وتأكد من أن الخطة تغيرت (مثل Seq Scan → Index Scan/Seek, عدد الصفوف المقروءة انخفض، خطوة الفرز اختفت).\n- القياسات الحقيقية: قارن زمن الاستجابة قبل/بعد في نفس الظروف وبحجم بيانات ممثل.\n\nراقب أيضًا تأثيره على عمليات الكتابة، لأن الفهارس الجديدة قد تبطئ //.

INSERT

UPDATE

DELETE