تصميم أنظمة عاملية لا تنهار في الإنتاج

Q: كيف أجعل الوكيل متوقعًا وسهل التصحيح؟

اجعل النموذج يعمل داخل هيكل واضح بدلًا من حلقة حرة الشكل: - نموذج الوكيل كـ آلة حالة ذات مجموعة محدودة من الحالات والانتقالات المسموح بها. - استخدم LLM فقط للخيارات المحلية (مثلاً: أي أداة تستدعي بعد ذلك، كيف تملأ المعاملات)، لا لاختلاق تدفقات عشوائية. - احفظ الحالة خارجيًا حتى تصبح كل انتقالات قابلة لإعادة التشغيل والتدقيق. - اجعل الوكلاء صغارًا ومركزين : مهمة واحدة رئيسية ومؤشر نجاح أساسي. بهذا يمكنك شرح واختبار وتصحيح السلوك خطوة بخطوة بدلًا من مطاردة "تفكير الوكيل" الغامض.

Q: ما هي الطريقة الصحيحة لإدارة الذاكرة والحالة للوكلاء؟

افصل الحالة قصيرة الأمد عن الذاكرة طويلة الأمد ، واجعل LLM بلا حالة. - استخدم الحالة قصيرة الأمد لكل ما يلزم لإتمام المهمة الحالية: الهدف النشط، الخطوة الحالية، مخرجات الأدوات، وأعداد المحاولات المتبقية. - خزّن الذاكرة طويلة الأمد (مثل ملف المستخدم، تاريخ المشروع) في مخزن خارجي مع مخططات مُهيكلة ، لا كسجلات نصية. - اعتبر LLM دالة نقية فوق كائن حالة صريح: احمل الحالة ذات الصلة، ابن المطالبة، استدعِ النموذج، ثم احفظ الحالة المحدثة. تجنّب استخدام السجلات الخام أو سجل المحادثة كـ "ذاكرة"؛ اشتق سجلات مهيكلة صغيرة منها مع قواعد احتفاظ وخصوصية واضحة.

تسجيل الدخول ابدأ الآن

تصميم أنظمة عاملية لا تنهار في الإنتاج | Koder.ai

من عروض مبهرة إلى وكلاء هشّون في الإنتاج

الأنظمة العاملية هي تطبيقات حيث لا يكتفي نموذج اللغة الكبير بالإجابة على مطالبة، بل يقرر ما الذي ينبغي فعله تاليًا: أي أدوات يستدعي، أي بيانات يجلب، أي خطوات ينفذ، ومتى يُعلن أنه "انتهى". تجمع هذه الأنظمة بين نموذج، ومجموعة أدوات (واجهات برمجة، قواعد بيانات، خدمات)، حلقة تخطيط/تنفيذ، وبنية تحتية تصل كل شيء ببعضه.

في العرض التوضيحي، يبدو هذا سحريًا: يضع الوكيل خطة، يستدعي بعض الأدوات، ويعيد نتيجة مثالية. مسار السعادة قصير، الكمون منخفض، ولا شيء ينهار في نفس الوقت.

لماذا تعمل عروض العروض ويتوقف الإنتاج

تحت أحمال حقيقية، يتعرض نفس الوكيل لضغوط لم يشهدها العرض التوضيحي:

واجهات برمجة التطبيقات تتأخر، تُرجِع بيانات جزئية، أو تغير عقودها.
عدة طلبات تتسابق على موارد مشتركة وتفسد الحالة.
المحادثات طويلة الأمد تُضخم الذاكرة وتتجاوز حدود السياق.
أخطاء نموذجية دقيقة تتراكَم عبر العديد من استدعاءات الأدوات.

النتيجة: سلوك متقلب يصعب إعادة إنتاجه، فساد بيانات صامت، وتدفقات مستخدمين تتوقف أو تدور إلى ما لا نهاية بين الحين والآخر.

الأثر التجاري الحقيقي

الوكلاء المتقلبون لا يؤثرون فقط على "سعادة" المستخدم؛ بل:

يسببون حوادث واستدعاءات فريق النوبة.
ينتجون إجابات خاطئة تتسلّل إلى أنظمة لاحقة.
يقوّضون ثقة المستخدم: يتوقف الناس تدريجيًا عن الاعتماد على الميزة.
يزيدون فواتير السحابة عبر عمليات إعادة المحاولة والحلقات الجارية.

ما سيركز عليه هذا الدليل

هذا المقال حول أنماط هندسية، ليس "مطالبات أفضل". سننظر إلى آلات الحالة، عقود الأدوات الصريحة، استراتيجيات إعادة المحاولة ومعالجة الفشل، التحكم في الذاكرة والتزامن، وأنماط المراقبة التي تجعل الأنظمة العاملية متوقعة تحت الحمل — وليس فقط مبهرة على المسرح.

لماذا تنهار معظم بنى الوكلاء عند النطاق

معظم أنظمة الوكلاء تبدو جيدة في عرض توضيحي لمجرى السعادة الواحد. تفشل عندما تأتي حركة المرور والأدوات وحالات الحافة معًا.

سلوكيات هشة: حلقات، توقفات، عمل جزئي، أخطاء صامتة

التنسيق السطحي يفترض أن النموذج سيـ"يفعل الشيء الصحيح" في استدعاء أو اثنين. تحت الاستخدام الحقيقي، ترى أنماطًا متكررة:

حلقات: يستمر الوكيل في إعادة التخطيط أو إعادة استدعاء نفس الأداة لأنه لا يتعرّف على الاكتمال أو الفشل.
توقفات: ينتظر الوكيل أداة أو مهمة فرعية بلا مهلة، تاركًا جلسات المستخدم معلقة.
عمل جزئي: يكمل الوكيل نصف سير العمل (مثلاً، يصوغ بريدًا إلكترونيًا لكنه لا يرسله، أو ينتج خطة لكنه لا ينفذ الخطوات).
أخطاء صامتة: تفشل الأدوات أو تختلف المخططات، لكن الوكيل يعيد بثقة إجابة محتملة مع بيانات مفقودة أو خاطئة.

دون حالات صريحة وشروط نهاية، تصبح هذه السلوكيات حتمية.

عدم الحتمية الخفيّة وعدم موثوقية الأدوات

التعيين العشوائي لنماذج LLM، تفاوت الكمون، وتوقيت الأدوات يخلق عدم حتمية خفيّة. نفس المدخل قد يسلك فروعًا مختلفة، يستدعي أدوات مختلفة، أو يفسر نتائج الأدوات بطرق متباينة.

عند النطاق، تسود مشاكل الأدوات:

المهلات والتقلب من واجهات الجهات العليا وقواعد البيانات
انجراف المخططات بين عقود الأدوات وما تُرجعه الخدمات فعليًا
صيغ أخطاء غير متسقة لم يتعلّم الوكيل كيفية التعامل معها

كل واحد من هذه يؤدي إلى حلقات عشوائية، عمليات إعادة محاولة، أو إجابات نهائية غير صحيحة.

التزامن يضخم حالات الحافة وعدم مطابقة المنتج

ما لا ينهار كثيرًا عند 10 طلبات في الثانية سينهار باستمرار عند 1,000 طلب في الثانية. يكشف التزامن عن:

حالات سباق على الحالة المشتركة أو التخزين المخبأ
نفاد حدود المعدل مما يسبب فشل الأدوات المتتابع
سرب ثيران من المحاولات يُشغّلها تباطؤ تبعية واحدة

فرق المنتج تتوقع غالبًا تدفقات عمل حتمية، مستويات خدمة واضحة، وقابلية للتتبع. يقدم الوكلاء، إذا تُركوا بلا قيد، سلوكًا احتماليًا وبأفضل جهد مع ضمانات ضعيفة.

عندما تتجاهل البنى هذا التعارض — تعامل الوكلاء كخدمات تقليدية بدلًا من مخطّطي احتمالات — تتصرف الأنظمة بشكل غير متوقع تمامًا عندما تكون الموثوقية مهمة أكثر.

مبادئ التصميم لأنظمة عاملية جاهزة للإنتاج

الوكلاء الجاهزون للإنتاج أقل ارتباطًا بـ "مطالبات ذكية" وأكثر ارتباطًا بتصميم نظم منضبط. طريقة مفيدة للتفكير فيهم هي كآلات صغيرة متوقعة تستدعي LLM أحيانًا، لا ككتل غامضة من LLM تلمس أنظمتك أحيانًا.

ما الذي يجعل الوكيل جاهزًا للإنتاج؟

أربع خصائص مهمة:

الأمان: يجب أن يحترم الوكيل قيود الوصول إلى البيانات، الآثار الجانبية، ووعود المستخدم. هذا يعني أذونات صريحة، حراس على الأدوات، ومعالجة حذرة للمخرجات غير الموثوقة.
قابلية التنبؤ: لنفس المدخلات والحالة، يجب أن يتصرف الوكيل ضمن نطاق ضيق متوقع. يجب أن تقدر أن تشرح ما يمكنه وما لا يمكنه فعله.
قابلية التصحيح: عندما يحدث خطأ، يمكنك تتبع المسار: أي حالة، أي قرار، أي استدعاء أداة، أي استدعاء نموذج. لا حلقات مخفية، لا "أفكار" غامضة بلا بنية.
تحمّل التغيير: يمكنك ترقية النماذج، الأدوات، أو الاستراتيجيات دون إعادة كتابة النظام بأكمله.

لن تحصل على هذه الخصائص من المطالبات فقط. تحصل عليها من البنية.

فضّل سير العمل الصريح على الحلقات الحرة الشكل

النمط الافتراضي الذي يبدأ به الكثير من الفرق هو: "طالما لم ننتهِ، استدعِ النموذج، دعه يفكر، ربما يستدعي أداة، كرر". هذا سهل للنمذجة وصعب للتشغيل.

نمط أكثر أمانًا هو تمثيل الوكيل كسير عمل صريح:

عرّف مجموعة نهائية من الحالات (مثلاً COLLECTING_INPUT, PLANNING, EXECUTING_STEP, WAITING_ON_HUMAN, DONE).
عرّف الانتقالات المسموح بها بين الحالات.
استخدم LLM بشكل رئيسي لـ القرارات المحلية: اختيار الحالة التالية، اختيار أداة، أو ملء معلمات.

هذا يحوّل الوكيل إلى آلة حالة حيث يمكن فحص كل خطوة، اختبارها، وإعادة تشغيلها. الحلقات الحرة الشكل تبدو مرنة، لكن سير العمل الصريح هو ما يجعل الحوادث قابلة للتصحيح والسلوك قابلًا للتدقيق.

فكّر في "الوكيل الإلهي" إلى مهارات معيارية

الوكلاء الأحاديون الشمول الذين "يفعلون كل شيء" جذابون، لكنهم يخلقون ترابطًا قويًا بين مسؤوليات غير مرتبطة: التخطيط، الاسترجاع، منطق الأعمال، تنسيق واجهة المستخدم، والمزيد.

بدلاً من ذلك، ركب وكلاء/مهارات صغيرة ومحددة النطاق:

مخطط يجزّئ المهمات.
منفّذ ينفّذ خطوات ملموسة.
متخصص لكل مجال (الفوترة، الدعم، التحليلات، إلخ).

يمكن لكل مهارة أن تملك آلة الحالة الخاصة بها، الأدوات، وقواعد الأمان. يصبح منطق التركيب بعد ذلك سير عمل أعلى مستوى، لا مطالبة متزايدة داخل وكيل واحد.

هذه البساطة تُبقي كل وكيل قابلًا للفهم وتسمح بتطوير قدرة واحدة دون زعزعة بقية النظام.

فصل السياسة، الحالة، والأدوات

نموذج ذهني مفيد هو تقسيم الوكيل إلى ثلاث طبقات:

سياسة القرار (مطالبات LLM + النموذج)
تغطي كيف يختار الوكيل الإجراءات التالية، ضمن قيود صارمة. يجب أن تتمكن من تبديل النموذج، تعديل الحرارة، أو تحسين المطالبات دون العبث بربط النظام.
آلة الحالة / محرك سير العمل
يملك أين أنت في العملية، أي انتقالات ممكنة، وكيف تحفظ التقدم. تقترح السياسة تحركًا؛ آلة الحالة تتحقق وتطبقه.
طبقة الأدوات
تنفّذ ما يمكن أن يحدث في العالم: واجهات برمجة التطبيقات، قواعد البيانات، الطوابير، والخدمات الخارجية. تكشف الأدوات عن عقود ضيقة ومصنفة وتفرض التفويض، حدود المعدل، والتحقق من المدخلات.

بفرض هذا الفصل، تتجنب فخ إخفاء منطق الأعمال داخل المطالبات أو أوصاف الأدوات. يصبح LLM مكوّن قرار داخل غلاف حتمي واضح، لا الغلاف نفسه.

صمّم من أجل الصغر والوضوح

أكثر الأنظمة العاملية موثوقية ليست أكثرها إثارة — بل تلك التي يمكنك شرح سلوكها على سبورة بيضاء.

عمليًا:

اجعل كل وكيل مركزًا على وظيفة واحدة ومؤشر نجاح واحد.
رمّز سير العمل وانتقالات الحالة صراحة بدلًا من النص الحر.
اجعل نماذج LLM تختار بين خيارات محددة جيدًا، لا تختلق إجراءات كاملة من الصفر.

الميول نحو وكلاء صغار، مركّبون، ومنظمون جيدًا هو ما يسمح للأنظمة بالنمو دون الانهيار تحت ثقل التعقيد.

نمذجة تدفقات عمل الوكيل كآلات حالة صريحة

تبدأ معظم تطبيقات الوكلاء كحلقة "فكر، افعل، لاحظ" حول استدعاء LLM. هذا مقبول للعروض، لكنه يتحول سريعًا إلى غامض وهش. نهج أفضل هو اعتبار الوكيل آلة حالة صريحة: مجموعة نهائية من الحالات، مع انتقالات معرفة تُنفَّذ عبر أحداث.

تمثيل تدفقات الوكيل كحالات وانتقالات

بدلاً من ترك النموذج يقرر ضمنيًا ما التالي، عرّف مخطط حالة صغير:

PLAN – تفسير طلب المستخدم، تجزئة المهمة، واختيار الأدوات.
CALL_TOOL – تنفيذ استدعاء أداة واحد (أو دفعة) بمدخلات مُحقَّقة.
VERIFY – فحص مخرجات الأدوات مقابل بديهات بسيطة أو فحوصات نموذجية إضافية.
RECOVER – معالجة الأخطاء: إعادة المحاولة، التراجع إلى بديل، أو التصعيد.
DONE – إعادة إجابة نهائية وإغلاق سير العمل.
FAILED – خطأ نهائي مع سبب وسياق واضح.

تُطلِق الانتقالات بين هذه الحالات أحداث مَكتوبة مثل UserRequestReceived, ToolCallSucceeded, ToolValidationFailed, TimeoutExceeded, أو HumanOverride. كل حدث، مع الحالة الحالية، يحدد الحالة التالية والإجراءات.

هذا يجعل المحاولات والمهلات مباشرة: تُرفَق سياسات بحالات فردية (مثلاً CALL_TOOL قد يعيد المحاولة 3 مرّات بتراجع أُسِّي، بينما PLAN قد لا يُعاد المحاولة إطلاقًا) بدلًا من نشر منطق إعادة المحاولة عبر الشيفرة.

خارجية الحالة للمرونة والنطاق

خزّن الحالة الحالية والسياق القليل الضروري في مخزن خارجي (قاعدة بيانات، طابور، أو محرك سير العمل). يصبح الوكيل عندئذ دالة نقية:

next_state, actions = transition(current_state, event, context)

هذا يمكّن من:

المتانة – إذا مات عامل أثناء التشغيل، يمكن لآخر استئناف العمل من آخر حالة محفوظة.
التحجيم الأفقي – عمال بلا حالة يستهلكون أحداثًا، يحدثون الحالة، ويصدرون أحداثًا تالية.
الإعادة والتعويض – يمكنك إعادة تجسيد تشغيل، إعادة قيادته من أي حالة، أو تنفيذ إجراءات تعويضية عندما يجب التراجع عن تدفق.

فوائد للتفكير والمراجعات

مع آلة حالة، كل خطوة من سلوك الوكيل صريحة: أي حالة، أي حدث وقع، أي انتقال نفّذ، وأي آثار جانبية أنتجت. هذه الوضوح يسرّع التصحيح، يبسط تحقيق الحوادث، ويخلق أثر تدقيق طبيعي للامتثال. يمكنك إثبات، من السجلات وتاريخ الحالة، أن إجراءات خطرة معينة تُؤخذ فقط من حالات محددة وتحت شروط معرّفة.

تصميم عقود أدوات موثوقة للوكلاء

يتصرف الوكلاء بشكل أكثر توقعًا عندما تبدو الأدوات أقل كـ "واجهات مخفية في نص" وأكثر كواجهات جيدة التصميم مع ضمانات صريحة.

عرّف العقد، لا فقط المطالبة

يجب أن تشتمل كل أداة على عقد يغطي:

مخطط الإدخال: الحقول المطلوبة، الأنواع، القيم المحددة، القيود، الافتراضات.
مخطط الإخراج: حمولة النجاح، الحقول القابلة للعدم، وماذا يعني "لا نتيجة".
نموذج الخطأ: أخطاء مكتوبة (مثلاً InvalidInput, NotFound, RateLimited, TransientFailure) مع دلالات واضحة.
اتفاقيات مستوى الخدمة (SLAs): توقعات الكمون، أهداف التوافر، وحدود المعدل.

عرّض هذا العقد للنموذج كوثائق مُهيكلة، لا كتلة نصية كبيرة. يجب أن يعرف مخطط الوكيل أي الأخطاء قابلة لإعادة المحاولة، أيها يتطلب تدخل المستخدم، وأيها يوقِف سير العمل.

JSON صارم، تحقق صارم

عامل مدخلات ومخرجات الأدوات كما أي واجهة إنتاجية:

استخدم مخططات JSON صارمة (مثلاً OpenAPI, JSON Schema) للمدخلات والمخرجات.
حقّق قبل الاستدعاء (لاكتشاف أخطاء النموذج) وبعده (لاكتشاف تراجعات الأداة).
أصلِح مشاكل طفيفة تلقائيًا (مثلاً تحويل الأنواع) لكن سجّلها للتعديل لاحقًا.

هذا يسمح بتبسيط المطالبات: بدلًا من تعليمات وصفية مطولة، اعتمد على توجيه يقوده المخطط. القيود الواضحة تقلل الحشو والنداء لأدوات هلوغرافية وتسلسل استدعاءات غير منطقي.

الإصدار والتوافق

تتطور الأدوات؛ يجب ألا تنهار الوكلاء في كل مرة يحدث فيها هذا.

version أدوات (v1, v1.1, v2) وثبّت الوكلاء على إصدار.
جرّح الحقول تدريجيًا؛ احتفظ بالحقول القديمة قابلة للقراءة لفترة.
أضف حقولًا بطريقة متوافقة للأمام؛ تجنّب تغيير الدلالات بصمت.

يمكن لمنطق التخطيط بعد ذلك مزج وكلاء وأدوات بمستويات نضج مختلفة بثقة.

معالجة الفشل والأوضاع المتدهورة

صمّم العقود مع وضع الفشل الجزئي في الحسبان:

أذن بالنتائج الجزئية مع تفاصيل خطأ لكل عنصر.
عرّف استجابة متدهورة (مثلاً بيانات مخبأة، تقريبية، أو قديمة) بدلًا من الفشل الصريح.
علّم أي الحقول "أفضل جهد" وأيها "يجب توافره".

بإمكان الوكيل عندئذ التكيّف: متابعة سير العمل بوظائف أقل، طلب تأكيد المستخدم، أو التحول إلى أداة بديلة.

حدود الأمان والتفويض

عقود الأدوات مكان طبيعي لترميز حدود الأمان:

حدد نطاق ما يُسمح للأداة بقراءته أو تعديله.
اطلب معلمات صريحة للعمليات الحساسة (مثلاً confirm: true).
ميز بين العمليات بنطاق المستخدم وعمليات بنطاق النظام.

ادمج هذا مع فحوصات على الخادم؛ لا تعتمد فقط على انضباط النموذج في "التصرّف".

لماذا تبسّط العقود الجيدة الوكلاء

عندما تمتلك الأدوات عقودًا واضحة ومتحقق منها ومُرقَّمة، تصبح المطالبات أقصر، يصبح التنسيق أبسط، ويصبح التصحيح أسهل بكثير. تنقل التعقيد من تعليمات اللغة الطبيعية الهشة إلى مخططات وسياسات حتمية، مما يقلل من استدعاءات أدوات هلوسية وآثار جانبية غير متوقعة.

أنماط إعادة المحاولة، القدرة على التكرار، ومعالجة الفشل

احتفظ بملكية الكود بالكامل

صدّر الكود المصدري وادمجه في مستودعاتك وأنابيب النشر.

صدّر الكود

تفترض الأنظمة العاملية الموثوقة أن كل شيء سيفشل في مرحلة ما: النماذج، الأدوات، الشبكات، حتى طبقة التنسيق الخاصة بك. الهدف ليس تجنّب الفشل، بل جعله رخيصًا وآمنًا.

القدرة على التكرار: أساس المحاولات الآمنة

القدرة على التكرار تعني: تكرار نفس الطلب يعطي نفس الأثر الظاهر خارجيًا كما لو نُفذ مرة واحدة. هذا مطلوب لوكلاء LLM الذين يعيدون غالبًا إصدار استدعاءات الأدوات بعد فشل جزئي أو استجابة غامضة.

اجعل الأدوات قابلة للتكرار عبر التصميم:

معرفات الطلب: يحتوي كل استدعاء أداة على request_id ثابت. تخزن الأداة هذا وتُرجع نفس النتيجة إذا رأت المعرف مرة أخرى.
عمليات upsert بدلًا من insert: استخدم معاني "أنشئ أو حدّث" مفصولة بمفتاح أعمال طبيعي أو مركب، لا معرف تزايدي تلقائي.
التحققات والترقيم: أرفق تجزئات محتوى أو أرقام إصدار لتمكين الأداة من اكتشاف التكرارات أو الكتابات المتعارضة.

استراتيجيات المحاولة التي لا تفجّر التكاليف

استخدم محاولات منظمة للأخطاء العابرة (المهلات، حدود المعدل، 5xx): تراجع أسي، تشويش لتجنّب سرب المحاولات، وحد أقصى محاولات صارم. سجّل كل محاولة بمعرّفات ترابط حتى يمكنك تتبّع سلوك الوكيل.

لأخطاء دائمة (4xx، أخطاء التحقق من الصحة، انتهاكات قواعد الأعمال)، لا تعيد المحاولة. أبلِغ الوكيل بخطأ مُهيكل حتى يعيد التخطيط، يطلب من المستخدم، أو يختار أداة مختلفة.

قواطع الدائرة والبدائل

نفّذ قواطع دائرة على مستوى الوكيل والأدوات: بعد تكرار الفشل، احظر استدعاءات تلك الأداة مؤقتًا وافشل بسرعة. اقترن هذا بوضع بدائل محددة: أوضاع متدهورة، بيانات مخبأة، أو أدوات بديلة.

تجنّب المحاولات العمياء من حلقة الوكيل. بلا أدوات قابلة للتكرار وفئات فشل واضحة، ستضاعف فقط الآثار الجانبية والكمون والتكلفة.

إدارة الذاكرة، الحالة، واتساق البيانات للوكلاء

الوكلاء الموثوقون يبدأون بتفكير واضح حول ما هي الحالة وأين تعيش.

الحالة قصيرة الأمد مقابل الذاكرة طويلة الأمد

عامل الوكيل كما تفعل خدمة تعالج طلبًا:

الحالة قصيرة الأمد: كل ما يلزم لإكمال المهمة الحالية أو المهمة الفرعية. يشمل الهدف النشط، الخطوة الحالية، مخرجات الأدوات، القرارات الجزئية، ومتغيرات الضبط (عدد المحاولات المتبقية، الفرع المختار، إلخ). يجب أن تكون محدودة النطاق وقابلة للإلقاء عند انتهاء سير العمل.
الذاكرة طويلة الأمد: معلومات يجب أن تبقى عبر الجولات والجلسات: ملفات تعريف المستخدم، تفضيلات، قرارات سابقة، تاريخ المشروع، واختصارات متعلمة.

خلط هذين يؤدي إلى ارتباك وأخطاء. مثلاً، وضع نتائج أدوات مؤقتة في "الذاكرة" يجعل الوكلاء يعيدون استخدام سياق قديم لاحقًا.

أين تخزن الحالة

لديك ثلاث خيارات رئيسية:

ضمن السياق (المطالبة فقط) – بسيط، كمون منخفض، لكنه محدود وغير دائم. مناسب للحالة قصيرة الأمد داخل تنفيذ واحد.
مخزن خارجي – قاعدة بيانات، تخزين مخبأ، أو متجر متجهات. استخدمه للذاكرة طويلة الأمد وأي حالة يجب أن تصمد عبر إعادة التشغيل أو تنسيق العمال.
هجين – اجعل الحالة الموثوقة خارجيًا؛ حمّل فقط ما تحتاجه داخل السياق للخطوة التالية.

قاعدة جيدة: LLM دالة بلا حالة على كائن حالة صريح. احفظ هذا الكائن خارج النموذج وأعد توليد المطالبات منه.

تجنّب مُضاد النمط "السجلات كذاكرة"

نمط فشل شائع هو استخدام سجلات المحادثة، الآثار، أو المطالبات كذاكرة افتراضية.

المشاكل:

الاسترجاع يصبح ارتجاليًا وهشًا.
الحقائق المهمة تُدفن في نص طويل.
قد تتناقض عدة تشغيلات دون فائز واضح "آخر كتابة تكسب".

بدلًا من ذلك، عرّف مخططات ذاكرة مُهيكلة: user_profile, project, task_history، إلخ. استخلص السجلات من الحالة، لا العكس.

التناسق مع البيانات والأدوات المشتركة

عندما تُحدّث أدوات أو وكلاء متعددون نفس الكيانات (مثلاً سجل CRM أو حالة تذكرة)، تحتاج ضوابط تناسق أساسية:

استخدم مصادر حقائق مفردة للكيانات الأساسية (مثلاً: طلب، تذكرة، مستند).
فضّل عقود أدوات قابلة للتكرار: الأدوات يجب أن تتعامل بأمان مع المحاولات عبر معرفات ثابتة وعمليات upsert.
طبّق التزامن التفاؤلي (أرقام إصدار، طوابع زمنية) عندما قد تتسابق وكلاء لتحديث نفس السجل.

للعمليات عالية القيمة، سجّل سجل قرارات منفصلًا عن سجل المحادثة: ماذا تغيّر، لماذا، واستنادًا إلى أي مدخلات.

لقطات وتنفيذ قابل للاستئناف

للبقاء على قيد الحياة أثناء الانهيارات، النشر، وحدود المعدل، يجب أن تكون التدفقات قابلة للاستئناف:

بعد كل خطوة مهمة، احفظ لقطة حالة: الخطوة الحالية، المدخلات، نتائج الأدوات، والإجراءات المعلقة.
اجعل كل انتقال في آلة الحالة قابلًا لإعادة التشغيل من اللقطة.
عند الفشل أو إعادة التشغيل، أعد تحميل آخر لقطة واستأنف بدلًا من البدء من الصفر.

هذا يمكّن أيضًا من تصحيح عبر الزمن: يمكنك فحص وإعادة تشغيل الحالة الدقيقة التي أدت إلى قرار سيئ.

الخصوصية، الاحتفاظ، والذاكرة الدنيا

الذاكرة مسؤولية بقدر ما هي ميزة. للوكلاء الإنتاجيين:

حدّد صراحة ما يجب ألا يُخزن مطلقًا (مثل الأسرار، المستندات الخام، معلومات تعريف شخصية حساسة). استخدم التنقيح أو التجزئة حيث يناسب.
عرّف سياسات احتفاظ لكل نوع ذاكرة (مستوى الجلسة، 30 يومًا، حجز قانوني، إلخ).
امنح المستخدمين ضوابط لعرض وحذف ذاكرتهم طويلة الأمد.
تجنّب تخزين المطالبات الكاملة أو مدخلات الأدوات عندما يكفي ملخّص مهيكل أصغر.

عامل الذاكرة كسطح منتج: مصمَّم، مُرقَّم، ومحكوم — ليس مجرد ركام نصي متزايد مُلحق بوكيلك.

التزامن، حدود المعدل، والضغط العكسي في أنظمة الوكلاء

يبدو الوكلاء متسلسلين على السبورة، لكنهم يتصرفون كنظم موزعة تحت حمل حقيقي. بمجرد أن يكون لديك العديد من المستخدمين المتزامنين، الأدوات، والوظائف الخلفية، ستتعامل مع حالات سباق، عمل مكرر، ومشاكل ترتيب.

مخاطر التزامن في تدفقات الوكيل

أوضاع فشل شائعة:

حالات سباق: تنفيذان لوكيلين يحدثان تحديثًا متزامنًا على نفس التذكرة أو المستند، فيكتب كل منهما فوق الآخر.
عمل مكرر: استدعاءات معاد محاولة أو عمال غير مهيئين يعالجون نفس المهمة مرتين (مثلاً، خصم مزدوج لدفعة).
آثار غير مرتبة: تنتهي استدعاءات الأدوات بترتيب غير متوقع، فيكتب نتيجة قديمة فوق الحالة الأحدث.

تخفف هذه بمزيج من عقود أدوات قابلة للتكرار، حالة سير عمل صريحة، وقفل تفاؤلي/تشاؤمي في طبقة البيانات.

قوائم الانتظار مقابل التدفقات المتزامنة

التدفق التزامني طلب–استجابة بسيط لكن هش: كل تبعية يجب أن تكون متاحة وفي حدود المعدل وسريعة. عندما يتفرع الوكيل إلى عدة أدوات أو مهام فرعية متوازية، انقل الخطوات طويلة التشغيل أو ذات الآثار الجانبية خلف قائمة انتظار.

تمكّنك التنظيم عبر قوائم الانتظار من:

التحكم في التزامن عبر تجمعات عمال
تركيز محاولات وإلغاء التكرار
عزلة الأدوات البطيئة أو المتقلبة عن الكمون الموجّه للمستخدم

حدود المعدل والضغط العكسي

عادةً ما يصطدم الوكلاء بثلاث فئات من الحدود:

النماذج: توكنات في الدقيقة، طلبات في الدقيقة، حجم السياق
الأدوات: خدمات داخلية مع قيود QPS أو قيود CPU
واجهات الجهات العليا: حصص طرف ثالث وقيود صارمة

تحتاج طبقة حدود معدل صريحة مع حصص per-user، per-tenant، وعالمية. استخدم دلاء توكن أو دلاء مسربة لتطبيق السياسات، وعرّف أخطاء واضحة (مثلاً RATE_LIMIT_SOFT, RATE_LIMIT_HARD) حتى يتراجع الوكلاء بهدوء.

الضغط العكسي هو كيف يحمي النظام نفسه تحت الضغط. استراتيجيات تشمل:

التفريق عن المرور غير الحرج أولًا
خفض الميزات (سياقات أصغر، استدعاءات أدوات أقل)
إيقاف قوائم الانتظار منخفضة الأولوية بينما تبقي التدفقات الحرجة متحركة

راقب إشارات التشبّع: عمق القوائم، استغلال العمال، ومعدلات أخطاء/كمون الأدوات والنماذج. ارتفاع القوائم مع زيادة الكمون أو أخطاء 429/503 هي إنذار مبكر أن الوكلاء يتجاوزون بيئتهم.

المراقبة: التتبّع، المقاييس، والسجلات لسلوك الوكيل

اجعل إعادة المحاولة آمنة

أضف معرفات طلب متكافئة التأثير (idempotent) وأنماط إعادة محاولة آمنة في منطق الخدمة.

أنشئ مشروعًا

لا يمكنك جعل وكيل موثوقًا إذا لم تستطع الإجابة على سؤالين بسرعة: ماذا فعل؟ ولماذا فعل ذلك؟ المراقبة للأنظمة العاملية تجعل تلك الإجابات رخيصة ودقيقة.

ما الذي تحتاج أن تراه

صمّم المراقبة بحيث أن مهمة واحدة لها تتبّع يمر عبر:

كل خطوة وكيل وانتقال حالة
كل استدعاء أداة وردّها
كل استدعاء نموذج ونموذج المطالبة المستخدم

أرفق داخل ذلك التتبّع سجلات مُهيكلة للقرارات الرئيسية (اختيار المسار، مراجعة الخطة، تشغيل الحماية) ومقاييس للحجم والصحة.

تتبّع مفيد عادةً يحتوي على:

بيانات التعريف للمهمة: المستأجر، المستخدم، القناة، الأولوية
حالة الوكيل: اسم الحالة الحالي، الحالة التالية، عدد المحاولات
مدخلات/مخرجات الأداة: المدخلات، المخرجات، الكمون، الأخطاء، حالة قاطع الدائرة
منادات النموذج: معرف قالب المطالبة، اسم النموذج، عدادات التوكن، الكمون

التسجيل والتنقيح

سجّل المطالبات، مدخلات الأدوات، ومخرجاتها بصيغة مُهيكلة، لكن مررها أولًا عبر طبقة تنقيح:

أخفِ PII والأسرار
اقتطع الحِمولات الضخمة مع وضع تجزئة للربط
علّم الحقول بمستويات حساسية للتحكم بالاحتفاظ والوصول

أبقِ المحتوى الخام خلف مفاتيح ميزة في بيئات التطوير؛ افتراضيًا يجب أن تعرض الإنتاج وجهات نظر منقّحة.

مقاييس ذات معنى

على الأقل، تتبّع:

معدل نجاح/فشل المهام حسب الوكيل وحالة الاستخدام
متوسط وعدد الخطوات (P95) لكل مهمة
الكمون: من طرف إلى طرف وحسب أداة/نموذج
تكلفة كل مهمة (توكنات، إنفاق الأدوات) وكل نتيجة ناجحة

عند حدوث حادث، تسمح التتبّعات والمقاييس الجيدة بالانتقال من "الوكيل يبدو هشًا" إلى بيان دقيق مثل: "P95 المهام تفشل في ToolSelection بعد محاولتين بسبب مخطط جديد في billing_service"، ما يقلل وقت التشخيص من ساعات إلى دقائق ويعطي أدوات ضبط ملموسة.

استراتيجيات الاختبار والتقييم للأنظمة العاملية

اختبار الوكلاء يعني اختبار كلٍ من الأدوات التي يستدعونها والتدفقات التي تربط كل شيء معًا. عامله كاختبار نظم موزعة، لا مجرد تعديل للمطالبات.

اختبارات الوحدة: عقود الأدوات، لا المطالبات

ابدأ باختبارات وحدة عند حد الأدوات:

تحقق من المخططات: الحقول المطلوبة، القيم، والمدى والثوابت.
اختبر القدرة على التكرار وسيمانتكس الأخطاء (ما الأخطاء، ما الرموز، وما قابلية إعادة المحاولة).
تأكد من أن الأدوات تتعامل مع مدخلات مشوهة برفق وتعيد أخطاء مُهيكلة.

هذه الاختبارات لا تعتمد أبدًا على LLM. تنادي الأداة مباشرة بمدخلات تركيبية وتتحقق من المخرجات أو عقد الخطأ بالضبط.

اختبارات التكامل: التدفقات والسلوك متعدد الخطوات

تختبر اختبارات التكامل سير عمل الوكيل من الطرف إلى الطرف: LLM + أدوات + التنسيق.

نمذجها كاختبارات مبنية على سيناريو:

مسارات سعيدة للرحلات الأساسية للمستخدم (حجز، استرداد، تصعيد، إلخ).
حالات الحافة: بيانات مفقودة، فشل أدوات جزئي، مهلات، حدود المعدل.
تفاعلات عبر الأدوات: عندما تغذي مخرجات الأداة A الأداة B.

تؤكد هذه الاختبارات انتقالات الحالة واستدعاءات الأدوات، لا كل توكن من كلمات LLM. تحقّق من: أي أدوات استُدعيت، بأي معاملات، بأي ترتيب، وما النتيجة النهائية/الحالة التي وصل إليها الوكيل.

تثبيت بيانات ثابتة للنموذج والأدوات

للحفاظ على تكرارية الاختبارات، ثبّت ردود LLM ومخرجات الأدوات.

سجّل ردود LLM مرة واحدة (لكل مطالبة + نموذج + إعداد) واحفظها كملفات مرجعية JSON.
موّكِ الأنظمة الخارجية خلف الأدوات حتى لا تضرب الخدمات الحية في الاختبارات.
استخدم بذورًا صريحة وإعدادات حرارة ثابتة في الاختبارات.

نمط شائع:

with mocked_llm(fixtures_dir="fixtures/llm"), mocked_tools():
    result = run_agent_scenario(input_case)
    assert result.state == "COMPLETED"

مجموعات الانحدار للمطالبات والمخططات

يجب أن يُثير كل تغيير في مطالبة أو مخطط مجموعة انحدار إلزامية:

احتفظ بمجموع مدخلات مروّسة + حالات متوقعة، تتتبّع، أو تصنيفات.
اجعل هذه الملفات ذهبية؛ الاختلافات تظهر تغيّر السلوك.
صادق أو تراجع صراحة عن أي انحراف في التدفقات الحرجة.

تطور المخططات (إضافة حقول، تشديد الأنواع) يحصل له اختبارات انحدار خاصة لالتقاط الوكلاء أو الأدوات التي لا تزال تفترض العقد القديم.

التقييم غير المتصل قبل النشر

لا تُدشّن نموذجًا جديدًا، سياسة، أو استراتيجية توجيه مباشرةً إلى إنتاج.

بدلًا من ذلك:

أعد تشغيل مجموعة الانحدار غير المتصلة ضد التكوين الجديد.
أجرِ اختبارات إعادة تشغيل على عينات من التفاعلات التاريخية.
احسب مقاييس تلقائية (نجاح المهمة، معدلات أخطاء الأدوات، الكمون، التكلفة) وعند الحاجة قيّم بعينات بشرية.

فقط بعد اجتياز بوابات غير متصلة يجب أن يصل الإصدار إلى الإنتاج، ويفضل خلف أعلام ميزة وإطلاق تدريجي.

إدارة بيانات الاختبار والتعمية

سجلات الوكلاء غالبًا تحتوي بيانات حساسة. يجب أن يحترم الاختبار ذلك.

كوّن مجموعات اختبار من مدخلات مجهولة أو تركيبية.
اقطع أو جزّء المعرفات، النص الحر الحاوي PII، والأسرار قبل تخزين السجلات أو المراجع.
قسم الوصول: يمكن للمهندسين رؤية آثار السلوك، لكن ليس الأسرار الخام للمستخدمين.

رمّز هذه القواعد كجزء من خط CI بحيث لا يمكن إنشاء أو تخزين أثر اختبار دون فحوصات تعمية.

تشغيل، مراقبة، وتطوير الوكلاء في الإنتاج

شغّل الوكلاء على الأجهزة المحمولة

أنشئ تطبيقًا بـ Flutter لتشغيل سير عمل الوكلاء على الأجهزة المحمولة.

ابنِ تطبيقًا محمولًا

تشغيل الوكلاء في الإنتاج أقرب إلى إدارة نظام موزع من نشر نموذج ثابت. تحتاج ضوابط للنشر، أهداف موثوقية واضحة، وإدارة تغيير منضبطة.

استراتيجيات نشر آمنة

قدّم وكلاء أو سلوكيات جديدة تدريجيًا:

وضع الظل: شغّل الوكيل جنبًا إلى جنب مع النظام القائم، سجّل قراراته، لكن لا تؤثر على المستخدمين. قارن النتائج خارج الخط.
قَنابر (Canaries): عرّض جزءًا صغيرًا محددًا من الحركة (مثلاً 1–5%) لإصدار الوكيل الجديد. راقب معدلات الخطأ، الكمون، والجودة قبل التوسيع.
اختبارات A/B: لتدفقات وجه المستخدم، قارن الوكيل الجديد بالقديم على مقاييس العمل، ليس فقط مقاييس النموذج.

ادعم كل هذا بأعلام ميزة وسياسات قابلة للتكوين: قواعد التوجيه، الأدوات المفعّلة، الحرارة، إعدادات الأمان. يجب أن تكون التغييرات قابلة للنشر عبر التكوين، لا الشيفرة، وقابلة للعكس فورًا.

SLOs وسير عمل الحوادث

عرّف SLOs تعكس صحة النظام وقيمة المستخدم:

الموثوقية: معدل نجاح المهام، استدعاءات الأدوات، وتدفقات الطرف إلى الطرف.
الكمون: p50/p95 للمسارات الحرجة.
الجودة: درجات التقييم التلقائي، توزيعات التقييم البشري، أو مؤشرات نجاح محددة بالمهمة.

اربط هذه بتنبيهات وادِر الحوادث كما لأي خدمة إنتاجية: ملكية واضحة، دفاتر تشغيل للتشخيص، وخطوات تخفيف معيارية (تراجع العلم، تصفية الحركة، وضع آمن).

التحسين المستمر والتحكم في التغيير

استخدم السجلات، التتبّعات، ونصوص المحادثات لتحسين المطالبات، الأدوات، والسياسات. عامل كل تغيير كأثر مُرقّم بمراجعة، موافقة، وقدرة على التراجع.

تجنّب تغييرات المطالبات أو الأدوات الصامتة. بلا تحكم بالتغيير لا يمكنك ربط التراجعات بتحريرات معينة، ويصبح الاستجابة للحوادث لعبة تخمين بدلًا من هندسة منهجية.

بنية مرجعية لأنظمة عاملية موثوقة

يستفيد نظام وكيل جاهز للإنتاج من فصل واضح للمسؤوليات. الهدف هو إبقاء الوكيل ذكيًا في اتخاذ القرار، لكن غبيًا في البنية التحتية.

المكوّنات الأساسية

1. البوابة / حافة API
نقطة دخول موحدة للعملاء (التطبيقات، الخدمات، واجهات المستخدم). تتعامل مع:

المصادقة والتفويض (مستخدم، خدمة، مستأجر)
حدود المعدل والحصص
تشكيل الطلب (مخططات، حدود الحجم، تحقق أساسي)

2. المنسق (Orchestrator)
المنسق هو "جذع الدماغ"، لا الدماغ. ينسق:

المخطط: يترجم نية المستخدم إلى سير عمل أو آلة حالة
منسق الحالة: ينفّذ ذلك السير، يتتبع الحالة، يتعامل مع المحاولات والمهلات
محرك السياسات: يفرض الأمان، الامتثال، الأدوات المسموح بها، قواعد PII، وميزانيات التكلفة

تعيش نماذج LLM خلف المنسق، تُستخدم من قبل المخطط وبواسطة أدوات محددة تحتاج فهم اللغة.

3. طبقة الأدوات والتخزين
يبقى منطق الأعمال في خدمات الميكرو الحالية، الطوابير، وأنظمة البيانات. الأدوات هي أغلفة رقيقة حول:

خدمات داخلية عبر HTTP/gRPC
قواعد بيانات، متاجر متجهات، ذاكرات مخبأة
واجهات خارجية

يستدعي المنسق الأدوات عبر عقود صارمة، بينما تظل أنظمة التخزين مصدر الحقيقة.

التكامل، الضوابط، والقياسات

فرض المصادقة والحصص عند البوابة؛ وفرض الأمان، وصول البيانات، والسياسة في المنسق. تصدر كل الاستدعاءات (LLM والأدوات) قياسات مُهيكلة إلى خط أنابيب يغذي:

تتبعات لسلوك خطوة بخطوة
مقاييس لـ SLOs وحدود المعدل
سجلات تدقيق للأمن والامتثال
محاسبة التكلفة بحسب المستخدم، المشروع، والأداة

بنية أبسط (بوابة → منسق واحد → أدوات) أسهل في التشغيل؛ إضافة مخططات منفصلة، محركات سياسة، وبوابات نماذج يزيد المرونة بتكلفة تنسيق أعلى، كمون، وتعقيد تشغيلي.

جمع الأمور معًا والخطوات التالية لفريقك

الآن لديك المكوّنات الأساسية لوكلاء يتصرفون بتوقع تحت حمل حقيقي: آلات حالة صريحة، عقود أدوات واضحة، محاولات منضبطة، ومراقبة عميقة. الخطوة النهائية هي تحويل تلك الأفكار إلى ممارسة متكررة لفريقك.

الأنماط الأساسية، في صورة واحدة

فكّر في كل وكيل كسير عمل ذو حالة:

آلة حالة تحدد الخطوات القانونية (plan → gather → act → summarize، إلخ) والانتقالات بينها.
عقود الأدوات تحدد ما يمكن لكل إجراء فعله، بمخططات صارمة، مهلات، وأسطح خطأ.
إعادة المحاولة والقدرة على التكرار تحمي كل تفاعل خارجي حتى تكون الإعادات آمنة ولا تُطبّق الآثار الجانبية مرتين.
المراقبة (تتبّعات، مقاييس، سجلات) تجعل كل قرار واستدعاء أداة قابلًا للشرح والتصحيح.

عندما تتوافق هذه القطع، تحصل على أنظمة تتدهور بلطف بدلًا من الانهيار تحت حالات الحافة.

قائمة تحقق خفيفة لتصنيع الوكيل للإنتاج

قبل شحن وكيل نموذجي للمستخدمين الحقيقيين، تأكد من:

سير العمل: الحالات والانتقالات صريحة؛ لا حلقات مخفية، لا سلاسل أدوات غير محدودة.
العقود: لكل أداة مدخلات/مخرجات مكتوبة بالأنواع، أوضاع فشل واضحة، ومهلات.
الأمان: حراس على المدخلات والمخرجات والإجراءات (حدود المعدل، قوائم السماح، الحصص).
المحاولات: سياسات معرّفة لكل أداة؛ مفاتيح قابلية التكرار لكل استدعاء مؤثر.
الحالة: الذاكرة والحالة المستمرة مترابطة، مُرقمة، وقابلة للاسترداد.
المراقبة: يمكنك الإجابة على "ماذا حدث؟" لأي جلسة مستخدم في تتبّع واحد.
الاختبار: لديك اختبارات مبنية على السيناريوهات بالإضافة إلى مجموعات انحدار للمطالبات، الأدوات، والسياسات.

إن كان أي بند ناقصًا، فأنت لا تزال في طور النموذج الأولي.

كيف يمكن للفرق تقسيم الملكية

إعداد مستدام عادةً يفصل:

فرق المنتج: تمتلك سلوك الوكيل، المطالبات، الأدوات الخاصة بمجالهم، ومجموعات تقييمهم.
فرق المنصة / البنية: تمتلك إطار آلة الحالة، SDKs الأدوات المشتركة، التسجيل والتتبّع، وتطبيق السياسات وبُنية التقييم المشتركة.

هذا يسمح لفرق المنتج بالتحرّك بسرعة بينما تضمن فرق المنصة الموثوقية، الأمان، وضوابط التكلفة.

امتدادات مستقبلية والتكرار الآمن

بعد تأسيس الأسس المستقرة، يمكنك استكشاف:

سياسات قائمة على التعلم: استخدام التتبّعات المسجلة لتحسين التوجيه، اختيار الأدوات، واستراتيجيات الاسترجاع.
التعلّم التعزيزي: تحسين النتائج طويلة الأمد مثل إتمام المهمة أو الإيرادات بدلًا من إجابات فردية.
تدفقات ذات ضبط ذاتي: ضبط الحرارة، الأدوات، أو الفرعيّات تلقائيًا بناءً على الأداء الملاحظ.

التقدّم هنا يجب أن يكون تدريجيًا: أدخل مكونات التعلم خلف أعلام ميزة، مع تقييم غير متصل وحواجز أمان قوية.

الموضوع المشترك طوال هذا كله هو نفسه: صمّم للفشل، فضّل الوضوح على البراعة، وكرر حيث يمكنك الملاحظة والعودة بسهولة. مع هذه القيود في مكانها، تتوقف الأنظمة العاملية عن كونها نماذج مرعبة وتصبح بنية تحتية يمكن لمؤسستك الاعتماد عليها.

الأسئلة الشائعة

ما هو النظام العامل (agentic system) وكيف يختلف عن تطبيق LLM العادي؟

نظام عامل هو تطبيق حيث لا يكتفي نموذج اللغة الكبير (LLM) بالإجابة على مطلب واحد، بل يقرر ما الذي ينبغي فعله تاليًا: أي أدوات يستدعي، أي بيانات يجلبها، أي خطوة من سير العمل ينفذ، ومتى يتوقف.

على عكس إكمال الدردشة البسيط، يجمع النظام العامل بين:

سياسة اتخاذ القرار (LLM + مطالبات)
سير عمل أو آلة حالة تتبع التقدّم
مجموعة أدوات (واجهات برمجة التطبيقات، قواعد البيانات، الخدمات)
بنية تحتية للمحاولات، حفظ الحالة، التسجيل، والمراقبة

في الإنتاج، يصبح نموذج اللغة مكوّنًا واحدًا لاتخاذ القرار داخل غلاف حتمي أكبر — ليس النظام بأكمله.

لماذا تفشل الوكلاء الذين يبدون رائعين في العروض التوضيحية عند الانتقال إلى الإنتاج؟

العروض التوضيحية عادةً تعمل في مسار سعيد واحد: مستخدم واحد، أدوات تعمل على نحو مثالي، لا تأخيرات زمنية، لا انجراف في المخططات، ومحادثات قصيرة. تحت حمل الإنتاج تواجه الوكلاء:

أدوات متقلبة: تأخيرات زمنية، أخطاء 5xx، وتغيّرات في صيغة الاستجابة
التزامن: عدد كبير من المستخدمين يتسابقون على موارد مشتركة وحدود المعدل
جلسات طويلة الأمد: تضخّم السياق، ارتباك الذاكرة، وانجراف الحالة
خطأ نموذجي يتراكَم: خطوات صغيرة خاطئة تتصاعد عبر استدعاءات أدوات متعددة

دون سير عمل صريح، عقود، ومعالجة للأخطاء، تولد هذه العوامل حلقات، توقفات، أعمال جزئية، وأخطاء صامتة لا تظهر في بيئة العرض.

كيف أجعل الوكيل متوقعًا وسهل التصحيح؟

اجعل النموذج يعمل داخل هيكل واضح بدلًا من حلقة حرة الشكل:

نموذج الوكيل كـ آلة حالة ذات مجموعة محدودة من الحالات والانتقالات المسموح بها.
استخدم LLM فقط للخيارات المحلية (مثلاً: أي أداة تستدعي بعد ذلك، كيف تملأ المعاملات)، لا لاختلاق تدفقات عشوائية.
احفظ الحالة خارجيًا حتى تصبح كل انتقالات قابلة لإعادة التشغيل والتدقيق.
اجعل الوكلاء صغارًا ومركزين: مهمة واحدة رئيسية ومؤشر نجاح أساسي.

بهذا يمكنك شرح واختبار وتصحيح السلوك خطوة بخطوة بدلًا من مطاردة "تفكير الوكيل" الغامض.

ماذا يعني نمذجة الوكيل كآلة حالة؟

نمذجة الوكيل كـ سير عمل ذو حالات مسماة وأحداث مكتوبة بدلًا من while not done: call LLM.

الحالات النموذجية قد تشمل:

كيف أصمم عقود الأدوات (tool contracts) لوكلائي؟

صمّم الأدوات مثل واجهات إنتاجية جيدة، لا كأوصاف نصية مخفية داخل المطالبات. يجب أن يحتوي كل أداة على:

كيف أتعامل مع الفشل، المحاولات، والقدرة على التكرار في تدفقات الوكيل؟

افترض أن كل استدعاء خارجي سيفشل أحيانًا وصمّم حول ذلك.

نمطيات رئيسية:

القدرة على التكرار (Idempotency): قبول مفتاح ثابت أو مفتاح عمل تجاري وإرجاع نفس النتيجة عند التكرار.

ما هي الطريقة الصحيحة لإدارة الذاكرة والحالة للوكلاء؟

افصل الحالة قصيرة الأمد عن الذاكرة طويلة الأمد، واجعل LLM بلا حالة.

استخدم الحالة قصيرة الأمد لكل ما يلزم لإتمام المهمة الحالية: الهدف النشط، الخطوة الحالية، مخرجات الأدوات، وأعداد المحاولات المتبقية.
خزّن الذاكرة طويلة الأمد (مثل ملف المستخدم، تاريخ المشروع) في مخزن خارجي مع مخططات مُهيكلة، لا كسجلات نصية.
اعتبر LLM دالة نقية فوق كائن حالة صريح: احمل الحالة ذات الصلة، ابن المطالبة، استدعِ النموذج، ثم احفظ الحالة المحدثة.

تجنّب استخدام السجلات الخام أو سجل المحادثة كـ "ذاكرة"؛ اشتق سجلات مهيكلة صغيرة منها مع قواعد احتفاظ وخصوصية واضحة.

كيف أتعامل مع التزامن، حدود المعدل، والضغط العكسي في أنظمة الوكلاء؟

اعتبر نظام الوكيل نظامًا موزعًا تحت الحمل حتى لو بدا متسلسلًا.

للبقاء موثوقًا:

ضع الخطوات الطويلة أو ذات الآثار الجانبية خلف قوائم انتظار للتحكم في التزامن عبر مجموعات عمال.
نفّذ حدود معدل للنماذج والأدوات مع حصص لكل مستخدم، كل مستأجر، وعالمية.

ما المراقبة التي أحتاجها لتشغيل الوكلاء بأمان في الإنتاج؟

تحتاج أن تجيب على سؤالين لكل مهمة: "ماذا فعل؟" و"لماذا فعل ذلك؟".

متطلبات عملية:

تتبعات: تتبّع شامل لكل مهمة يغطّي انتقالات الحالة، استدعاءات الأدوات، واستدعاءات النموذج.
سجلات مُهيكلة: سجّل القرارات الرئيسية (اختيار الأداة، مراجعات الخطة، تشغيل الحماية) مع معرفات ارتباط.

كيف ينبغي للفرق نشر وتشغيل أنظمة العامل بشكل آمن مع مرور الوقت؟

عامل الوكلاء كخدمات متطورة وادِرهم بنفس الصرامة مثل أي نظام إنتاجي آخر.

ممارسات موصى بها:

استخدم وضع الظل (shadow mode)، القَنابر (canaries)، وأعلام الميزات لنشر نماذج ووكلاء جدد تدريجيًا.
عرّف SLOs للموثوقية، الكمون، والجودة، واربطها بتنبيهات ودفاتر تشغيل.
حافظ على مجموعات تراجع واختبارات تشغيلية لكل تغيير في المطالبات، الأدوات، أو السياسات.
قسّم الملكية: فرق المنتج تمتلك السلوك والأدوات المجالّيّة؛ فرق المنصة تمتلك إطار آلة الحالة، SDKs، المراقبة، وتطبيق السياسات.

هذا يمكّنك من تحسين الوكلاء باستمرار مع احتواء الأخطاء، تشخيصها، وقابلية التراجع.

request_id