Question 1

What is an agentic system, and how is it different from a normal LLM app?

Accepted Answer

ਇੱਕ ਏਜੰਟਿਕ ਪ੍ਰਣਾਲੀ ਉਹ ਐਪਲੀਕੇਸ਼ਨ ਹੈ ਜਿੱਥੇ LLM ਸਿਰਫ਼ ਇੱਕ ਪ੍ਰਾਂਪਟ ਦਾ ਜਵਾਬ ਨਹੀਂ ਦਿੰਦਾ, ਬਲਕਿ ਅਗਲਾ ਕਦਮ ਖ਼ੁਦ ਫੈਸਲਾਂਦਾ ਹੈ: ਕਿਹੜੇ ਟੂਲ ਕਾਲ ਕਰਨੇ ਹਨ, ਕਿਹੜੇ ਡੇਟਾ ਲੈਣਾ ਹੈ, ਵਰਕਫਲੋ ਦਾ ਕਿਹੜਾ ਕਦਮ ਚਲਾਉਣਾ ਹੈ ਅਤੇ ਕਦੋਂ ਰੁਕਣਾ ਹੈ।

ਸਧਾਰਣ ਚੈਟ ਕੰਪਲੀਸ਼ਨ ਦੇ ਵਿਰੁੱਧ, ਇੱਕ ਏਜੰਟਿਕ ਪ੍ਰਣਾਲੀ ਵਿੱਚ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ:

ਇੱਕ ਫੈਸਲਾ ਪਾਲਿਸੀ (LLM + ਪ੍ਰਾਂਪਟ)
ਇੱਕ ਵਰਕਫਲੋ ਜਾਂ ਸਟੇਟ ਮਸ਼ੀਨ ਜੋ ਪ੍ਰਗਟਾਵਾ ਟਰੈਕ ਕਰਦੀ ਹੈ
ਇੱਕ ਸੈੱਟ ਟੂਲਾਂ (APIs, ਡੇਟਾਬੇਸ, ਸਰਵਿਸਜ਼)
ਰੀਟ੍ਰਾਈ, state persistence, ਲੋਗਿੰਗ ਅਤੇ ਓਬਜ਼ਰਵੇਬਿਲਿਟੀ ਲਈ ਢਾਂਚਾ

ਉਤਪਾਦਨ ਵਿੱਚ, LLM ਇੱਕ ਵੱਡੇ ਨਿਰਧਾਰਤ ਸ਼ੈੱਲ ਦੇ اندر ਇੱਕ ਫੈਸਲਾ ਕਰਨ ਵਾਲਾ ਕੰਪੋਨੈਂਟ ਬਣ ਜਾਂਦਾ ਹੈ—ਨਹੀਂ ਕਿ ਸਿਸਟਮ ਦਾ ਸਾਰਾ ਭਾਗ।

Question 2

Why do agents that look great in demos often fail in production?

Accepted Answer

ਡੈਮੋ ਆਮ ਤੌਰ 'ਤੇ ਇੱਕ ਖੁਸ਼ੀ-ਰਾਹ ਚਲਾਉਂਦੇ ਹਨ: ਇਕ ਵਰਤੋਂਕਾਰ, ਆਦਰਸ਼ ਟੂਲ ਵਿਹਾਰ, ਕੋਈ ਟਾਈਮਆਊਟ ਨਹੀਂ, ਕੋਈ schema drift ਨਹੀਂ, ਅਤੇ ਛੋਟੀਆਂ ਗੱਲਬਾਤਾਂ। ਉਤਪਾਦਨ ਲੋਡ 'ਤੇ, ਏਜੰਟ ਇਹਨਾਂ ਨਾਲ ਨਿਭਾਉਂਦੇ ਹਨ:

ਫਲੇਕੀ ਟੂਲ: ਸਮਾਂਸੀਮਾ-ਲੰਘਣ, 5xx ਐਰਰ, ਅਤੇ ਬਦਲਦੇ ਰਿਸਪਾਂਸ ਫਾਰਮੈਟ
ਰਨ-ਕਨਕਰੈਂਸੀ: ਬਹੁਤ ਸਾਰੇ ਯੂਜ਼ਰ ਸਾਂਝੇ ਰਿਸੋਰਸਾਂ ਅਤੇ ਰੇਟ ਲਿਮਿਟਾਂ ਲਈ ਰੇਸ ਕਰਦੇ ਹਨ
ਲੰਬੇ ਸੈਸ਼ਨ: ਵਧੇ ਹੋਏ ਸੰਦਰਭ, ਮੇਮੋਰੀ ਦਾ ਗੁਲਮਲ, ਅਤੇ ਸਟੇਟ ਡ੍ਰਿਫਟ
ਮਾਡਲ ਗਲਤੀਆਂ ਦਾ ਇਕੱਠਾ ਹੋਣਾ: ਛੋਟੀਆਂ ਗਲਤੀਆਂ ਬਹੁਤ ਸਾਰੇ ਟੂਲ ਕਾਲਾਂ 'ਤੇ ਨੁਕਸਾਨ ਪਹੁੰਚਾਉਂਦੀਆਂ ਹਨ

ਬਿਨਾਂ ਸਪੱਸ਼ਟ ਵਰਕਫਲੋ, ਕਾਂਟ੍ਰੈਕਟ, ਅਤੇ ਫੇਲਅਰ ਹੈਂਡਲਿੰਗ ਦੇ, ਇਹ ਕਾਰਕ ਲੂਪ, ਰੁਕਾਵਟਾਂ, ਆਧੂਰੇ ਕੰਮ, ਅਤੇ ਖਾਮੋਸ਼ ਗਲਤੀਆਂ ਪੈਦਾ ਕਰਦੇ ਹਨ ਜੋ ਡੈਮੋ ਵਾਤਾਵਰਣ ਵਿੱਚ ਨਹੀਂ ਦਿਖਾਈ ਦਿੰਦੀਆਂ।

Question 3

How do I make an agent predictable and easy to debug?

Accepted Answer

LLM ਨੂੰ ਇੱਕ ਸਪੱਸ਼ਟ ਢਾਂਚੇ ਦੇ اندر ਚਲਾਓ ਨਾ ਕਿ ਫ੍ਰੀ-ਫਾਰਮ ਲੂਪ ਦੇ ਵਿਚ: - ਏਜੰਟ ਨੂੰ ਇੱਕ ਸਟੇਟ ਮਸ਼ੀਨ ਵਜੋਂ ਮਾਡਲ ਕਰੋ ਜਿਸ ਵਿੱਚ ਸੀਮਿਤ ਸਟੇਟਸ ਅਤੇ ਮਨਜ਼ੂਰ ਹਰੇਕ ਤਬਦੀਲੀਆਂ ਹੁੰਦੀਆਂ ਹਨ। - LLM ਨੂੰ ਸਿਰਫ਼ ਲੋਕਲ ਚੋਣਾਂ ਲਈ ਵਰਤੋ (ਉਦਾਹਰਨ ਲਈ: ਅਗਲਾ ਟੂਲ ਕਿਹੜਾ ਕਾਲ ਕਰਨਾ ਹੈ, ਪੈਰਾਮੀਟਰ ਕਿਵੇਂ ਭਰਨੇ), ਨਾ ਕਿ ਪੂਰੇ ਫਲੋ ਦੀ ਰਚਨਾ ਲਈ। - ਸਟੇਟ ਨੂੰ ਬਾਹਰੀ ਤੋਰ 'ਤੇ ਪਿਰਸਿਸਟ ਕਰੋ ਤਾਂ ਕਿ ਹਰ ਤਬਦੀਲੀ ਰੀਪਲੇਅਬਲ ਅਤੇ ਆਡਿਟੇਬਲ ਹੋਵੇ। - ਏਜੰਟ ਛੋਟੇ ਅਤੇ ਕੇਂਦਰਿਤ ਰੱਖੋ: ਇੱਕ ਮੁੱਖ ਕੰਮ, ਇੱਕ ਪ੍ਰਧਾਨ ਸਫਲਤਾ ਮੈਟ੍ਰਿਕ। ਇਸ ਤਰ੍ਹਾਂ ਤੁਸੀਂ ਹਰ ਕਦਮ ਨੂੰ ਵਿਆਖਿਆ ਕਰ ਸਕਦੇ ਹੋ, ਟੈਸਟ ਕਰ ਸਕਦੇ ਹੋ ਅਤੇ ਡੀਬੱਗ ਕਰ ਸਕਦੇ ਹੋ ਬਜਾਏ ਗੁੱਥੇ "ਏਜੰਟ ਸੋਚ" ਵਾਲੇ ਲੂਪਾਂ ਦੇ।

Question 4

What does it mean to model an agent as a state machine?

Accepted Answer

ਏਜੰਟ ਨੂੰ ਵਰਕਫਲੋ ਦੇ ਤੌਰ 'ਤੇ ਮਾਡਲ ਕਰੋ ਜਿਸ ਵਿੱਚ ਨਾਮੀ ਸਟੇਟਸ ਅਤੇ ਟਾਈਪ ਕੀਤੇ ਇਵੈਂਟਸ ਹੋਣ, ਨਾ ਕਿ ਵਰਗੀ ਲੂਪ। ਆਮ ਸਟੇਟਸ ਸ਼ਾਮਲ ਹੋ ਸਕਦੇ ਹਨ: - – ਬੇਨਤੀ ਨੂੰ ਸਮਝੋ ਅਤੇ ਕਦਮ-ਬ-ਕਦਮ ਯੋਜਨਾ ਬਣਾਓ - – ਕਿਸੇ ਖਾਸ ਟੂਲ ਜਾਂ ਬੈਚ ਟੂਲਾਂ ਨੂੰ ਕਾਲ ਕਰੋ - – ਨਤੀਜਿਆਂ ਨੂੰ ਸਧਾਰਨ ਨਿਯਮਾਂ ਜਾਂ ਸੈਕੰਡਰੀ ਮਾਡਲ ਚੈੱਕ ਨਾਲ ਜਾਂਚੋ - – ਰੀਟ੍ਰਾਈ, ਫਾਲਬੈਕ ਜਾਂ ਏਸਕਲੈਸ਼ਨ ਰਾਹੀਂ ਐਰਰ ਹੈਂਡਲਿੰਗ - / – ਟਰਮੀਨਲ ਨਤੀਜੇ ਇਵੈਂਟਾਂ (ਜਿਵੇਂ , ) ਅਤੇ ਮੌਜੂਦਾ ਸਟੇਟ ਮਿਲਕੇ ਅਗਲਾ ਸਟੇਟ ਨਿਰਧਾਰਤ ਕਰਦੇ ਹਨ। ਇਹ ਰੀਟ੍ਰਾਈ, ਟਾਈਮਆਊਟ ਅਤੇ ਏਰਰ ਹੈਂਡਲਿੰਗ ਨੂੰ ਸਪੱਸ਼ਟ ਬਣਾਉਂਦਾ ਹੈ।

Question 5

How should I design tool contracts for my agents?

Accepted Answer

ਟੂਲਾਂ ਨੂੰ ਪ੍ਰੋਡਕਸ਼ਨ APIs ਵਾਂਗ ਤਿਆਰ ਕਰੋ, ਨਾ ਕਿ ਪ੍ਰਾਂਪਟ ਵਿੱਚ ਛੁਪੇ ਹੋਏ ਵਰਣਨਾਂ ਵਾਂਗ। ਹਰ ਟੂਲ ਦਾ ਕਾਂਟ੍ਰੈਕਟ ਸ਼ਾਮਲ ਹੋਵੇ: - Input schema: ਲੋੜੀਂਦੇ ਫੀਲਡ, ਕਿਸਮਾਂ, ਸੀਮਾਵਾਂ ਅਤੇ ਡੀਫਾਲਟਸ - Output schema: ਸਫਲਤਾ ਪੇਡਲੋਡ, ਨੱਲੇਬਲ ਫੀਲਡ, ਅਤੇ "ਕੋਈ ਨਤੀਜਾ ਨਹੀਂ" ਦਾ ਮਤਲਬ - Error model: ਟਾਈਪ ਕੀਤੇ ਐਰਰ (ਉਦਾਹਰਨ: , , , ) ਅਤੇ ਸਪੱਸ਼ਟ ਸੈਮੈਂਟਿਕਸ - SLAs: ਲੈਟੈਂਸੀ ਉਮੀਦਾਂ, ਉਪਲਬਧਤਾ ਟਾਰਗੇਟ, ਅਤੇ ਰੇਟ ਲਿਮਿਟ ਇਹ ਕਾਂਟ੍ਰੈਕਟ ਮਾਡਲ ਨੂੰ ਸਟਰਕਚਰਡ ਦਸਤਾਵੇਜ਼ ਦੇ ਰੂਪ ਵਿੱਚ ਦਿਖਾਉ, ਲੰਮੇ ਪੈਰਾ ਦੀ ਥਾਂ। ਪਲਾਨਰ ਨੂੰ ਪਤਾ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਕਿਹੜੇ ਐਰਰ ਰੀਟ੍ਰਾਈਯੋਗ ਹਨ, ਕਿਹੜੇ ਯੂਜ਼ਰ ਦਖਲਗਿਰੀ ਚਾਹੀਦੇ ਹਨ, ਅਤੇ ਕਿਹੜੇ ਵਰਕਫਲੋ ਰੋਕਦੇ ਹਨ।

Question 6

How do I handle failures, retries, and idempotency in agent workflows?

Accepted Answer

ਹਰ ਬਾਹਰੀ ਕਾਲ ਕਦੇ ਨਾ ਕਦੇ ਫੇਲ ਹੋਵੇਗੀ—ਇਸ ਗੱਲ ਨੂੰ ਮੰਨ ਕੇ ਡਿਜ਼ਾਇਨ ਕਰੋ। ਮੁੱਖ ਪੈਟਰਨ: - Idempotency: side-effecting ਟੂਲ ਇੱਕ ਥਿਰ ਜਾਂ ਬਿਜ਼ਨਸ ਕੁੰਜੀ ਮਨਦੇ ਹੋਣ ਅਤੇ ਵਾਪਸ ਉਹੀ ਨਤੀਜਾ ਦੇਣ। - Targeted retries: ਸਿਰਫ਼ ਟ੍ਰਾਂਜ਼ੀਐਂਟ ਫੇਲਿਊਰ (ਟਾਈਮਆਊਟ, 5xx, ਰੇਟ ਲਿਮਿਟ) ਲਈ ਇਕਸਪੋਨੇਨਸ਼ਲ ਬੈਕਆਫ ਅਤੇ ਸੀਮਤ ਅਟੈਂਪਟ। - Circuit breakers: ਇੱਕ ਨਾਕਾਰਾ ਟੂਲ ਨੂੰ ਅਸਥਾਈ ਤੌਰ 'ਤੇ ਬਲੌਕ ਕਰੋ ਅਤੇ ਫਾਲਬੈਕ ਜਾਂ ਡਿਗਰੇਡ ਮੋਡ ਚੁਣੋ। - Structured failure surfaces: ਐਸੇ ਐਰਰ ਟਾਈਪ ਵਾਪਸ ਕਰੋ ਕਿ ਏਜੰਟ ਫੈਸਲਾ ਕਰ ਸਕੇ ਕਿ ਰੀਟ੍ਰਾਈ ਕਰਨਾ ਹੈ, ਦੁਬਾਰਾ ਯੋਜਨਾ ਬਣਾਈਏ ਜਾਂ ਯੂਜ਼ਰ ਨੂੰ ਪੁੱਛੋ। ਇਸ ਨਾਲ ਭਰੋਸੇਯੋਗਤਾ ਉੱਚੀ ਰਹਿੰਦੀ ਹੈ ਬਿਨਾਂ ਚਲਾਕ ਲੂਪਾਂ, ਡੁਪਲੀਕੇਟ ਸਾਈਡ-ਐਫੈਕਟਸ, ਜਾਂ ਅਣਕੰਟਰੋਲ ਖਰਚੇ ਦੇ।

Question 7

What is the right way to manage memory and state for agents?

Accepted Answer

ਛੋਟੇ-ਅਰੰਭਕ ਸਟੇਟ ਨੂੰ ਲੰਬੇ ਸਮੇਂ ਦੀ ਮੇਮੋਰੀ ਤੋਂ ਵੱਖ ਕਰੋ ਅਤੇ LLM ਨੂੰ ਸਟੇਟਲੈੱਸ ਰੱਖੋ।

ਵਰਤਮਾਨ ਵਰਕਫਲੋ ਨੂੰ ਪੂਰਾ ਕਰਨ ਲਈ ਲੋੜੀਂਦੀ ਚੀਜ਼ਾਂ ਲਈ short-term state ਵਰਤੋ: ਸਰਗਰਮ ਲਕੜੀ, ਰੀਟ੍ਰਾਈ ਗਿਣਤੀ, ਟੂਲ ਆਉਟਪੁੱਟ ਆਦਿ।
ਲੰਬੇ ਸਮੇਂ ਦੀ ਮੇਮੋਰੀ (ਯੂਜ਼ਰ ਪ੍ਰੋਫ਼ਾਈਲ, ਪ੍ਰਾਜੈਕਟ ਇਤਿਹਾਸ) ਨੂੰ ਬਾਹਰੀ ਸਟੋਰ ਵਿੱਚ ਸਟੋਰ ਕਰੋ—ਸੰਰਚਿਤ ਸਕੀਮਾਂ ਨਾਲ, ਕੱਚੇ ਟ੍ਰਾਂਸਕ੍ਰਿਪਟ ਨਹੀਂ।
LLM ਨੂੰ ਇਕ ਸਪੂਰਨ ਫੰਕਸ਼ਨ ਸਮਝੋ ਜੋ ਇੱਕ ਸਪੱਸ਼ਟ ਸਟੇਟ ਆਬਜੈਕਟ 'ਤੇ ਕੰਮ ਕਰਦਾ ਹੈ: ਢੁਕਵੀਂ ਸਟੇਟ ਲੋਡ ਕਰੋ, ਪ੍ਰਾਂਪਟ ਬਣਾਓ, ਮਾਡਲ ਕਾਲ ਕਰੋ, ਫਿਰ ਅਪਡੇਟ ਸਟੇਟ ਪਿਰਸਿਸਟ ਕਰੋ।

ਅਣਸੰਰਚਿਤ ਲੋਗ ਜਾਂ ਪੂਰਾ ਗੱਲਬਾਤ ਇਤਿਹਾਸ ਨੂੰ "ਮੇਮੋਰੀ" ਵਜੋਂ ਵਰਤਣ ਤੋਂ ਬਚੋ; ਇਸ ਦੀ ਥਾਂ ਤੇ ਇੱਕ ਸੰਕੁਚਿਤ, ਸਟ੍ਰਕਚਰਡ ਰਿਕਾਰਡ ਬਣਾਓ ਜਿਸ ਦੀ ਰਿਟੇਸ਼ਨ ਅਤੇ ਪ੍ਰਾਈਵੇਸੀ ਨੀਤੀਆਂ ਹੋਣ।

Question 8

How should I deal with concurrency, rate limits, and backpressure in agent systems?

Accepted Answer

ਏਜੰਟ ਸਿਸਟਮ ਨੂੰ ਲੋਡ ਹੇਠਾਂ ਇੱਕ ਵੰਡਿਆ ਹੋਇਆ ਸਿਸਟਮ ਸਮਝੋ, ਭਾਵੇਂ ਹਰ ਫਲੋ ਸੀਰੀਅਲ ਲੱਗੇ। ਭਰੋਸੇਯੋਗ ਰਹਿਣ ਲਈ: - ਲੰਬੇ ਚੱਲ ਰਹੇ ਜਾਂ ਸਾਈਡ-ਐਫੈਕਟ ਵਾਲੇ ਕਦਮਾਂ ਨੂੰ ਕਿਊਜ਼ ਪਿੱਛੇ ਰੱਖੋ ਤਾਂ ਕਿ ਤੁਸੀਂ ਵਰਕਰ ਪੂਲਾਂ ਨਾਲ concurrency ਨੂੰ ਕੰਟਰੋਲ ਕਰ ਸਕੋ। - ਮਾਡਲਾਂ ਅਤੇ ਟੂਲਾਂ ਲਈ ਪ੍ਰਤੀ-ਯੂਜ਼ਰ, ਪ੍ਰਤੀ-ਟੇਨੈਂਟ ਅਤੇ ਗਲੋਬਲ ਕੋਟੇਅਸ ਦੇ ਨਾਲ ਰੇਟ ਲਿਮਿਟ ਲਗਾਓ। - ਬੈਕਪ੍ਰੈਸ਼ਰ ਵਰਤੋ: ਬੇਸਲੈਤ ਟ੍ਰੈਫਿਕ ਨੂੰ ਛੱਡੋ, ਫੀਚਰਾਂ ਨੂੰ ਡਿਗਰੇਡ ਕਰੋ, ਜਾਂ ਘੱਟ-ਤਰਜੀਹ ਵਾਲੇ ਕਿਊਜ਼ ਨੂੰ ਰੋਕੋ ਜਦੋਂ ਸਿਸਟਮ ਭਰਿਆ ਹੋਵੇ। - ਡੁਪਲੀਕੇਟ ਕੰਮ ਅਤੇ ਰੇਸ ਕন্ডੀਸ਼ਨ ਤੋਂ ਬਚਣ ਲਈ idempotent ਟੂਲ ਕਾਂਟ੍ਰੈਕਟਾਂ ਅਤੇ optimistic/pessimistic ਲਾਕਿੰਗ ਮਿਲਾ ਕੇ ਵਰਤੋ। ਕਿਊ ਡੈਪਥ, ਲੈਟੈਂਸੀ ਪ੍ਰਸੈਂਟਾਈਲ, ਅਤੇ ਦਰਾਂ ਦੀ ਨਿਗਰਾਨੀ ਕਰੋ ਤਾਂ ਕਿ ਓਵਰਲੋਡ ਨੂੰ ਆਛੇ ਤਰੀਕੇ ਨਾਲ ਰੋਕਿਆ ਜਾ ਸਕੇ।

Question 9

What observability do I need to run agents safely in production?

Accepted Answer

ਤੁਸੀਂ ਕਿਸੇ ਵੀ ਟਾਸਕ ਲਈ "ਏਜੰਟ ਨੇ ਕੀ ਕੀਤਾ?" ਅਤੇ "ਉਸਨੇ ਉਹ ਕੀਤਾ ਕਿਉਂ?" ਦੇ ਜਵਾਬ ਸੌਖੇ ਅਤੇ ਸਹੀ ਤਰੀਕੇ ਨਾਲ ਦੇ ਸਕਣਾ ਚਾਹੁੰਦੇ ਹੋ। ਓਬਜ਼ਰਵੇਬਿਲਿਟੀ ਲਈ: - ਟ੍ਰੇਸਾਂ: ਹਰ ਟਾਸਕ ਲਈ ਇੱਕ ਏੰਡ-ਟੂ-ਏੰਡ ਟ੍ਰੇਸ ਜੋ ਸਟੇਟ ਟ੍ਰਾਂਜ਼ੀਸ਼ਨ, ਟੂਲ ਕਾਲ ਅਤੇ ਮਾਡਲ ਇੰਵੋਕੇਸ਼ਨ ਨੂੰ ਜੋੜੇ। - ਸਟ੍ਰਕਚਰਡ ਲੌਗ: ਮੈਜਰ ਫੈਸਲਿਆਂ (ਟੂਲ ਸਿਲੈਕਸ਼ਨ, ਪਲੈਨ ਰਿਵਿਜ਼ਨ, ਗਾਰਡਰੇਲ ਟ੍ਰਿਗਰ) ਨੂੰ correlation IDs ਨਾਲ ਲਗਾਓ। - ਮੀਟ੍ਰਿਕਸ: ਟਾਸਕ ਸਫਲਤਾ ਦਰ, ਸਟੇਟ ਵਾਰ ਫੇਲਡ ਰੇਟ, ਲੈਟੈਂਸੀ (ਪੂਰਾ ਅਤੇ ਪ੍ਰਤੀ-ਟੂਲ/ਮਾਡਲ), ਅਤੇ ਪ੍ਰਤੀ ਸਫਲ ਨਤੀਜੇ ਲਾਗਤ। - ਰੇਡੈਕਸ਼ਨ: ਪ੍ਰਾਂਪਟ, ਟੂਲ ਇਨਪੁਟ ਅਤੇ ਆਉਟਪੁਟ ਵਿੱਚੋਂ PII ਅਤੇ ਸੀਕ੍ਰੇਟ ਨੂੰ ਲੌਗ ਤੋਂ ਪਹਿਲਾਂ ਮਾਸਕ ਕਰੋ; ਸੰਵੇਦਨਸ਼ੀਲਤਾ ਅਨੁਸਾਰ ਰਿਟੇਸ਼ਨ ਕੰਟਰੋਲ ਕਰੋ। ਇਸ ਨਾਲ ਘਟਨਾ ਟ੍ਰਾਇਜ਼ ਜਾਂਚ "ਏਜੰਟ ਫਲੇਕੀ ਮਹਿਸੂਸ ਹੁੰਦਾ ਹੈ" ਤੋਂ ਬਦਲ ਕੇ ਸਪੱਸ਼ਟ ਸਟੇਟ, ਟੂਲ ਅਤੇ ਬਦਲਾਅ ਦੇ ਕਾਰਨ ਤੱਕ ਆ ਜਾਂਦੀ ਹੈ।

Question 10

How should teams roll out and operate agentic systems safely over time?

Accepted Answer

ਏਜੰਟਾਂ ਨੂੰ ਵਿਕਸਤ ਕਰਨ ਵੇਲੇ ਉਨ੍ਹਾਂ ਨੂੰ ਸਰਵਿਸ ਦੀ ਤਰ੍ਹਾਂ ਹੀ ਚਲਾਓ — ਸਥਿਰ ਨਹੀਂ। ਇਹਨਾਂ ਨੂੰ ਇੰਜੀਨੀਅਰਿੰਗ ਦੇ ਉੱਚ ਮਿਆਰ ਨਾਲ ਸੰਭਾਲੋ:

ਸ਼ੈਡੋ ਮੋਡ, ਕੈਨਰੀਜ਼ ਅਤੇ ਫੀਚਰ ਫਲੈਗ ਵਰਤ ਕੇ ਨਵੇਂ ਏਜੰਟ ਜਾਂ ਮਾਡਲ ਵਰਜ਼ਨ ਨੂੰ ਹੌਲੀ-ਹੌਲੀ ਰੋਲ ਕਰੋ।
ਭਰੋਸਿਆਂ ਲਈ SLOs ਨਿਰਧਾਰਤ ਕਰੋ: Reliablity, Latency, Quality; ਇਨ੍ਹਾਂ ਨੂੰ alerts ਅਤੇ ਰਨਬੁਕਸ ਨਾਲ ਜੋੜੋ।
ਕਿਸੇ ਵੀ ਪ੍ਰਾਂਪਟ, ਟੂਲ ਜਾਂ ਨੀਤੀ ਵਿੱਚ ਤਬਦੀਲੀ ਲਈ regression suites ਅਤੇ offline replays ਰਖੋ।
ਜ਼ਿਮੇਵਾਰੀ ਵੰਡੋ: ਪ੍ਰੋਡਕਟ ਟੀਮਜ਼ ਵਿਹਾਰ ਅਤੇ ਡੋਮੇਨ ਟੂਲਾਂ ਲਈ, ਪ್ಲੈਟਫਾਰਮ ਟੀਮਜ਼ ਸਟੇਟ-ਮਸ਼ੀਨ ਫਰੇਮਵਰਕ, ਸਾਂਝੇ ਟੂਲ SDKs, ਓਬਜ਼ਰਵੇਬਿਲਿਟੀ ਅਤੇ ਨੀਤੀਆਂ ਲਈ।

ਇਸ ਤਰ੍ਹਾਂ ਤੁਸੀਂ ਕਤਾਰਬੱਧ ਤੌਰ 'ਤੇ ਏਜੰਟਾਂ ਨੂੰ ਬਿਹਤਰ ਕਰ ਸਕਦੇ ਹੋ ਅਤੇ ਫੇਲ੍ਹਅਰਾਂ ਨੂੰ ਸੀਮਿਤ, ਤੁਰੰਤ ਸਮਝਣਯੋਗ ਅਤੇ ਵਾਪਸ ਲੈਣਯੋਗ ਰੱਖ ਸਕਦੇ ਹੋ।

From impressive demos to fragile production agents

Why demos work and production breaks

The real business impact

What this guide focuses on

Why most agent architectures break at scale

Fragile behaviors: loops, stalls, partial work, silent errors

Hidden non-determinism and tool unreliability

Concurrency amplifies edge cases and product mismatch

Design principles for production-grade agentic systems

What makes an agent production-ready?

Prefer explicit workflows over free-form loops

Break the “god agent” into modular skills

Separate policy, state, and tools

Design for smallness and clarity

Modeling agent workflows as explicit state machines

Representing agent flows as states and transitions

Externalizing state for resilience and scale

Benefits for reasoning and audits

Designing reliable tool contracts for agents

Define the contract, not just the prompt

Strict JSON, strict validation

Versioning and compatibility

Handling failure and degraded modes

Security and authorization boundaries

Why good contracts simplify agents

Retries, idempotency, and failure-handling patterns

Idempotency: the foundation for safe retries

Retry strategies that don’t explode costs

Circuit breakers and fallbacks

Managing memory, state, and data consistency for agents

Short-term state vs. long-term memory

Where to store state

Avoiding the “logs as memory” anti-pattern

Consistency with shared data and tools

Snapshots and resumable executions

Privacy, retention, and minimal memory

Concurrency, rate limits, and backpressure in agent systems

Concurrency hazards in agent workflows

Queues vs synchronous flows

Rate limits and backpressure

Observability: tracing, metrics, and logs for agent behavior

What you need to see

Logging and redaction

Metrics that actually matter

Testing and evaluation strategies for agentic systems

Unit tests: tool contracts, not prompts

Integration tests: flows and multi-step behavior

Deterministic fixtures for LLM and tools

Regression suites for prompts and schemas

Offline evaluation before rollout

Test data management and anonymization

Operating, monitoring, and evolving agents in production

Safe rollout strategies

SLOs and incident workflows

Continuous improvement and change control

A reference architecture for reliable agentic systems

Core components

Integration, controls, and telemetry

Putting it all together and next steps for your team

The core patterns, in one picture

A lightweight checklist for productionizing an agent

How teams can split ownership

Future extensions and safe iteration

ਅਕਸਰ ਪੁੱਛੇ ਜਾਣ ਵਾਲੇ ਸਵਾਲ