AI-ਤਿਆਰ ਸਿਸਟਮਾਂ ਵਿੱਚ ਪ੍ਰਮਾਣਕੀਕਰਨ, ਗਲਤੀਆਂ ਅਤੇ ਐਜ-ਕੇਸ

Q: ਮਾਡਲ ਆਉਟਪੁੱਟ ਨੂੰ ਅਜਿਹਾ ਕਿਵੇਂ ਵੈਧ ਕਰੀਏ ਜੋ ਸੁਰੱਖਿਅਤ ਹੋਵੇ?

Start with an explicit output schema: - required keys (e.g., , ) - types (string/number/array) - enums and constraints (length/ranges) Then add semantic checks (IDs resolve, totals reconcile, dates make sense, citations support claims). If validation fails, avoid consuming the output downstream—retry with tighter constraints or use a fallback.

Q: ਅਸਲ AI ਪ੍ਰੋਡਕਟਾਂ ਵਿੱਚ ਐਜ ਕੇਸ ਆਮ ਤੌਰ 'ਤੇ ਕਿੱਥੋਂ ਆਉਂਦੇ ਹਨ?

Common edge cases come from: - messy real user inputs (copied PDFs, weird line breaks, long contexts) - boundary values (empty fields, max-length text, unusual Unicode, mixed languages) - integration drift (API field changes, permission mismatches, date/currency contract mismatches) Plan to discover “unknown unknowns” via privacy-aware logs that capture which validation rule failed and what recovery path ran.

ਲੌਗ ਇਨ ਸ਼ੁਰੂ ਕਰੋ

AI-ਤਿਆਰ ਸਿਸਟਮਾਂ ਵਿੱਚ ਪ੍ਰਮਾਣਕੀਕਰਨ, ਗਲਤੀਆਂ ਅਤੇ ਐਜ-ਕੇਸ | Koder.ai

ਇਸ ਪੋਸਟ ਵਿੱਚ “AI-ਤਿਆਰ ਸਿਸਟਮ” ਦਾ ਕੀ ਮਤਲਬ ਹੈ

ਇੱਕ AI-ਤਿਆਰ ਸਿਸਟਮ ਉਹ ਕੋਈ ਵੀ ਉਤਪਾਦ ਹੈ ਜਿੱਥੇ ਇੱਕ AI ਮਾਡਲ ਦੇ ਨਤੀਜੇ ਸਿਸਟਮ ਦੇ ਅਗਲੇ ਕਦਮ ਨੂੰ ਸਿੱਧਾ ਪ੍ਰਭਾਵਿਤ ਕਰਦੇ ਹਨ—ਕਿ ਕੀ ਯੂਜ਼ਰ ਨੂੰ ਦਿਖਾਇਆ ਜਾਂਦਾ ਹੈ, ਕੀ ਸਟੋਰ ਹੁੰਦਾ ਹੈ, ਕਿਸੇ ਹੋਰ ਟੂਲ ਨੂੰ ਕੀ ਭੇਜਿਆ ਜਾਂਦਾ ਹੈ, ਜਾਂ ਕੀ ਕਾਰਵਾਈ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।

ਇਹ "ਚੈਟਬੌਟ" ਤੋਂ ਵੱਡਾ ਹੈ। ਅਮਲ ਵਿੱਚ, AI-generated ਹੋ ਸਕਦਾ ਹੈ:

ਤਿਆਰ ਕੀਤਾ ਟੈਕਸਟ ਜਾਂ ਡੇਟਾ (ਸੰਖੇਪ, ਸ਼੍ਰੇਣੀਬੱਧਤਾ, ਖੰਦੇ ਹੋਏ ਫੀਲਡ)
ਤਿਆਰ ਕੀਤਾ ਕੋਡ (ਸਨਿੱਪੇਟ, ਕਨਫਿਗ, SQL, ਟੈਮਪਲੇਟ)
ਤਿਆਰ ਸ਼ੁਦਾ ਵਰਕਫਲੋਜ਼ (ਕਦਮ-ਦਰ-ਕਦਮ ਯੋਜਨਾਵਾਂ, ਚੈੱਕਲਿਸਟ, ਰਾਊਟਿੰਗ ਫੈਸਲੇ)
ਏਜੈਂਟ ਵਿਹਾਰ (ਮਾਡਲ ਟੂਲ ਚੁਣਦਾ ਹੈ, API ਕਾਲ ਕਰਦਾ ਹੈ, ਅਤੇ ਕਾਰਵਾਈਆਂ ਜੁੜਦੀਆਂ ਹਨ)
ਪ੍ਰਾਮਪਟ-ਚਲਿਤ ਸਿਸਟਮ (ਸੋਚ-ਸਮਝ ਕੇ ਬਣਾਏ ਪ੍ਰਾਮਪਟ ਜੋ "ਸੌਫਟ ਕੋਡ" ਵਾਂਗ ਕੰਮ ਕਰਦੇ ਹਨ)

ਜੇ ਤੁਸੀਂ Koder.ai ਵਰਗੇ vibe-coding ਪਲੇਟਫਾਰਮ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਹੈ—ਜਿੱਥੇ ਇੱਕ ਚੈਟ ਗੱਲਬਾਤ ਪੂਰੇ ਵੈੱਬ, ਬੈਕਐਂਡ, ਜਾਂ ਮੋਬਾਇਲ ਐਪ ਬਣਾਉਣ ਅਤੇ ਵਿਕਸਤ ਕਰਨ ਲਈ ਨਤੀਜੇ ਦੇ ਸਕਦੀ ਹੈ—ਤਾਂ ਇਹ “AI ਨਤੀਜਾ ਕੰਟਰੋਲ ਫਲੋ ਬਣ ਜਾਂਦਾ ਹੈ” ਵਾਲਾ ਵਿਚਾਰ ਬਹੁਤ ਹੀ ਸਪੱਠ ਹੈ। ਮਾਡਲ ਦਾ ਨਤੀਜਾ ਸਿਰਫ ਸਲਾਹ ਨਹੀਂ ਹੁੰਦਾ; ਇਹ ਰੂਟ, ਸਕੀਮਾ, API ਕਾਲ, ਡਿਪਲੋਇਮੈਂਟ, ਅਤੇ ਯੂਜ਼ਰ-ਦਿੱਖਣ ਵਾਲੇ ਵਿਹਾਰ ਨੂੰ ਬਦਲ ਸਕਦਾ ਹੈ।

ਪ੍ਰਮਾਣਕੀਕਰਨ ਅਤੇ ਗਲਤੀਆਂ ਪ੍ਰੋਡਕਟ ਫੀਚਰ ਕਿਉਂ ਹਨ

ਜਦੋਂ AI ਨਤੀਜਾ ਕੰਟਰੋਲ ਫਲੋ ਦਾ ਹਿੱਸਾ ਹੋਵੇ, ਤਾਂ ਪ੍ਰਮਾਣਕੀਕਰਨ ਨਿਯਮ ਅਤੇ ਗਲਤੀ ਸੰਭਾਲ ਯੂਜ਼ਰ-ਸਾਮ੍ਹਣੇ ਭਰੋਸੇਯੋਗਤਾ ਫੀਚਰ ਬਣ ਜਾਂਦੇ ਹਨ, ਸਿਰਫ਼ ਇੰਜੀਨੀਅਰਿੰਗ ਦੀਆਂ ਡੀਟੇਲਾਂ ਨਹੀਂ। ਇੱਕ ਛੱਡਿਆ ਮੈਦਾਨ, ਖਰਾਬ ਬਣਿਆ JSON, ਜਾਂ ਵਿਸ਼ਵਾਸ ਨਾਲ-ਭਰਿਆ ਪਰ ਗਲਤ ਨਿਰਦੇਸ਼ ਸਿਰਫ਼ "ਫੇਲ" ਨਹੀਂ ਹੁੰਦਾ—ਇਹ ਗੁੰਝਲਦਾਰ UX, ਗਲਤ ਰਿਕਾਰਡ, ਜਾਂ ਖਤਰਨਾਕ ਕਾਰਵਾਈਆਂ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ।

ਇਸ ਲਈ ਮਕਸਦ "ਕਦੇ ਵੀ ਫੇਲ ਨਾ ਹੋਵੇ" ਨਹੀਂ ਹੈ। ਨਤੀਜੇ ਪ੍ਰੋਬਬਿਲਿਸਟਿਕ ਹੁੰਦੇ ਹਨ, ਫੇਲ੍ਹ ਹੋਣਾ ਆਮ ਗੱਲ ਹੈ। ਮਕਸਦ ਹੈ ਕਾਬੂ ਵਾਲੀ ਨਾਕਾਮੀ: ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਜਲਦੀ ਪਹਚਾਨਣਾ, ਸਾਫ਼ ਤਰੀਕੇ ਨਾਲ ਸੰਚਾਰ ਕਰਨਾ, ਅਤੇ ਸੁਰੱਖਿਅਤ ਤਰੀਕੇ ਨਾਲ ਰਿਕਵਰ ਕਰਨਾ।

ਇਸ ਪੋਸਟ 'ਚ ਕੀ ਕਵਰ ਕੀਤਾ ਜਾਵੇਗਾ

ਬਾਕੀ ਲੇਖ ਨੂੰ ਪ੍ਰੈਕਟਿਕਲ ਖੇਤਰਾਂ ਵਿੱਚ ਵੰਡਿਆ ਗਿਆ ਹੈ:

ਨਿਯਮ ਜੋ ਇਨਪੁੱਟ ਅਤੇ ਆਉਟਪੁੱਟ (ਸੰਰਚਨਾ ਅਤੇ ਮਾਇਨਾ) ਦੀ ਜਾਂਚ ਕਰਦੇ ਹਨ
ਗਲਤੀ ਸੰਭਾਲ ਦੇ ਚੋਣ (ਫੇਲ ਫਾਸਟ ਬਨਾਮ ਫੇਲ ਗ੍ਰੇਸਫੁੱਲ)
ਐਜ-ਕੇਸ ਜੋ ਅਸਲ ਵਰਤੋਂ ਵਿੱਚ ਆਉਂਦੇ ਹਨ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਘਟਾਉਣ ਦੇ ਤਰੀਕੇ
ਟੈਸਟਿੰਗ ਦੀਆਂ ਰਣਨੀਤੀਆਂ ਉਹਨੀਆਂ ਵਰਤਾਰਾਂ ਲਈ ਜੋ ਪੂਰਨ ਤੌਰ ਤੇ ਨਿਰਣਾਇਕ ਨਹੀਂ ਹੁੰਦੀਆਂ
ਮਾਨੀਟਰਿੰਗ ਅਤੇ ਨਿਰੀਖਣ ਤਾਂ ਜੋ ਤੁਸੀਂ ਫੇਲ੍ਹ, ਰੁਝਾਨ ਅਤੇ ਰਿਗ੍ਰੈਸ਼ਨ ਵੇਖ ਸਕੋ

ਜੇ ਤੁਸੀਂ ਪ੍ਰਮਾਣਕੀਕਰਨ ਅਤੇ ਗਲਤੀ ਰਾਹਾਂ ਨੂੰ ਪਹਿਲੀ ਗਿਣਤੀ ਦੇ ਹਿੱਸੇ ਵਾਂਗ ਟ੍ਰੀਟ ਕਰੋਗੇ, ਤਾਂ AI-ਤਿਆਰ ਸਿਸਟਮ ਭਰੋਸੇਯੋਗ ਅਤੇ ਸਮੇਂ ਦੇ ਨਾਲ ਸੁਧਰਦੇ ਰਹਿਣਗੇ।

ਕਿਉਂ ਪ੍ਰਮਾਣਕੀਕਰਨ ਨਿਯਮ AI ਨਤੀਜਿਆਂ ਨਾਲ ਕੁਦਰਤੀ ਤੌਰ 'ਤੇ ਉੱਭਰਦੇ ਹਨ

AI ਸਿਸਟਮ ਪਲੇਸਿਬਲ ਉੱਤਰ ਬਣਾਉਣ ਵਿਚ ਮਹਿਰ ਹਨ, ਪਰ "ਪਲੇਸਿਬਲ" ਦਾ ਮਤਲਬ "ਉਪਯੋਗਯੋਗ" ਨਹੀਂ ਹੁੰਦਾ। ਜਦੋਂ ਤੁਸੀਂ ਐਕਸ਼ਨ ਲਈ AI ਨਤੀਜੇ ਉਤੇ ਭਰੋਸਾ ਕਰਦੇ ਹੋ—ਇਮੇਲ ਭੇਜਣਾ, ਟਿਕਟ ਬਣਾਉਣਾ, ਰਿਕਾਰਡ ਅੱਪਡੇਟ ਕਰਨਾ—ਤੁਹਾਡੇ ਲੁਕਵੇਂ ਧਾਰਣਾਵਾਂ ਸਪੱਸ਼ਟ ਪ੍ਰਮਾਣਕੀਕਰਨ ਨਿਯਮ ਬਣ ਜਾਂਦੇ ਹਨ।

ਹੋਰ-ਹੋਰ ਤਬਦੀਲੀ ਧਾਰਣਾਵਾਂ ਨੂੰ ਖੋਲ੍ਹ ਦਿੰਦੀ ਹੈ

ਰਵਾਇਤੀ ਸੌਫਟਵੇਅਰ ਨਾਲ ਨਤੀਜੇ ਆਮ ਤੌਰ 'ਤੇ ਨਿਰਧਾਰਤ ਹੁੰਦੇ ਹਨ: ਜੇ ਇਨਪੁੱਟ X ਹੈ, ਤਾਂ ਤੁਸੀਂ Y ਦੀ ਉਮੀਦ ਕਰਦੇ ਹੋ। AI-ਤਿਆਰ ਸਿਸਟਮਾਂ ਦੇ ਨਾਲ, ਇੱਕੋ ਪ੍ਰਾਮਪਟ ਵੱਖ-ਵੱਖ ਫਰੇਜ਼ਿੰਗز, ਵੱਖਰੀਆਂ ਵਿਸਥਾਰ ਦੀਆਂ ਪਦਾਰਥਾਂ, ਜਾਂ ਵੱਖਰੀਆਂ ਵਿਆਖਿਆਵਾਂ ਦੇ ਸਕਦੀ ਹੈ। ਇਹ ਵੈਰੀਬਿਲਿਟੀ ਖੁਦ ਵਿੱਚ ਕੋਈ ਬਗ ਨਹੀਂ—ਪਰ ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਤੁਸੀਂ ਅਣਆਧਾਰਤ ਉਮੀਦਾਂ 'ਤੇ ਨਹੀਂ ਟਿਕ ਸਕਦੇ, ਜਿਵੇਂ "ਇਹ ਸਮੇਂ ਜ਼ਰੂਰ ਇੱਕ ਤਾਰੀਖ ਸ਼ਾਮਲ ਕਰੇਗਾ" ਜਾਂ "ਇਹ ਆਮ ਤੌਰ 'ਤੇ JSON ਵਾਪਸ ਕਰਦਾ ਹੈ"।

ਪ੍ਰਮਾਣਕੀਕਰਨ ਨਿਯਮ ਉਹ ਪ੍ਰਯੋਗਿਕ ਜਵਾਬ ਹਨ: ਇਸ ਨਤੀਜੇ ਲਈ ਕੀ ਸੱਚ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ ਤਾਂ ਜੋ ਇਹ ਸੁਰੱਖਿਅਤ ਅਤੇ ਉਪਯੋਗੀ ਹੋਵੇ?

“ਸਹੀ-ਲੱਗਣਾ” ਅਤੇ “ਸਾਡੀ ਕਾਰੋਬਾਰ ਲਈ ਸਹੀ ਹੋਣਾ” ਵਿੱਚ ਫਰਕ

ਇੱਕ AI ਜਵਾਬ ਸਹੀ-ਲੱਗ ਸਕਦਾ ਹੈ ਪਰ ਫਿਰ ਵੀ ਤੁਹਾਡੀਆਂ ਅਸਲੀ ਲੋੜਾਂ ਨੂੰ ਫੇਲ ਕਰ ਸਕਦਾ ਹੈ।

ਉਦਾਹਰਣ ਲਈ, ਮਾਡਲ ਹੋ ਸਕਦਾ ਹੈ:

ਇੱਕ ਚੰਗੀ ਬਣਤਰ ਵਾਲਾ ਪਤਾ ਦੇਵੇ ਪਰ ਗਲਤ ਦੇਸ਼ ਵਰਤੇ
ਇੱਕ ਸਦਭਾਵਨਾ ਭਰਿਆ ਰਿਫੰਡ ਸੁਨੇਹਾ ਬਣਾਏ ਜੋ ਤੁਹਾਡੀ ਨੀਤੀ ਨੂੰ ਤੋੜਦਾ ਹੋਵੇ
ਇੱਕ ਸਾਰ ਜੋ ਕੋਈ ਮੈਟ੍ਰਿਕ ਬਣਾਏ ਜੋ ਤੁਹਾਡੀ ਟੀਮ ਟਰੈਕ ਨਹੀਂ ਕਰਦੀ

ਅਮਲ ਵਿੱਚ ਤੁਸੀਂ ਦੋ تہਾਂ ਦੀ ਜਾਂਚ ਦੇ ਨਾਲ ਰਿਹਾਂ ਹੋ:

ਸੰਰਚਨਾਤਮਕ ਵੈਧਤਾ (ਕੀ ਇਹ ਪਾਰਸ ਹੋ ਸਕਦਾ ਹੈ, ਪੂਰਾ ਹੈ, ਉਮੀਦ ਕੀਤੀ ਫਾਰਮੈਟ ਵਿੱਚ ਹੈ?)
ਕਾਰੋਬਾਰੀ ਵੈਧਤਾ (ਕੀ ਇਹ ਆਗਿਆਯੋਗ ਹੈ, ਕਾਫੀ ਸਹੀ ਹੈ, ਅਤੇ ਤੁਹਾਡੇ ਨਿਯਮਾਂ ਨਾਲ ਮਿਲਦਾ-ਜੁਲਦਾ ਹੈ?)

ਅਸਪਸ਼ਟਤਾ ਆਮ ਤੌਰ 'ਤੇ ਕਿੱਥੇ ਆਉਂਦੀ ਹੈ

AI ਨਤੀਜੇ ਅਕਸਰ ਉਹ ਵੇਰਵੇ ਧੁੰਦਲੇ ਕਰ ਦਿੰਦੇ ਹਨ ਜੋ ਮਨੁੱਖ ਅਸਾਨੀ ਨਾਲ ਸਪਸ਼ਟ ਕਰ ਲੈਂਦੇ ਹਨ, ਖ਼ਾਸ ਕਰਕੇ:

ਫਾਰਮੈਟ: “03/04/2025” (ਮਾਰਚ 4 ਜਾਂ ਅਪ੍ਰੈਲ 3?)
ਯੂਨਿਟਸ: “20” (ਮਿੰਟ, ਘੰਟੇ, ਡਾਲਰ?)
ਨਾਮ: “Alex Chen” (ਤੁਹਾਡੇ CRM ਵਿੱਚ ਕੌਣ?)
ਟਾਈਮ ਜੋਨਜ਼: “ਕਲ ਸਵੇਰੇ” (ਕਿਸ ਦੀ ਟਾਈਮ ਜੋਨ?)

ਕਾਂਟ੍ਰੈਕਟSochੋ: ਇਨਪੁੱਟ, ਆਉਟਪੁੱਟ, ਸਾਈਡ-ਇਫੈਕਟ

ਪ੍ਰਮਾਣਕੀ ਡਿਜ਼ਾਈਨ ਕਰਨ ਲਈ ਇੱਕ ਮਦਦਗਾਰ ਤਰੀਕਾ ਇਹ ਹੈ ਕਿ ਹਰ AI ਇੰਟਰੈਕਸ਼ਨ ਲਈ ਇੱਕ "ਕਾਂਟ੍ਰੈਕਟ" ਪਰਿਭਾਸ਼ਿਤ ਕਰੋ:

ਇਨਪੁੱਟਸ: ਲੋੜੀਂਦੇ ਫੀਲਡ, ਮਨਜ਼ੂਰ ਰੇਂਜ, ਲੋੜੀਂਦਾ ਸੰਦਰਭ
ਆਉਟਪੁੱਟਸ: ਲੋੜੀਂਦੇ ਕੀਜ਼, ਮਨਜ਼ੂਰ ਕੀਤੇ ਵੈਲਯੂਜ਼, ਕਾਨਫ਼ੀਡੈਂਸ ਥ੍ਰੇਸ਼ਹੋਲਡ
ਸਾਈਡ-ਇਫੈਕਟਸ: ਕਿਹੜੇ ਕਾਰਜ ਆਗਿਆਯੋਗ ਹਨ (ਜਿਵੇਂ "ਕੇਵਲ ਡਰਾਫਟ", "ਭੇਜਣ ਤੋ ਪਹਿਲਾਂ ਪੁਸ਼ਟੀ ਲੋੜੀ")

ਜਦੋਂ ਕਾਂਟ੍ਰੈਕਟ ਮੌਜੂਦ ਹੁੰਦੇ ਹਨ, ਪ੍ਰਮਾਣਕੀ ਨਿਯਮ ਬਿਊਰੋਕਰੇਸੀ ਨਹੀਂ ਲੱਗਦੇ—ਇਹ ਤੁਹਾਡੇ AI ਵਿਹਾਰ ਨੂੰ ਭਰੋਸੇਯੋਗ ਬਣਾਉਣ ਦੇ ਤਰੀਕੇ ਹਨ।

ਇਨਪੁੱਟ ਪ੍ਰਮਾਣਕੀਕਰਨ: ਸਾਹਮਣੇ ਦਰਵਾਜ਼ੇ ਦੀ ਰੱਖਿਆ

ਇਨਪੁੱਟ ਪ੍ਰਮਾਣਕੀਕਰਨ AI-ਤਿਆਰ ਸਿਸਟਮਾਂ ਲਈ ਭਰੋਸੇਯੋਗਤਾ ਦੀ ਪਹਿਲੀ ਲਾਈਨ ਹੈ। ਜੇ ਗੰਦਾ ਜਾਂ ਅਣਉਮੀਦ ਇਨਪੁੱਟਾਂ ਘੁੱਸ ਆ ਜਾਵੇ, ਮਾਡਲ ਫਿਰ ਵੀ ਕੁਝ "ਪੱਕਾ" ਨਤੀਜਾ ਦੇ ਸਕਦਾ ਹੈ, ਅਤੇ ਠੀਕ ਓਹੀ وجہ ਹੈ ਕਿ ਸਾਹਮਣੇ ਦਰਵਾਜ਼ਾ ਮਹੱਤਵਪੂਰਨ ਹੈ।

AI ਸਿਸਟਮ ਵਿੱਚ “ਇਨਪੁੱਟ” ਕੀ-ਕਿਹੜਾ ਗਿਣਿਆ ਜਾਂਦਾ ਹੈ?

ਇਨਪੁੱਟ ਸਿਰਫ ਪ੍ਰਾਮਪਟ ਬਾਕਸ ਨਹੀਂ ਹਨ। ਆਮ ਸਰੋਤ ਸ਼ਾਮਿਲ ਹਨ:

ਯੂਜ਼ਰ ਟੈਕਸਟ (ਚੈਟ ਸੁਨੇਹੇ, ਪ੍ਰਾਮਪਟ, ਟਿੱਪਣੀਆਂ)
ਫਾਇਲਾਂ (PDFs, ਚਿੱਤਰ, ਸਪ੍ਰੈਡਸ਼ੀਟ, ਆਡੀਓ)
ਸੰਰਚਿਤ ਫਾਰਮ (ਡ੍ਰੌਪਡਾਊਨ, ਬਹੁ-ਕਦਮ ਆਨਬੋਰਡਿੰਗ)
API ਪੇਲੋਡ (ਹੋਰ ਸੇਵਾਵਾਂ ਤੋਂ JSON, webhook)
ਹਾਸਲ ਕੀਤੇ ਡੇਟਾ (ਸਰਚ ਨਤੀਜੇ, ਡੇਟਾਬੇਸ ਕਤਾਰਾਂ, ਟੂਲ ਆਉਟਪੁੱਟ)

ਇਨ੍ਹਾਂ ਵਿੱਚੋਂ ਹਰ ਇੱਕ ਅਧੂਰਾ, ਖ਼ਰਾਬ, ਬਹੁਤ ਵੱਡਾ, ਜਾਂ ਸਿਧਾ ਉਹ ਨਹੀਂ ਜੋ ਤੁਸੀਂ ਉਮੀਦ ਕਰਦੇ ਹੋ ਹੋ ਸਕਦਾ ਹੈ।

ਟਾਲਣ ਯੋਗ ਫੇਲ੍ਹਾਂ ਨੂੰ ਰੋਕਣ ਵਾਲੀਆਂ ਪ੍ਰੈਕਟਿਕਲ ਜਾਂਚਾਂ

ਚੰਗਾ ਪ੍ਰਮਾਣਕੀਕਰਨ ਸਾਫ਼, ਟੈਸਟੇਬਲ ਨਿਯਮਾਂ 'ਤੇ ਧਿਆਨ ਦਿੰਦਾ ਹੈ:

ਲੋੜੀਂਦੇ ਫੀਲਡ: ਕੀ ਪ੍ਰਾਮਪਟ ਮੌਜੂਦ ਹੈ, ਫਾਇਲ ਜੁੜੀ ਹੈ, ਭਾਸ਼ਾ ਚੁਣੀ ਗਈ?
ਰੇਂਜ ਅਤੇ ਸੀਮਾਵਾਂ: ਵੱਧ ਤੋਂ ਵੱਧ ਫਾਇਲ ਸਾਈਜ਼, ਆਈਟਮਾਂ ਦੀ ਗਿਣਤੀ, ਨਿਊਮਰਿਕ ਘੱਟ/ਵੱਧ ਸੀਮਾਵਾਂ
ਮਨਜ਼ੂਰ ਕੀਤੇ ਮੁੱਲ: enum-ਝੁਝਲਾਉ ਫੀਲਡ ("summary" | "email" | "analysis"), ਮਨਜ਼ੂਰ ਫਾਇਲ ਕਿਸਮਾਂ
ਲੰਬਾਈ ਸੀਮਾਵਾਂ: ਪ੍ਰਾਮਪਟ ਦੀ ਲੰਬਾਈ, ਸਿਰਲੇਖ ਦੀ ਲੰਬਾਈ, ਐਰੇ ਆਕਾਰ
ਇਨਕੋਡਿੰਗ ਅਤੇ ਫਾਰਮੈਟ: ਵੈਧ UTF-8, ਵੈਧ JSON, ਬ੍ਰੋਕਨ base64 ਨਾ ਹੋਵੇ, ਸੁਰੱਖਿਅਤ URL ਫਾਰਮੇਟ

ਇਹ ਜਾਂਚਾਂ ਮਾਡਲ ਦੇ ਸੰਕਟ ਨੂੰ ਘਟਾਉਂਦੀਆਂ ਹਨ ਅਤੇ ਡਾਊਨਸਟਰੀਮ ਸਿਸਟਮਾਂ (ਪਾਰਸਰ, ਡੈਟਾਬੇਸ, ਕਿਊਜ਼) ਨੂੰ ਕਰੈਸ਼ ਹੋਣ ਤੋਂ ਬਚਾਉਂਦੀਆਂ ਹਨ।

ਨਹਿਰੋਕੇਣ ਤੋਂ ਪਹਿਲਾਂ ਨਾਰਮਲਾਈਜ਼ ਕਰੋ (ਜੇ ਸੰਭਵ ਹੋ)

ਨਾਰਮਲਾਈਜ਼ੇਸ਼ਨ "ਲਗਭਗ ਠੀਕ" ਨੂੰ ਇਕਸਾਰ ਡੇਟਾ ਵਿੱਚ ਬਦਲ ਦੇਂਦੀ ਹੈ:

ਵ੍ਹਾਈਟਸਪੇਸ ਟ੍ਰਿਮ ਕਰੋ; ਦੁਹਰਾਏ ਖਾਲੀ ਸਥਾਨ ਘਟਾਓ
ਜਦੋਂ ਮਾਇਨਾ ਬਦਲਦੀ ਨਹੀਂ, ਤਾਂ ਕੇਸ ਨਾਰਮਲਾਈਜ਼ ਕਰੋ (ਜਿਵੇਂ ਦੇਸ਼ ਕੋਡ)
ਲੋਕੇਲ ਫਾਰਮੈਟ ਧਿਆਨ ਨਾਲ ਪਾਰਸ ਕਰੋ ("," ਬਨਾਮ "." ਦਸਮੇਲ, ਵੱਖ-ਵੱਖ ਤਾਰੀਖ ਆਰਡਰ)
ਪਾਰਸ ਕਰਨ ਤੋਂ ਬਾਅਦ ਤਾਰੀਆਂ ਨੂੰ ਇੱਕ ਸਟੈਂਡਰਡ ਰੂਪ (ਜਿਵੇਂ ISO-8601) ਵਿੱਚ ਰੂਪਾਂਤਰਿਤ ਕਰੋ

ਸਿਰਫ ਉਸ ਵੇਲੇ ਨਾਰਮਲਾਈਜ਼ ਕਰੋ ਜਦੋਂ ਨਿਯਮ ਬੇਮਿਸ਼ਕ ਹੋਵੇ। ਜੇ ਤੁਸੀਂ ਯਕੀਨ ਨਹੀਂ ਹੋ ਸਕਦੇ ਕਿ ਯੂਜ਼ਰ ਨੇ ਕੀ ਮੀਨਾ ਕੀਤਾ, ਤਾਂ ਅਨੁਮਾਨ ਨਾ ਲਗਾਓ।

ਰੱਜੈਕਟ ਬਨਾਮ ਆਟੋ-ਸਹੀ: ਸੁਰੱਖਿਅਤ ਵਿਕਲਪ ਚੁਣੋ

ਰੱਜੈਕਟ ਕਰੋ ਜਦੋਂ ਸੁਧਾਰ ਕਰਨ ਨਾਲ ਮਾਇਨਾ ਬਦਲ ਸਕਦੀ ਹੈ, ਸੁਰੱਖਿਆ ਜੋਖਮ ਬਣ ਸਕਦਾ ਹੈ, ਜਾਂ ਯੂਜ਼ਰ ਦੀ ਗਲਤੀ ਚੁਪ ਹੋ ਜਾਏ (ਉਦਾਹਰਣ: ਅਸਪਸ਼ਟ ਤਾਰੀਖਾਂ, ਅਣਉਮੀਦ ਮੁਦਰਾਵਾਂ, ਸ਼ੱਕੀ HTML/JS)।
ਆਟੋ-ਸਹੀ ਜਦੋਂ ਇਰਾਦਾ ਸਪਸ਼ਟ ਹੋ ਅਤੇ ਬਦਲਾਅ ਵਾਪਸਯੋਗ ਹੋ (ਜਿਵੇਂ ਟ੍ਰਿਮਿੰਗ, ਆਮ ਵਿਸ਼ੇਸ਼ ਚਿੰਨ੍ਹ ਠੀਕ ਕਰਨਾ, ".PDF" ਨੂੰ "pdf" ਕਰਨਾ)।

ਇੱਕ ਕਾਰਗਰ ਨਿਯਮ: ਫਾਰਮੈਟ ਲਈ ਆਟੋ-ਸਹੀ, ਸੈਮਾਂਟਿਕ ਲਈ ਰੱਜੈਕਟ। ਜਦੋਂ ਤੁਸੀਂ ਰੱਜੈਕਟ ਕਰੋ, ਤਾਂ ਯੂਜ਼ਰ ਨੂੰ ਸਪਸ਼ਟ ਸੁਨੇਹਾ ਦੇਓ ਕਿ ਕੀ ਬਦਲਣਾ ਹੈ ਅਤੇ ਕਿਉਂ।

ਆਉਟਪੁੱਟ ਪ੍ਰਮਾਣਕੀਕਰਨ: ਸੰਰਚਨਾ ਅਤੇ ਮਾਇਨੇ ਦੀ ਜਾਂਚ

ਆਉਟਪੁੱਟ ਪ੍ਰਮਾਣਕੀਕਰਨ ਮਾਡਲ ਦੇ ਬੋਲਣ ਤੋਂ ਬਾਅਦ ਦੀ ਚੈੱਕ ਪੋਇੰਟ ਹੈ। ਇਹ ਦੋ ਸਵਾਲਾਂ ਦਾ ਜਵਾਬ ਦਿੰਦਾ ਹੈ: (1) ਕੀ ਆਉਟਪੁੱਟ ਠੀਕ ਰੂਪ ਵਿੱਚ ਹੈ? ਅਤੇ (2) ਕੀ ਇਹ ਵਾਸਤਵ ਵਿੱਚ ਮਨਜ਼ੂਰਯੋਗ ਅਤੇ ਉਪਯੋਗੀ ਹੈ? ਅਸਲ ਉਤਪਾਦਾਂ ਵਿੱਚ, ਤੁਹਾਨੂੰ ਆਮ ਤੌਰ 'ਤੇ ਦੋਹਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

1) ਆਉਟਪੁੱਟ ਸਕੀਮਾਂ ਨਾਲ ਸੰਰਚਨਾਤਮਕ ਪ੍ਰਮਾਣਕੀਕਰਨ

ਸਭ ਤੋਂ ਪਹਿਲਾਂ ਇੱਕ ਆਉਟਪੁੱਟ ਸਕੀਮਾ ਪਰਿਭਾਸ਼ਿਤ ਕਰੋ: ਉਹ JSON ਆਕਾਰ ਜੋ ਤੁਸੀਂ ਉਮੀਦ ਕਰਦੇ ਹੋ, ਕਿਹੜੇ ਕੀਜ਼ ਲਾਜਮੀ ਹਨ, ਅਤੇ ਉਹ ਕਿਸ ਕਿਸਮ ਅਤੇ ਮਨਜ਼ੂਰ ਕੀਤੇ ਮੁੱਲ ਹੋ ਸਕਦੇ ਹਨ। ਇਹ "ਫ੍ਰੀ-ਫਾਰਮ ਟੈਕਸਟ" ਨੂੰ ਉਸ ਚੀਜ਼ ਵਿੱਚ ਬਦਲ ਦਿੰਦਾ ਹੈ ਜਿਸਨੂੰ ਤੁਹਾਡੀ ਐਪਲੀਕੇਸ਼ਨ ਸੁਰੱਖਿਅਤ ਤਰੀਕੇ ਨਾਲ ਉਪਭੋਗ ਕਰ ਸਕੇ।

ਇੱਕ ਪ੍ਰਯੋਗਿਕ ਸਕੀਮਾ ਆਮ ਤੌਰ 'ਤੇ ਇਹ ਦਰਸਾਉਂਦਾ ਹੈ:

ਲਾਜ਼ਮੀ ਕੀਜ਼ (ਉਦਾਹਰਨ answer, confidence, citations)
ਕਿਸਮਾਂ (ਸਟ੍ਰਿੰਗ ਵਨਾਮ ਨੰਬਰ ਵਨਾਮ ਐਰੇ)
Enums (ਉਦਾਹਰਨ: status "ok" | "needs_clarification" | "refuse" ਵਿੱਚੋਂ ਇੱਕ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ)
ਬੰਧਨ (ਘੱਟ/ਜ਼ਿਆਦਾ ਲੰਬਾਈ, ਨੰਬਰ ਰੇਂਜ, ਖਾਲੀ ਨਹੀਂ ਹੋਣ ਵਾਲੇ ਐਰੇ)

ਸੰਰਚਨਾਤਮਕ ਜਾਂਚ ਆਮ ਫੇਲ੍ਹਾਂ ਨੂੰ ਫੜ ਲੈਂਦੀ ਹੈ: ਮਾਡਲ ਪ੍ਰੋਜ ਦੇ ਬਜਾਏ prose ਵਾਪਸ ਕਰ ਦੇਵੇ, ਇੱਕ ਕੀ ਨੂੰ ਭੁੱਲ ਜਾਵੇ, ਜਾਂ ਇੱਕ ਨੰਬਰ ਦੇ ਜਗ੍ਹਾ ਸਟ੍ਰਿੰਗ ਦੇ ਦੇਵੇ ਜਿਸਦੀ ਤੁਹਾਨੂੰ ਲੋੜ ਹੈ।

2) ਸੈਮਾਂਟਿਕ ਪ੍ਰਮਾਣਕੀਕਰਨ: ਸਿਰਫ਼ ਸੰਰਚਨਾ ਕਾਫੀ ਨਹੀਂ

ਪੂਰੀ ਤਰ੍ਹਾਂ ਠੀਕ JSON ਵੀ ਗਲਤ ਹੋ ਸਕਦਾ ਹੈ। ਸੈਮਾਂਟਿਕ ਪ੍ਰਮਾਣਕੀਕਰਨ ਜਾਂਚਦੀ ਹੈ ਕਿ ਸਮੱਗਰੀ ਤੁਹਾਡੇ ਉਤਪਾਦ ਅਤੇ ਨੀਤੀਆਂ ਲਈ ਮਾਇਨੇਦਾਰ ਹੈ ਕਿ ਨਹੀਂ।

ਜਿਹੜੇ ਉਦਾਹਰਣ ਸਕੀਮਾ ਪਾਸ ਕਰਦੇ ਹੋਏ ਪਰ ਮਾਇਨੇ ਵਿੱਚ ਫੇਲ ਹੁੰਦੇ ਹਨ:

ਹੈਲੂਸੀਨੇਟਿਡ IDs: customer_id: "CUST-91822" ਵਾਪਸ ਆਉਂਦਾ ਹੈ ਜੋ ਤੁਹਾਡੇ ਡੇਟਾਬੇਸ ਵਿੱਚ ਮੌਜੂਦ ਨਹੀਂ
ਕਮਜ਼ੋਰ ਹਨ ਜਾਂ ਗਲਤ ਸਰੋਤ: citations ਹਨ ਪਰ ਦਾਅਵੇ ਦੀ ਸਮਰਥਨਾ ਨਹੀਂ ਕਰਦੇ—ਜਾਂ ਉਹ ਸਰੋਤ ਮੁਹੱਈਆ ਨਹੀਂ ਸੀ
ਅਸੰਭਵ ਟੋਟਲ: ਆਈਟਮਾਂ ਦੇ ਜੋੜ 120 ਬਨਦੇ ਹਨ, ਪਰ total 98 ਹੈ; ਜਾਂ ਛੂਟ ਸਬਟੋਟਲ ਤੋਂ ਵੱਧ ਹੈ

ਸੈਮਾਂਟਿਕ ਜਾਂਚ ਆਮ ਤੌਰ 'ਤੇ ਕਾਰੋਬਾਰੀ ਨਿਯਮਾਂ ਵਰਗੀਆਂ ਹੁੰਦੀਆਂ ਹਨ: "IDs ਨੂੰ resolve ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ", "ਟੋਟਲ ਮਿਲਾਣੇ ਚਾਹੀਦੇ ਹਨ", "ਤਾਰੀਖਾਂ ਭਵਿੱਖ ਵਿੱਚ ਹੋਣੀ ਚਾਹੀਦੀ ਹਨ", "ਦਾਅਵੇ ਦਸਤਾਵੇਜ਼ਾਂ ਨਾਲ ਸਹਾਇਤ ਹੋਣ", ਅਤੇ "ਨਿੱਰੋਧਤ ਸਮੱਗਰੀ ਨਹੀਂ ਹੋਣੀ ਚਾਹੀਦੀ"।

3) ਅਸਲ ਸਿਸਟਮਾਂ ਵਿੱਚ ਕੰਮ ਕਰਨ ਵਾਲੀ ਰਣਨੀਤੀਆਂ

ਸਕੀਮਾ ਲਾਗੂ ਕਰਨਾ: JSON ਨੂੰ ਵਰਤਣ ਤੋਂ ਪਹਿਲਾਂ ਵੈਧਤਾ ਕਰਵਾਓ; ਉਲੰਘਣਾ 'ਤੇ ਰੱਜੈਕਟ ਜਾਂ ਰੀਟ੍ਰਾਈ ਕਰੋ
ਸੀਮਤ ਡਿਕੋਡਿੰਗ / ਸਰਚਿਤ ਆਉਟਪੁੱਟ: ਜੋ ਮਾਡਲ ਜਾਰੀ ਕਰ ਸਕਦਾ ਹੈ ਉਸ ਨੂੰ ਸੀਮਿਤ ਕਰੋ ਤਾਂ ਕਿ ਗਲਤ ਆਕਾਰ ਪੈਦਾ ਹੋਣਾ ਮੁਸ਼ਕਿਲ ਹੋਵੇ
ਪੋਸਟ-ਚੈਕਰ: ਨਿਰਣਾਇਕ ਵੈਰੀਫਾਇਰ ਚਲਾਓ (ਕਦੇ-ਕਦੇ ਦੂਜਾ ਮਾਡਲ ਵੀ) ਤਾਂ ਜੋ ਸੰਗਤਤਾ, ਸਾਇਟੇਸ਼ਨ ਅਤੇ ਨੀਤੀ ਪਾਲਣਾ ਦੀ ਜਾਂਚ ਹੋ ਸਕੇ

ਮਕਸਦ ਮਾਡਲ ਨੂੰ ਸਜ਼ਾ ਦੇਣਾ ਨਹੀਂ—ਮਕਸਦ ਇਹ ਹੈ ਕਿ ਡਾਊਨਸਟਰੀਮ ਸਿਸਟਮ "ਅਧਿਕਾਰ-ਭਰਪੂਰ ਬਕਵਾਸ" ਨੂੰ ਹੁਕਮ ਨਾ ਸਮਝ ਲੈਣ।

ਗਲਤੀ ਸੰਭਾਲ ਬੁਨਿਆਦੀ: ਫੇਲ ਫਾਸਟ ਜਾਂ ਫੇਲ ਗ੍ਰੇਸਫੁੱਲ

Make validation failures visible

Instrument logs and metrics to see which rules fail and where users get stuck.

Get Started

AI-ਤਿਆਰ ਸਿਸਟਮ ਕਈ ਵਾਰੀ ਅਜਿਹੇ ਨਤੀਜੇ ਦੇਣਗੇ ਜੋ ਗੈਰ-ਵੈਧ, ਅਧੂਰੇ, ਜਾਂ ਅੱਗਲੇ ਕਦਮ ਲਈ ਅਣਉਪਯੋਗ ਹੁੰਦੇ ਹਨ। ਚੰਗੀ ਗਲਤੀ ਸੰਭਾਲ ਇਹ ਫੈਸਲਾ ਕਰਦੀ ਹੈ ਕਿ ਕਿਹੜੀਆਂ ਸਮੱਸਿਆਵਾਂ ਕੰਮ ਨੂੰ ਤੁਰੰਤ ਰੋਕਣੀਆਂ ਚਾਹੀਦੀਆਂ ਹਨ, ਅਤੇ ਕਿਹੜੀਆਂ ਨੂੰ ਬਿਨਾਂ ਯੂਜ਼ਰ ਨੂੰ ਹੈਰਾਨ ਕੀਤੇ ਰਿਕਵਰ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।

ਹਾਰਡ ਫੇਲ੍ਹ ਬਨਾਮ ਸਾਫਟ ਫੇਲ੍ਹ

ਇੱਕ ਹਾਰਡ ਫੇਲ੍ਹ ਉਹ ਹੈ ਜਦੋਂ ਅੱਗੇ ਵੱਧਣਾ ਸੰਭਵ ਤੌਰ 'ਤੇ ਗਲਤ ਨਤੀਜੇ ਜਾਂ ਅਣਸੁਰੱਖਿਤ ਵਿਹਾਰ ਪੈਦਾ ਕਰੇਗਾ। ਉਦਾਹਰਣ: ਲਾਜ਼ਮੀ ਫੀਲਡ ਗਾਇਬ, JSON ਨੂੰ ਪਾਰਸ ਨਾ ਕੀਤਾ ਜਾ ਸਕੇ, ਜਾਂ ਨਤੀਜੇ ਨੇ ਕਿਸੇ ਅਣਮਨਜ਼ੂਰ ਨੀਤੀ ਦੀ ਉਲੰਘਣਾ ਕੀਤੀ। ਇਨ੍ਹਾਂ ਮਾਮਲਿਆਂ ਵਿੱਚ ਫੇਲ ਫਾਸਟ ਕਰੋ: ਰੋਕੋ, ਸਪਸ਼ਟ ਗਲਤੀ ਦਰਸਾਓ, ਅਤੇ ਅਨੁਮਾਨ ਨਾ ਕਰੋ।

ਇੱਕ ਸਾਫਟ ਫੇਲ੍ਹ ਉਹ ਹੈ ਜੋ ਰਿਕਵਰੀਯੋਗ ਹੁੰਦਾ ਹੈ ਜਿੱਥੇ ਸੁਰੱਖਿਅਤ ਫੈਲਬੈਕ ਮੌਜੂਦ ਹੈ। ਉਦਾਹਰਣ: ਮਾਡਲ ਨੇ ਸਹੀ ਮਾਇਨਾ ਦਿੱਤੀ ਪਰ ਫਾਰਮੈਟ ਠੀਕ ਨਹੀਂ, ਕੋਈ ਡਿਪੈਂਡੈਂਸੀ ਆਰਕਾਈਕਲ ਹੈ, ਜਾਂ ਬੇਨਤੀ ਟਾਈਮਆਉਟ ਹੋ ਗਿਆ। ਇੱਥੇ ਫੇਲ ਗ੍ਰੇਸਫੁੱਲ ਕਰੋ: ਰੀਟ੍ਰਾਈ (ਸੀਮਤ), ਜ਼ਿਆਦਾ ਸਖ਼ਤ ਨਿਰਦੇਸ਼ਾਂ ਨਾਲ ਮੁੜ ਪ੍ਰਾਮਪਟ ਕਰੋ, ਜਾਂ ਸਧਾਰਨ ਫੈਲਬੈਕ ਰਾਹ ਦੀ ਚੋਣ ਕਰੋ।

ਯੂਜ਼ਰ ਸੰਦੇਸ਼: ਜੋ ਹੋਇਆ ਉਹ ਕਹੋ ਅਤੇ ਅਗਲਾ ਕਦਮ ਦਸੋ

ਯੂਜ਼ਰ-ਸਾਮ੍ਹਣੇ ਗਲਤੀਆਂ ਸਖ਼ਤ ਅਤੇ ਕਾਰਗਰ ਹੋਣੀਆਂ ਚਾਹੀਦੀਆਂ ਹਨ:

ਕੀ ਹੋਇਆ: “ਅਸੀਂ ਇਸ ਦਸਤਾਵੇਜ਼ ਲਈ ਵੈਧ ਸੰਖੇਪ ਨਹੀਂ ਬਣਾਉ ਸਕੇ।”
ਅਗਲਾ ਕੀ ਕਰਨਾ ਹੈ: “ਕਿਰਪਾ ਕਰਕੇ ਮੁੜ ਕੋਸ਼ਿਸ਼ ਕਰੋ, ਜਾਂ ਇੱਕ ਛੋਟਾ ਫਾਇਲ ਅਪਲੋਡ ਕਰੋ।”
ਵਿਕਲਪਿਕ ਸੰਦਰਭ (ਗੈਰ-ਟੈਕਨੀਕਲ): “ਜਵਾਬ ਅਧੂਰਾ ਸੀ।”

ਸਟੈਕ ਟ੍ਰੇਸ, ਅੰਦਰੂਨੀ ਪ੍ਰਾਮਪਟ, ਜਾਂ ਅੰਦਰੂਨੀ IDs ਦਿਖਾਉਣ ਤੋਂ ਬਚੋ। ਇਹ ਡੀਟੇਲਾਂ ਅੰਦਰੂਨੀ ਤੌਰ 'ਤੇ ਲਾਭਦਾਇਕ ਹਨ—ਪੇਪਰ 'ਤੇ ਨਹੀਂ।

ਯੂਜ਼ਰ-ਫੇਸਿੰਗ ਗਲਤੀਆਂ ਅਤੇ ਅੰਦਰੂਨੀ ਨਿਦਾਨ ਸਪਲਾਈ ਕਰਨ ਨੂੰ ਵੱਖਰਾ ਕਰੋ

ਗਲਤੀਆਂ ਨੂੰ ਦੋ ਸਮਕਾਲੀ ਆਉਟਪੁੱਟ ਵਾਂਗ ਬਰਤੋ:

ਯੂਜ਼ਰ-ਫੇਸਿੰਗ: ਇੱਕ ਸੇਫ਼ ਸੁਨੇਹਾ, ਅਗਲਾ ਕਦਮ, ਅਤੇ (ਕਦੇ-ਕਦੇ) ਇੱਕ ਰੀਟ੍ਰਾਈ ਬਟਨ
ਅੰਦਰੂਨੀ ਨਿਦਾਨ: ਢਾਂਚਾਬੱਧ ਲਾਗਜ਼ਿੰਗ ਇੱਕ ਗਲਤੀ ਕੋਡ, ਰਾਅ ਮਾਡਲ ਆਉਟਪੁੱਟ, ਪ੍ਰਮਾਣਕੀ ਨਤੀਜੇ, ਸਮਾਂ, ਅਤੇ ਇਕ correlation/request ID

ਇਸ ਨਾਲ ਪ੍ਰੋਡਕਟ ਸ਼ਾਂਤ ਅਤੇ ਸਮਝਦਾਰ ਬਣਦਾ ਹੈ, ਅਤੇ ਤੁਹਾਡੇ ਟੀਮ ਨੂੰ ਸਮੱਸਿਆਵਾਂ ਠੀਕ ਕਰਨ ਲਈ ਕਾਫ਼ੀ ਜਾਣਕਾਰੀ ਮਿਲਦੀ ਹੈ।

ਤੇਜ਼ ਤਰਤੀਬ ਲਈ ਗਲਤੀਆਂ ਨੂੰ ਵਰਗੀਕ੍ਰਿਤ ਕਰੋ

ਸਧਾਰਣ ਟੈਕਸੋਨੋਮੀ ਟੀਮਾਂ ਨੂੰ ਤੇਜ਼ ਕਾਰਵਾਈ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ:

ਪ੍ਰਮਾਣਕੀ: ਆਉਟਪੁੱਟ ਸਕੀਮਾ ਨਾਲ ਮੇਲ ਨਹੀਂ ਖਾਂਦਾ, ਫੀਲਡ ਗਾਇਬ, ਅਸੁਰੱਖਿਅਤ ਸਮੱਗਰੀ
ਡਿਪੈਂਡੈਂਸੀ: ਡੈਟਾਬੇਸ/API ਫੇਲਿਅਰ, ਪਰਮਿਸ਼ਨ ਮੁੱਦੇ
ਟਾਈਮਆਉਟ: ਮਾਡਲ ਜਾਂ ਅੱਪਸਟ੍ਰੀਮ ਕਾਲ ਸਮਾਂ ਉਲੰਘ ਗਿਆ
ਲੌਜਿਕ: glue ਕੋਡ, ਮੈਪਿੰਗ, ਜਾਂ ਕਾਰੋਬਾਰੀ ਨਿਯਮਾਂ ਵਿੱਚ ਬੱਗ

ਜਦੋਂ ਤੁਸੀਂ ਇਕ ਘਟਨਾ ਨੂੰ ਠੀਕ ਢੰਗ ਨਾਲ ਲੇਬਲ ਕਰ ਸਕਦੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਇਸ ਨੂੰ ਸਹੀ ਮਾਲਕ ਨੂੰ ਰਾਊਟ ਕਰ ਸਕਦੇ ਹੋ—ਅਤੇ ਅਗਲੀ ਵਾਰ ਸਹੀ ਨਿਯਮ ਸੁਧਾਰ ਸਕਦੇ ਹੋ।

ਰਿਕਵਰੀਜ਼ ਅਤੇ ਫਾਲਬੈਕ ਜੋ ਗਲਤੀਆਂ ਨੂੰ ਵਧਾਉਂਦੇ ਨਹੀਂ

ਪ੍ਰਮਾਣਕੀ ਨਿਯਮ ਸਮੱਸਿਆਵਾਂ ਫੜ ਲੈਂਦੇ ਹਨ; ਰਿਕਵਰੀ ਇਹ ਤੈਅ ਕਰਦੀ ਹੈ ਕਿ ਯੂਜ਼ਰ ਨੂੰ ਮਦਦਗਾਰ ਅਨੁਭਵ ਮਿਲੇਗਾ ਜਾਂ ਮਨਪਸੰਦ ਇਕ ਰੁਕਾਵਟ। ਮਕਸਦ "ਹਮੇਸ਼ਾ ਸਫਲ ਹੋ ਜਾਣਾ" ਨਹੀਂ—ਮਕਸਦ ਹੈ "ਭਰੋਸੇਯੋਗ ਤਰੀਕੇ ਨਾਲ ਫੇਲ੍ਹ ਕਰਨਾ, ਅਤੇ ਸੁਰੱਖਿਆ ਨਾਲ degrade ਕਰਨਾ"।

ਰੀਟ੍ਰਾਈਜ਼: ਤਜ਼ਰੀਅੀ ਫੇਲ੍ਹਾਂ ਲਈ ਮਦਦਗਾਰ, ਗਲਤ ਜਵਾਬਾਂ ਲਈ ਨੁਕਸਾਨਦਾਇਕ

ਰੀਟ੍ਰਾਈ ਲੋਜਿਕ ਸਭ ਤੋਂ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਹੁੰਦੀ ਹੈ ਜਦੋਂ ਫੇਲ੍ਹ ਸੰਭਵਤ: ਤਾਰੀਖੀ ਹੋਵੇ:

ਰੇਟ ਲਿਮਿਟਸ (429), ਨੈੱਟਵਰਕ ਹਿਕਸ, ਜਾਂ ਮਾਡਲ ਟਾਈਮਆਉਟ
ਛੋਟੀ ਮਿਆਦ ਦੀ ਉਪਸਥਿਤੀ ਰੁਕਾਵਟ

ਬਾਊਂਡਡ ਰੀਟ੍ਰਾਈਜ਼ ਵਰਤੋ ਜਿਸ ਵਿੱਚ exponential backoff ਅਤੇ jitter ਹੋਵੇ। ਲਗਾਤਾਰ ਪੰਜ ਵਾਰ ਤੁਰੰਤ ਰੀਟ੍ਰਾਈ ਕਰਨਾ ਇੱਕ ਛੋਟੀ ਘਟਨਾ ਨੂੰ ਵੱਡੀ ਬਣਾਉਣ ਦਾ ਕਾਰਣ ਬਣਦਾ ਹੈ।

ਜਦੋਂ ਆਉਟਪੁੱਟ ਸੰਰਚਨਾਤਮਕ ਤੌਰ 'ਤੇ ਗਲਤ ਜਾਂ ਸੈਮਾਂਟਿਕ ਤੌਰ 'ਤੇ ਗਲਤ ਹੋਵੇ, ਤਾਂ ਰੀਟ੍ਰਾਈਜ਼ ਨੁਕਸਾਨਦਾਇਕ ਹੋ ਸਕਦੇ ਹਨ। ਜੇ ਤੁਹਾਡੇ ਵੈਲਿਡੇਟਰ ਨੇ ਕਿਹਾ "ਲਾਜ਼ਮੀ ਫੀਲਡ ਗਾਇਬ" ਜਾਂ "ਨੀਤੀ ਉਲੰਘਣਾ", ਤਾਂ ਇੱਕੋ ਪ੍ਰਾਮਪਟ ਨਾਲ ਦੂਜੀ ਕੋਸ਼ਿਸ਼ ਕੇਵਲ ਵੱਖਰੀ ਗਲਤ ਜਵਾਬ ਪੈਦਾ ਕਰ ਸਕਦੀ ਹੈ—ਅਤੇ ਟੋਕਨ ਅਤੇ ਲੇਟੈਂਸੀ ਖ਼ਰਚ ਕਰ ਸਕਦੀ ਹੈ। ਐਸੇ ਮਾਮਲਿਆਂ ਵਿੱਚ, ਪ੍ਰਾਮਪਟ ਰੀਪੇਅਰ (ਜਿਆਦਾ ਸਖ਼ਤ ਹੁਕਮ) ਜਾਂ ਫਾਲਬੈਕ ਪਸੰਦ ਕਰੋ।

ਸਧਾਰਨ ਤੌਰ 'ਤੇ degrade ਕਰਨ ਵਾਲੇ ਫਾਲਬੈਕ

ਇੱਕ ਚੰਗਾ ਫਾਲਬੈਕ ਉਹ ਹੈ ਜੋ ਤੁਸੀਂ ਯੂਜ਼ਰ ਨੂੰ ਸਮਝਾ ਸਕਦੇ ਹੋ ਅਤੇ ਅੰਦਰੂਨੀ ਤੌਰ 'ਤੇ ਮੈਜਰ ਕਰ ਸਕਦੇ ਹੋ:

ਛੋਟਾ/ਸਸਤਾ ਮਾਡਲ "ਕਾਫ਼ੀ ਚੰਗਾ" ਜਵਾਬ ਲਈ
ਕੀਚ-ਦਿੱਤਾ ਜਵਾਬ (cached answer) ਦੋਹਰਾਏ ਜਾਂ ਸਥਿਰ ਪ੍ਰਸ਼ਨਾਂ ਲਈ
ਨਿਯਮ-ਆਧਾਰਿਤ ਬੇਸਲਾਈਨ (ਟੈਮਪਲੇਟ, হਿਊਰਿਸਟਿਕਸ) ਨਿਰਧਾਰਿਤ ਫਾਰਮੇਟ ਲਈ
ਮਾਨਵ ਸਮੀਖਿਆ ਜਦੋਂ ਗਲਤੀ ਦਾ ਨਤੀਜਾ ਉੱਚ ਜੋਖਮ ਵਾਲਾ ਹੋਵੇ

ਹਸਤਾਂਤਰਨ ਨੂੰ ਸਪੱਸ਼ਟ ਰੱਖੋ: ਕਿਹੜਾ ਰਾਹ ਵਰਤਿਆ ਗਿਆ ਤਾਂ ਜੋ ਤੁਸੀਂ بعد ਵਿੱਚ ਗੁਣਵੱਤਾ ਅਤੇ ਲਾਗਤ ਦੀ ਤੁਲਨਾ ਕਰ ਸਕੋ।

ਅੰਸ਼ਿਕ ਸਫਲਤਾ: ਚੇਤਾਵਨੀ ਨਾਲ ਬੈਸਟ-ਇਫੋਰਟ ਵਾਪਸ ਕਰੋ

ਕਈ ਵਾਰ ਤੁਸੀਂ ਉਪਯੋਗੀ ਸਬਸੈੱਟ ਦੇ ਸਕਦੇ ਹੋ (ਉਦਾਹਰਣ: ਨਿਕਲੇ ਹੋਏ ਐਂਟੀਟੀਜ਼ ਪਰ ਪੂਰਨ ਸੰਖੇਪ ਨਹੀਂ)। ਇਸਨੂੰ ਅੰਸ਼ਿਕ ਵਜੋਂ ਦਰਸਾਓ, ਚੇਤਾਵਨੀਆਂ ਸ਼ਾਮਿਲ ਕਰੋ, ਅਤੇ ਗੈਰ-ਜਰੂਰੀ ਖਾਲੀਆਂ ਥਾਵਾਂ ਨੂੰ ਚੁੱਪਚਾਪ ਭਰਨ ਤੋਂ ਬਚੋ। ਇਹ ਭਰੋਸਾ ਬਚਾਉਂਦਾ ਹੈ ਅਤੇ ਕਾਲਰ ਨੂੰ ਕਾਮਯਾਬ ਕੁਝ ਦਿੰਦਾ ਹੈ।

ਰੇਟ ਲਿਮਿਟਸ, ਟਾਈਮਆਉਟ ਅਤੇ ਸਰਕਿਟ ਬ੍ਰੇਕਰ

ਹਰ ਕਾਲ ਲਈ ਟਾਈਮਆਉਟ ਅਤੇ ਕੁੱਲ ਰਿਕਵੇਸਟ ਡੈਡਲਾਈਨ ਸੈੱਟ ਕਰੋ। ਜਦੋਂ ਰੇਟ-ਲਿਮਿਟ ਹੋਵੇ, Retry-After ਦਾ ਆਦਰ ਕਰੋ (ਜੇ ਮੌਜੂਦ ਹੋਵੇ)। ਇੱਕ ਸਰਕਿਟ ਬ੍ਰੇਕਰ ਸ਼ਾਮਿਲ ਕਰੋ ਤਾਂ ਜੋ بار-بار ਫੇਲ੍ਹ ਹੋਣ 'ਤੇ ਤੇਜ਼ੀ ਨਾਲ ਫਾਲਬੈਕ 'ਤੇ ਸਵਿੱਚ ਹੋ ਜਾਏ ਨਾ ਕਿ ਮਾਡਲ/API 'ਤੇ ਦਬਾਅ ਵਧੇ। ਇਹ cascading slowdowns ਨੂੰ ਰੋਕਦਾ ਅਤੇ ਰਿਕਵਰੀ ਵਿਹਾਰ ਨੂੰ ਸਥਿਰ ਬਣਾਉਂਦਾ ਹੈ।

ਅਸਲ ਵਰਤੋਂ ਵਿੱਚ ਐਜ-ਕੇਸ ਕਿੱਥੋਂ ਆਉਂਦੇ ਹਨ

ਐਜ-ਕੇਸ ਉਹ ਹਾਲਤਾਂ ਹਨ ਜੋ ਤੁਹਾਡੀ ਟੀਮ ਡੈਮੋਜ਼ ਵਿੱਚ ਨਹੀਂ ਦੇਖਦੀ: ਵਿਰਲੇ ਇਨਪੁੱਟ, ਅਜੀਬ ਫਾਰਮੈਟ, ਵਿਵਾਦੀ ਪ੍ਰਾਮਪਟ, ਜਾਂ ਗੱਲਬਾਤ ਜੋ ਬਹੁਤ ਲੰਬੀ ਚੱਲ ਜਾਂਦੀ ਹੈ। AI-ਤਿਆਰ ਸਿਸਟਮਾਂ ਨਾਲ, ਇਹ ਤੇਜ਼ੀ ਨਾਲ ਉੱਪੱਜਦੇ ਹਨ ਕਿਉਂਕਿ ਲੋਕ ਸਿਸਟਮ ਨੂੰ ਲਚਕੀਲੇ ਸਹਾਇਕ ਵਾਂਗ ਵਰਤਦੇ ਹਨ—ਫਿਰ ਉਸਨੂੰ ਖੁਸ਼ ਰਸਤਾ ਤੋਂ ਬਾਹਰ ਧੱਕਦੇ ਹਨ।

1) ਵਿਰਲੇ ਅਤੇ ਗੰਦੇ ਯੂਜ਼ਰ ਇਨਪੁੱਟ

ਅਸਲ ਯੂਜ਼ਰ ਟੈਸਟ ਡੇਟਾ ਵਾਂਗ ਨਹੀਂ ਲਿਖਦੇ। ਉਹ ਸਕ੍ਰੀਨਸ਼ਾਟਾਂ ਚੈਪ ਕਰਦਿਆਂ ਤੋਂ ਬਦਲੇ ਹੋਏ ਟੈਕਸਟ ਪੇਸਟ ਕਰਦੇ ਹਨ, ਅਧ-ਮੁਕੰਮਲ ਨੋਟਸ, ਜਾਂ PDF ਤੋਂ ਨਕਲ ਕੀਤਾ ਸਮੱਗਰੀ ਜਿਸ ਵਿਚ ਅਜੀਬ ਲਾਈਨ-ਬ੍ਰੇਕਸ ਹੋਦੇ ਹਨ। ਉਹ "ਕ੍ਰੀਏਟਿਵ" ਪ੍ਰਾਮਪਟ ਵੀ ਟਰਾਈ ਕਰਦੇ ਹਨ: ਮਾਡਲ ਨੂੰ ਨਿਯਮ ਅਣਡਿੱਠੇ ਕਰਨ ਲਈ ਕਹਿਣਾ, ਛੁਪੇ ਹੋਏ ਨਿਦੇਸ਼ ਬਾਹਰ ਲਿਆਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਨਾ, ਜਾਂ ਜਾਣ-ਬੁਝ ਕੇ ਗੁੰਝਲਦਾਰ ਫਾਰਮੇਟ ਵapas ਕਰਵਾਉਣਾ।

ਲੰਮਾ ਸੰਦਰਭ ਇੱਕ ਹੋਰ ਆਮ ਐਜ-ਕੇਸ ਹੈ। ਇੱਕ ਯੂਜ਼ਰ 30-ਪੰਨੇ ਦੀ ਦਸਤਾਵੇਜ਼ ਅਪਲੋਡ ਕਰ ਸਕਦਾ ਹੈ ਅਤੇ ਢਾਂਚਾਬੱਧ ਸਾਰ ਮੰਗ ਸਕਦਾ ਹੈ, ਫਿਰ ਦਸ ਸਪੱਸ਼ਟੀਕਰਨ ਸਵਾਲ ਪੋੱਛ ਸਕਦਾ ਹੈ। ਪਹਿਲੇ ਦੌਰ ਵਿੱਚ ਮਾਡਲ ਚੰਗਾ ਪ੍ਰਦਰਸ਼ਨ ਦਿਖਾ ਸਕਦਾ ਹੈ, ਪਰ ਸੰਦਰਭ ਵਧਣ ਨਾਲ ਵਿਹਾਰ ਡ੍ਰਿਫਟ ਕਰ ਸਕਦਾ ਹੈ।

2) ਬਾਰਡਰੀ ਵੈਲਯੂਜ਼ ਜੋ ਧਾਰਣਾਵਾਂ ਨੂੰ ਟੋੜਦੇ ਹਨ

ਕਈ ਫੇਲ੍ਹ ਆਮ ਉਪਯੋਗ ਤੋਂ ਜ਼ਿਆਦਾ ਪਰਿਧੀਆਂ ਤੋਂ ਆਉਂਦੇ ਹਨ:

ਖਾਲੀ ਮੁੱਲ: ਖਾਲੀ ਫੀਲਡ, ਗਾਇਬ ਅਟੈਚਮੈਂਟ, ਜਾਂ ਮੂਲ-ਥਾਂ "N/A"
ਵੱਧ ਤੋਂ ਵੱਧ ਲੰਬਾਈ: ਬਹੁਤ ਲੰਬੇ ਨਾਮ, ਵੱਡੇ ਲਿਸਟ, ਬਹੁ-ਪੈਰਾ ਪਤੇ, ਜਾਂ ਪੂਰੀ ਚੈਟ ਇਤਿਹਾਸ ਇੱਕ ਇਨਪੁੱਟ ਵਿੱਚ
ਅਸਧਾਰਣ ਯੂਨੀਕੋਡ: emojis, zero-width spaces, smart quotes, right-to-left ਟੈਕਸਟ, ਜਾਂ ਮਿਲਦੇ-ਜੁਲਦੇ ਕਿ ਉਹ ਤੁਲਨਾ ਵਿੱਚ ਵੱਖਰੇ ਹੋ ਸਕਦੇ ਹਨ
ਮਿਖਿਆ ਭਾਸ਼ਾਵਾਂ: ਟਿਕਟ ਅੱਧ-English ਅੱਧ-Spanish; ਕੈਟਲੌਗ ਜਿੱਥੇ ਸਿਰਲੇਖ ਜਾਪਾਨੀ 'ਚ ਹਨ ਪਰ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਫ਼ਰਾਂਸੀਸੀ ਵਿੱਚ

ਇਹ ਅਕਸਰ ਬੁਨਿਆਦੀ ਜਾਂਚਾਂ ਨੂੰ ਪਾਰ ਕਰ ਜਾਂਦੇ ਹਨ ਕਿਉਂਕਿ ਟੈਕਸਟ ਮਨੁੱਖਾਂ ਨੂੰ ਠੀਕ ਲੱਗਦਾ ਹੈ ਪਰ ਪਾਰਸਿੰਗ, ਗਿਣਤੀ, ਜਾਂ ਡਾਊਨਸਟ੍ਰੀਮ ਨਿਯਮਾਂ ਵਿੱਚ ਫੇਲ ਹੁੰਦਾ ਹੈ।

3) ਇੰਟਿਗ੍ਰੇਸ਼ਨ ਐਜ-ਕੇਸ (ਦੁਨੀਆ ਤੁਹਾਡੇ ਹੇਠਾਂ ਬਦਲ ਜਾਂਦੀ ਹੈ)

ਭਾਵੇਂ ਤੁਹਾਡਾ ਪ੍ਰਾਮਪਟ ਅਤੇ ਪ੍ਰਮਾਣਕੀ ਠੀਕ ਹੋਵੇ, ਇੰਟਿਗ੍ਰੇਸ਼ਨ ਨਵੇਂ ਐਜ-ਕੇਸ ਲਿਆ ਸਕਦੀ ਹੈ:

ਇੱਕ ਡਾਊਨਸਟ੍ਰੀਮ API ਫੀਲਡ ਦਾ ਨਾਮ ਬਦਲ ਦੇਵੇ, ਲਾਜ਼ਮੀ ਪੈਰਾਮੀਟਰ ਸ਼ਾਮਿਲ ਕਰ ਦੇਵੇ, ਜਾਂ ਨਵੀਆਂ 에ਰਰ ਕੋਡਸ ਵਾਪਸ ਕਰਨ ਲੱਗੇ
ਪਰਮਿਸ਼ਨ ਗਲਤੀਆਂ: AI ਇੱਕ ਡੇਟਾ ਦੀ ਬੇਨਤੀ ਬਣਾਉਂਦਾ ਹੈ ਜਿਸ ਤੱਕ ਯੂਜ਼ਰ ਨੂੰ ਅਧਿਕਾਰ ਨਹੀਂ, ਜਾਂ ਸਰਵਿਸ ਅਕਾਊਂਟ ਲਈ ਕਾਰਵਾਈ ਕਰਨ ਦਾ ਅਧਿਕਾਰ ਨਹੀਂ
ਡੇਟਾ ਸਹਿਮਤੀਆਂ 'ਚ ਡ੍ਰਿਫਟ: ਇੱਕ ਟੂਲ ISO ਤਾਰੀਖਾਂ ਉਮੀਦ ਕਰਦਾ ਹੈ ਪਰ "ਅਗਲਾ ਸ਼ੁੱਕਰਵਾਰ" ਮਿਲਦਾ ਹੈ, ਜਾਂ ਮੁਦਰਾ ਕੋਡ ਦੀ ਬਜਾਏ ਸਿੰਬਲ ਮਿਲਦਾ ਹੈ

4) "ਅਜਾਣੀਆਂ-ਅਜਾਣੀਆਂ" ਅਤੇ ਲੌਗਜ਼ ਕਿਉਂ ਜ਼ਰੂਰੀ ਹਨ

ਕੁਝ ਐਜ-ਕੇਸ ਪਹਿਲਾਂ ਭਵਿੱਖਬਾਣੀ ਨਹੀਂ ਕੀਤੇ ਜਾ ਸਕਦੇ। ਇਕੱਲੀ ਭਰੋਸੇਯੋਗ ਤਰੀਕਾ ਉਹਨਾਂ ਦੀ ਖੋਜ ਕਰਨ ਲਈ ਅਸਲ ਫੇਲ੍ਹਾਂ ਨੂੰ ਵੇਖਣਾ ਹੈ। ਚੰਗੇ ਲਾਗਜ਼ ਅਤੇ ਟ੍ਰੇਸਜ਼ ਵਿੱਚ ਇਹ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ: ਇਨਪੁੱਟ ਆਕਾਰ (ਸੁਰੱਖਿਅਤ ਤਰੀਕੇ ਨਾਲ), ਮਾਡਲ ਆਉਟਪੁੱਟ (ਸੁਰੱਖਿਅਤ), ਜੋ ਪ੍ਰਮਾਣਕੀ ਨਿਯਮ ਫੇਲ ਹੋਏ, ਅਤੇ ਕਿਸ ਫਾਲਬੈਕ ਰਾਹ ਚਲਿਆ। ਜਦੋਂ ਤੁਸੀਂ ਫੇਲ੍ਹਾਂ ਨੂੰ ਪੈਟਰਨ ਵਾਂਗ ਗਰੁੱਪ ਕਰ ਸਕਦੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਹੈਰਾਨੀ ਨੂੰ ਨਵੇਂ ਸਪੱਸ਼ਟ ਨਿਯਮਾਂ ਵਿਚ ਤਬਦੀਲ ਕਰ ਸਕਦੇ ਹੋ—ਬਿਨਾਂ ਅਨੁਮਾਨ ਲਗਾਏ।

ਸੁਰੱਖਿਆ ਅਤੇ ਸੁਰੱਖਿਆ: ਜਦੋਂ ਪ੍ਰਮਾਣਕੀਕਰਨ ਰક્ષણ ਬਣ ਜਾਂਦਾ ਹੈ

Build agents with guardrails

Define tool limits and confirmations so agents only take actions your product allows.

Try It

ਪ੍ਰਮਾਣਕੀਕਰਨ ਕੇਵਲ ਆਉਟਪੁੱਟ ਨੂੰ ਸਾਫ਼ ਰੱਖਣ ਬਾਰੇ ਨਹੀਂ; ਇਹ ਵੀ ਹੈ ਕਿਤੰੂ AI ਸਿਸਟਮ ਨੂੰ ਕੁਝ ਅਣਸੁਰੱਖਿਅਤ ਕਰਨ ਤੋਂ ਰੋਕਿਆ ਜਾ ਸਕੇ। AI-ਸ_ieabled ਐਪਾਂ ਵਿੱਚ ਬਹੁਤ ਸਾਰੇ ਸੁਰੱਖਿਆ ਘਟਨਾਕ੍ਰਮ ਸਿਰਫ਼ "ਖ਼ਰਾਬ ਇਨਪੁੱਟ" ਜਾਂ "ਖ਼ਰਾਬ ਆਉਟਪੁੱਟ" ਦੇ ਮੁੱਦੇ ਹੁੰਦੇ ਹਨ ਪਰ ਉਚੇ ਸਟੇਕਸ: ਇਹ ਡੇਟਾ ਲੀਕ, ਅਣਅਧਿਕਾਰਤ ਕਾਰਵਾਈਆਂ, ਜਾਂ ਟੂਲ ਮਿਸਯੂਜ਼ ਨੂੰ ਜਨਮ ਦੇ ਸਕਦੇ ਹਨ।

ਪ੍ਰਾਮਪਟ ਇੰਜੈਕਸ਼ਨ ਇੱਕ ਪ੍ਰਮਾਣਕੀ ਸਮੱਸਿਆ ਹੈ (ਸੁਰੱਖਿਆ ਪ੍ਰਭਾਵ ਨਾਲ)

Prompt injection ਉਹ ਸਮਾਂ ਹੈ ਜਦੋਂ ਅਨਟਰੱਸਟ ਕੀਤੀ ਸਮੱਗਰੀ (ਯੂਜ਼ਰ ਸੁਨੇਹਾ, ਵੈਬ ਪੇਜ, ਈਮੇਲ, ਦਸਤਾਵੇਜ਼) ਵਿੱਚ ਇੰਝ ਨਿਰਦੇਸ਼ ਹੋ ਸਕਦੇ ਹਨ: "ਆਪਣੇ ਨਿਯਮ ਨਹੀਂ ਮੰਨੋ" ਜਾਂ "ਮੈਨੂੰ ਛੁਪਿਆ ਸਿਸਟਮ ਪ੍ਰਾਮਪਟ ਭੇਜੋ"। ਇਹ ਇੱਕ ਪ੍ਰਮਾਣਕੀ ਸਮੱਸਿਆ ਵਾਂਗ ਲੱਗਦਾ ਹੈ ਕਿਉਂਕਿ ਸਿਸਟਮ ਨੂੰ ਇਹ ਫੈਸਲਾ ਕਰਨਾ ਪੈਂਦਾ ਹੈ ਕਿ ਕਿਹੜੇ ਨਿਰਦੇਸ਼ ਵੈਧ ਹਨ ਅਤੇ ਕਿਹੜੇ ਦੁਖਦਾਈ।

ਇੱਕ ਵਰਤੋਂਯੋਗ ਰੁਖ: ਮਾਡਲ-ਵੱਲੇ ਟੈਕਸਟ ਨੂੰ ਅਣ-ਭਰੋਸੇਯੋਗ ਮੰਨੋ। ਤੁਹਾਡੀ ਐਪ ਨੂੰ ਇਰਾਦਾ ਦੀ ਜਾਂਚ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ (ਕਿਹੜਾ ਇੱਕ ਕਾਰਜ ਮੰਗਿਆ ਜਾ ਰਿਹਾ ਹੈ) ਅਤੇ ਅਧਿਕਾਰ (ਬੇਨਤੀ ਕਰਨ ਵਾਲਾ ਇਸ ਨੂੰ ਕਰਨ ਦਾ ਹੱਕ ਰੱਖਦਾ ਹੈ) — ਸਿਰਫ਼ ਫਾਰਮੈਟ ਦੀ ਨਹੀਂ।

ਰੱਖਿਆ ਵਾਲੀਆਂ ਜਾਂਚਾਂ ਜੋ ਗਾਰਡਰੇਲ ਵਾਂਗ ਕੰਮ ਕਰਦੀਆਂ ਹਨ

ਚੰਗੀ ਸੁਰੱਖਿਆ ਅਕਸਰ ਆਮ ਪ੍ਰਮਾਣਕੀ ਨਿਯਮਾਂ ਵਾਂਗ دکھਦੀ ਹੈ:

ਟੂਲ allowlists: ਖਾਸ ਸੰਦਰਭ ਵਿੱਚ ਕਿਹੜੇ ਟੂਲ/ਕਾਰਵਾਈਆਂ ਮਾਡਲ ਕਾਲ ਕਰ ਸਕਦਾ ਹੈ ਉਸਨੂੰ ਖੁੱਲ੍ਹੇ ਢੰਗ ਨਾਲ ਸੀਮਿਤ ਕਰੋ
URL ਅਤੇ ਫਾਇਲ ਸੀਮਾਵਾਂ: ਕੇਵਲ ਮਨਜ਼ੂਰ ਡੋਮੇਨ ਆਨੁਮਤ ਕਰੋ, लोकਲ ਨੈੱਟਵਰਕ ਟਾਰਗਟਾਂ ਨੂੰ ਰੋਕੋ, ਫਾਇਲ ਕਿਸਮ/ਸਾਈਜ਼ ਸੀਮਤ ਕਰੋ, ਅਤੇ arbitrary file reads ਤੋਂ ਬਚੋ
ਡੇਟਾ ਰੈਡੈਕਸ਼ਨ: ਸਿਕ੍ਰੈਟ (API ਕੀਜ਼, ਟੋਕਨ), ਨਿੱਜੀ ਡੇਟਾ, ਅਤੇ ਅੰਦਰੂਨੀ IDs ਨੂੰ ਮਾਡਲ ਨੂੰ ਭੇਜਣ ਤੋਂ ਪਹਿਲਾਂ ਜਾਂ ਆਉਟਪੁੱਟ ਵਾਪਸ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਪਤਾ ਲਾ ਕੇ ਹਟਾਓ

ਜੇ ਤੁਸੀਂ ਮਾਡਲ ਨੂੰ ਬਰਾਊਜ਼ ਕਰਨ ਜਾਂ ਦਸਤਾਵੇਜ਼ ਫੈਚ ਕਰਨ ਦਿੰਦੇ ਹੋ, ਤਾਂ ਇਹ ਜਾਂਚੋ ਕਿ ਇਹ ਕਿੱਥੇ ਜਾ ਸਕਦਾ ਹੈ ਅਤੇ ਕੀ ਲੈ ਕੇ ਆ ਸਕਦਾ ਹੈ।

ਟੂਲਾਂ ਅਤੇ ਟੋਕਨ ਲਈ ਘੱਟੋ-ਘੱਟ ਅਧਿਕਾਰ ਦਾ ਨਿਯਮ

least privilege ਲਾਗੂ ਕਰੋ: ਹਰ ਟੂਲ ਨੂੰ ਘੱਟ ਤੋਂ ਘੱਟ ਅਨੁਮਤੀਆਂ ਦਿਓ, ਅਤੇ ਟੋਕਨਾਂ ਨੂੰ ਟਾਈਟ ਸਕੋਪ ਕਰੋ (ਛੋਟੀ పద ਰਹਿਤ, ਸੀਮਤ ਐਂਡਪਾਇੰਟ, ਸੀਮਤ ਡੇਟਾ). ਇਹ ਬਿਹਤਰ ਹੈ ਕਿ ਬੇਨਤੀ ਫੇਲ ਹੋ ਜਾਵੇ ਅਤੇ ਇੱਕ ਸੀਮਤ ਕਾਰਜ ਮੰਗਣਾ, ਬਜਾਏ ਵਿਆਪਕ ਪਹੁੰਚ ਦੇਣ ਦੇ "ਕਿਰਪਾ ਕਰਕੇ"।

ਸੰਵੇਦਨਸ਼ੀਲ ਕਾਰਵਾਈਆਂ ਲਈ friction ਅਤੇ traceability ਲੋੜੀਂਦੀ ਹੈ

ਉੱਚ-ਪ੍ਰਭਾਵ ਵਾਲੀਆਂ ਕਾਰਵਾਈਆਂ (ਭੁਗਤਾਨ, ਖਾਤਾ ਬਦਲਾਅ, ਈਮੇਲ ਭੇਜਣਾ, ਡੇਟਾ ਮਿਟਾਉਣਾ) ਲਈ ਸ਼ਾਮਿਲ ਕਰੋ:

ਸਪੱਸ਼ਟ ਪੁਸ਼ਟੀਅਕਰਨ ("ਤੁਸੀਂ X ਨੂੰ $500 ਭੇਜਣ ਜਾ ਰਹੇ ਹੋ—ਕੀ ਪੁਸ਼ਟੀ ਕਰੋ?")
ਡੁਅਲ ਕਨਟਰੋਲ (ਮਹੱਤਵਪੂਰਨ ਕਾਰਵਾਈ ਲਈ ਮਨੁੱਖੀ ਮਨਜ਼ੂਰੀ ਜਾਂ ਦੂਜੀ ਫੈਕਟਰ)
ਆਡਿਟ ਟ੍ਰੇਲਜ਼ (ਕਿਸ ਨੇ ਮੰਗ ਕੀਤੀ, ਕੀ ਚਲਾਇਆ ਗਿਆ, ਇਨਪੁੱਟ, ਟੂਲ ਕਾਲਾਂ, ਟਾਈਮਸਟੈਂਪ)

ਇਹ ਉਪਾਇਆ ਪ੍ਰਮਾਣਕੀ ਨੂੰ ਇੱਕ UX ਡੀਟੇਲ ਤੋਂ ਵਾਸਤਵਿਕ ਸੁਰੱਖਿਆ ਬਾਊਂਡਰੀ ਬਣਾਉਂਦੇ ਹਨ।

AI-ਤਿਆਰ ਵਿਹਾਰ ਲਈ ਟੈਸਟਿੰਗ ਰਣਨੀਤੀ

AI-ਤਿਆਰ ਵਿਹਾਰ ਦੀ ਪੜਤਾਲ ਉਸ ਸਮੇਂ ਸਭ ਤੋਂ ਵਧੀਆ ਕੰਮ ਕਰਦੀ ਹੈ ਜਦੋਂ ਤੁਸੀਂ ਮਾਡਲ ਨੂੰ ਇੱਕ ਅਨਿਸ਼ਚਿਤ ਸਹਿਯੋਗੀ ਵਾਂਗ ਸਮਝਦੇ ਹੋ: ਤੁਸੀਂ ਹਰ ਸਟੇਂਟੈਂਸ ਦੀ ਪੂਰੀ ਗਾਰੰਟੀ ਨਹੀਂ ਦੇ ਸਕਦੇ, ਪਰ ਤੁਸੀਂ ਸਰਹੱਦਾਂ, ਸੰਰਚਨਾ, ਅਤੇ ਉਪਯੋਗਿਤਾ 'ਤੇ ਦਾਅਵਾ ਕਰ ਸਕਦੇ ਹੋ।

ਇਕ ਪੜ੍ਹਤਾਲੀ ਟੈਸਟ ਸੂਟ (ਤਾਂ ਜੋ ਫੇਲ੍ਹ ਠੀਕ ਫਿਕਸ ਵੱਲ ਇਸ਼ਾਰਾ ਕਰੇ)

ਕਈ ਪੱਧਰ ਵਰਤੋ ਜੋ ਹਰ ਇੱਕ ਵੱਖਰਾ ਸਵਾਲ ਜਵਾਬ ਦੇਂਦੇ ਹਨ:

ਯੂਨਿਟ ਟੈਸਟ: ਆਪਣਾ ਕੋਡ (ਪਾਰਸਰ, ਵੈਲਿੂਡੇਟਰ, ਰਾਊਟਿੰਗ, ਪ੍ਰਾਮਪਟ ਬਿਲਡਰ) ਟੈਸਟ ਕਰੋ। ਇਹ deterministic ਅਤੇ ਤੇਜ਼ ਹੋਣੇ ਚਾਹੀਦੇ ਹਨ।
ਕਾਂਟ੍ਰੈਕਟ ਟੈਸਟ: ਮਾਡਲ ਨਾਲ ਸ਼ੇਪ-ਅੱਗਮਨ ਦੀ ਜਾਂਚ ਕਰੋ, ਜਿਵੇਂ "ਜ਼ਰੂਰਤ ਹੈ ਕਿ ਵੈਧ JSON X/Y/Z ਚੀਜ਼ਾਂ ਨਾਲ ਵਾਪਸ ਹੋਵੇ" ਜਾਂ "ਕਾਫ਼ੀ ਘੱਟ ਕਾਨਫ਼ੀਡੈਂਸ 'ਤੇ citation ਫੀਲਡ ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ"।
End-to-end দৃਸ਼ਯ: reallistic ਯੂਜ਼ਰ ਫਲੋਜ਼ ਚਲਾਓ (ਰੀਟ੍ਰਾਈਜ਼ ਅਤੇ ਫਾਲਬੈਕ ਸਮੇਤ) ਤਾਂ ਜੋ ਵੇਖਿਆ ਜਾ ਸਕੇ ਕਿ ਸਿਸਟਮ ਤਣਾਅ 'ਤੇ ਵੀ ਮਦਦਗਾਰ ਰਹਿੰਦਾ ਹੈ।

ਇੱਕ ਚੰਗਾ ਨਿਯਮ: ਜੇ ਕੋਈ ਬੱਗ end-to-end ਟੈਸਟ ਤੱਕ ਪਹੁੰਚਦਾ ਹੈ, ਤਾਂ ਇੱਕ ਛੋਟਾ ਟੈਸਟ (ਯੂਨਿਟ/ਕਾਂਟ੍ਰੈਕਟ) ਵੀ ਸ਼ਾਮਿਲ ਕਰੋ ਤਾਂ ਕਿ ਅਗਲੀ ਵਾਰ ਉਹ ਜਲਦੀ ਫੜਿਆ ਜਾ ਸਕੇ।

“ਗੋਲਡਨ ਸੈੱਟ” ਪ੍ਰਾਮਪਟ ਬਣਾਓ

ਇੱਕ ਛੋਟਾ, ਚੁਣਿਆ ਹੋਇਆ ਪ੍ਰਾਮਪਟਾਂ ਦਾ ਸੰਗ੍ਰਹਿ ਬਣਾਓ ਜੋ ਅਸਲ ਵਰਤੋਂ ਦੀ ਪ੍ਰਤੀਨਿਧਤਾ ਕਰਦੇ ਹਨ। ਹਰ ਇੱਕ ਲਈ ਦਰਜ ਕਰੋ:

ਪ੍ਰਾਮਪਟ (ਅਤੇ ਕੋਈ ਵੀ system/developer ਨਿਰਦੇਸ਼)
ਲੋੜੀਂਦੇ ਰੋਕ (ਫਾਰਮੈਟ, ਸੁਰੱਖਿਆ ਨਿਯਮ, ਕਾਰੋਬਾਰੀ ਨਿਯਮ)
ਉਮੀਦ ਕੀਤੀ ਵਿਹਾਰ (ਸਖ਼ਤ ਬੋਲਵਿੱਚ ਨਹੀਂ): ਉਦਾਹਰਨ ਲਈ “3 ਸੁਝਾਅ ਵਾਲਾ ਓਬਜੈਕਟ ਵਾਪਸ ਕਰਦਾ ਹੈ”, “ਸਿਕ੍ਰੈਟਾਂ ਲਈ ਇਨਕਾਰ ਕਰਦਾ ਹੈ”, “ਜੇ ਇਨਪੁੱਟ ਗਾਇਬ ਹੋਵੇ ਤਾਂ ਸਪੱਸ਼ਟੀकरण ਸਵਾਲ ਪੂਛਦਾ ਹੈ”)

ਗੋਲਡਨ ਸੈੱਟ ਨੂੰ CI ਵਿੱਚ ਚਲਾਓ ਅਤੇ ਸਮੇਂ ਦੇ ਨਾਲ ਬਦਲਾਵਾਂ ਟ੍ਰੈਕ ਕਰੋ। ਜਦੋਂ ਕੋਈ ਘਟਨਾ ਹੁੰਦੀ ਹੈ, ਉਸ ਕੇਸ ਲਈ ਨਵਾਂ ਗੋਲਡਨ ਟੈਸਟ ਸ਼ਾਮਿਲ ਕਰੋ।

ਫਜ਼ਿੰਗ: ਅਜੀਬ ਇਨਪੁੱਟਾਂ ਨੂੰ ਆਮ ਬਣਾਓ

AI ਸਿਸਟਮ ਗੰਦੇ ਐਜ 'ਤੇ ਅਕਸਰ ਫੇਲ੍ਹ ਹੁੰਦੇ ਹਨ। ਆਟੋਮੇਟਡ ਫਜ਼ਿੰਗ ਸ਼ਾਮਿਲ ਕਰੋ ਜੋ:

ਰੈਂਡਮ ਸਟਰਿੰਗਜ਼ ਅਤੇ ਮਿਕਸਡ ਇਨਕੋਡਿੰਗ ਪੈਦਾ ਕਰੇ
ਖਰਾਬ JSON, ਕਟਿਆ ਹੋਇਆ ਪੇਲੋਡ, ਵਾਧੂ ਕਾਮਾ
ਅਤਿ-ਮੁੱਲ (ਬਹੁਤ ਵੱਡਾ ਟੈਕਸਟ, ਖਾਲੀ ਫੀਲਡ, ਬਹੁਤ ਵੱਡੇ ਨੰਬਰ, ਅਸਧਾਰਣ ਤਾਰੀਖਾਂ)

ਗੈਰ-ਨਿਰਣਾਇਕ ਆਉਟਪੁੱਟਾਂ ਦੀ ਟੈਸਟਿੰਗ

ਸਿੱਧਾ ਟੈਕਸਟ ਦੇ snapshot ਦੀ ਬਜਾਏ, ਰੋਬਰਿਕਸ ਅਤੇ ਟੋਲਰੈਂਸ ਵਰਤੋ:

ਚੈੱਕਲਿਸਟ ਦੇ ਖਿਲਾਫ ਨਤੀਜਿਆਂ ਨੂੰ ਸਕੋਰ ਕਰੋ (ਲਾਜ਼ਮੀ ਫੀਲਡ, ਮਨਾਹੀ ਕੀਤੀ ਸਮੱਗਰੀ, ਲੰਬਾਈ ਸੀਮਾਵਾਂ)
ਸੈਮਾਂਟਿਕ ਜਾਂਚਾਂ (ਉਦਾਹਰਨ: ਕਲਾਸੀਫਿਕੇਸ਼ਨ ਲੇਬਲ ਮਨਜ਼ੂਰ ਸੈੱਟ ਵਿੱਚ ਹੋਵੇ)
ਸਾਰਾਂ ਲਈ ਸਮਾਨਤਾ ਸੀਮਾਵਾਂ, ਨਾਲ ਹੀ “ਮੁੱਖ ਤੱਥ ਜ਼ਰੂਰ ਜ਼ਿਕਰ ਹੋਣ” ਦੀ ਬਾਞੀ

ਇਸ ਨਾਲ ਟੈਸਟ ਸਥਿਰ ਰਹਿੰਦੇ ਹਨ ਪਰ ਅਸਲ ਰਿਗ੍ਰੈਸ਼ਨਾਂ ਨੂੰ ਫੜ ਲੈਂਦੇ ਹਨ।

ਪ੍ਰਮਾਣਕੀ ਅਤੇ ਗਲਤੀਆਂ ਲਈ ਮਾਨੀਟਰਿੰਗ ਅਤੇ ਨਿਰੀਖਣ

Turn rules into real apps

Build with chat and bake validation, errors, and safe recoveries into the workflow.

Start Free

ਜਦੋਂ ਤੁਸੀਂ ਅਸਲ ਵਰਤੋਂ ਵਿੱਚ ਕੀ ਹੋ ਰਿਹਾ ਹੈ ਦੇਖ ਸਕਦੇ ਹੋ, ਪ੍ਰਮਾਣਕੀ ਨਿਯਮ ਅਤੇ ਗਲਤੀ ਸੰਭਾਲ ਹੀ ਬਿਹਤਰ ਬਣਦੇ ਹਨ। ਮਾਨੀਟਰਿੰਗ "ਸਾਨੂੰ ਲੱਗਦਾ ਹੈ ਠੀਕ ਹੈ" ਨੂੰ ਸਪੱਸ਼ਟ ਸਬੂਤ ਵਿੱਚ ਬਦਲ ਦਿੰਦੀ ਹੈ: ਕੀ ਫੇਲ੍ਹ ਹੋ ਰਿਹਾ ਹੈ, ਕਿੰਨੀ ਵਾਰੀ, ਅਤੇ ਭਰੋਸੇਯੋਗਤਾ ਸੁਧਰ ਰਹੀ ਹੈ ਜਾਂ ਚੁੱਪਚਾਪ ਗਿਰ ਰਹੀ ਹੈ।

ਕੀ ਲਾਗ ਕਰੋ (ਪਰ ਪ੍ਰਾਈਵੇਸੀ ਸਮੱਸਿਆਵਾਂ ਤੋਂ ਬਚੋ)

ਸ਼ੁਰੂ ਕਰੋ ਉਹਨਾਂ ਲਾਗਜ਼ ਨਾਲ ਜੋ ਦੱਸਦੇ ਹਨ ਕਿ ਇੱਕ ਬੇਨਤੀ ਕਿਵੇਂ ਸਫਲ ਜਾਂ ਅਸਫਲ ਰਹੀ—ਫੇਰ ਸੰਵੇਦਨਸ਼ੀਲ ਡਾਟਾ ਡਿਫੌਲਟ ਰੂਪ ਵਿੱਚ redact ਕਰੋ ਜਾਂ ਬਚਾਓ।

ਇਨਪੁੱਟ ਅਤੇ ਆਉਟਪੁੱਟ (ਪ੍ਰਾਈਵੇਸੀ-ਸਾਵਧਾਨ): ਹੈਸ਼, ਕਟਿਆ ਹਿੱਸਾ, ਜਾਂ ਸੰਰਚਿਤ ਫੀਲਡ ਸਟੋਰ ਕਰੋ ਬਜਾਏ ਰਾ ਟੈਕਸਟ ਦੇ। ਜੇ ਰਾਅ ਸਮਗਰੀ ਰੱਖਣੀ ਲਾਜ਼ਮੀ ਹੋਵੇ, ਤਾਂ ਘੱਟ ਰੀਟੇਨਸ਼ਨ, ਪਹੁੰਚ ਨਿਯੰਤਰਣ, ਅਤੇ ਸਪਸ਼ਟ ਉਦੇਸ਼ ਰੱਖੋ।
ਪ੍ਰਮਾਣਕੀ ਫੇਲ੍ਹ: ਨਿਯਮ ਦਾ ਨਾਮ, ਫੀਲਡ/ਪਾਥ (ਉਦਾਹਰਨ address.postcode), ਅਤੇ ਫੇਲ੍ਹ ਦਾ ਕਾਰਨ (ਸਕੀਮਾ ਮਿਸਮੇਚ, ਅਸੁਰੱਖਿਅਤ ਸਮੱਗਰੀ, ਲੋੜੀਂਦੀ ਇਰਾਦਾ ਗਾਇਬ)
ਟੂਲ ਕਾਲਾਂ ਅਤੇ ਸਾਈਡ-ਇਫੈਕਟਸ: ਕਿਹੜਾ ਟੂਲ ਕਾਲ ਹੋਇਆ, ਪੈਰਾਮੀਟਰ (ਸੈਨਿਟਾਈਜ਼ਡ), ਰਿਸਪਾਂਸ ਕੋਡ, ਅਤੇ ਸਮਾਂ। ਜਦੋਂ ਫੇਲ੍ਹ ਬਾਹਰਲੇ ਸਰੋਤ ਤੋਂ ਆਉਂਦਾ ਹੈ ਤਾਂ ਇਹ ਜ਼ਰੂਰੀ ਹੈ।
ਐਕਸਪਸ਼ਨ ਅਤੇ ਟਾਈਮਆਉਟ: ਅੰਦਰੂਨੀ ਗਲਤੀਆਂ ਲਈ ਸਟੈਕ ਟ੍ਰੇਸ, ਨਾਲ ਹੀ ਯੂਜ਼ਰ-ਸੇਫ ਕੋਡ ਜੋ ਮਸ਼ਹੂਰ ਸ਼੍ਰੇਣੀਆਂ ਨਾਲ ਮੈਪ ਕੀਤਾ ਜਾ ਸਕੇ

ਉਹ ਮੈਟ੍ਰਿਕਸ ਜੋ ਭਰੋਸੇਯੋਗਤਾ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਦੇ ਹਨ

ਲਾਗ ਤੱਜ਼ੀਨੀ ਇਕ ਘਟਨਾ ਨੂੰ ਡੀਬੱਗ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੀਆਂ ਹਨ; ਮੈਟ੍ਰਿਕਸ ਪੈਟਰਨ ਪਛਾਣਨ ਵਿੱਚ। ਟਰੈਕ ਕਰੋ:

ਪ੍ਰਮਾਣਕੀ ਫੇਲ੍ਹ ਦਰ (ਓਵਰਅਲ ਅਤੇ ਨਿਯਮ ਅਨੁਸਾਰ)
ਸਕੀਮਾ ਪਾਸ ਦਰ (ਉਮੀਦ ਕੀਤੀ ਸੰਰਚਨਾ ਨਾਲ ਮੇਲ ਖਾਂਦੀ ਆਉਟਪੁੱਟ)
ਰੀਟ੍ਰਾਈ ਦਰ ਅਤੇ ਰਿਕਵਰੀ ਸਫਲਤਾ ਦਰ (ਫਾਲਬੈਕ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ)
ਲੇਟੈਂਸੀ (end-to-end ਅਤੇ ਪ੍ਰਤੀ-ਟੂਲ ਕਾਲ)
ਉੱਚ-ਤਰਤੀਬੀ ਗਲਤੀ ਸ਼੍ਰੇਣੀਆਂ (ਉਦਾਹਰਨ: “ਮਿਸਿੰਗ ਫੀਲਡ”, “ਟੂਲ ਟਾਈਮਆਉਟ”, “ਨੀਤੀ ਉਲੰਘਣਾ”)

ਡ੍ਰਿਫਟ 'ਤੇ ਅਲਰਟਿੰਗ

AI ਆਉਟਪੁੱਟ ਪ੍ਰਾਮਪਟ ਸੋਧਾਂ, ਮਾਡਲ ਅਪਡੇਟ, ਜਾਂ ਨਵੀਂ ਯੂਜ਼ਰ ਵਰਤੋਂ ਤੋਂ ਬਾਅਦ ਨਰਮ ਤਰੀਕੇ ਨਾਲ ਬਦਲ ਸਕਦੇ ਹਨ। ਅਲਰਟਸ ਤਬਦੀਲੀ 'ਤੇ ਧਿਆਨ ਦੇਣੇ ਚਾਹੀਦੇ ਹਨ, ਨਾ ਕਿ ਸਿਰਫ਼ ਅਬਸਲੂਟ ਸੀਮਾਵਾਂ 'ਤੇ:

ਕਿਸੇ ਵਿਸ਼ੇਸ਼ ਪ੍ਰਮਾਣਕੀ ਨਿਯਮ ਵਿੱਚ ਅਚਾਨਕ ਵਾਧਾ
ਨਵੀਂ ਗਲਤੀ ਸ਼੍ਰੇਣੀ ਦਾ ਆਗਮਨ
ਆਉਟਪੁੱਟ ਆਕਾਰ ਵਿੱਚ ਬਦਲਾਅ (ਉਦਾਹਰਨ: ਇੱਕ JSON ਫੀਲਡ ਹੁਣ ਮੁਕੰਮਲ ਟੈਕਸਟ ਬਣ ਗਿਆ)

ਗੈਰ-ਟੈਕਨੀਕਲ ਟੀਮਾਂ ਲਈ ਡੈਸ਼ਬੋਰਡ

ਇੱਕ ਚੰਗਾ ਡੈਸ਼ਬੋਰਡ ਇਸਦਾ ਜਵਾਬ ਦਿੰਦਾ: "ਕੀ ਇਹ ਯੂਜ਼ਰਾਂ ਲਈ ਕੰਮ ਕਰ ਰਿਹਾ ਹੈ?" ਇੱਕ ਸਰਲ ਭਰੋਸੇਯੋਗਤਾ ਸਕੋਰਕਾਰਡ, ਸਕੀਮਾ ਪਾਸ ਰੇਟ ਲਈ ਟ੍ਰੈਂਡ ਲਾਈਨ, ਫੇਲ੍ਹਾਂ ਦੀ ਵਰਗੀਕਰਨ, ਅਤੇ ਸਭ ਤੋਂ ਆਮ ਫੇਲ੍ਹ ਕਿਸਮਾਂ ਦੇ ਉਦਾਹਰਨ (ਸੰਵੇਦਨਸ਼ੀਲ ਸਮੱਗਰੀ ਤੋਂ ਮੁਕਤ) ਸ਼ਾਮਿਲ ਕਰੋ। ਇੰਜੀਨੀਅਰਾਂ ਲਈ ਡੀਪ-ਡਿਵ ਵਿਚ ਲਿੰਕ ਕਰੋ, ਪਰ ਉੱਪਰੀ-ਸਤਹ ਦ੍ਰਿਸ਼ ਯੂਜ਼ਰ ਅਤੇ ਸਪੋਰਟ ਟੀਮ ਲਈ ਪੜ੍ਹਨਯੋਗ ਰੱਖੋ।

ਲਗਾਤਾਰ ਸੁਧਾਰ: ਫੇਲ੍ਹਾਂ ਨੂੰ ਵਧੀਆ ਨਿਯਮਾਂ ਵਿੱਚ بدلਣਾ

ਪ੍ਰਮਾਣਕੀਕਰਨ ਅਤੇ ਗਲਤੀ ਸੰਭਾਲ "ਇੱਕ ਵਾਰੀ ਸੈੱਟ ਕਰਨ ਅਤੇ ਭੁੱਲ ਜਾਣ" ਵਾਲੇ ਕੰਮ ਨਹੀਂ ਹਨ। AI-ਤਿਆਰ ਸਿਸਟਮਾਂ ਵਿੱਚ, ਅਸਲ ਕੰਮ ਸ਼ੁਰੂਆਤ ਤੋਂ ਬਾਅਦ ਹੁੰਦਾ ਹੈ: ਹਰ ਅਜੀਬ ਆਉਟਪੁੱਟ ਤੁਹਾਡੇ ਨਿਯਮਾਂ ਬਾਰੇ ਇੱਕ ਸੂਚਨਾ ਹੈ।

ਤੇਜ਼ ਫੀਡਬੈਕ ਲੂਪ ਬਣਾਓ

ਫੇਲ੍ਹਾਂ ਨੂੰ ਡਾਟਾ ਸਮਝੋ, ਥੋਟੀਆਂ ਨਹੀਂ। ਸਭ ਤੋਂ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਲੂਪ ਆਮ ਤੌਰ 'ਤੇ ਮਿਲ ਕੇ ਕੰਮ ਕਰਦੇ ਹਨ:

ਯੂਜ਼ਰ ਰਿਪੋਰਟਸ (ਸਧਾਰਨ "ਸਮੱਸਿਆ ਰਿਪੋਰਟ ਕਰੋ" + ਵਿਕਲਪਿਕ ਸਕਰੀਨਸ਼ਾਟ/ਆਉਟਪੁੱਟ ID)
ਮਾਨਵ ਸਮੀਖਿਆ ਕਤਾਰਾਂ ਅੰਦਾਜ਼ੇਮੇਸੇ (ਗੁੰਝਲਦਾਰ, ਅਸੁਰੱਖਿਅਤ, ਜਾਂ "ਗਲਤ ਲੱਗਦਾ" ਕੇਸ)
ਆਟੋਮੇਟਿਕ ਲੇਬਲਿੰਗ (regex/sਕੀਮਾ ਫੇਲ੍ਹ, toxicity flags, ਭਾਸ਼ਾ ਪਛਾਣ, ਉੱਚ-ਅਨਿਸ਼ਚਿਤਤਾ ਸਿਗਨਲ)

ਹਰ ਰਿਪੋਰਟ ਨੂੰ ਸਹੀ ਇਨਪੁੱਟ, ਮਾਡਲ/ਪ੍ਰਾਮਪਟ ਵਰਜਨ, ਅਤੇ ਵੈਲਿਡੇਟਰ ਨਤੀਜਿਆਂ ਨਾਲ ਜੋੜੋ ਤਾਂ ਜੋ ਤੁਸੀਂ ਬਾਅਦ ਵਿੱਚ ਦੁਹਰਾਈ ਪਾ ਸਕੋ।

ਠੀਕ ਕਰਨਾ ਅਸਲ ਵਿੱਚ ਕਿਵੇਂ ਹੁੰਦਾ ਹੈ

ਜ਼ਿਆਦਾਤਰ ਸੁਧਾਰ ਕਈ ਆਮ ਕਦਮਾਂ ਵਿੱਚ ਆਉਂਦੇ ਹਨ:

ਸਕੀਮਾ ਸਖ਼ਤ ਕਰੋ: ਜੇ ਤੁਹਾਨੂੰ JSON ਦੀ ਉਮੀਦ ਹੈ, ਤਾਂ ਲਾਜ਼ਮੀ ਫੀਲਡ, enums, ਅਤੇ ਕਿਸਮਾਂ ਪਰਿਭਾਸ਼ਿਤ ਕਰੋ; "ਲਗਭਗ JSON" ਨੂੰ ਰੱਜੈਕਟ ਕਰੋ।
ਧਿਆਨ ਕੇਂਦਰਿਤ ਵੈਲਿੂਡੇਟਰ ਜੋੜੋ: ਯੂਨਿਟ, ਤਾਰੀਖ ਫਾਰਮੇਟ, ਮਨਜ਼ੂਰ ਰੇਂਜ, ਅਤੇ "ਲਾਜ਼ਮੀ ਸ਼ਾਮਿਲ" ਨਿਯਮ ਲਗਾਓ।
ਪ੍ਰਾਮਪਟਾਂ ਨੂੰ ਸੰਸ਼ੋਧਿਤ ਕਰੋ: ਤਰਜੀਹਾਂ ਨੂੰ ਸਪਸ਼ਟ ਕਰੋ ("ਜੇ ਯਕੀਨ ਨਹੀਂ, ਤਾਂ ਕਹੋ 'ਮੈਂ ਨਹੀਂ ਜਾਣਦਾ'"), ਉਦਾਹਰਨ ਜੋੜੋ, ਅਤੇ ਅਸਪਸ਼ਟ ਨਿਰਦੇਸ਼ ਘਟਾਓ।
ਫਾਲਬੈਕ ਸ਼ਾਮਿਲ ਕਰੋ: ਸਖ਼ਤ ਪ੍ਰਾਮਪਟ ਨਾਲ ਮੁੜ-ਪੂਛੋ, ਸੁਰੱਖਿਅਤ ਟੈਮਪਲੇਟ ਜੋੜੋ, ਜਾਂ ਮਾਨਵ ਸਮੀਖਿਆ 'ਤੇ ਰਾਹ ਦਿਓ—ਬਿਨਾਂ ਗੈਰ-ਯਕੀਨੀ ਤੱਥ ਅੱਡ ਕਰਨ ਦੇ।

ਜਦੋਂ ਤੁਸੀਂ ਇੱਕ ਕੇਸ ਠੀਕ ਕਰਦੇ ਹੋ, ਤਾਂ ਪੁੱਛੋ: "ਕਿਹੜੇ ਨੇੜਲੇ ਕੇਸ ਹਜੇ ਵੀ ਛੁੱਟ ਸਕਦੇ ਹਨ?" ਨਿਯਮ ਨੂੰ ਇਕ ਕੇਸ ਲਈ ਨਹੀਂ, ਪਰ ਇਕ ਛੋਟੇ ਖੇਤਰ ਲਈ ਵਿਸਤਾਰ ਕਰੋ।

ਵਰਜਨਿੰਗ ਅਤੇ ਸੁਰੱਖਿਅਤ ਰੋਲਆਊਟ

ਪ੍ਰਾਮਪਟਾਂ, ਵੈਲਿਡੇਟਰਾਂ, ਅਤੇ ਮਾਡਲਾਂ ਨੂੰ ਕੋਡ ਵਾਂਗ ਵਰਜਨ ਕਰੋ। ਬਦਲਾਵਾਂ ਨੂੰ canary ਜਾਂ A/B ਰੋਲਆਊਟ ਨਾਲ ਲਾਓ, ਮੁੱਖ ਮੈਟ੍ਰਿਕਸ (ਰਿੱਜੈਕਟ ਦਰ, ਯੂਜ਼ਰ ਸੰਤੋਸ਼, ਲਾਗਤ/ਲੇਟੈਂਸੀ) ਨੂੰ ਟ੍ਰੈਕ ਕਰੋ, ਅਤੇ ਤੇਜ਼ rollback ਰਸਤਾ ਰੱਖੋ।

ਇਹ ਥਾਂ ਪ੍ਰੋਡਕਟ ਟੂਲਿੰਗ ਮਦਦ ਕਰ ਸਕਦੀ ਹੈ: ਉਦਾਹਰਨ ਲਈ Koder.ai ਵਰਗੇ ਪਲੇਟਫਾਰਮ snapshots ਅਤੇ rollback ਦਾ ਸਮਰਥਨ ਦਿੰਦੇ ਹਨ, ਜੋ ਪ੍ਰਾਮਪਟ/ਵੈਲਿਡੇਟਰ ਵਰਜਨਿੰਗ ਨਾਲ ਚੰਗੀ ਤਰ੍ਹਾਂ ਮਿਲਦੇ ਹਨ। ਜਦੋਂ ਕੋਈ ਅਪਡੇਟ ਸਕੀਮਾ ਫੇਲ੍ਹਾਂ ਵਧਾ ਦੇਵੇ ਜਾਂ ਇੱਕ ਇੰਟਿਗ੍ਰੇਸ਼ਨ ਨੂੰ ਤੋੜ ਦੇਵੇ, ਤੁਰੰਤ rollback ਇੱਕ ਪ੍ਰੋਡਕਸ਼ਨ ਘਟਨਾ ਨੂੰ ਤੇਜ਼ ਰਿਕਵਰੀ ਵਿੱਚ ਬਦਲ ਦੇ ਸਕਦਾ ਹੈ।

ਪ੍ਰਯੋਗਿਕ ਚੈੱਕਲਿਸਟ

ਕੀ ਅਸੀਂ ਕਿਸੇ ਰਿਪੋਰਟ ਕੀਤੀ ਸਮੱਸਿਆ ਨੂੰ ਲਾਗਜ਼ ਤੋਂ ਦੁਹਰਾ ਸਕਦੇ ਹਾਂ?
ਕੀ ਫੇਲ੍ਹਾਂ ਨੂੰ ਸਹੀ ਬਕੈਟ ਵੱਲ ਰੂਟ ਕੀਤਾ ਜਾਂਦਾ ਹੈ (ਰੀਟ੍ਰਾਈ, ਫਾਲਬੈਕ, ਮਾਨਵ ਸਮੀਖਿਆ, ਹਾਰਡ ਸਟਾਪ)?
ਕੀ ਅਸੀਂ ਸਕੀਮਾ/ਵੈਲਿਡੇਟਰ ਅਤੇ ਪ੍ਰਾਮਪਟ ਨੂੰ ਇਕੱਠੇ ਅੱਪਡੇਟ ਕੀਤਾ?
ਕੀ ਅਸੀਂ ਇਸ ਫੇਲ੍ਹ ਲਈ ਟੈਸਟ ਕੇਸ ਜੋੜਿਆ ਤਾਂ ਜੋ ਇਹ ਮੁੜ ਨਾ ਆਏ?
ਕੀ ਅਸੀਂ ਕਿਸੇ canary ਦੇ ਪਿੱਛੇ ਸ਼ਿਪ ਕੀਤਾ ਅਤੇ ਪ੍ਰਭਾਵ ਮਾਨੀਟਰ ਕੀਤਾ?

ਅਕਸਰ ਪੁੱਛੇ ਜਾਣ ਵਾਲੇ ਸਵਾਲ

ਇਸ ਪੋਸਟ ਵਿੱਚ “AI-ਤਿਆਰ ਕੀਤਾ ਸਿਸਟਮ” ਕਿਸਨੂੰ ਕਹਿੰਦੇ ਹਨ?

An AI-generated system is any product where a model’s output directly affects what happens next—what is shown, stored, sent to another tool, or executed as an action.

It’s broader than chat: it can include generated data, code, workflow steps, or agent/tool decisions.

ਪ੍ਰਮਾਣਕੀਕਰਨ ਅਤੇ ਗਲਤੀ ਸੰਭਾਲ ਨੂੰ ਪ੍ਰੋਡਕਟ ਫੀਚਰ ਕਿਉਂ माना ਜਾਂਦਾ ਹੈ?

Because once AI output is part of control flow, reliability becomes a user experience concern. A malformed JSON response, a missing field, or a wrong instruction can:

create confusing UI states
write incorrect records
trigger unsafe side effects

Designing validation and error paths up front makes failures controlled instead of chaotic.

ਸੰਰਚਨਾਤਮਕ ਵੈਧਤਾ ਅਤੇ ਕਾਰੋਬਾਰੀ ਵੈਧਤਾ ਵਿੱਚ ਕੀ ਫਰਕ ਹੈ?

Structural validity means the output is parseable and shaped as expected (e.g., valid JSON, required keys present, correct types).

Business validity means the content is acceptable for your real rules (e.g., IDs must exist, totals must reconcile, refund text must follow policy). You usually need both layers.

AI ਇੰਟਰਐਕਸ਼ਨਾਂ ਨੂੰ “ਕਾਂਟ੍ਰੈਕਟ” ਵਾਂਗ ਡਿਜ਼ਾਇਨ ਕਰਨ ਦਾ ਕੀ ਮਤਲਬ ਹੈ?

A practical contract defines what must be true at three points:

Inputs: required fields, allowed ranges, required context
Outputs: required keys, allowed values, thresholds (e.g., confidence)
Side effects: which actions are permitted (e.g., “draft only,” “must confirm before send”)

Once you have a contract, validators are just automated enforcement of it.

AI ਵਰਕਫਲੋ ਵਿੱਚ ਕਿਹੜੇ ਇਨਪੁੱਟ ਪ੍ਰਮਾਣਕੀਕਰਨ ਲਾਇਕ ਹਨ?

Treat input broadly: user text, files, form fields, API payloads, and retrieved/tool data.

High-leverage checks include required fields, file size/type limits, enums, length bounds, valid encoding/JSON, and safe URL formats. These reduce model confusion and protect downstream parsers and databases.

ਕਦੋਂ ਅਸੀਂ ਇਨਪੁੱਟ ਆਟੋ-ਸਹੀ ਕਰੀਏ ਤੇ ਕਦੋਂ ਰੱਜેક્ટ ਕਰੀਏ?

Normalize when the intent is unambiguous and the change is reversible (e.g., trimming whitespace, normalizing case for country codes).

Reject when “fixing” might change meaning or hide errors (e.g., ambiguous dates like “03/04/2025,” unexpected currencies, suspicious HTML/JS). A good rule: auto-correct format, reject semantics.

ਮਾਡਲ ਆਉਟਪੁੱਟ ਨੂੰ ਅਜਿਹਾ ਕਿਵੇਂ ਵੈਧ ਕਰੀਏ ਜੋ ਸੁਰੱਖਿਅਤ ਹੋਵੇ?

Start with an explicit output schema:

required keys (e.g., answer, status)
types (string/number/array)
enums and constraints (length/ranges)

Then add semantic checks (IDs resolve, totals reconcile, dates make sense, citations support claims). If validation fails, avoid consuming the output downstream—retry with tighter constraints or use a fallback.

ਫੇਲ ਫਾਸਟ ਅਤੇ ਫੇਲ ਗ੍ਰੇਸਫੁੱਲ ਵਿਚੋਂ ਕਿਵੇਂ ਚੁਣੀਏ?

Fail fast on problems where continuing is risky: can’t parse output, missing required fields, policy violations.

Fail gracefully when a safe recovery exists: transient timeouts, rate limits, minor formatting issues.

In both cases, separate:

User-facing message: short, actionable, non-technical
Internal diagnostics: error code, raw output (safely), validator results, timing, correlation ID

ਕਦੋਂ ਰੀਟ੍ਰਾਈਜ਼ ਅਤੇ ਫਾਲਬੈਕ ਮਦਦਗਾਰ ਹੁੰਦੇ ਹਨ—ਅਤੇ ਕਦੋਂ ਨੁਕਸਾਨ ਦੇਂਦੇ ਹਨ?

Retries help when the failure is transient (timeouts, 429s, brief outages). Use bounded retries with exponential backoff and jitter.

Retries are often wasteful for “wrong answer” failures (schema mismatch, missing required fields, policy violation). Prefer prompt repair (stricter instructions), deterministic templates, a smaller model, cached results, or human review depending on risk.

ਅਸਲ AI ਪ੍ਰੋਡਕਟਾਂ ਵਿੱਚ ਐਜ ਕੇਸ ਆਮ ਤੌਰ 'ਤੇ ਕਿੱਥੋਂ ਆਉਂਦੇ ਹਨ?

Common edge cases come from:

messy real user inputs (copied PDFs, weird line breaks, long contexts)
boundary values (empty fields, max-length text, unusual Unicode, mixed languages)
integration drift (API field changes, permission mismatches, date/currency contract mismatches)

Plan to discover “unknown unknowns” via privacy-aware logs that capture which validation rule failed and what recovery path ran.