ਇਨਸੀਡੈਂਟ ਟ੍ਰੈਕਿੰਗ ਅਤੇ ਪੋਸਟਮੋਰਟਮ ਲਈ ਵੈੱਬ ਐਪ ਕਿਵੇਂ ਬਣਾਈਏ

Q: How do we define an “incident” so the app doesn’t become unusable or inconsistent?

ਆਪਣੇ ਆਰਗਨਾਈਜ਼ੇਸ਼ਨ ਲਈ ਇੱਕ ठोस ਪਰਿਭਾਸ਼ਾ ਲਿਖੋ: - ਕੀ ਯੋਗ ਹੈ (ਗਾਹਕ ਪ੍ਰਭਾਵ, ਸੁਰੱਖਿਆ, SLA/SLO ਬ੍ਰੀਚ, ਅੰਦਰੂਨੀ-ਕੇਵਲ) - ਇਹ ਕਦੋਂ ਸ਼ੁਰੂ/ਖਤਮ ਹੁੰਦਾ ਹੈ (ਪਹਿਲੀ ਅਲਾਰਮ ਬਨਾਮ ਸਵੀਕਾਰੋ; ਠੀਕ ਹੋਣਾ ਬਨਾਮ ਮਾਨੀਟਰੇਡ) - ਕਿਹੜੇ ਫੀਲਡ ਲਾਜ਼ਮੀ ਹਨ (ਸੇਵਾ, ਸਮੀਕਰਨ, ਮਾਲਕ, ਟਾਈਮਸਟੈਂਪ, ਸਥਿਤੀ) ਉਹ ਪਰਿਭਾਸ਼ਾ ਸਿੱਧਾ ਤੁਹਾਡੇ ਵਰਕਫਲੋ ਸਟੇਟਸ ਅਤੇ ਲਾਜ਼ਮੀ ਫੀਲਡਾਂ ਨਾਲ ਜੋੜੀ ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ ਤਾਂ ਕਿ ਡਾਟਾ ਬਿਨਾਂ ਝੰਜਟ ਦੇ ਲਗਾਤਾਰ ਅਤੇ ਸੰਗਠਿਤ ਰਹੇ।

Q: What are the must-have features for the first release of an incident tracking web app?

ਇਕ ਪ੍ਰਯੋਗਾਤਮਕ v1 ਸੈੱਟ ਵਿੱਚ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ: - ਇਨਸੀਡੈਂਟ ਇਨਟੇਕ (ਟਾਈਟਲ, ਸੇਵਾ, ਸਮੀਕਰਨ, ਰਿਪੋਰਟਰ; ਬਾਕੀ ਬਚਤ ਵਾਲੇ) - ਤੇਜ਼ ਅਪਡੇਟ (ਸਥਿਤੀ, ਪ੍ਰਭਾਵ ਸੰਖੇਪ, ਮੁੱਖ ਨੋਟਸ, ਅਗਲੇ ਕਦਮ) - ਇੱਕ ਮਿਲਿਆ ਹੋਇਆ ਟਾਈਮਲਾਈਨ (ਆਟੋ-ਕੈਪਚਰ ਕੀਤੀਆਂ ਚੇਜ਼ਾਂ + ਮੈਨੂਅਲ ਇਵੈਂਟ) - ਬੁਨਿਆਦੀ ਭੂਮਿਕਾਵਾਂ/ਮਾਲਕੀ (ਕਮਾਂਡਰ/ਮਾਲਕ ਦਰਸਿਆ ਹੋਇਆ) - ਇਨਸੀਡੈਂਟ ਬੰਦ ਹੋਣ 'ਤੇ ਜੁੜਿਆ ਹੋਇਆ ਪੋਸਟਮੋਰਟਮ ਬਣਾਉਣਾ - ਕਾਰਵਾਈ ਆਈਟਮਾਂ ਨਾਲ ਮਾਲਕ, ਨਿਰਧਾਰਿਤ ਤਾਰੀਖ ਅਤੇ ਸਥਿਤੀ ਉੱਚ-ਸੁਝਾਅ ਵਾਲੀਆਂ ਆਟੋਮੇਸ਼ਨ ਤੁਹਾਨੂੰ ਤਬ ਤੱਕ ਨਹੀਂ ਚਾਹੀਦੀਆਂ ਜਦ ਤੱਕ ਇਹ ਮੂਲ ਫਲੋ ਸਟਰੈੱਸ ਹੇਠਾਂ ਠੀਕ ਤਰ੍ਹਾਂ ਕੰਮ ਨਹੀਂ ਕਰਦੇ।

Q: How should we design incident states and transitions?

ਛੋਟੇ ਅਤੇ ਪੂਰਣਯੋਗ ਸਟੇਜ ਵਰਤੋਂ ਜੋ ਟੀਮਾਂ ਅਮਲ ਵਿੱਚ ਵਰਤਦੀਆਂ ਹਨ: - Detect → Triage → Mitigate → Resolve → Learn ਹਰ ਸਟੇਜ ਲਈ “ਕੀ ਹੋ ਗਿਆ” ਪਰਿਭਾਸ਼ਿਤ ਕਰੋ, ਫਿਰ ਗਾਰਡਰੇਲ ਸ਼ਾਮਲ ਕਰੋ: - Triage ਤੋ ਬਾਹਰ ਜਾਣ ਲਈ ਸਮੀਕਰਨ ਲਾਜ਼ਮੀ ਕਰੋ - Resolved ਦਰਜ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਨਤੀਜਾ ਸੰਖੇਪ ਲਾਜ਼ਮੀ ਕਰੋ - Resolved → Investigating ਲਈ ਫਿਰ-ਖੋਲ੍ਹਣ ਦਾ ਕਾਰਨ ਲਾਜ਼ਮੀ ਕਰੋ ਇਸ ਨਾਲ ਫੱਸੇ ਹੋਏ ਇਨਸੀਡੈਂਟਾਂ ਤੋਂ ਬਚਾਅ ਹੁੰਦਾ ਹੈ ਅਤੇ ਬਾਅਦ ਦੀ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਗੁਣਵੱਤਾ ਬਿਹਤਰ ਹੁੰਦੀ ਹੈ।

Q: Which roles should the app support, and how do we keep responsibilities clear?

ਕੁਝ ਸਾਫ਼ ਰੋਲ ਮਾਡਲ ਕਰੋ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਅਧਿਕਾਰਾਂ ਨਾਲ ਜੋੜੋ: - Reporter: ਇਨਸੀਡੈਂਟ ਬਣਾਉਂਦਾ ਹੈ ਅਤੇ ਸ਼ੁਰੂਆਤੀ ਸੰਦਰਭ ਜੋੜਦਾ ਹੈ - Responder: ਅਪਡੇਟ, ਟਾਈਮਲਾਈਨ ਈਵੇਂਟ ਅਤੇ ਮਿਟੀਗੇਸ਼ਨ ਕਰਦਾ ਹੈ - Incident Commander: ਰਿਸਪਾਂਡਰ ਨਿਯੁਕਤ/ਨਿਰਧਾਰਿਤ ਕਰਦਾ ਹੈ, ਸਮੀਕਰਨ ਮਨਜ਼ੂਰ ਕਰਦਾ ਹੈ, ਹਿੱਸੇਦਾਰ ਅਪਡੇਟਾਂ ਨੂੰ ਕੰਟਰੋਲ ਕਰਦਾ ਹੈ - Reviewer: ਪੋਸਟਮੋਰਟਮ ਦੀ ਗੁਣਵੱਤਾ ਅਤੇ ਮਨਜ਼ੂਰੀ ਸੰਭਾਲਦਾ ਹੈ UI ਵਿੱਚ ਵਰਤਮਾਨ ਮਾਲਕ/ਕਮਾਂਡਰ ਸਪਸ਼ਟ ਦਿਖਾਈ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ ਅਤੇ ਡੈਲੀਗੇਸ਼ਨ (ਰਿਅਸਾਈਨ, ਕਮਾਂਡਰ ਰੋਟੇਸ਼ਨ) ਦੀ ਸਹਾਇਤਾ ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ।

Q: What data entities should we model, and what relationships matter most?

ਛੋਟਾ ਪਰ ਸਰਚਿਰਚਿਤ ਡਾਟਾ ਮਾਡਲ ਰੱਖੋ: - Incident - Service - Update (ਅੰਦਰੂਨੀ ਬਨਾਮ ਹਿੱਸੇਦਾਰ-ਮੁੱਖ) - Timeline Event (ਟਾਈਮਸਟੈਂਪ ਕੀਤੇ ਹਕੀਕਤਾਂ) - Action Item - Postmortem Stable identifiers (UUIDs) ਵਰਤੋਂ ਅਤੇ ਇੱਕ ਮਨੁੱਖ-ਪ੍ਰੀਤ ਸੂਚਕ (ਜਿਵੇਂ INC-2025-0042) ਰੱਖੋ। ਸੰਪਾਦਨ ਨੂੰ ਇਤਿਹਾਸ ਵਜੋਂ ਸੁਰੱਖਿਅਤ ਕਰੋ—ਹਰ ਰਿਕਾਰਡ ਤੇ created at/created by ਅਤੇ ਇੱਕ ਆਡੀਟ ਲੌਗ ਰੱਖੋ।

Q: How do we handle internal notes versus stakeholder-facing status updates?

ਅੰਦਰੂਨੀ ਨੋਟਸ ਅਤੇ ਹਿੱਸੇਦਾਰ-ਮੁੱਖ ਸਥਿਤੀ ਅਲੱਗ ਰੱਖੋ: - Internal updates: ਰਣਨੀਤਿਕ, ਉੱਚ ਵਾਲੀਅਮ, ਗੰਦ ਹੋ ਸਕਦੇ ਹਨ - Stakeholder updates: ਸੰਭਾਲੇ ਹੋਏ, ਸਮੇਂ-ਟਿਕੇ, ਅਕਸਰ ਕਮਾਂਡਰ ਮਨਜ਼ੂਰਕਰਵੇ ਦੋਨੋਂ ਨੂੰ ਇਨਸੀਡੈਂਟ ਰਿਕਾਰਡ ਵਿੱਚ ਸੁਰੱਖਿਅਤ ਰੱਖੋ ਤਾਂ ਕਿ ਫੈਸਲੇ ਬਾਅਦ ਵਾਪਸੀ ਤੇ ਵੀ ਦੁਹਰਾਏ ਨਾ ਜਾਣ ਅਤੇ ਸੰਵੇਦਨਸ਼ੀਲ ਜਾਣਕਾਰੀ ਲੀਕ ਨਾ ਹੋਵੇ।

Q: How do we ensure postmortem action items actually get completed?

ਕਾਰਵਾਈ ਆਈਟਮਾਂ ਨੂੰ ਸਰਚਿਰਚਿਤ ਰਿਕਾਰਡ ਬਣਾਓ, ਨਿੱਲੇ ਟੈਕਸਟ ਨਹੀਂ: - Owner (ਇੱਕ ਜ਼ਿੰਮੇਵਾਰ ਵਿਅਕਤੀ) - Due date - Priority - Status (Open/In progress/Blocked/Done/Won’t do) - Verification criteria ਫਿਰ ਗਲੋਬਲ ਵਿਉਜ਼ ਦਿਓ (overdue, due this week, by owner/service) ਅਤੇ ਸਧਾਰੇ ਨੋਟਿਸ/ਏਸਕੇਲੈਸ਼ਨ ਇਸਤਰੇਨ ਜਿਹੜੇ ਫਾਲੋ-ਅਪ ਨੂੰ ਗਾਇਬ ਹੋਣ ਤੋਂ ਰੋਕਦੇ ਹਨ।

ਲੌਗ ਇਨ ਸ਼ੁਰੂ ਕਰੋ

ਇਨਸੀਡੈਂਟ ਟ੍ਰੈਕਿੰਗ ਅਤੇ ਪੋਸਟਮੋਰਟਮ ਲਈ ਵੈੱਬ ਐਪ ਕਿਵੇਂ ਬਣਾਈਏ | Koder.ai

ਲਕੜੀ ਮੁੜ ਸਾਫ਼: ਟੀਚੇ, ਵਰਤੋਂਕਾਰ ਅਤੇ ਸਫਲਤਾ ਮੈਟਰਿਕ਼ ਸਪਸ਼ਟ ਕਰੋ

ਸਕ੍ਰੀਨ ਡਰਾਫ਼ਟ ਕਰਨ ਜਾਂ ਡੇਟਾਬੇਸ ਚੁਣਨ ਤੋਂ ਪਹਿਲਾਂ, ਇਹ ਤਹਿ ਕਰੋ ਕਿ ਤੁਹਾਡੀ ਟੀਮ "ਇਨਸੀਡੈਂਟ ਟ੍ਰੈਕਿੰਗ ਵੈੱਬ ਐਪ" ਨਾਲ ਕੀ ਮੰਨਦੀ ਹੈ—ਅਤੇ "ਪੋਸਟਮੋਰਟਮ ਪ੍ਰਬੰਧਨ" ਦਾ ਕੀ ਉਦੇਸ਼ ਹੈ। ਟੀਮਾਂ ਅਕਸਰ ਇਕੋ ਸ਼ਬਦ ਨੂੰ ਵੱਖ-ਵੱਖ ਢੰਗ ਨਾਲ ਵਰਤਦੀਆਂ ਹਨ: ਇੱਕ ਗਰੁੱਪ ਲਈ ਇਨਸੀਡੈਂਟ ਕੋਈ ਵੀ ਗਾਹਕ-रਿਪੋਰਟ ਕੀਤੀ ਸਮੱਸਿਆ ਹੋ ਸਕਦੀ ਹੈ; ਦੂਜੇ ਲਈ ਸਿਰਫ਼ Sev-1 ਆਊਟੇਜ ਜਿਸ 'ਤੇ on-call ਏਸਕਲੇਸ਼ਨ ਹੋਇਆ ਹੋਵੇ।

ਆਪਣੀ ਟੀਮ ਲਈ “ਇਨਸੀਡੈਂਟ ਟ੍ਰੈਕਿੰਗ” ਦੀ ਪਰਿਭਾਸ਼ਾ ਦਿਓ

ਛੋਟੀ ਪਰਿਭਾਸ਼ਾ ਲਿਖੋ ਜੋ ਜਵਾਬ ਦਿੰਦੀ ਹੋਵੇ:

ਕੀ ਇੱਕ ਇਨਸੀਡੈਂਟ ਨੂੰ ਯੋਗ ਸਮਝਿਆ ਜਾਂਦਾ ਹੈ (ਗਾਹਕ ਪ੍ਰਭਾਵ, ਅੰਦਰੂਨੀ-ਕੇਵਲ ਪ੍ਰਭਾਵ, ਸੁਰੱਖਿਆ ਘਟਨਾ, ਛੁੱਟੇ ਹੋਏ SLA)?
ਇੱਕ ਇਨਸੀਡੈਂਟ ਕਦੋਂ "ਸ਼ੁਰੂ" ਅਤੇ "ਖਤਮ" ਹੁੰਦਾ ਹੈ (ਪਹਿਲਾ ਅਲਰਟ ਵਿਰੁੱਧ ਪਹਿਲੀ ਮਨੁੱਖੀ ਪੁਸ਼ਟੀ; ਪੂਰੀ ਤਰ੍ਹਾਂ ਠੀਕ ਹੋਣਾ ਵਿਰੁੱਧ ਨਿਗਰਾਨੀ)?
ਕਿਹੜਾ ਡਾਟਾ ਲਾਜ਼ਮੀ ਹੈ (ਸੇਵਾ ਪ੍ਰਭਾਵਿਤ, ਸਮੀਕਰਨ, ਮਾਲਕ, ਟਾਈਮਸਟੈਂਪ, ਸਥਿਤੀ ਅਪਡੇਟ)?

ਇਹ ਪਰਿਭਾਸ਼ਾ ਤੁਹਾਡੇ ਇਨਸੀਡੈਂਟ ਰਿਸਪਾਂਸ ਵਰਕਫਲੋ ਨੂੰ ਚਲਾਏਗੀ ਅਤੇ ਐਪ ਨੂੰ ਬਹੁਤ ਕਠੋਰ (ਕੋਈ ਇਸਨੂੰ ਵਰਤਦਾ ਨਹੀਂ) ਜਾਂ ਬਹੁਤ ਲੂਜ਼ (ਡਾਟਾ ਗੈਰ-ਸੰਕਲਿਤ) ਹੋਣ ਤੋਂ ਬਚਾਏਗੀ।

“ਪੋਸਟਮੋਰਟਮ ਪ੍ਰਬੰਧਨ” ਦੀ ਪਰਿਭਾਸ਼ਾ ਕਰੋ (ਅਤੇ ਤੁਸੀਂ ਇਹ ਕਿਉਂ ਕਰ ਰਹੇ ਹੋ)

ਫੈਸਲਾ ਕਰੋ ਕਿ ਤੁਹਾਡੇ ਸੰਸਥਾ ਵਿੱਚ ਪੋਸਟਮੋਰਟਮ ਕੀ ਹੈ: ਹਰ ਇਨਸੀਡੈਂਟ ਲਈ ਇੱਕ ਹਲਕਾ ਸੰਖੇਪ, ਜਾਂ ਸਿਰਫ਼ ਉੱਚ-ਸੇਵ ਸਮੱਸਿਆਵਾਂ ਲਈ ਪੂਰਾ RCA। ਇਹ ਵੀ ਸਪਸ਼ਟ ਕਰੋ ਕਿ ਉਦੇਸ਼ ਸਿੱਖਣਾ ਹੈ, ਅਨੁਕੂਲਤਾ ਪੂਰਾ ਕਰਨਾ ਹੈ, ਦੁਹਰਾਏ ਜਾਣ ਵਾਲੇ ਇਨਸੀਡੈਂਟ ਘਟਾਉਣਾ ਹੈ ਜਾਂ ਇਹਨਾਂ ਤਿੰਨਾਂ ਦਾ ਮਿਲਾਪ।

ਇੱਕ ਲਾਭਦਾਇਕ ਨਿਯਮ: ਜੇ ਤੁਸੀਂ ਉਮੀਦ ਕਰਦੇ ਹੋ ਕਿ ਪੋਸਟਮੋਰਟਮ ਬਦਲਾਅ ਲਿਆਏਗਾ, ਤਾਂ ਤੁਹਾਡੇ ਟੂਲ ਨੂੰ ਐਕਸ਼ਨ ਆਈਟਮ ਟ੍ਰੈਕਿੰਗ ਦਾ ਸਮਰਥਨ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ, ਸਿਰਫ਼ ਦਸਤਾਵੇਜ਼ ਸਟੋਰੇਜ ਨਹੀਂ।

ਤੁਸੀਂ ਕਿਹੜੀਆਂ ਸਮੱਸਿਆਵਾਂ ਹੱਲ ਕਰ ਰਹੇ ਹੋ ਉਹਨਾਂ ਦੀ ਸੂਚੀ ਬਣਾਓ

ਜਿਆਦਾਤਰ ਟੀਮਾਂ ਇਹ ਤਰ੍ਹਾਂ ਦਾ ਐਪ ਇਸਲਈ ਬਣਾਉਂਦੀਆਂ ਹਨ ਤਾਂ ਕਿ ਕੁਝ ਮੁੜ-ਆਉਂਦੀਆਂ ਦਰਦ-ਬਿੰਦੂ ਠੀਕ ਕੀਤੀਆਂ ਜਾ ਸਕਣ:

ਦਿੱਖ (Visibility): "ਹੁਣ ਕੀ ਹੋ ਰਿਹਾ ਹੈ?" "ਇਹ ਸੇਵਾ ਕਿੰਨੀ ਵਾਰੀ ਟੁਟਦੀ ਹੈ?"\n- ਸੰਯੋਜਨ (Coordination): ਸਪਸ਼ਟ ਮਾਲਕੀ, ਹੈਂਡਅਫ਼ਸ ਅਤੇ ਸਾਂਝਾ ਇਨਸੀਡੈਂਟ ਟਾਈਮਲਾਈਨ\n- ਸਿੱਖਣਾ (Learning): ਲਗਾਤਾਰ RCA ਟੈਂਪਲੇਟ ਅਤੇ ਇੱਕ ਸਮੀਖਿਆ ਪ੍ਰਕਿਰਿਆ ਜੋ ਅਸਲ ਵਿੱਚ ਹੁੰਦੀ ਹੈ\n- ਫਾਲੋ-ਥਰੂ (Follow-through): ਕਾਰਵਾਈ ਆਈਟਮ ਮੀਟਿੰਗ ਮਗਰੋਂ ਗਾਇਬ ਨਾ ਹੋਣ

ਇਸ ਸੂਚੀ ਨੂੰ ਘੱਟ ਰੱਖੋ। ਤੁਸੀਂ ਜੋ ਵੀ ਫੀਚਰ ਜੋੜਦੇ ਹੋ, ਉਹ ਘੱਟੋ-ਘੱਟ ਇੱਕ ਸਮੱਸਿਆ ਨਾਲ ਮੈਚ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ।

ਉਹ ਮਾਪਦੰਡ ਚੁਣੋ ਜੋ ਵਰਤਾਰ ਨੂੰ ਅਨੁਕੂਲ ਹੋਣ

ਕੁਝ ਮੈਟਰਿਕ ਚੁਣੋ ਜੋ ਤੁਸੀਂ ਆਪਣੇ ਐਪ ਦੇ ਡਾਟਾ ਮਾਡਲ ਤੋਂ ਆਪੋ-ਆਪ ਮਾਪ ਸਕੋ:

ਡੈਟੈਕਟ, ਅਕਨਾਲਜ, ਮਿਟੀਗੇਟ ਅਤੇ ਰੀਜ਼ਾਲਵ ਕਰਨ ਦਾ ਸਮਾਂ (ਤੁਹਾਡੀ ਇਨਸੀਡੈਂਟ ਟਾਈਮਲਾਈਨ ਇਹ ਕੈਪਚਰ ਕਰੇਗੀ)\n- ਸੇਵਰਿਟੀ, ਸੇਵਾ ਅਤੇ ਰੂਟ ਕਾਰਨ ਸ਼੍ਰੇਣੀ ਅਨੁਸਾਰ ਫ੍ਰਿਕਵੈਂਸੀ\n- ਐਕਸ਼ਨ-ਆਈਟਮ ਕਲੋਜ਼ਰ ਰੇਟ ਅਤੇ ਮੀਡੀਅਨ ਟਾਈਮ-ਟੂ-ਕਲੋਜ਼\n- ਗੁਣਵੱਤਾ ਸਿਗਨਲ: N ਦਿਨਾਂ ਵਿੱਚ ਪੋਸਟਮੋਰਟਮ ਪੂਰਾ ਹੋਣ ਵਾਲੇ ਇਨਸੀਡੈਂਟਾਂ ਦਾ ਪ੍ਰਤੀਸ਼ਤ; ਸਪਸ਼ਟ ਮਾਲਕ ਅਤੇ ਸਥਿਤੀ ਅਪਡੇਟ ਦੇ ਪ੍ਰਤੀਸ਼ਤ

ਇਹ ਤੁਹਾਡੇ ਆਪਰੇਸ਼ਨਲ ਮੈਟਰਿਕਸ ਤੇ ਪਹਿਲੀ ਰਿਲੀਜ਼ ਲਈ "ਡone ਨਿਯਮ" ਬਣਣਗੇ।

ਆਪਣੇ ਵਰਤੋਂਕਾਰ ਸਪਸ਼ਟ ਕਰੋ (ਅਤੇ ਹਰ ਇੱਕ ਦੀ ਲੋੜ)

ਉਹੀ ਐਪ ਵੱਖ-ਵੱਖ ਭੂਮਿਕਾਵਾਂ ਦੀ ਸੇਵਾ ਕਰਦੀ ਹੈ ਆਨ-ਕਾਲ ਓਪਰੇਸ਼ਨ ਵਿੱਚ:

On-call engineer: ਤੇਜ਼ ਇਨਟੇਕ, ਘੱਟ ਖੇਤਰ, ਆਸਾਨ ਸਥਿਤੀ ਅਪਡੇਟ\n- Incident commander: ਕੋਆਰਡੀਨੇਸ਼ਨ ਵਿਉ, ਵਰਤਮਾਨ ਸਥਿਤੀ, ਮਾਲਕ, ਚੈੱਕਪੌਇੰਟ\n- Managers: ਰੁਝਾਨ, ਮੁੜ-ਆਉਂਦੀਆਂ ਸਮੱਸਿਆਵਾਂ, ਐਕਸ਼ਨ ਆਈਟਮਾਂ 'ਤੇ ਫਾਲੋ-ਥਰੂ\n- Stakeholders: ਅੰਦਰੂਨੀ ਸ਼ੋਰ ਬਿਨਾਂ ਸਪਸ਼ਟ ਸਥਿਤੀ ਅਪਡੇਟ

ਜੇ ਤੁਸੀਂ ਸਭਨਾਂ ਲਈ ਇਕੱਠੇ ਡਿਜ਼ਾਈਨ ਕਰਦੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਇਕ ਭៀੜ UI ਬਣਾਉਗੇ। ਇਸਦੀ ਬਜਾਏ, v1 ਲਈ ਇੱਕ ਪ੍ਰਾਇਮਰੀ ਯੂਜ਼ਰ ਚੁਣੋ—ਅਤੇ ਯਕੀਨੀ ਬਣਾਓ ਕਿ ਬਾਕੀ ਹਰ ਕੋਈ ਬਾਅਦ ਵਿੱਚ ਟੇਲਰ ਕੀਤੇ ਵਿਉਜ਼, ਡੈਸ਼ਬੋਰਡ ਅਤੇ ਪਰਮੀਸ਼ਨ ਰਾਹੀਂ ਉਹ ਸਬ ਕੁਝ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦਾ ਹੈ।

ਇਨਸੀਡੈਂਟ ਵਰਕਫਲੋ ਅਤੇ ਭੂਮਿਕਾਵਾਂ ਡਿਜ਼ਾਈਨ ਕਰੋ

ਇੱਕ ਸਾਫ਼ ਵਰਕਫਲੋ ਦੋ ਆਮ ਫੇਲ੍ਯਰ ਮੋਡਾਂ ਨੂੰ ਰੋਕਦਾ ਹੈ: ਇਨਸੀਡੈਂਟ ਜਿਹੜੇ ਰੁਕ ਜਾਂਦੇ ਹਨ ਕਿਉਂਕਿ ਕੋਈ "ਅਗਲਾ ਕੀ ਹੈ" ਨਹੀਂ ਜਾਣਦਾ, ਅਤੇ ਇਨਸੀਡੈਂਟ ਜਿਹੜੇ "ਮੁਕੰਮਲ" ਦਿਖਦੇ ਹਨ ਪਰ ਕਦੇ ਸਿੱਖਿਆ ਨਹੀਂ ਲੈਂਦੇ। ਅੰਤ ਤੋਂ ਅੰਤ ਆਪਣੀ ਲਾਈਫਸਾਈਕਲ ਨਕਸ਼ਾ ਬਣਾਓ ਅਤੇ ਫਿਰ ਹਰ ਕਦਮ ਨਾਲ ਭੂਮਿਕਾਵਾਂ ਅਤੇ ਪਰਮੀਸ਼ਨਾਂ ਜੋੜੋ।

ਇਨਸੀਡੈਂਟ ਲਾਈਫਸਾਈਕਲ ਮੈਪ ਕਰੋ

ਜਿਆਦਾਤਰ ਟੀਮਾਂ ਇੱਕ ਸਧਾਰਣ ਆਰਕ ਦੀ ਪਾਲਣਾ ਕਰਦੀਆਂ ਹਨ: detect → triage → mitigate → resolve → learn. ਤੁਹਾਡਾ ਐਪ ਇਸਨੂੰ ਇੱਕ ਛੋਟੇ, ਪੇਸ਼ਗੀ ਕੀਤੇ ਗਏ ਕਦਮਾਂ ਨਾਲ ਦਰਸਾਵੇ, ਨਾ ਕਿ ਬੇਅੰਤ ਵਿਕਲਪਾਂ ਦੇ ਮੀਨੂ ਨਾਲ।

ਹਰ ਸਟੇਜ ਲਈ "ਡਨ" ਕੀ ਹੋਣਾ ਹੈ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰੋ। ਉਦਾਹਰਨ ਲਈ, ਮਿਟੀਗੇਸ਼ਨ ਦਾ ਮਤਲਬ ਹੋ ਸਕਦਾ ਹੈ ਕਿ ਗਾਹਕ ਪ੍ਰਭਾਵ ਰੁਕ ਗਿਆ, ਭਾਵੇਂ ਮੂਲ ਕਾਰਨ ਅਜੇ ਵੀ ਅਣਜਾਣ ਹੋਵੇ।

ਭੂਮਿਕਾਵਾਂ ਅਤੇ ਜ਼ਿੰਮੇਵਾਰੀਆਂ ਪਰਿਭਾਸ਼ਿਤ ਕਰੋ

ਭੂਮਿਕਾਵਾਂ ਨੂੰ ਸਪਸ਼ਟ ਰੱਖੋ ਤਾਂ ਕਿ ਲੋਕ ਬਿਨਾਂ ਮੀਟਿੰਗ ਦੇ ਦੀਰ ਘੜੀ ਬਿਨਾਂ ਕਾਰਵਾਈ ਕਰ ਸਕਣ:

Reporter: ਇਨਸੀਡੈਂਟ ਬਣਾਉਂਦਾ ਹੈ, ਸ਼ੁਰੂਆਤੀ ਸੰਦਰਭ ਜੋੜਦਾ ਹੈ, ਲਿੰਕ/ਲੌਗ ਅਟੈਚ ਕਰਦਾ ਹੈ।\n- Responder: ਜਾਂਚ ਕਰਦਾ ਹੈ, ਅਪਡੇਟ ਜੋੜਦਾ ਹੈ, ਮਿਟੀਗੇਸ਼ਨ ਕਰਦਾ ਹੈ।\n- Incident Commander: ਕੋਆਰਡੀਨੇਸ਼ਨ ਦਾ ਮਾਲਕ, ਰਿਸਪਾਂਡਰਾਂ ਨੂੰ ਨਿਯੁਕਤ ਕਰਦਾ ਹੈ, ਸਮੀਕਰਨ ਮਨਜ਼ੂਰ ਕਰਦਾ ਹੈ, ਹਿੱਸੇਦਾਰ ਅਪਡੇਟਾਂ ਨੂੰ ਨਿਯੰਤਰਿਤ ਕਰਦਾ ਹੈ।\n- Reviewer: ਪੋਸਟ-ਇਨਸੀਡੈਂਟ ਸਮੀਖਿਆ ਦੀ ਅਗਵਾਈ ਕਰਦਾ ਹੈ, ਪੋਸਟਮੋਰਟਮ ਗੁਣਵੱਤਾ ਯਕੀਨੀ ਕਰਦਾ ਹੈ।

ਤੁਹਾਡੇ UI ਨੂੰ ਵਰਤਮਾਨ ਮਾਲਕ ਨੂੰ ਦਰਸਾਉਣਾ ਚਾਹੀਦਾ ਹੈ, ਅਤੇ ਤੁਹਾਡਾ ਵਰਕਫਲੋ ਡੈਲੀਗੇਸ਼ਨ (ਰੀਅਸਾਈਨ, ਰਿਸਪਾਂਡਰ ਜੋੜਨਾ, ਕਮਾਂਡਰ ਰੋਟੇਸ਼ਨ) ਦਾ ਸਮਰਥਨ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ।

ਸਟੇਟਸ ਅਤੇ ਟ੍ਰਾਂਜੀਸ਼ਨ

ਲਾਜ਼ਮੀ ਸਟੇਟਸ ਅਤੇ ਮਨਜ਼ੂਰ ਹੋਏ ਟ੍ਰਾਂਜੀਸ਼ਨ ਚੁਣੋ, ਜਿਵੇਂ Investigating → Mitigated → Resolved. ਗਾਰਡਰੇਲ ਸ਼ਾਮਲ ਕਰੋ:

triage ਤੋਂ ਅੱਗੇ ਜਾਣ ਤੋਂ ਪਹਿਲਾਂ ਇੱਕ ਸਮੀਕਰਨ ਲਾਜ਼ਮੀ ਕਰੋ।\n- Resolved ਦਰਜ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਇੱਕ ਰਿਜ਼ੋਲੂਸ਼ਨ ਸੰਖੇਪ ਲਾਜ਼ਮੀ ਕਰੋ।\n- "Resolved → Investigating" ਨੂੰ ਰੋਕੋ ਜਦ ਤੱਕ ਇੱਕ ਰੀਓਪਨ ਕਾਰਨ ਦਰਜ ਨਾ ਕੀਤਾ ਗਿਆ ਹੋਵੇ।

ਸੰਚਾਰ ਚੈਨਲਾਂ ਦੀ ਯੋਜਨਾ ਬਣਾਓ

ਅੰਦਰੂਨੀ ਅਪਡੇਟ (ਤੇਜ਼, ਰਣਨੀਤਿਕ, ਗੰਦ ਹੋ ਸਕਦੇ) ਅਤੇ ਹਿੱਸੇਦਾਰ-ਸਮਰਥ ਅਪਡੇਟ (ਸਪਸ਼ਟ, ਸਮੇਂ-ਟਿਕੇ, ਸੰਭਾਲੇ ਹੋਏ) ਨੂੰ ਵੱਖ ਕਰੋ। ਦੋ ਅਪਡੇਟ ਸਟਰੀਮ ਬਣਾਓ ਜਿਨ੍ਹਾਂ ਦੇ ਵੱਖ-ਵੱਖ ਟੈਂਪਲੇਟ, ਵਿਖਾਈ ਅਤੇ ਮਨਜ਼ੂਰੀ ਨਿਯਮ ਹੋਣ—ਅਕਸਰ ਕਮਾਂਡਰ ਹੀ ਹਿੱਸੇਦਾਰ ਅਪਡੇਟ ਪਬਲਿਸ਼ ਕਰਦਾ ਹੈ।

ਡਾਟਾ ਮਾਡਲ: ਏਂਟਿਟੀਜ਼, ਸੰਬੰਧ ਅਤੇ ਇਤਿਹਾਸ

ਇਕ ਚੰਗਾ ਇਨਸੀਡੈਂਟ ਟੂਲ UI ਵਿੱਚ "ਸਰਲ" ਮਹਿਸੂਸ ਹੁੰਦਾ ਹੈ ਕਿਉਂਕਿ ਅਧੀਨ ਡਾਟਾ ਮਾਡਲ ਲਾਜ਼ਮੀ ਅਤੇ ਸਥਿਰ ਹੁੰਦਾ ਹੈ। ਸਕ੍ਰੀਨ ਬਣਾਉਣ ਤੋਂ ਪਹਿਲਾਂ ਫੈਸਲਾ ਕਰੋ ਕਿ ਕਿਹੜੇ ਆਬਜੈਕਟ ਮੌਜੂਦ ਹਨ, ਉਹ ਕਿਵੇਂ ਜੁੜਦੇ ਹਨ, ਅਤੇ ਕਿਹੜੀ ਜਾਣਕਾਰੀ ਇਤਿਹਾਸਕ ਰੂਪ ਵਿੱਚ ਸਹੀ ਰਹਿਣੀ ਚਾਹੀਦੀ ਹੈ।

ਕੋਰ ਏਂਟਿਟੀਜ਼ (ਆਬਜੈਕਟ ਜਿਹਨਾਂ ਨੂੰ ਤੁਸੀਂ ਸਟੋਰ ਕਰੋਗੇ)

ਛੋਟੇ ਸੈੱਟ ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ:

Incident: ਹਰ ਚੀਜ਼ ਦਾ ਕੰਟੇਨਰ।\n- Service: ਜੋ ਤੁਸੀਂ ਚਲਾਉਂਦੇ ਹੋ (API, ਡੈਟਾਬੇਸ, ਮੋਬਾਈਲ ਐਪ), ਪ੍ਰਭਾਵ ਅਤੇ ਰਿਪੋਰਟਿੰਗ ਲਈ ਵਰਤੋਂ ਵਿੱਚ।\n- Update: ਮਨੁੱਖ-ਪੜ੍ਹਨਯੋਗ ਸਥਿਤੀ ਅਪਡੇਟ (ਅੰਦਰੂਨੀ ਨੋਟਸ ਅਤੇ ਬਾਹਰੀ ਸਥਿਤੀ ਲਈ)।\n- Timeline Event: ਨിശਚਿਤ, ਟਾਈਮਸਟੈਂਪ ਕੀਤਾ ਹਕੀਕਤਾਂ ("ਅਲਾਰਮ ਫਾਇਰ ਹੋਇਆ", "ਰੋਲਬੈਕ ਕੀਤਾ", "ਮਿਟੀਗੇਸ਼ਨ ਲਾਗੂ ਕੀਤਾ").\n- Action Item: ਫਾਲੋ-ਅੱਪ ਜਿਨ੍ਹਾਂ ਦੇ ਮਾਲਕ ਅਤੇ ਡਿਊ ਡੇਟ ਹੁੰਦੇ ਹਨ।\n- Postmortem: ਸੰਰਚਿਤ ਰਾਈਟ-ਅਪ (ਪ੍ਰਭਾਵ, ਰੂਟ ਕਾਰਨ ਵਿਸਲੇਸ਼ਣ, ਸਿੱਖਿਆ, ਲਿੰਕਸ)।

ਸੰਬੰਧ ਅਤੇ ਆਈਡੈਂਟੀਫਾਇਰ

ਜਿਆਦਾਤਰ ਸੰਬੰਧ ਇੱਕ-ਤੋਂ-ਅਨੇਕ ਹਨ:

ਇੱਕ Incident → ਕਈ Updates / Timeline Events / Action Items\n- ਇੱਕ Incident → ਇੱਕ (ਜਾਂ ਜ਼ੀਰੋ) Postmortem\n- ਇੱਕ Incident ↔ ਕਈ Services (ਅਕਸਰ many-to-many "affected_services" ਜੋਇਨ ਰਾਹੀਂ)

ਇਨਸੀਡੈਂਟ ਅਤੇ ਇਵੈਂਟਸ ਲਈ ਸਥਿਰ ਆਈਡੀ (UUIDs) ਵਰਤੋਂ। ਮਨੁੱਖਾਂ ਲਈ ਇੱਕ ਦੋਸਤਾਨਾ ਕੀ ਵਰਗਾ INC-2025-0042 ਪੈਦਾ ਕਰੋ ਜੋ ਤ੍ਰਤੀਬ ਤੋਂ ਬਣ ਸਕਦਾ ਹੈ।

ਮੈਟਾਡੇਟਾ ਜੋ ਤੁਸੀਂ ਬਾਅਦ ਵਿੱਚ ਚਾਹੋਗੇ

ਇਨ੍ਹਾਂ ਨੂੰ ਸ਼ੁਰੂ ਤੋਂ ਮਾਡਲ ਕਰੋ ਤਾਂ ਕਿ ਤੁਸੀਂ ਫਿਲਟਰ, ਖੋਜ ਅਤੇ ਰਿਪੋਰਟ ਕਰ ਸਕੋ:

Severity, status (open/mitigated/resolved), tags\n- Start time, end time, detection time\n- Incident commander, owner team, on-call rotation (ਵਿਕਲਪਿਕ)\n- ਪ੍ਰਭਾਵਿਤ ਸੇਵਾਵਾਂ, ਗਾਹਕ ਪ੍ਰਭਾਵ ਸੰਖੇਪ

ਇਤਿਹਾਸ, ਰੀਟੇਨਸ਼ਨ ਅਤੇ ਆਡੀਟੇਬਿਲਟੀ

ਇਨਸੀਡੈਂਟ ਡਾਟਾ ਸੰਵੇਦਨਸ਼ੀਲ ਹੁੰਦਾ ਹੈ ਅਤੇ ਅਕਸਰ ਬਾਅਦ ਵਿੱਚ ਸਮੀਖਿਆ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਸੰਪਾਦਨ ਨੂੰ ਡਾਟਾ ਵਜੋਂ ਤਾਂਲੋ—ਓਵਰਰਾਈਟ ਨਾ ਕਰੋ:\n\n- ਹਰ ਰਿਕਾਰਡ 'ਤੇ created_at/created_by ਸਟੋਰ ਕਰੋ।\n- ਸੋਧਾਂ ਲਈ ਇੱਕ ਆਡੀਟ ਲੌਗ ਰੱਖੋ (ਫੀਲਡ ਬਦਲਾਅ + ਕਰਮਕਾਰੀ + ਟਾਈਮਸਟੈਂਪ), ਜਾਂ ਮੁਹੱਤਵਪੂਰਨ ਦਸਤਾਵੇਜ਼ਾਂ (postmortem, updates) ਦੇ ਵਰਜਨ ਰੱਖੋ।\n- ਰੀਟੇਨਸ਼ਨ ਪਹਿਲਾਂ ਹੀ ਫੈਸਲਾ ਕਰੋ (ਉਦਾਹਰਨ, ਇਨਸੀਡੈਂਟ ਹਰ ਵੇਲੇ ਰੱਖੋ, ਚੈਟ ਟਰਾਂਸਕ੍ਰਿਪਟ N ਦਿਨ ਬਾਅਦ ਮਿਟਾਓ)।

ਇਹ ਬਣਤਰ ਬਾਅਦ ਵਿੱਚ ਖੋਜ, ਮੈਟਰਿਕਸ ਅਤੇ ਪਰਮੀਸ਼ਨਜ਼ ਵਰਗੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਬਿਨਾਂ ਰੀਵਰਕ ਦੇ ਆਸਾਨ ਬਣਾਉਂਦੀ ਹੈ।

ਇਨਸੀਡੈਂਟ ਇਨਟੇਕ, ਅਪਡੇਟ ਅਤੇ ਟਾਈਮਲਾਈਨ ਬਣਾਉ

ਜਦ ਕੁੱਝ ਖਰਾਬ ਹੁੰਦਾ ਹੈ, ਐਪ ਦਾ ਕੰਮ ਟਾਈਪਿੰਗ ਘਟਾਉਣਾ ਅਤੇ ਸਪਸ਼ਟਤਾ ਵਧਾਉਣਾ ਹੈ। ਇਹ ਭਾਗ "ਲਿਖਣ ਦਾ ਰਾਸ্তা" ਕਵਰ ਕਰਦਾ ਹੈ: ਲੋਕ ਕਿਵੇਂ ਇੱਕ ਇਨਸੀਡੈਂਟ ਬਣਾਉਂਦੇ ਹਨ, ਇਸਨੂੰ ਅਪਡੇਟ ਰੱਖਦੇ ਹਨ, ਅਤੇ ਬਾਅਦ ਵਿੱਚ ਕੀ ਹੋਇਆ ਉਸਦੀ ਪੁਨਰ-ਰਚਨਾ ਕਰਦੇ ਹਨ।

ਇਨਸੀਡੈਂਟ ਇਨਟੇਕ: ਘੱਟ ਫੀਲਡ, ਸਮਝਦਾਰ ਡਿਫਾਲਟ

ਇਨਟੇਕ ਫਾਰਮ ਇਤਨਾ ਛੋਟਾ ਰੱਖੋ ਕਿ ਤੁਸੀਂ ਟਰਬਲਸ਼ੂਟਿੰਗ ਦੌਰਾਨ ਵੀ ਮੁਕੰਮਲ ਕਰ ਸਕੋ। ਇੱਕ ਚੰਗੇ ਡਿਫਾਲਟ ਲਾਜ਼ਮੀ ਫੀਲਡਾਂ ਦਾ ਸੈੱਟ ਹੈ:

Title (ਸਧਾਰਨ ਭਾਸ਼ਾ: "ਮੋਬਾਈਲ 'ਤੇ ਚੈਕਆਊਟ ਗਲਤੀਆਂ")\n- Service/System (ਲਿਸਟ ਤੋਂ ਚੁਣੋ ਤਾਂ ਕਿ ਸਪੈਲਿੰਗ ਵੱਖਰਾ ਨਾ ਹੋਵੇ)\n- Severity (ਸੇਵਾ ਜਾਂ ਸਮੇਂ ਦੇ ਆਧਾਰ 'ਤੇ ਡਿਫਾਲਟ, ਪਰ ਸੰਪਾਦਨਯੋਗ)\n- Reporter (ਲੌਗ-ਇਨ ਯੂਜ਼ਰ ਤੋਂ ਆਟੋ-ਭਰੋ)

ਬਾਕੀ ਸਭ ਕ੍ਰੀਏਸ਼ਨ ਸਮੇਂ ਵਿਕਲਪਿਕ ਹੋਣ ਚਾਹੀਦਾ ਹੈ (ਪ੍ਰਭਾਵ, ਗਾਹਕ ਟਿਕਟ ਲਿੰਕ, ਸ਼ੱਕੀ ਕਾਰਨ). ਸਮਝਦਾਰ ਡਿਫਾਲਟ ਵਰਤੋਂ: start time ਨੂੰ "ਹੁਣ" 'ਤੇ ਸੈੱਟ ਕਰੋ, ਯੂਜ਼ਰ ਦੀ on-call team ਪ੍ਰੀ-ਸਿਲੈਕਟ ਕਰੋ, ਅਤੇ ਇੱਕ ਇਕ-ਟੈਪ "Create & open incident room" ਕਾਰਵਾਈ ਦਿਓ।

ਤੇਜ਼ ਅਪਡੇਟ: ਸਥਿਤੀ, ਪ੍ਰਭਾਵ, ਅਗਲੇ ਕਦਮ

ਤੁਹਾਡੀ ਅਪਡੇਟ UI ਨੂੰ ਦੁਹਰਾਉਣਯੋਗ, ਛੋਟੇ ਸੋଧਾਂ ਲਈ ਅਨੁਕੂਲ ਕੀਤਾ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਇੱਕ ਕੰਪੈਕਟ ਅਪਡੇਟ ਪੈਨਲ ਦਿਓ ਜਿਸ ਵਿੱਚ:

Status (Investigating / Identified / Mitigated / Resolved)\n- Impact summary (ਇੱਕ ਜਾਂ ਦੋ ਵਾਕ)\n- Key notes (ਕੀ ਪਿਛਲੇ ਅਪਡੇਟ ਤੋਂ ਬਦਲਿਆ)\n- Next steps (ਅਗਲੇ ਕੀ ਕੰਮ ਹਨ, ਕਿਸ ਦੁਆਰਾ)

ਅਪਡੇਟਾਂ ਨੂੰ ਐਪੇਂਡ-ਫ੍ਰੈਂਡਲੀ ਬਣਾਓ: ਹਰ ਅਪਡੇਟ ਇੱਕ ਟਾਈਮਸਟੈਂਪ ਕੀਤੀ ਐਂਟਰੀ ਬਣ ਜਾਂਦੀ ਹੈ, ਪਿਛਲੇ ਟੈਕਸਟ ਦੇ ਓਵਰਰਾਈਟ ਦੀ ਨਹੀਂ।

ਟਾਈਮਲਾਈਨ: ਆਟੋਮੈਟਿਕ ਇਤਿਹਾਸ ਅਤੇ ਮੈਨੂਅਲ ਇਵੈਂਟ

ਇੱਕ ਟਾਈਮਲਾਈਨ ਬਣਾਓ ਜੋ ਮਿਲਾਵਟ ਕਰਦੀ ਹੋਵੇ:

ਆਟੋ-ਕੈਪਚਰ ਕੀਤੀਆਂ ਇਵੈਂਟਸ: ਫੀਲਡ ਬਦਲਾਅ (ਸੇਵਰਿਟੀ, ਸਥਿਤੀ), ਅਸਾਈਨੀਜ਼, ਜੋੜੇ ਗਏ ਲਿੰਕ, ਰਿਜ਼ੋਲੂਸ਼ਨ ਸਮਾਂ\n- ਮੈਨੂਅਲ ਇਵੈਂਟਸ: "ਹਾਟਫਿਕਸ ਡਿਪਲੌਇਡ ਕੀਤਾ", "ਰੋਲਬੈਕ ਕੀਤਾ", "DB failover ਸ਼ੁਰੂ ਕੀਤਾ"

ਇਹ ਇਕ ਭਰੋਸੇਯੋਗ ਕਹਾਣੀ ਬਣਾਉਂਦਾ ਹੈ ਬਿਨਾਂ ਲੋਕਾਂ ਨੂੰ ਹਰ ਕਲਿੱਕ ਲੌਗ ਕਰਨ ਲਈ ਮਜ਼ਬੂਰ ਕੀਤਾ।

ਮੋਬਾਈਲ 'ਤੇ ਤੇਜ਼ੀ ਲਈ ਡਿਜ਼ਾਈਨ ਕਰੋ

ਆਊਟੇਜ ਦੌਰਾਨ ਬਹੁਤ ਸਾਰੇ ਅਪਡੇਟ ਫੋਨ ਤੋਂ ਹੁੰਦੇ ਹਨ। ਇੱਕ ਤੇਜ਼, ਘੱਟ-ਘਰਾਫਾ ਸਕ੍ਰੀਨ ਤਰਜੀਹ ਦਿਓ: ਵੱਡੇ ਟੱਚ ਟਾਰਗੇਟ, ਇੱਕ ਸਕ੍ਰੋਲਿੰਗ ਪੰਨਾ, ਆਫਲਾਈਨ-ਫਰੈਂਡਲੀ ਡਰਾਫਟ, ਅਤੇ ਇਕ-ਟੈਪ ਕਾਰਵਾਈਆਂ ਜਿਵੇਂ "Post update" ਅਤੇ "Copy incident link"।

Severity, ਚੈਕਲਿਸਟ ਅਤੇ ਸਹਾਇਕ ਸੰਦਰਭ ਸ਼ਾਮਲ ਕਰੋ

Severity ਇਨਸੀਡੈਂਟ ਰਿਸਪਾਂਸ ਦਾ "ਸਪੀਡ ਡਾਇਲ" ਹੈ: ਇਹ ਦੱਸਦਾ ਹੈ ਕਿ ਲੋਕ ਕਿਸ ਤਰ੍ਹਾਂ ਜ਼ਰੂਰੀ ਤੌਰ ਤੇ ਕੰਮ ਕਰਨ, ਕਿੰਨੀ ਵਿਆਪਕ ਤੌਰ ਤੇ ਸੁਚਿਤ ਕਰਨ ਅਤੇ ਕਿਹੜੀਆਂ ਤਰਜੀحات ਸਵੀਕਾਰਯੋਗ ਹਨ।

Severity ਦੀਆਂ ਪੱਧਰਾਂ (ਅਤੇ ਉਹਨਾਂ ਦਾ ਮਤਲਬ)

ਧੁੰਦਲੇ ਲੇਬਲਾਂ ਜਿਵੇਂ "ਹਾਈ/ਮੀਡੀਅਮ/ਲੋ" ਤੋਂ ਬਚੋ। ਹਰ severity ਪੱਧਰ ਨੂੰ ਸਪਸ਼ਟ ਓਪਰੇਸ਼ਨਲ ਉਮੀਦਾਂ ਨਾਲ ਜੋੜੋ—ਖਾਸ ਕਰਕੇ ਜਵਾਬ ਦਾ ਸਮਾਂ ਅਤੇ ਸੰਚਾਰ ਕੈਡੈਂਸ।

ਉਦਾਹਰਨ:

SEV1 (Critical): ਯੂਜ਼ਰ-ਮੁਖੀ ਆਊਟੇਜ ਜਾਂ ਵੱਡਾ ਸੁਰੱਖਿਆ-ਖਤਰਾ। ਤੁਰੰਤ ਪੇਜ ਕਰੋ, ਇਨਸੀਡੈਂਟ ਬ੍ਰਿਜ/ਚੈਟ ਖੋਲੋ, ਹਰ 15–30 ਮਿੰਟ 'ਤੇ ਹਿੱਸੇਦਾਰਾਂ ਨੂੰ ਅਪਡੇਟ ਕਰੋ, ਅਤੇ ਸੋਚੋ ਕਿ ਜਨਤਕ ਸਥਿਤੀ ਅਪਡੇਟ ਜਾਰੀ ਕਰਨੀਆਂ ਹਨ।\n- SEV2 (Major): ਆੰਸ਼ਿਕ ਆਊਟੇਜ ਜਾਂ ਗੰਭੀਰ ਘਟਨਾ। ਜਲਦੀ ਜਵਾਬ ਦਿਓ, ਚੈਟ ਵਿੱਚ ਕੋਆਰਡੀਨੇਟ ਕਰੋ, ਹਰ 30–60 ਮਿੰਟ 'ਤੇ ਅਪਡੇਟ ਕਰੋ।\n- SEV3 (Minor): ਸੀਮਤ ਪ੍ਰਭਾਵ, ਵਰਕਅਰਾਊਂਡ ਉਪਲਬਧ। ਜੇ ਲੋੜ ਹੋਵੇ ਤਾਂ ਬਿਜਨਸ ਘੰਟਿਆਂ ਦੌਰਾਨ ਹੈਂਡਲ ਕਰੋ, ਮੁੱਖ ਮੀਲ-ਪੱਥਰ 'ਤੇ ਅਪਡੇਟ ਕਰੋ।\n- SEV4 (Info): ਤੁਰੰਤ ਪ੍ਰਭਾਵ ਨਹੀਂ; ਇੱਕ ਓਪਰੇਸ਼ਨਲ ਮੁੱਦਾ ਵਜੋਂ ਟ੍ਰੈਕ ਕਰੋ।

ਜਿੱਥੇ ਵੀ severity ਚੁਣੀ ਜਾ ਰਹੀ ਹੋਵੇ UI ਵਿੱਚ ਇਹ ਨੀਤੀਆਂ ਦਿੱਖਾਓ ਤਾਂ ਜੋ ਰਿਸਪਾਂਡਰਾਂ ਨੂੰ ਬਾਹਰੀ ਡੌਕਸ ਵਿੱਚ ਤਲਾਸ਼ ਨਾ ਕਰਨੀ ਪਏ।

ਉਹ ਰਿਸਪਾਂਡਰ ਚੈੱਕਲਿਸਟ ਜੋ ਤੁਹਾਡੇ ਵਰਕਫਲੋ ਨਾਲ ਮੇਲ ਖਾਂਦੇ ਹੋ

ਚੈੱਕਲਿਸਟ ਲੋਕਾਂ ਦੀ ਮਾਨਸਿਕ ਭਾਰ ਘਟਾਉਂਦੇ ਹਨ ਜਦ ਉਹ ਤਣਾਅ ਵਿੱਚ ਹੁੰਦੇ ਹਨ। ਉਨ੍ਹਾਂ ਨੂੰ ਛੋਟਾ, ਕਾਰਵਾਈਯੋਗ ਅਤੇ ਭੂਮਿਕਾ-ਨਿਰਧਾਰਿਤ ਰੱਖੋ।

ਇੱਕ ਉਪਯੋਗੀ ਪੈਟਰਨ ਕੁਝ ਵਿਭਾਗਾਂ ਦਾ ਹੁੰਦਾ ਹੈ:

Triage: ਗਾਹਕ ਪ੍ਰਭਾਵ ਦੀ ਪੁਸ਼ਟੀ ਕਰੋ, ਬਲਾਸਟ ਰੇਡੀਅਸ ਨਿਰਧਾਰਿਤ ਕਰੋ, ਸਮੀਕਰਨ ਸੈੱਟ ਕਰੋ, ਇਨਸੀਡੈਂਟ ਲੀਡ ਨਿਯੁਕਤ ਕਰੋ।\n- Mitigation: ਰੋਲਬੈਕ/ਫੀਚਰ ਫਲੈਗ ਕਾਰਵਾਈਆਂ ਦੀ ਪੁਸ਼ਟੀ ਕਰੋ, ਰਿਕਵਰੀ ਸਿਗਨਲ ਦੀ ਜਾਂਚ ਕਰੋ, ਰਿਗ੍ਰੈਸ਼ਨ ਲਈ ਮਾਨੀਟਰ ਕਰੋ।\n- Comms: ਸਪੋਰਟ ਨੂੰ ਨੋਟੀਫਾਈ ਕਰੋ, ਅੰਦਰੂਨੀ ਅਪਡੇਟ ਪੋਸਟ ਕਰੋ, ਪਬਲਿਕ/ਸਟੇਟਸ ਅਪਡੇਟ ਤੇ ਫੈਸਲਾ ਕਰੋ, ਗਾਹਕ-ਸਮਰਥ ਭੇਸ਼ਨੀ ਕੈਪਚਰ ਕਰੋ।

ਚੈੱਕਲਿਸਟ ਆਈਟਮਾਂ ਨੂੰ ਟਾਈਮਸਟੈਂਪ ਅਤੇ ਅਟਰੀਬਿਊਟ ਕੀਤਾ ਜਾਵੇ ਤਾਂ ਜੋ ਉਹ ਇਨਸੀਡੈਂਟ ਰਿਕਾਰਡ ਦਾ ਹਿੱਸਾ ਬਣ ਜਾਣ।

ਸਹਾਇਕ ਆਰਟੀਫੈਕਟ ਲਿੰਕ ਕਰੋ (ਤਾਂ ਜੋ ਸੰਦਰਭ ਗੁੰਮ ਨਾ ਹੋਏ)

ਇਨਸੀਡੈਂਟ ਕਦੇ ਵੀ ਇਕ ਟੂਲ ਵਿੱਚ ਨਹੀਂ ਰਹਿੰਦੇ। ਤੁਹਾਡਾ ਐਪ ਰਿਸਪਾਂਡਰਾਂ ਨੂੰ ਇਹ ਆਸਾਨੀ ਦੇਵੇ ਕਿ ਉਹ ਲਿੰਕ ਜੋੜ ਸਕਣ:

ਡੈਸ਼ਬੋਰਡ ਅਤੇ ਖਾਸ ਚਾਰਟ\n- ਲੌਗ ਕੁਇਰੀਜ਼\n- ਟਿਕਟ/ਇਸ਼ੂਜ਼\n- ਚੈਟ ਧਾਗੇ ਜਾਂ ਵਾਰ-ਰੂਮ ਚੈਨਲ\n- ਰਨਬੁਕਸ ਅਤੇ ਪਲੇਬੁਕ

"ਟਾਈਪਡ" ਲਿੰਕ ਪਸੰਦ ਕਰੋ (ਉਦਾਹਰਨ, Runbook, Ticket) ਤਾਂ ਕਿ ਉਹ ਬਾਅਦ ਵਿੱਚ ਫਿਲਟਰ ਕੀਤੇ ਜਾ ਸਕਣ।

SLA/SLO ਪ੍ਰਭਾਵ ਕੈਪਚਰ ਕਰੋ ਜਦ ਲੋੜੀਏ

ਜੇ ਤੁਹਾਡੀ ਸੰਸਥਾ ਰਿਲਾਇਬਿਲਟੀ ਟਾਰਗਟ ਟ੍ਰੈਕ ਕਰਦੀ ਹੈ, ਤਾਂ ਹਲਕਾ ਫੀਲਡ ਜਿਵੇਂ SLO affected (yes/no), ਅੰਦਾਜ਼ਾ error budget burn, ਅਤੇ ਗਾਹਕ SLA ਰਿਸਕ ਸ਼ਾਮਲ ਕਰੋ। ਉਨ੍ਹਾਂ ਨੂੰ ਵਿਕਲਪਿਕ ਰੱਖੋ—ਪਰ ਇਨਸੀਡੈਂਟ ਦੌਰਾਨ ਜਾਂ ਬਾਅਦ ਜਦ ਵੇਰਵੇ ਤਾਜ਼ੇ ਹੋਣ ਤਾਂ ਅਸਾਨੀ ਨਾਲ ਭਰਨਾ ਹੋਵੇ।

ਪੋਸਟਮੋਰਟਮ ਟੈਂਪਲੇਟ ਅਤੇ ਸਮੀਖਿਆ ਪ੍ਰਕਿਰਿਆ ਬਣਾਓ

ਇਸਨੂੰ ਇੱਕ ਅਸਲੀ ਟੂਲ ਵਾਂਗ ਚਲਾਓ

ਜਦ ਤੁਹਾਡੇ ਕੋਲ ਟੈਸਟ ਕਰਨ ਲਈ ਤਿਆਰ ਹੋਵੋ ਤਾਂ ਪ੍ਰੋਟੋਟਾਈਪ ਤੋਂ ਹੋਸਟ ਕੀਤੇ ਪਰਿਵੇਸ਼ 'ਤੇ ਜਾਓ।

ਡਿਪਲੌਇ ਕਰੋ

ਇੱਕ ਚੰਗਾ ਪੋਸਟਮੋਰਟਮ ਸ਼ੁਰੂ ਕਰਨ ਵਿੱਚ ਆਸਾਨ, ਭੁੱਲਣਾ ਮੁਸ਼ਕਿਲ ਅਤੇ ਟੀਮਾਂ ਵਿੱਚ ਲਗਾਤਾਰ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਸਭ ਤੋਂ ਸਧਾਰਣ ਰਸਤਾ ਇਹ ਹੈ ਕਿ ਇੱਕ ਡਿਫ਼ਾਲਟ ਟੈਂਪਲੇਟ ਪ੍ਰਦਾਨ ਕੀਤਾ ਜਾਵੇ (ਕੋਮਲ ਲਾਜ਼ਮੀ ਫੀਲਡਾਂ ਨਾਲ) ਅਤੇ ਇਨਸੀਡੈਂਟ ਰਿਕਾਰਡ ਤੋਂ ਆਟੋ-ਭਰ ਦਿੱਤਾ ਜਾਵੇ ਤਾਂ ਲੋਕ ਸਮਾਂ ਸੋਚਣ ਵਿੱਚ ਲਗਾਉਣ—ਦੁਹਰਾਉਣ ਵਿੱਚ ਨਹੀਂ।

ਇੱਕ ਪ੍ਰਯੋਗਾਤਮਕ ਪੋਸਟਮੋਰਟਮ ਟੈਂਪਲੇਟ (ਕੀ ਸ਼ਾਮਲ ਕਰਨਾ)

ਤੁਹਾਡਾ ਬਿਲਟ-ਇਨ ਟੈਂਪਲੇਟ ਸੰਰਚਨਾ ਅਤੇ ਲਚੀਲਾਪਣ ਵਿਚ ਸੰਤੁਲਨ ਰੱਖੇ:

Summary: ਸਧਾਰਨ ਭਾਸ਼ਾ ਵਿੱਚ ਕੀ ਹੋਇਆ (2–5 ਵਾਕ)\n- Impact: ਕਿਸਨੇ/ਕੀ ਪ੍ਰਭਾਵਤ ਹੋਇਆ, ਕਿੰਨਾ ਸਮਾਂ, ਯੂਜ਼ਰ-ਦਿੱਖਣ ਵਾਲੇ ਲਕੀਰਾਂ, ਅਤੇ ਬਿਜ਼ਨਸ ਪ੍ਰਭਾਵ (ਆਰਡਰ ਦੇਵਰਡ, ਐਰਰ ਰੇਟ, SLA ਬ੍ਰੀਚ)\n- Root cause: ਮੁੱਖ ਤਕਨੀਕੀ/ਪ੍ਰਕਿਰਿਆ ਕਾਰਨ। ਤੱਥ-ਅਧਾਰਿਤ ਰੱਖੋ, ਦੋਸ਼-ਨੁਮਾਈ ਨਹੀਂ।\n- Contributing factors: ਦੁਸਰੇ ਮਸਲੇ (ਮਾਨੀਟਰਨਿੰਗ ਖਾਮੀਆਂ, ਅਸਪਸ਼ਟ ਮਾਲਕੀ, ਖਤਰਨਾਕ ਬਦਲਾਅ ਦਾ ਸਮਾਂ)\n- What went well / what went wrong / where we got lucky: ਇਮੋਸ਼ਨਲ ਪਰਕਿਰਿਆਵਾਂ ਲਈ ਪ੍ਰੇਰਕ ਪ੍ਰਾਂਪਟ ਜੋ ਇਮਾਨਦਾਰ, ਕਾਰਵਾਈਯੋਗ ਅਨੁਭਵ ਉਤਪੰਨ ਕਰਨ

ਜੇ ਤੁਸੀਂ ਜਲਦੀ ਪਬਲਿਸ਼ਿੰਗ ਚਾਹੁੰਦੇ ਹੋ ਤਾਂ ਸ਼ੁਰੂਆਤੀ ਦੌਰ ਵਿੱਚ "Root cause" ਨੂੰ ਵਿਕਲਪਿਕ ਰੱਖੋ—but ਅंतਿਮ ਮਨਜ਼ੂਰੀ ਤੋਂ ਪਹਿਲਾਂ ਇਹ ਲਾਜ਼ਮੀ ਕਰੋ।

ਪੋਸਟਮੋਰਟਮ ਨੂੰ ਇਨਸੀਡੈਂਟ ਟਾਈਮਲਾਈਨ ਨਾਲ ਆਟੋ-ਲਿੰਕ ਕਰੋ

ਪੋਸਟਮੋਰਟਮ ਇੱਕ ਵੱਖਰਾ ਦਸਤਾਵੇਜ਼ ਨਹੀਂ ਹੋਣਾ ਚਾਹੀਦਾ ਜੋ ਅੰਦਰ-ਬਾਹਰ ਤੈਰ ਰਿਹਾ ਹੋਵੇ। ਜਦ ਇੱਕ ਪੋਸਟਮੋਰਟਮ ਬਣਾਇਆ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਆਟੋਮੈਟਿਕ ਤੌਰ 'ਤੇ ਜੁੜੇ:

ਇਨਸੀਡੈਂਟ ਟਾਈਮਲਾਈਨ (ਮੁੱਖ ਅਪਡੇਟ, ਸਥਿਤੀ ਬਦਲਾਅ, ਮਿਟੀਗੇਸ਼ਨ ਕਦਮ)\n- ਭਾਗੀਦਾਰ (incident commander, responders, comms)\n- ਆਰਟੀਫੈਕਟ (ਸੰਬੰਧਿਤ ਟਿਕਟ, ਡੈਸ਼ਬੋਰਡ, ਲੌਗ ਲਿੰਕ—ਹਵਾਲੇ ਵਜੋਂ ਸਟੋਰ)

ਇਹਨਾਂ ਨੂੰ ਪੋਸਟਮੋਰਟਮ ਸੈਕਸ਼ਨਾਂ ਨੂੰ ਪ੍ਰੀ-ਫਿਲ ਕਰਨ ਲਈ ਵਰਤੋਂ। ਉਦਾਹਰਨ ਵਜੋਂ, "Impact" ਬਲਾਕ ਇਨਸੀਡੈਂਟ ਦੇ ਸ਼ੁਰੂ/ਅੰਤ ਸਮਿਆਂ ਅਤੇ ਵਰਤਮਾਨ ਸਮੀਕਰਨ ਨਾਲ ਸ਼ੁਰੂ ਹੋ ਸਕਦਾ ਹੈ, ਜਦੋਂ ਕਿ "What we did" ਟਾਈਮਲਾਈਨ ਐਂਟਰੀਜ਼ ਤੋਂ ਖਿੱਚਿਆ ਜਾ ਸਕਦਾ ਹੈ।

ਸਿੱਖਣ을 ਸਮਰਥਨ ਕਰਨ ਵਾਲੀ ਸਮੀਖਿਆ ਅਤੇ ਮਨਜ਼ੂਰੀ ਫਲੋ

ਇਕ ਹਲਕਾ ਵਰਕਫਲੋ ਜੋ ਪੋਸਟਮੋਰਟਮਾਂ ਨੂੰ ਫੱਸਣ ਤੋਂ ਰੋਕੇ ਸ਼ਾਮਲ ਕਰੋ:

Draft (ਇਨਸੀਡੈਂਟ ਬੰਦ ਹੋਣ 'ਤੇ ਆਟੋ-ਤੌਰ 'ਤੇ ਬਣਾਇਆ ਜਾਂਦਾ ਹੈ, ਜਾਂ ਮੈਨੁਅਲ)\n2. In Review (ਨਿਰਧਾਰਿਤ ਸਮੀਖਿਆਕਾਰ—ਅਕਸਰ IC + ਸੇਵਾ ਮਾਲਕ)\n3. Approved (ਲੌਕਡ ਸੰਖੇਪ + ਫੈਸਲਾ ਨੋਟਸ ਸਟੋਰ)\n4. Published (ਅੰਦਰੂਨੀ ਤੌਰ 'ਤੇ ਸਾਂਝਾ; ਵਿਕਲਪਿਕ ਤੌਰ 'ਤੇ ਗਾਹਕ-ਮੁਕਾਬਲੇ ਅਪਡੇਟ ਨਾਲ ਜੋੜਿਆ)

ਹਰ ਕਦਮ 'ਤੇ ਫੈਸਲਾ ਨੋਟਸ ਕੈਪਚਰ ਕਰੋ: ਕੀ ਬਦਲਿਆ, ਕਿਉਂ ਬਦਲਿਆ, ਅਤੇ ਕਿਸ ਨੇ ਮਨਜ਼ੂਰ ਕੀਤਾ। ਇਹ "ਚੁੱਪ ਚੇਤਾਵਨੀ ਸੋਧਾਂ" ਤੋਂ ਬਚਾਉਂਦਾ ਹੈ ਅਤੇ ਭਵਿੱਖ ਦੀ ਸਮੀਖਿਆ ਲਈ ਆਸਾਨ ਬਣਾਉਂਦਾ ਹੈ।

ਜੇ ਤੁਸੀਂ UI ਸਧਾਰਾ ਰੱਖਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ ਸਮੀਖਿਆ ਨੂੰ ਕਮੈਂਟਸ ਵਾਂਗTreat ਕਰੋ ਜਿਨ੍ਹਾਂ ਦੇ ਵਿਸ਼ੇਸ਼ ਨਤੀਜੇ (Approve / Request changes) ਹੋਣ ਅਤੇ ਆਖਰੀ ਮਨਜ਼ੂਰੀ ਨੂੰ ਅਪਰਿਵਰਤਨੀ ਰਿਕਾਰਡ ਵਜੋਂ ਸਟੋਰ ਕਰੋ।

ਟîmਾਂ ਲਈ ਜੋ ਇਸਦੀ ਲੋੜ ਹੈ, "Published" ਨੂੰ ਆਪਣੇ ਸਥਿਤੀ ਅਪਡੇਟ ਵਰਕਫਲੋ ਨਾਲ ਜੋੜੋ (ਦੇਖੋ /blog/integrations-status-updates) ਬਿਨਾ ਸਮੱਗਰੀ ਨੂੰ ਹੱਥੋਂ-ਹੱਥ ਕਾਪੀ ਕੀਤੇ।

ਐਕਸ਼ਨ ਆਈਟਮਾਂ ਨੂੰ ਮੁਕੰਮਲ ਹੋਣ ਤੱਕ ਟ੍ਰੈਕ ਕਰੋ

ਪੋਸਟਮੋਰਟਮ ਸਿਰਫ਼ ਦਸਤਾਵੇਜ਼ ਰੱਖ ਕੇ ਭਵਿੱਖ ਦੇ ਇਨਸੀਡੈਂਟ ਘਟਾਉਣ ਵਿੱਚ ਸਹਾਇਕ ਨਹੀਂ ਹੁੰਦੇ—ਫਾਲੋ-ਅਪ ਕੰਮ ਹਕੀਕਤ ਵਿੱਚ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਐਕਸ਼ਨ ਆਈਟਮਾਂ ਨੂੰ ਤੁਹਾਡੇ ਐਪ ਵਿੱਚ ਪਹਿਲ-ਸ਼੍ਰੇਣੀ ਆਬਜੈਕਟਾਂ ਵਜੋਂ ਸਮਝੋ—ਨਾ ਕਿ ਦਸਤਾਵੇਜ਼ ਦੇ ਅੰਤ ਵਿੱਚ ਇੱਕ ਪੈਰਾ।

ਐਕਸ਼ਨ ਆਈਟਮਾਂ ਨੂੰ ਸੰਰਚਿਤ ਰਿਕਾਰਡ ਵਜੋਂ ਪਰਿਭਾਸ਼ਿਤ ਕਰੋ

ਹਰ ਐਕਸ਼ਨ ਆਈਟਮ ਕੋਨਸਿਸਟੈਂਟ ਫੀਲਡਾਂ ਨਾਲ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ ਤਾਂ ਕਿ ਇਹ ਟਰੈਕ ਅਤੇ ਮਾਪਿਆ ਜਾ ਸਕੇ:\n\n- Owner (ਇੱਕ ਜ਼ਿੰਮੇਵਾਰ ਵਿਅਕਤੀ)\n- Due date (ਅਤੇ ਵਿਕਲਪਕ "start not before")\n- Priority (ਉਦਾਹਰਨ: P0–P3 ਜਾਂ High/Medium/Low)\n- Status (Open, In progress, Blocked, Done, Won’t do)\n- Verification criteria (ਕਿਵੇਂ ਪਤਾ ਲੱਗੇਗਾ ਕਿ ਫਿਕਸ ਕੰਮ ਕਰ ਗਿਆ)

ਛੋਟੇ ਪਰ ਉਪਯੋਗੀ ਮੈਟਾਡੇਟਾ ਜੋੜੋ: tags (ਜਿਵੇਂ "monitoring", "docs"), component/service, ਅਤੇ "created from" (incident ID ਅਤੇ postmortem ID)।

ਇਨ੍ਹਾਂ ਕੰਮਾਂ ਨੂੰ ਇਨਸੀਡੈਂਟਾਂ ਵਿੱਚੋਂ ਬਾਹਰ ਖੋਜਯੋਗ ਬਣਾਓ

ਐਕਸ਼ਨ ਆਈਟਮਾਂ ਨੂੰ ਇੱਕ ਹੀ ਪੋਸਟਮੋਰਟਮ ਪੇਜ ਵਿੱਚ ਫੜ ਨਾ ਰੱਖੋ। ਇਹ ਦਿਓ:

ਮਾਲਕ, ਸੇਵਾ, ਟੈਗ ਅਤੇ ਸਥਿਤੀ ਦੁਆਰਾ ਗਲੋਬਲ ਖੋਜ\n- ਫਿਲਟਰ ਜਿਵੇਂ "overdue", "due this week", "blocked", "high priority"\n- ਸਧਾਰਨ ਰਿਪੋਰਟਿੰਗ: ਟੀਮ/ਸੇਵਾ ਅਨੁਸਾਰ ਗਿਣਤੀਆਂ, ਪੂਰਨਤਾ ਦਰ, ਔਸਤ ਸਮਾਂ-ਤੱਕ-ਕਲੋਜ਼

ਇਹ ਫਾਲੋ-ਅਪ ਨੂੰ ਇਕ ਆਪਰੇਸ਼ਨਲ ਕਿਊ ਵਿੱਚ ਬਦਲ ਦਿੰਦਾ ਹੈ ਨਾ ਕਿ ਫੈਲੇ ਹੋਏ ਨੋਟਸ ਵਿੱਚ।

ਦੁਹਰਾਏ ਜਾਣ ਵਾਲੇ ਕੰਮ ਅਤੇ ਬਾਹਰੀ ਲਿੰਕ (ਵਿਕਲਪਿਕ)

ਕੁਝ ਟਾਸਕ ਦੁਹਰਾਏ ਜਾਂਦੇ ਹਨ (ਤਰਮਾਤਮਕ game days, ਰਨਬੁਕ ਰਿਵਿਊਜ਼). ਇੱਕ ਰਿਕਰਿੰਗ ਟੈਂਪਲੇਟ ਸਹਾਇਤਾ ਜਨਕੋ ਜੋ ਨਿਰਧਾਰਿਤ ਸਮਾਂ-ਅਨੁਸਾਰ ਨਵੇਂ ਆਈਟਮ ਬਣਾਉਂਦਾ ਹੈ, ਪਰ ਹਰ ਇਕ ਘਟਨਾ ਅਲੱਗ-ਅਲੱਗ ਟ੍ਰੈਕਿੰਗ ਯੋਗ ਰਹਿੰਦੀ ਹੈ।

ਜੇ ਟੀਮ ਪਹਿਲਾਂ ਹੀ ਕਿਸੇ ਹੋਰ ਟ੍ਰੈਕਰ ਦੀ ਵਰਤੋਂ ਕਰ ਰਹੀ ਹੈ, ਤਾਂ ਇੱਕ ਐਕਸ਼ਨ ਆਈਟਮ ਵਿੱਚ ਇਕ ਬਾਹਰੀ ਹਵਾਲਾ ਲਿੰਕ ਅਤੇ ਬਾਹਰੀ ID ਸ਼ਾਮਲ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿਓ, ਜਦਕਿ ਤੁਹਾਡਾ ਐਪ ਇਨਸੀਡੈਂਟ ਲਿੰਕੇਜ ਅਤੇ ਵੇਰੀਫਿਕੇਸ਼ਨ ਲਈ ਸਰੋਤ ਬਣਿਆ ਰਹੇ।

ਰੀਮਾਈਂਡਰ ਅਤੇ ਏਸਕੇਲੈਸ਼ਨ ਨਿਯਮ

ਹਲਕੇ ਨਰੜ: ਮਾਲਕਾਂ ਨੂੰ ਡਿਊ ਡੇਟ ਨੇੜੇ ਨੋਟੀਫਾਈ ਕਰੋ, ਆਦਤਕ ਠਹਿਰੇ ਹੋਏ ਆਈਟਮਾਂ ਨੂੰ ਟੀਮ ਲੀਡ ਨੂੰ ਫਲੈਗ ਕਰੋ, ਅਤੇ ਰਿਪੋਰਟਾਂ ਵਿੱਚ ਚਿਰ-ਆਓ ਵਾਢੇ ਪੈਟਰਨ ਦਿਖਾਓ। ਨਿਯਮਾਂ ਨੂੰ ਬਦਲਣਯੋਗ ਰੱਖੋ ਤਾਂ ਕਿ ਟੀਮਾਂ ਆਪਣੀ ਆਨ-ਕਾਲ ਓਪਰੇਸ਼ਨ ਅਤੇ ਕੰਮ ਦੇ ਹਕੀਕਤ ਨਾਲ ਮੇਲ ਖਾ ਸਕਨ।

ਪਰਮੀਸ਼ਨ, ਐਕਸੈਸ ਕੰਟਰੋਲ ਅਤੇ ਆਡੀਟੇਬਿਲਟੀ

ਆਪਣੇ ਬਣਾਉਣ ਦੀ ਲਾਗਤ ਘਟਾਓ

ਜੋ ਤੁਸੀਂ ਬਣਾਇਆ ਉਸਨੂੰ ਸਾਂਝਾ ਕਰਕੇ ਜਾਂ ਟੀਮ ਮੈਟਸ ਨੂੰ ਨਿਯੋਤਣ ਕਰਕੇ ਕ੍ਰੈਡਿਟ ਪ੍ਰਾਪਤ ਕਰੋ।

ਕ੍ਰੈਡਿਟ ਕਮਾਓ

ਇਨਸੀਡੈਂਟ ਅਤੇ ਪੋਸਟਮੋਰਟਮ ਅਕਸਰ ਸੰਵੇਦਨਸ਼ੀਲ ਵੇਰਵੇ ਰੱਖਦੇ ਹਨ—ਗਾਹਕ ਪਹਿਚਾਣ, ਅੰਦਰੂਨੀ IP, ਸੁਰੱਖਿਆ ਖੋਜ, ਜਾਂ ਵੈਂਡਰ ਮੁੱਦੇ। ਸਪਸ਼ਟ ਪਹੁੰਚ ਨਿਯਮ ਟੂਲ ਨੂੰ ਸਹਿਯੋਗੀ ਰੱਖਦੇ ਹਨ ਬਿਨਾਂ ਇਸਨੂੰ ਡਾਟਾ ਲੀਕ ਬਣਨ ਦੇ।

ਪਰਮੀਸ਼ਨ ਲੈਵਲ ਪਰਿਭਾਸ਼ਿਤ ਕਰੋ

ਛੋਟੇ, ਸਮਝਣਯੋਗ ਰੋਲ ਸੈੱਟ ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ:

View-only (stakeholders): ਇਨਸੀਡੈਂਟ ਸੰਖੇਪ, ਟਾਈਮਲਾਈਨ, ਅਤੇ ਅੰਤਮ ਪੋਸਟਮੋਰਟਮ ਪੜ੍ਹ ਸਕਦੇ ਹਨ, ਪਰ ਸੋਧ ਨਹੀਂ ਕਰ ਸਕਦੇ। ਲੀਡਰਸ਼ਿਪ, ਗਾਹਕ ਸਪੋਰਟ, ਅਤੇ ਪਾਰਟਨਰ ਟੀਮਾਂ ਲਈ ਉਪਰਿੋਗੀ।\n- Editors (responders): ਇਨਸੀਡੈਂਟ ਬਣਾਉਣ, ਅਪਡੇਟ ਜੋੜਣ, ਟਾਈਮਲਾਈਨ ਪ੍ਰਬੰਧਨ, ਅਤੇ ਪੋਸਟਮੋਰਟਮ ਡਰਾਫਟ ਕਰਨ ਦੀ ਯੋਗਤਾ।\n- Admins (owners): ਰੋਲਾਂ ਨੂੰ ਪ੍ਰਬੰਧਿਤ ਕਰਨਾ, ਟੈਂਪਲੇਟਾਂ ਨੂੰ ਸੰਰਚਿਤ ਕਰਨਾ, ਇੰਟੇਗ੍ਰੇਸ਼ਨ ਕਨੈਕਟ ਕਰਨਾ, ਅਤੇ ਐਕਸੈਸ ਤकरਾਰਾਂ ਹੱਲ ਕਰਨ ਦੀ ਯੋਗਤਾ।

ਜੇ ਤੁਹਾਡੇ ਕੋਲ ਕਈ ਟੀਮਾਂ ਹਨ, ਤਾਂ ਰੋਲਾਂ ਨੂੰ ਸੇਵਾ/ਟੀਮ ਮੁਤਾਬਕ ਸਕੋਪ ਕਰੋ (ਉਦਾਹਰਨ, “Payments Editors”) ਬਦਲੇ ਵਿੱਚ ਫੈਲੇ ਹੋਏ ਗਲੋਬਲ ਐਕਸੈਸ ਦੇਣ ਦੇ।

ਕੀ ਗੁਪਤ ਹੈ ਬਨਾਮ ਸਾਂਝਾ ਕੀਤੀ ਜਾ ਸਕਦੀ

ਆਦਤਾਂ ਪਹਿਲਾਂ ਤੋਂ ਕਲੈਸੀਫਾਈ ਕਰੋ ਤਾਂ ਕਿ ਲੋਕ ਆਦਤਾਂ ਬਣਾਉਣ ਤੋਂ ਪਹਿਲਾਂ ਤਹਿ ਫੈਸਲਾ ਕਰ ਸਕਣ:

ਅੰਦਰੂਨੀ-ਕੇਵਲ ਫੀਲਡ: ਗਾਹਕ PII, ਸੁਰੱਖਿਆ ਜਾਂਚ ਨੋਟਸ, ਰਾ ਲੌਗ, ਅੰਦਰੂਨੀ ਚੈਟ ਟਰਾਂਸਕ੍ਰਿਪਟ।\n- ਸਾਂਝਾ ਕਰਨਯੋਗ ਫੀਲਡ: ਉੱਚ-ਸਤ੍ਹਾ ਪ੍ਰਭਾਵ, ਸ਼ੁਰੂ/ਅੰਤ ਸਮੇ, ਮਿਟੀਗੇਸ਼ਨ, ਪਬਲਿਕ ਸਥਿਤੀ ਅਪਡੇਟ।

ਇੱਕ ਵਿਆਹਦਾਰ ਪੈਟਰਨ ਹੈ ਕਿ ਸੈਕਸ਼ਨਾਂ ਨੂੰ Internal ਜਾਂ Shareable ਮਾਰਕ ਕਰੋ ਅਤੇ ਨਿਰਯਾਤਾਂ ਅਤੇ ਸਥਿਤੀ ਪੰਨਿਆਂ ਵਿੱਚ ਇਸਨੂੰ ਲਾਗੂ ਕਰੋ। ਸੁਰੱਖਿਆ ਘਟਨਾਵਾਂ ਲਈ ਇੱਕ ਵੱਖਰਾ ਇਨਸੀਡੈਂਟ ਕਿਸਮ ਹੋ ਸਕਦੀ ਹੈ ਜਿਸ ਵਿੱਚ ਕਠੋਰ ਡਿਫ਼ਾਲਟ ਹੋਣ।

ਭਰੋਸੇਯੋਗ ਆਡੀਟ ਲੌਗ

ਇਨਸੀਡੈਂਟ ਅਤੇ ਪੋਸਟਮੋਰਟਮ ਵਿੱਚ ਹਰ ਸੋਧ ਲਈ ਦਰਜ ਕਰੋ: ਕਿਸਨੇ ਸੋਧ ਕੀਤੀ, ਕੀ ਸੋਧਿਆ, ਅਤੇ ਕਦੋਂ। ਸੇਵਾਵਾਂ, ਸਮੀਕਰਨ, ਪ੍ਰਭਾਵ ਅਤੇ "ਅੰਤਿਮ" ਮਨਜ਼ੂਰੀਆਂ ਦੀਆਂ ਸੋਧਾਂ ਸ਼ਾਮਲ ਕਰੋ। ਆਡੀਟ ਲੌਗ ਖੋਜਯੋਗ ਅਤੇ ਅੰਪੇਢ ਰੱਖੋ (non-editable)।

ਪ੍ਰਮਾਣੀਕਰਨ ਅਤੇ ਸੈਸ਼ਨ ਸੁਰੱਖਿਆ

ਬਾਕਸ ਤੋਂ ਬਾਹਰ ਮਜ਼ਬੂਤ ਪ੍ਰਮਾਣੀਕਰਨ ਸੱਪੋਰਟ ਕਰੋ: ਈਮੇਲ + MFA ਜਾਂ ਮੈਜਿਕ ਲਿੰਕ, ਅਤੇ ਜੇ ਉਮੀਦ ਹੋਵੇ ਤਾਂ SSO (SAML/OIDC) ਸ਼ਾਮਲ ਕਰੋ। ਛੋਟੇ-ਮਿਆਦੀ ਸੈਸ਼ਨ, ਸੁਰੱਖਿਅਤ ਕੁਕੀਜ਼, CSRF ਸੁਰੱਖਿਆ, ਅਤੇ ਰੋਲ ਬਦਲਣ ਤੇ ਸੈਸ਼ਨ ਰਿਵੋਕੇਸ਼ਨ ਵਰਗੀਆਂ ਚੀਜ਼ਾਂ ਵਰਤੋਂ। ਵਧੇਰੇ ਰੋਲਆਊਟ ਵਿਚਾਰਾਂ ਲਈ ਦੇਖੋ /blog/testing-rollout-continuous-improvement।

UX: ਡੈਸ਼ਬੋਰਡ, ਖੋਜ ਅਤੇ ਨੈਵੀਗੇਸ਼ਨ

ਜਦ ਇੱਕ ਇਨਸੀਡੈਂਟ ਚਾਲੂ ਹੈ, ਲੋਕ ਸਕੈਨ ਕਰਦੇ ਹਨ—ਪੂਰਾ ਪੜ੍ਹਦੇ ਨਹੀਂ। ਤੁਹਾਡੀ UX ਨੂੰ ਕੁਝ ਸਕਿੰਟਾਂ ਵਿੱਚ ਵਰਤਮਾਨ ਸਥਿਤੀ ਸਪਸ਼ਟ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ, ਜਦਕਿ ਰਿਸਪਾਂਡਰਾਂ ਨੂੰ ਵਿਸਥਾਰ ਵਿੱਚ ਡ੍ਰਿਲ ਕਰਨ ਦੀ ਆਸਾਨੀ ਹੋਵੇ।

ਪਹਿਲਾਂ ਡਿਜ਼ਾਈਨ ਕਰਨ ਲਈ ਮੁੱਖ ਸਕ੍ਰੀਨ

ਤਿੰਨ ਸਕ੍ਰੀਨਾਂ ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ ਜੋ ਵੱਧਤਰ ਵਰਕਫਲੋ ਕਵਰ ਕਰਦੀਆਂ ਹਨ:

Incident list (ਡੈਸ਼ਬੋਰਡ): ਇੱਕ ਟੇਬਲ ਜਾਂ ਕਾਰਡ ਲਿਸਟ ਜਿੱਥੇ ਸਥਿਤੀ ਬੈਜ, ਸਮੀਕਰਨ, ਟਾਈਟਲ, ਪ੍ਰਭਾਵਿਤ ਸੇਵਾ(ਵਾਂ), ਮਾਲਕ/incident commander, ਆਖਰੀ ਅਪਡੇਟ ਸਮਾਂ, ਅਤੇ ਦੌਰਾਨੀਸ਼ੀ ਦਿਖਾਈ ਦੇਵੇ।\n- Incident detail: ਇੱਕ ਇਨਸੀਡੈਂਟ ਬਾਰੇ ਸਾਰੇ ਕੁਝ—ਸੰਖੇਪ, ਵਰਤਮਾਨ ਸਥਿਤੀ, ਮੁੱਖ ਲਿੰਕਸ, ਭਾਗੀਦਾਰ, ਅਤੇ ਕਾਰਵਾਈ ਪੈਨਲ।\n- Timeline view: ਅਪਡੇਟ ਅਤੇ ਇਵੈਂਟਸ ਦੀ ਕ੍ਰਮਵਾਰ ਫੀਡ (ਅਲਾਰਟਸ, ਮੈਨੂਅਲ ਨੋਟਸ, ਸਥਿਤੀ ਬਦਲਾਅ) ਜਿਸ ਵਿੱਚ ਵੱਡੇ, ਪੜ੍ਹਨਯੋਗ ਟਾਈਮਸਟੈਂਪ ਹੋਣ।

ਇੱਕ ਸਰਲ ਨਿਯਮ: ਇਨਸੀਡੈਂਟ ਡੀਟੇਲ ਪੇਜ਼ 'ਤੇ ਸਿਖਰ 'ਤੇ ਇਹ ਸੰਬੋਧਨ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ "ਹੁਣ ਕੀ ਹੋ ਰਿਹਾ ਹੈ?" ਅਤੇ ਹੇਠਾਂ "ਅਸੀਂ ਇੱਥੇ ਕਿਵੇਂ ਪਹੁੰਚੇ?"।

ਫਿਲਟਰਿੰਗ ਅਤੇ ਖੋਜ ਜੋ ਰਿਸਪਾਂਡਰ ਅਸਲ ਵਿੱਚ ਵਰਤੇ

ਇਨਸੀਡੈਂਟ ਤੇਜ਼ੀ ਨਾਲ ਇਕੱਤਰ ਹੋ ਜਾਂਦੇ ਹਨ, ਇਸ ਲਈ ਖੋਜ ਤੇਜ਼ ਅਤੇ ਦਰਦ-ਰਹਿਤ ਬਣਾਓ:

ਤੁਰੰਤ ਫਿਲਟਰ: service, severity, status (open/mitigating/resolved/postmortem due), tag, date range, ਅਤੇ owner\n- ਖੋਜ ਥੀਮਾਂ: ਟਾਈਟਲ, ਇਨਸੀਡੈਂਟ ID, ਪ੍ਰਭਾਵਿਤ ਕੰਪੋਨੈਂਟ, ਅਤੇ ਟੈਗ

My open incidents ਜਾਂ Sev-1 this week ਵਰਗੀਆਂ ਸੇਵ ਕੀਤੀਆਂ ਵਿਊਜ਼ ਦਿਓ ਤਾਂ ਕਿ on-call engineers ਹਰ ਸ਼ਿਫਟ ਦੌਰਾਨ ਫਿਲਟਰ ਮੁੜ ਬਣਾਉਣ ਤੋਂ ਬਚ ਸਕਣ।

ਸਥਿਤੀ ਬੈਜ ਅਤੇ "ਵਰਤਮਾਨ ਸਥਿਤੀ" ਦੀ ਸੰਗਤਤਾ

ਐਪ ਵਿੱਚ ਇਕੋ ਹੀ, ਰੰਗ-ਸੁਰੱਖਿਅਤ ਬੈਜ ਵਰਤੋਂ (ਤੇਨਸ਼ਨ ਵਾਲੇ ਛੋਟੇ ਰੰਗਾਂ ਤੋਂ ਬਚੋ). ਸਾਰੇ ਸਥਾਨਾਂ 'ਤੇ ਇਕੋ ਹੀ ਸਥਿਤੀ ਸ਼ਬਦਾਵਲੀ ਰੱਖੋ: ਲਿਸਟ, ਡੀਟੇਲ ਹੈਡਰ, ਅਤੇ ਟਾਈਮਲਾਈਨ ਇਵੈਂਟਸ।

ਇੱਕ ਨਜ਼ਰ ਵਿੱਚ, ਰਿਸਪਾਂਡਰਾਂ ਨੂੰ ਦਿਖਾਈ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ:

ਵਰਤਮਾਨ ਸਥਿਤੀ + severity\n- ਆਖਰੀ ਅਪਡੇਟ ਸਮਾਂ (ਅਤੇ ਜਿਸਨੇ ਪੋਸਟ ਕੀਤਾ)\n- ਅਗਲਾ ਚੈਕਪੌਇੰਟ (ਉਦਾਹਰਨ, "ਅਗਲਾ ਅਪਡੇਟ 8 ਮਿੰਟ ਵਿੱਚ") ਜੇ ਤੁਸੀਂ ਅਪਡੇਟ ਕੈਡੈਂਸ ਸਹਾਇਤ ਕਰਦੇ ਹੋ

ਤਣਾਅ ਹੇਠਾਂ ਪੜ੍ਹਨਯੋਗਤਾ

ਸਕੈਨੇਬਲਿਟੀ ਨੂੰ ਤਰਜੀਹ ਦਿਓ:\n\n- ਵੱਡੇ ਟਾਈਮਸਟੈਂਪ ਅਤੇ ਸਪਸ਼ਟ ਸੈਕਸ਼ਨ ਹੈਡਰ\n- ਸਕ੍ਰੋਲ ਕਰਨ ਸਮੇਂ ਚਿਪਕਣ ਵਾਲਾ ਇਨਸੀਡੈਂਟ ਹੈਡਰ\n- ਸ਼ੋਰ ਵਾਲੇ ਡਾਟਾ (ਰਾਅ ਅਲਾਰਟਸ, ਲੰਬੇ ਲੌਗ) ਲਈ ਕੋਲੈਪਸਿਬਲ ਸੈਕਸ਼ਨ\n- ਕੀਬੋਰਡ-ਮਿੱਤਰ ਨੈਵੀਗੇਸ਼ਨ (/, n/p ਅਗਲਾ/ਪਿਛਲਾ ਇਨਸੀਡੈਂਟ)

ਸਭ ਤੋਂ ਖਰਾਬ ਪਲ ਲਈ ਡਿਜ਼ਾਈਨ ਕਰੋ: ਜੇ ਕੋਈ ਨੀਂਦ-ਰਹਿਤ ਹੈ ਅਤੇ ਆਪਣੇ ਫੋਨ ਤੋਂ ਪੇਜਿੰਗ ਕਰ ਰਿਹਾ ਹੈ, UI ਫਿਰ ਵੀ ਉਨ੍ਹਾਂ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਸਹੀ ਕਾਰਵਾਈ ਵੱਲ ਰਹਿਨੁਮਾਈ ਕਰੇ।

ਇੰਟੀਗ੍ਰੇਸ਼ਨ: ਅਲਰਟਸ, ਚੈਟ, ਟਿਕਟਿੰਗ, ਅਤੇ ਸਟੇਟਸ ਅਪਡੇਟ

ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਉਸ ਚੀਜ਼ ਨੂੰ ਬਣਾ ਦਿੰਦੇ ਹਨ ਜੋ ਇਨਸੀਡੈਂਟ ਟ੍ਰੈਕਰ ਨੂੰ "ਨੋਟਸ ਰੱਖਣ ਦੀ ਥਾਂ" ਤੋਂ ਉਹ ਸਿਸਟਮ ਬਣਾਉਂਦੇ ਹਨ ਜਿਸ 'ਤੇ ਤੁਹਾਡੀ ਟੀਮ ਅਸਲ ਵਿੱਚ ਇਨਸੀਡੈਂਟ ਚਲਾਉਂਦੀ ਹੈ। ਪਹਿਲਾਂ ਉਹ ਸਿਸਟਮਾਂ ਦੀ ਸੂਚੀ ਬਣਾਓ ਜਿਨ੍ਹਾਂ ਨਾਲ ਤੁਸੀਂ ਜੁੜਨਾ ਲਾਜ਼ਮੀ ਸਮਝਦੇ ਹੋ: monitoring/observability (PagerDuty/Opsgenie, Datadog, CloudWatch), chat (Slack/Teams), email, ticketing (Jira/ServiceNow), ਅਤੇ ਇੱਕ status page।

ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਸ਼ੈਲੀ ਚੁਣੋ

ਜਿਆਦਾਤਰ ਟੀਮਾਂ ਇਕ ਮਿਕਸ ਨਾਲ ਖਤਮ ਹੁੰਦੀਆਂ ਹਨ:

Inbound webhooks alerts ਅਤੇ chat commands ਲਈ (ਤੇਜ਼, ਕਰੀਬ-ਹਕੀਕਤ, ਘੱਟ ਆਪਰੇਸ਼ਨਲ ਲਾਗਤ)\n- Polling ਜਦ ਇੱਕ ਟੂਲ push ਨਹੀਂ ਕਰ ਸਕਦਾ, ਪਰ ਅੰਤਰਾਲ ਸਾਵਧਾਨੀ ਨਾਲ ਰੱਖੋ ਅਤੇ ਨਤੀਜਿਆਂ ਨੂੰ ਕੈਸ਼ ਕਰੋ।\n- Manual linking ਇੱਕ fallback ਵਜੋਂ (alert URL ਪੇਸਟ ਕਰੋ, ticket key ਅਟੈਚ ਕਰੋ), ਜੋ APIs ਡਾਊਨ ਹੋਣ 'ਤੇ ਵੀ ਤੁਹਾਨੂੰ ਰੋਕਦਾ ਹੈ।

ਡੁਪਲਿਕੇਟ ਇਨਸੀਡੈਂਟ ਤੋਂ ਬਚਾਓ (idempotency)

ਅਲਰਟ ਅਸ਼ਾਂਤ ਹੁੰਦੇ, ਰੀਟ੍ਰਾਈ ਹੁੰਦੇ ਅਤੇ ਅਕਸਰ ਕ੍ਰਮ ਬਦਲ ਜਾਂਦਾ ਹੈ। ਹਰ ਪ੍ਰੋਵਾਇਡਰ ਇਵੈਂਟ ਲਈ ਇੱਕ ਸਥਿਰ idempotency key ਪਰਿਭਾਸ਼ਿਤ ਕਰੋ (ਉਦਾਹਰਨ: provider + alert_id + occurrence_id), ਅਤੇ ਇਸਨੂੰ ਇੱਕ ਯੂਨੀਕ ਸੰਕਲਪ ਨਾਲ ਸਟੋਰ ਕਰੋ। ਡੈਡਪਲੀਕੇਸ਼ਨ ਲਈ ਨੀਤੀਆਂ ਫੈਸਲਾ ਕਰੋ ਜਿਵੇਂ "ਉਹੀ ਸੇਵਾ + ਉਹੀ ਸਿਗਨੇਚਰ 15 ਮਿੰਟ ਵਿੱਚ" ਮੌਜੂਦਾ ਇਨਸੀਡੈਂਟ ਵਿੱਚ ਜੋੜਿਆ ਜਾਵੇ ਨਾ ਕਿ ਨਵਾਂ ਬਣਾਇਆ ਜਾਵੇ।

ਸੀਮਾਵਾਂ ਅਤੇ ਫੇਲਿਅਰ ਮੋਡ ਅਤੇ ਕਿਸ ਦਾ ਕੰਮ ਹੈ

ਸਪਸ਼ਟ ਕਰੋ ਕਿ ਤੁਹਾਡਾ ਐਪ ਕੀ ਜ਼ਿੰਮੇਵਾਰੀ ਲੈਂਦਾ ਹੈ ਅਤੇ ਕੀ ਸੋਰਸ ਟੂਲ ਵਿੱਚ ਰਹਿੰਦਾ ਹੈ:\n\n- ਤੁਹਾਡਾ ਐਪ ਇਨਸੀਡੈਂਟ ਰਿਕਾਰਡ, ਟਾਈਮਲਾਈਨ, ਭੂਮਿਕਾਵਾਂ, ਅਤੇ ਪੋਸਟਮੋਰਟਮ ਦਾ ਮਾਲਕ ਹੋ ਸਕਦਾ ਹੈ।\n- ਟਿਕਟ ਸਿਸਟਮ ਕੰਮ ਦੀ ਕਾਰਵਾਈ ਅਤੇ ਮਨਜ਼ੂਰੀਆਂ ਦਾ ਮਾਲਕ ਹੋ ਸਕਦਾ ਹੈ।

ਜਦ ਇੱਕ ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਫੇਲ ਹੋਵੇ, gracefully degrade ਕਰੋ: retries ਕਿਊ ਕਰੋ, ਇਨਸੀਡੈਂਟ 'ਤੇ ਇੱਕ ਚੇਤਾਵਨੀ ਦਿਖਾਓ ("Slack posting delayed"), ਅਤੇ ਸਦਾਂ ਆਪਰੇਟਰਾਂ ਨੂੰ ਮੈਨੁਅਲ ਜਾਰੀ ਰੱਖਣ ਦੀ ਆਗਿਆ ਦਿਓ।

ਬਿਨਾ ਵਾਧੂ ਕੰਮ ਦੇ ਸਥਿਤੀ ਅਪਡੇਟ

ਸਤਿਤੀ ਅਪਡੇਟ ਨੂੰ ਇੱਕ ਪਹਿਲ-ਸ਼੍ਰੇਣੀ ਆਉਟਪુਟ ਸਮਝੋ: UI ਵਿੱਚ ਇੱਕ ਸੰਰਚਿਤ "Update" ਕਾਰਵਾਈ ਚੈਟ ਨੂੰ ਪਬਲਿਸ਼ ਕਰ ਸਕਦੀ ਹੈ, ਇਨਸੀਡੈਂਟ ਟਾਈਮਲਾਈਨ ਵਿੱਚ ਜੋੜ ਸਕਦੀ ਹੈ, ਅਤੇ ਵਿਕਲਪਿਕ ਤੌਰ 'ਤੇ ਸਟੇਟਸ ਪੇਜ਼ ਨਾਲ ਸਮੱਕ ਕਰ ਸਕਦੀ ਹੈ—ਬਿਨਾਂ ਰਿਸਪਾਂਡਰ ਨੂੰ ਵਾਰ-ਵਾਰ ਉਹੀ ਸੁਨੇਹਾ ਲਿਖਣ ਲਈ ਮਾਂਗਣ ਦੇ।

ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਟੈਕ ਸਟੈਕ ਚੋਣ

ਪੂਰਾ ਸੋর্স ਕੰਟਰੋਲ ਰੱਖੋ

ਕੋਡਬੇਸ ਦੇ ਮਾਲਕ ਬਣੋ ਤਾਂ ਜੋ ਤੁਹਾਡੀ ਟੀਮ ਹਰ ਚੀਜ਼ ਨੂੰ ਕੜੀ ਕਰ ਸਕੇ, ਵਧਾ ਸਕੇ ਅਤੇ ਸਮੀਖਿਆ ਕਰ ਸਕੇ।

ਕੋਡ ਐਨਕਸਪੋਰਟ ਕਰੋ

ਤੁਹਾਡਾ ਇਨਸੀਡੈਂਟ ਟੂਲ "ਆਊਟੇਜ ਦੌਰਾਨ" ਸਿਸਟਮ ਹੈ, ਇਸ ਲਈ ਸਾਦਗੀ ਅਤੇ ਭਰੋਸਾ ਤਰਜੀਹ ਦਿਓ। ਸਭ ਤੋਂ ਵਧੀਆ ਸਟੈਕ ਅਕਸਰ ਉਹ ਹੈ ਜੋ ਤੁਹਾਡੀ ਟੀਮ ਦੇ ਲੋਕ ਸ਼ਾਮਿਲ ਕਰਕੇ ਚਲਾ ਸਕਦੇ ਹਨ ਅਤੇ 2 ਵਜੇ ਸਵੇਰੇ ਭਰੋਸੇ ਨਾਲ ਡੀਬੱਗ ਕਰ ਸਕਦੇ ਹਨ।

ਉਹ ਸਟੈਕ ਚੁਣੋ ਜੋ ਤੁਹਾਡੀ ਟੀਮ ਸੰਭਾਲ ਸਕੇ

ਉਸ ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ ਜੋ ਤੁਹਾਡੇ ਇੰਜੀਨੀਅਰ ਪਹਿਲਾਂ ਹੀ ਪ੍ਰੋਡਕਸ਼ਨ ਵਿੱਚ ਡੈਪਲੌਇ ਕਰਦੇ ਹਨ। ਇੱਕ ਮেইਨਸਟਰੀਮ ਵੈੱਬ ਫਰੇਮਵਰਕ (Rails, Django, Laravel, Spring, Express/Nest, ASP.NET) ਆਮ ਤੌਰ 'ਤੇ ਇੱਕ ਨਵੇਂ ਫਰੇਮਵਰਕ ਨਾਲੋਂ ਜੋ ਸਿਰਫ਼ ਇਕ ਵਿਅਕਤੀ ਸਮਝਦਾ ਹੋਵੇ, ਜ਼ਿਆਦਾ ਸੁਰੱਖਿਅਤ ਚੋਣ ਹੁੰਦਾ ਹੈ।

ਡਾਟਾ ਸਟੋਰੇਜ ਲਈ, ਰਿਸ਼ਤੇਦਾਰ ਡੈਟਾਬੇਸ (PostgreSQL/MySQL) ਇਨਸੀਡੈਂਟ ਰਿਕਾਰڈਾਂ ਲਈ ਚੰਗੇ ਮਿਲਦੇ ਹਨ: incidents, updates, participants, action items, ਅਤੇ postmortems ਸਭ ਲੈਣ-ਦੈਨ ਅਤੇ ਸਾਫ਼ ਸੰਬੰਧਾਂ ਤੋਂ ਫਾਇਦਾ ਲੈਂਦੇ ਹਨ। Redis ਸਿਰਫ਼ ਤਦ ਜੋੜੋ ਜਦੋਂ ਤੁਹਾਨੂੰ caching, queues, ਜਾਂ ephemeral locks ਦੀ ਅਸਲ ਲੋੜ ਹੋਵੇ।

ਹੋਸਟਿੰਗ ਇੱਕ ਮੈਨੇਜਡ ਪਲੇਟਫਾਰਮ (Render/Fly/Heroku-like) ਜਾਂ ਤੁਹਾਡੇ ਮੌਜੂਦਾ ਕਲਾਉਡ (AWS/GCP/Azure) 'ਤੇ ਵੀ ਸਾਦੀ ਹੋ ਸਕਦੀ ਹੈ। ਸੰਭਵ ਹੋਵੇ ਤਾਂ ਮੈਨੇਜਡ ਡੇਟਾਬੇਸ ਅਤੇ ਮੈਨੇਜਡ ਬੈਕਅਪ ਲੋ।

ਰੀਅਲ-ਟਾਈਮ: websockets ਵਿਰੁੱਧ ਪੀਰੀਓਡਿਕ ਰਿਫ੍ਰੇਸ਼

ਸਰਗਰਮ ਇਨਸੀਡੈਂਟਸ ਰੀਅਲ-ਟਾਈਮ ਅਪਡੇਟਸ ਨਾਲ ਵਧੀਆ ਮਹਿਸੂਸ ਹੁੰਦੇ ਹਨ, ਪਰ ਦਿਨ ਇੱਕ 'ਤੇ ਹਮੇਸ਼ਾਂ ਤੁਹਾਨੂੰ websockets ਦੀ ਲੋੜ ਨਹੀਂ।

ਪੀਰੀਓਡਿਕ ਰਿਫ੍ਰੇਸ਼ (polling) ਲਾਗੂ ਕਰਨ ਅਤੇ ਸੰਚਾਲਿਤ ਕਰਨ ਵਿੱਚ ਆਸਾਨ ਹੈ। ਬਹੁਤ ਸਾਰੀਆਂ ਟੀਮਾਂ ਲਈ, ਟਾਈਮਲਾਈਨ ਹਰ 10–30 ਸਕਿੰਟ 'ਤੇ ਅਪਡੇਟ ਕਰਨਾ "ਕਾਫ਼ੀ ਚੰਗਾ" ਹੈ।\n- Websockets/SSE ਜਦੋਂ ਤੁਸੀਂ ਬਹੁਤ ਸਾਰੇ concurrent viewers, ਤੇਜ਼-ਚਲਦੇ ਅਪਡੇਟਾਂ, ਜਾਂ ਚੈਟ-ਵਾਂਗ ਸਮੇਤ ਸਹਿਯੋਗ ਚਾਹੁੰਦੇ ਹੋ ਤਾਂ ਮੱਲ ਵਿਕਲਪ ਕੀਤਾ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ।

ਇੱਕ ਪ੍ਰਯੋਗਾਤਮਕ ਵਿਚਾਰ: API/events ਇੰਝ ਡਿਜ਼ਾਈਨ ਕਰੋ ਕਿ ਤੁਸੀਂ polling ਤੋਂ ਸ਼ੁਰੂ ਕਰ ਸਕੋ ਅਤੇ ਬਾਅਦ ਵਿੱਚ websockets 'ਤੇ ਅਪਡੇਟ ਕਰਨ ਬਿਨਾਂ UI ਨੂੰ ਮੁੜ-ਲਿਖੇ।

ਆਪਣੇ ਆਪ ਲਈ Observatory (ਆਪਣੇ ਇਨਸੀਡੈਂਟ ਟੂਲ ਦੀ ਦੇਖਭਾਲ)

ਜੇ ਇਹ ਐਪ ਇੱਕ ਇਨਸੀਡੈਂਟ ਦੌਰਾਨ ਫੇਲ ਹੋ ਜਾਵੇ, ਤਾਂ ਇਹ ਖੁਦ ਇੱਕ ਇਨਸੀਡੈਂਟ ਬਣ ਜਾਂਦਾ ਹੈ। ਇਸ ਲਈ ਸ਼ਾਮਲ ਕਰੋ:

ਸੰਗਠਿਤ ਲੌਗ (ਕਿਸਨੇ ਕੀ ਬਦਲਿਆ, ਅਤੇ ਬੇਨਤੀ ਸੰਦਰਭ)\n- ਮੈਟਰਿਕਸ (ਲੇਟੈਂਸੀ, ਐਰਰ ਦਰ, ਕਿਊ ਦੀ ਡੈਪਥ, websocket ਕਨੈਕਸ਼ਨ)\n- ਐਰਰ ਟ੍ਰੈਕਿੰਗ (ਅਣਕੈਚਡ ਐਕਸੈਪਸ਼ਨ, ਫਰੰਟਐਂਡ crash ਰਿਪੋਰਟਿੰਗ)

ਬੈਕਅਪ, ਮਾਈਗ੍ਰੇਸ਼ਨ ਅਤੇ ਆਪਣੀ ਆਪਤਕਾਲੀ ਯੋਜਨਾ

ਇਸਨੂੰ ਇੱਕ ਪ੍ਰੋਡਕਸ਼ਨ ਸਿਸਟਮ ਵਾਂਗ ਇਲਾਜ ਕਰੋ:\n\n- ਆਟੋਮੈਟਿਕ ਦੈਨਿਕ ਬੈਕਅਪ (ਅਤੇ ਨਿਯਮਤ ਰੀਸਟੋਰ ਟੈਸਟ)\n- ਸੁਰੱਖਿਅਤ ਸਕੀਮਾ ਮਾਈਗ੍ਰੇਸ਼ਨ (expand/contract ਪੈਟਰਨ, migration CI ਚੈੱਕ)\n- ਇੱਕ ਘੱਟੋ-ਘੱਟ DR ਯੋਜਨਾ: ਨਵੀਂ ਰੀਜਨ/ਅਕਾਊਂਟ ਵਿੱਚ ਕਿਵੇਂ ਲੈ ਕੇ ਆਉਣਾ ਹੈ, ਅਤੇ ਪ੍ਰਾਇਮਰੀ ਪਰਿਵੇਸ਼ ਡਾਊਨ ਹੋਣ 'ਤੇ ਡਾਟਾ ਤੱਕ ਕਿਵੇਂ ਪਹੁੰਚ ਕਰਨੀ ਹੈ

ਤੇਜ਼ੀ ਨਾਲ ਪ੍ਰੋਟੋਟਾਈਪ ਬਣਾਉਣ ਦਾ ਤਰੀਕਾ (ਗਲਤ ਡਿਜ਼ਾਈਨ 'ਤੇ ਕਮਿਟ ਕਰਨ ਤੋਂ ਬਿਨਾਂ)

ਜੇ ਤੁਸੀਂ ਵਰਕਫਲੋ ਅਤੇ ਸਕ੍ਰੀਨਸ ਨੂੰ ਵੈਧ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ ਬਿਨਾਂ ਪੂਰੀ ਬਿਲਡ ਵਿੱਚ ਨਿਵੇਸ਼ ਕੀਤੇ, ਤਾਂ ਇੱਕ vibe-coding ਤਰੀਕਾ ਚੰਗਾ ਰਹਿ ਸਕਦਾ ਹੈ: ਇੱਕ ਵਿਸਥਾਰਪੂਰਕ ਚੈਟ ਵਰਣਨ ਤੋਂ Koder.ai ਵਰਗੇ ਟੂਲ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇੱਕ ਕਾਰਜਕਾਰੀ ਪ੍ਰੋਟੋਟਾਈਪ ਤਿਆਰ ਕਰੋ, ਫਿਰ tabletop exercises ਦੌਰਾਨ ਰਿਸਪਾਂਡਰਾਂ ਨਾਲ ਇਸ਼ਤਿਹਾਰ ਕਰੋ। ਕਿਉਂਕਿ Koder.ai ਅਸਲ React frontends ਨਾਲ Go + PostgreSQL ਬੈਕਐਂਡ ਤਿਆਰ ਕਰ ਸਕਦਾ ਹੈ (ਅਤੇ ਸਰੋਤ ਕੋਡ ਐਕਸਪੋਰਟ ਸਪੋਰਟ ਕਰਦਾ ਹੈ), ਤੁਸੀਂ ਸ਼ੁਰੂਆਤੀ ਵਰਜਨ ਨੂੰ "ਛੱਡਣਯੋਗ ਪ੍ਰੋਟੋਟਾਈਪ" ਜਾਂ ਉਸਨੂੰ ਹਾਰਡਨ ਕਰਨ ਲਈ ਸ਼ੁਰੂਆਤ ਵਜੋਂ ਵਰਤ ਸਕਦੇ ਹੋ—ਬਿਨਾਂ ਉਹ ਸਿੱਖਿਆ ਖੋ ਦੇ।

ਟੈਸਟਿੰਗ, ਰੋਲਆਊਟ, ਅਤੇ ਲਗਾਤਾਰ ਸੁਧਾਰ

ਇਨਸੀਡੈਂਟ ਟ੍ਰੈਕਿੰਗ ਐਪ ਨੂੰ ਬਿਨਾਂ ਰਿਹਰਸਲ ਦੇ ਸ਼ਿਪ ਕਰਨਾ ਇੱਕ ਜੋਖਮ ਹੈ। ਸਭ ਤੋਂ ਵਧੀਆ ਟੀਮਾਂ ਇਸ ਟੂਲ ਨੂੰ ਕਿਸੇ ਹੋਰ ਓਪਰੇਸ਼ਨਲ ਸਿਸਟਮ ਵਾਂਗ ਟੈਸਟ ਕਰਦੀਆਂ ਹਨ: ਮੁੱਖ ਰਸਤੇ ਟੈਸਟ ਕਰੋ, ਹਕੀਕਤੀ ਡਰਿੱਲ ਚਲਾਓ, ਅਹਿਸਾਸੀ ਰੂਪ ਵਿੱਚ ਹੌਲੀ ਰੋਲਆਊਟ ਕਰੋ, ਅਤੇ ਅਸਲ ਵਰਤੋਂ ਦੇ ਆਧਾਰ 'ਤੇ ਟਿਊਨ ਕਰਦੇ ਰਹੋ।

ਮੁੱਖ ਰਸਤੇ end-to-end ਟੈਸਟ ਕਰੋ

ਉਹ ਫਲੋਜ਼ ਪਹਿਲਾਂ ਟੈਸਟ ਕਰੋ ਜੋ ਲੋਕ ਤਣਾਅ ਹੇਠਾਂ ਭਰੋਸਾ ਕਰਦੇ ਹਨ:\n\n- ਇਨਸੀਡੈਂਟ ਬਣਾਓ, ਸਮੀਕਰਨ ਨਿਰਧਾਰਤ ਕਰੋ, ਅਤੇ ਰਿਸਪਾਂਡਰਾਂ ਨੂੰ ਨੋਟੀਫਾਈ ਕਰੋ\n- ਅਪਡੇਟ ਪੋਸਟ ਕਰੋ (ਸਥਿਤੀ ਬਦਲਾਅ ਸਮੇਤ), ਇਨਸੀਡੈਂਟ ਟਾਈਮਲਾਈਨ ਵਿੱਚ ਆਰਡਰਿੰਗ ਦੀ ਪੁਸ਼ਟੀ ਕਰੋ, ਅਤੇ ਸੋਧਾਂ ਨੂੰ ਸਪਸ਼ਟ ਚਿੰਨ੍ਹਿਤ ਕਰੋ\n- ਇਨਸੀਡੈਂਟ ਹੱਲ ਕਰੋ ਅਤੇ ਬੰਦ ਕਰੋ, ਫਿਰ ਆਖਰੀ ਸਥਿਤੀ ਤੋਂ ਇੱਕ پੋਸਟਮੋਰਟਮ ਤਿਆਰ ਕਰੋ\n- ਲਿੰਕਸ ਅਤੇ ਹਵਾਲੇ (ਸੇਵਾਵਾਂ, ਮਾਲਕ, ਟਿਕਟ, ਚੈਟ ਧਾਗੇ) ਸਾਰੇ ਸਮੇਂ ਦੌਰਾਨ ਅਖੰਡ ਰਹਿੰਦੇ ਹਨ ਇਹ ਯਕੀਨੀ ਕਰੋ

Regressions ਲਈ ਟੈਸਟ ਸ਼ਾਮਲ ਕਰੋ ਜੋ ਨਹੀ ਟੁੱਟਣੇ ਚਾਹੀਦੇ: ਟਾਈਮਸਟੈਂਪ, ਸਮੇਂ-ਜ਼ੋਨ, ਅਤੇ ਇਵੈਂਟ ਆਰਡਰਿੰਗ। ਇਨਸੀਡੈਂਟ ਨੈਰਾਟਿਵ ਹੁੰਦੇ—ਜੇ ਟਾਈਮਲਾਈਨ ਗਲਤ ਹੋਵੇ, ਰੁਝਾਨ ਖਤਮ ਹੋ ਜਾਂਦਾ ਹੈ।

ਪਰਮੀਸ਼ਨ ਅਤੇ ਆਡੀਟੇਬਿਲਟੀ ਦੀ ਪੁਸ਼ਟੀ ਕਰੋ

ਪਰਮੀਸ਼ਨ ਬੱਗ ਆਪਰੇਸ਼ਨਲ ਅਤੇ ਸੁਰੱਖਿਆ ਜੋਖਮ ਹਨ। ਟੈਸਟ ਲਿਖੋ ਜੋ ਸਾਬਿਤ ਕਰਦੇ ਹੋਣ:

ਸਿਰਫ਼ ਅਧਿਕਾਰਤ ਰੋਲ ਸਮੀਕਰਨ ਬਦਲ ਸਕਦੇ ਹਨ, ਮੁੱਖ ਖੇਤਰ ਸੋਧ ਸਕਦੇ ਹਨ, ਜਾਂ ਇਨਸੀਡੈਂਟ ਬੰਦ ਕਰ ਸਕਦੇ ਹਨ\n- View-only ਯੂਜ਼ਰ ਰਿਸਟ੍ਰਿਕਟਿਡ ਇਨਸੀਡੈਂਟ ਨਹੀਂ ਵੇਖ ਸਕਦੇ\n- ਹਰ ਸੰਵੇਦਨਸ਼ੀਲ ਕਾਰਵਾਈ ਇੱਕ ਆਡੀਟ ਟਰੇਲ ਛੱਡਦੀ ਹੈ (ਕਿਸਨੇ, ਕੀ, ਕਦੋਂ), ਅਤੇ ਆਡੀਟ ਲੌਗ ਸੋਧਯੋਗ ਨਹੀਂ

ਇਨ੍ਹਾਂ "near misses" ਨੂੰ ਵੀ ਟੈਸਟ ਕਰੋ, ਜਿਵੇਂ ਕਿ ਯੂਜ਼ਰ ਮਿਡ-ਇਨਸੀਡੈਂਟ ਪਹੁੰਚ ਗੁਆ ਚੁੱਕੇ, ਜਾਂ ਟੀਮ ਰੀ-ਆਰਗ ਰੂਪ ਵਿੱਚ ਗਰੁੱਪ ਮੈਂਬਰਸ਼ਿਪ ਬਦਲ ਗਈ।

ਅਸਲੀ ਰਿਸਪਾਂਡਰਾਂ ਨਾਲ tabletop exercises ਚਲਾਓ

ਵਿਆਪਕ ਰੋਲਆਊਟ ਤੋਂ ਪਹਿਲਾਂ, tabletop ਸਿਮੂਲੇਸ਼ਨਾਂ ਚਲਾਓ ਜਿੱਥੇ ਤੁਹਾਡਾ ਐਪ ਸੱਚੇ ਤੌਰ 'ਤੇ ਸਤਿਆਪਿਤ ਕੰਮ ਕਰਨ ਵਾਲਾ ਸੋਰਸ ਬਣੇ। ਉਹ ਸਿਨੇਰਿਓ ਚੁਣੋ ਜੋ ਤੁਹਾਡੀ ਸੰਸਥਾ ਪਛਾਣਦੀ ਹੈ (ਉਦਾਹਰਨ, ਅੰਸ਼ਿਕ ਆਊਟੇਜ, ਡੇਟਾ ਡਿਲੇ, ਤੀਜੀ-ਪੱਖੀ ਫੇਲ). friction ਦੇ ਲਈ ਦੇਖੋ: ਗੁੰਝਲਦਾਰ ਫੀਲਡ, ਗੁੰਮ ਸੰਦਰਭ, ਬਹੁਤ ਜ਼ਿਆਦਾ ਕਲਿੱਕ, ਅਸਪਸ਼ਟ ਮਾਲਕੀ।

ਤੁਰੰਤ ਫੀਡਬੈਕ ਕੈਪਚਰ ਕਰੋ ਅਤੇ ਇਸਨੂੰ ਛੋਟੀ, ਤੇਜ਼ ਸੁਧਾਰਾਂ ਵਿੱਚ ਬਦਲੋ।

ਪਾਇਲਟ ਨਾਲ ਰੋਲਆਊਟ ਅਤੇ ਫੀਡਬੈਕ ਲੂਪ

ਇੱਕ ਪਾਇਲਟ ਟੀਮ ਅਤੇ ਕੁਝ ਪ੍ਰੀ-ਬਿਲਟ ਟੈਂਪਲੇਟ (ਇਨਸੀਡੈਂਟ ਕਿਸਮਾਂ, ਚੈੱਕਲਿਸਟ, ਪੋਸਟਮੋਰਟਮ ਫਾਰਮੈਟ) ਦੇ ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ। ਛੋਟੀ ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਇੱਕ ਪੰਨਾ "ਕਿਵੇਂ ਅਸੀਂ ਇਨਸੀਡੈਂਟ ਚਲਾਉਂਦੇ ਹਾਂ" ਦੀ ਗਾਈਡ ਐਪ ਵਿੱਚ ਲਿੰਕ ਕਰਕੇ ਦੇਵੋ (dekhо /docs/incident-process).\n ਅਪਣਾਉ ਮੈਟਰਿਕ ਟਰੈਕ ਕਰੋ ਅਤੇ friction ਪਟਰਨਾਂ 'ਤੇ iteration ਕਰੋ: time-to-create, % incidents with updates, postmortem completion rate, ਅਤੇ action-item closure time। ਇਨ੍ਹਾਂ ਨੂੰ product metrics ਵਜੋਂ ਸਲੂਕੀ ਕਰੋ—ਅਤੇ ਹਰ ਰਿਲੀਜ਼ ਵਿੱਚ ਸੁਧਾਰ ਕਰਦੇ ਰਹੋ।

ਅਕਸਰ ਪੁੱਛੇ ਜਾਣ ਵਾਲੇ ਸਵਾਲ

How do we define an “incident” so the app doesn’t become unusable or inconsistent?

ਆਪਣੇ ਆਰਗਨਾਈਜ਼ੇਸ਼ਨ ਲਈ ਇੱਕ ठोस ਪਰਿਭਾਸ਼ਾ ਲਿਖੋ:

ਕੀ ਯੋਗ ਹੈ (ਗਾਹਕ ਪ੍ਰਭਾਵ, ਸੁਰੱਖਿਆ, SLA/SLO ਬ੍ਰੀਚ, ਅੰਦਰੂਨੀ-ਕੇਵਲ)
ਇਹ ਕਦੋਂ ਸ਼ੁਰੂ/ਖਤਮ ਹੁੰਦਾ ਹੈ (ਪਹਿਲੀ ਅਲਾਰਮ ਬਨਾਮ ਸਵੀਕਾਰੋ; ਠੀਕ ਹੋਣਾ ਬਨਾਮ ਮਾਨੀਟਰੇਡ)
ਕਿਹੜੇ ਫੀਲਡ ਲਾਜ਼ਮੀ ਹਨ (ਸੇਵਾ, ਸਮੀਕਰਨ, ਮਾਲਕ, ਟਾਈਮਸਟੈਂਪ, ਸਥਿਤੀ)

ਉਹ ਪਰਿਭਾਸ਼ਾ ਸਿੱਧਾ ਤੁਹਾਡੇ ਵਰਕਫਲੋ ਸਟੇਟਸ ਅਤੇ ਲਾਜ਼ਮੀ ਫੀਲਡਾਂ ਨਾਲ ਜੋੜੀ ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ ਤਾਂ ਕਿ ਡਾਟਾ ਬਿਨਾਂ ਝੰਜਟ ਦੇ ਲਗਾਤਾਰ ਅਤੇ ਸੰਗਠਿਤ ਰਹੇ।

What should “postmortem management” include in a v1 product?

ਪੋਸਟਮੋਰਟਮ ਨੂੰ ਇੱਕ ਦਸਤਾਵੇਜ਼ ਵਜੋਂ ਨਹੀਂ, ਸਗੋਂ ਇੱਕ ਵਰਕਫਲੋ ਵਜੋਂ ਵਰਤੋ:

ਫੈਸਲਾ ਕਰੋ ਕਿ ਕਿਹੜੇ ਇਨਸੀਡੈਂਟਸ ਲਈ ਪੋਸਟਮੋਰਟਮ ਜ਼ਰੂਰੀ ਹੈ (ਸਭ ਲਈ ਜਾਂ ਸਿਰਫ਼ Sev-1/2)
ਇੱਕ ਡਿਫ਼ਾਲਟ ਟੈਂਪਲੇਟ ਵਰਤੋਂ ਅਤੇ ਇਨਸੀਡੈਂਟ ਡਾਟਾ (ਟਾਈਮਲਾਈਨ, ਭਾਗੀਦਾਰ, ਆਰਟੀਫੈਕਟ) ਤੋਂ ਆਟੋ-ਭਰੋ
ਇੱਕ ਸਮੀਖਿਆ ਸਟੇਟ ਸ਼ਾਮਲ ਕਰੋ (Draft → In Review → Approved → Published)
ਕਾਰਵਾਈ ਆਈਟਮਾਂ ਨੂੰ ਪ੍ਰਧਾਨ ਬਣਾਓ ਤਾਂ ਕਿ ਫਾਲੋ-ਥਰੂ ਨੂੰ ਮਾਪਿਆ ਜਾ ਸਕੇ

ਜੇ ਤੁਸੀਂ ਬਦਲੀ ਦੀ ਉਮੀਦ ਰੱਖਦੇ ਹੋ, ਤਾਂ ਤੁਹਾਨੂੰ ਸਿਰਫ਼ ਸੰਭਾਲਣ ਨਹੀਂ, ਬਲਕਿ ਐਕਸ਼ਨ-ਆਈਟਮ ਟ੍ਰੈਕਿੰਗ ਅਤੇ ਰੀਮਾਈਂਡਰ ਚਾਹੀਦੇ ਹੋਣਗੇ।

What are the must-have features for the first release of an incident tracking web app?

ਇਕ ਪ੍ਰਯੋਗਾਤਮਕ v1 ਸੈੱਟ ਵਿੱਚ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ:

ਇਨਸੀਡੈਂਟ ਇਨਟੇਕ (ਟਾਈਟਲ, ਸੇਵਾ, ਸਮੀਕਰਨ, ਰਿਪੋਰਟਰ; ਬਾਕੀ ਬਚਤ ਵਾਲੇ)
ਤੇਜ਼ ਅਪਡੇਟ (ਸਥਿਤੀ, ਪ੍ਰਭਾਵ ਸੰਖੇਪ, ਮੁੱਖ ਨੋਟਸ, ਅਗਲੇ ਕਦਮ)
ਇੱਕ ਮਿਲਿਆ ਹੋਇਆ ਟਾਈਮਲਾਈਨ (ਆਟੋ-ਕੈਪਚਰ ਕੀਤੀਆਂ ਚੇਜ਼ਾਂ + ਮੈਨੂਅਲ ਇਵੈਂਟ)
ਬੁਨਿਆਦੀ ਭੂਮਿਕਾਵਾਂ/ਮਾਲਕੀ (ਕਮਾਂਡਰ/ਮਾਲਕ ਦਰਸਿਆ ਹੋਇਆ)
ਇਨਸੀਡੈਂਟ ਬੰਦ ਹੋਣ 'ਤੇ ਜੁੜਿਆ ਹੋਇਆ ਪੋਸਟਮੋਰਟਮ ਬਣਾਉਣਾ
ਕਾਰਵਾਈ ਆਈਟਮਾਂ ਨਾਲ ਮਾਲਕ, ਨਿਰਧਾਰਿਤ ਤਾਰੀਖ ਅਤੇ ਸਥਿਤੀ

ਉੱਚ-ਸੁਝਾਅ ਵਾਲੀਆਂ ਆਟੋਮੇਸ਼ਨ ਤੁਹਾਨੂੰ ਤਬ ਤੱਕ ਨਹੀਂ ਚਾਹੀਦੀਆਂ ਜਦ ਤੱਕ ਇਹ ਮੂਲ ਫਲੋ ਸਟਰੈੱਸ ਹੇਠਾਂ ਠੀਕ ਤਰ੍ਹਾਂ ਕੰਮ ਨਹੀਂ ਕਰਦੇ।

How should we design incident states and transitions?

ਛੋਟੇ ਅਤੇ ਪੂਰਣਯੋਗ ਸਟੇਜ ਵਰਤੋਂ ਜੋ ਟੀਮਾਂ ਅਮਲ ਵਿੱਚ ਵਰਤਦੀਆਂ ਹਨ:

Detect → Triage → Mitigate → Resolve → Learn

ਹਰ ਸਟੇਜ ਲਈ “ਕੀ ਹੋ ਗਿਆ” ਪਰਿਭਾਸ਼ਿਤ ਕਰੋ, ਫਿਰ ਗਾਰਡਰੇਲ ਸ਼ਾਮਲ ਕਰੋ:

Triage ਤੋ ਬਾਹਰ ਜਾਣ ਲਈ ਸਮੀਕਰਨ ਲਾਜ਼ਮੀ ਕਰੋ
Resolved ਦਰਜ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਨਤੀਜਾ ਸੰਖੇਪ ਲਾਜ਼ਮੀ ਕਰੋ
Resolved → Investigating ਲਈ ਫਿਰ-ਖੋਲ੍ਹਣ ਦਾ ਕਾਰਨ ਲਾਜ਼ਮੀ ਕਰੋ

ਇਸ ਨਾਲ ਫੱਸੇ ਹੋਏ ਇਨਸੀਡੈਂਟਾਂ ਤੋਂ ਬਚਾਅ ਹੁੰਦਾ ਹੈ ਅਤੇ ਬਾਅਦ ਦੀ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਗੁਣਵੱਤਾ ਬਿਹਤਰ ਹੁੰਦੀ ਹੈ।

Which roles should the app support, and how do we keep responsibilities clear?

ਕੁਝ ਸਾਫ਼ ਰੋਲ ਮਾਡਲ ਕਰੋ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਅਧਿਕਾਰਾਂ ਨਾਲ ਜੋੜੋ:

Reporter: ਇਨਸੀਡੈਂਟ ਬਣਾਉਂਦਾ ਹੈ ਅਤੇ ਸ਼ੁਰੂਆਤੀ ਸੰਦਰਭ ਜੋੜਦਾ ਹੈ
Responder: ਅਪਡੇਟ, ਟਾਈਮਲਾਈਨ ਈਵੇਂਟ ਅਤੇ ਮਿਟੀਗੇਸ਼ਨ ਕਰਦਾ ਹੈ
Incident Commander: ਰਿਸਪਾਂਡਰ ਨਿਯੁਕਤ/ਨਿਰਧਾਰਿਤ ਕਰਦਾ ਹੈ, ਸਮੀਕਰਨ ਮਨਜ਼ੂਰ ਕਰਦਾ ਹੈ, ਹਿੱਸੇਦਾਰ ਅਪਡੇਟਾਂ ਨੂੰ ਕੰਟਰੋਲ ਕਰਦਾ ਹੈ
Reviewer: ਪੋਸਟਮੋਰਟਮ ਦੀ ਗੁਣਵੱਤਾ ਅਤੇ ਮਨਜ਼ੂਰੀ ਸੰਭਾਲਦਾ ਹੈ

UI ਵਿੱਚ ਵਰਤਮਾਨ ਮਾਲਕ/ਕਮਾਂਡਰ ਸਪਸ਼ਟ ਦਿਖਾਈ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ ਅਤੇ ਡੈਲੀਗੇਸ਼ਨ (ਰਿਅਸਾਈਨ, ਕਮਾਂਡਰ ਰੋਟੇਸ਼ਨ) ਦੀ ਸਹਾਇਤਾ ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ।

What data entities should we model, and what relationships matter most?

ਛੋਟਾ ਪਰ ਸਰਚਿਰਚਿਤ ਡਾਟਾ ਮਾਡਲ ਰੱਖੋ:

Incident
Service
Update (ਅੰਦਰੂਨੀ ਬਨਾਮ ਹਿੱਸੇਦਾਰ-ਮੁੱਖ)
Timeline Event (ਟਾਈਮਸਟੈਂਪ ਕੀਤੇ ਹਕੀਕਤਾਂ)
Action Item
Postmortem

Stable identifiers (UUIDs) ਵਰਤੋਂ ਅਤੇ ਇੱਕ ਮਨੁੱਖ-ਪ੍ਰੀਤ ਸੂਚਕ (ਜਿਵੇਂ INC-2025-0042) ਰੱਖੋ। ਸੰਪਾਦਨ ਨੂੰ ਇਤਿਹਾਸ ਵਜੋਂ ਸੁਰੱਖਿਅਤ ਕਰੋ—ਹਰ ਰਿਕਾਰਡ ਤੇ created_at/created_by ਅਤੇ ਇੱਕ ਆਡੀਟ ਲੌਗ ਰੱਖੋ।

How do we handle internal notes versus stakeholder-facing status updates?

ਅੰਦਰੂਨੀ ਨੋਟਸ ਅਤੇ ਹਿੱਸੇਦਾਰ-ਮੁੱਖ ਸਥਿਤੀ ਅਲੱਗ ਰੱਖੋ:

Internal updates: ਰਣਨੀਤਿਕ, ਉੱਚ ਵਾਲੀਅਮ, ਗੰਦ ਹੋ ਸਕਦੇ ਹਨ
Stakeholder updates: ਸੰਭਾਲੇ ਹੋਏ, ਸਮੇਂ-ਟਿਕੇ, ਅਕਸਰ ਕਮਾਂਡਰ ਮਨਜ਼ੂਰਕਰਵੇ

ਦੋਨੋਂ ਨੂੰ ਇਨਸੀਡੈਂਟ ਰਿਕਾਰਡ ਵਿੱਚ ਸੁਰੱਖਿਅਤ ਰੱਖੋ ਤਾਂ ਕਿ ਫੈਸਲੇ ਬਾਅਦ ਵਾਪਸੀ ਤੇ ਵੀ ਦੁਹਰਾਏ ਨਾ ਜਾਣ ਅਤੇ ਸੰਵੇਦਨਸ਼ੀਲ ਜਾਣਕਾਰੀ ਲੀਕ ਨਾ ਹੋਵੇ।

How should we define and use severity levels in the app?

Severity ਲਈ ਸਪਸ਼ਟ ਉਮੀਦਾਂ ਪਰिभਾਸ਼ਿਤ ਕਰੋ (ਜਿਵੇਂ ਜਵਾਬ ਦੀ ਤਜਵੀਜ਼ ਅਤੇ ਸੰਚਾਰ ਕੈਡੈਂਸ). ਉਦਾਹਰਣ ਲਈ:

SEV1: ਤੁਰੰਤ ਪੇਜ; ਹਰ 15–30 ਮਿੰਟ 'ਤੇ ਅਪਡੇਟ
SEV2: ਜਲਦੀ ਜਵਾਬ; 30–60 ਮਿੰਟ 'ਤੇ ਅਪਡੇਟ
SEV3: ਸੀਮਤ ਪ੍ਰਭਾਵ; ਮੁੱਖ ਮੈਲਸਟੋਨ ਅਪਡੇਟ
SEV4: ਜਾਣਕਾਰੀ ਲਈ ਟ੍ਰੈਕਿੰਗ

ਜਿੱਥੇ ਸਮੀਕਰਨ ਚੁਣਿਆ ਜਾ ਰਿਹਾ ਹੈ ਉਥੇ UI ਵਿੱਚ ਨਿਯਮ ਦਿਖਾਓ ਤਾਂ ਜੋ ਰਿਸਪਾਂਡਰਾਂ ਨੂੰ ਬਾਹਰੀ ਡੌਕਸ ਦੀ ਲੋੜ ਨਾ ਪਏ।

How do we ensure postmortem action items actually get completed?

ਕਾਰਵਾਈ ਆਈਟਮਾਂ ਨੂੰ ਸਰਚਿਰਚਿਤ ਰਿਕਾਰਡ ਬਣਾਓ, ਨਿੱਲੇ ਟੈਕਸਟ ਨਹੀਂ:

Owner (ਇੱਕ ਜ਼ਿੰਮੇਵਾਰ ਵਿਅਕਤੀ)
Due date
Priority
Status (Open/In progress/Blocked/Done/Won’t do)
Verification criteria

ਫਿਰ ਗਲੋਬਲ ਵਿਉਜ਼ ਦਿਓ (overdue, due this week, by owner/service) ਅਤੇ ਸਧਾਰੇ ਨੋਟਿਸ/ਏਸਕੇਲੈਸ਼ਨ ਇਸਤਰੇਨ ਜਿਹੜੇ ਫਾਲੋ-ਅਪ ਨੂੰ ਗਾਇਬ ਹੋਣ ਤੋਂ ਰੋਕਦੇ ਹਨ।

How do we prevent integrations (alerts/webhooks) from creating duplicate incidents?

ਪ੍ਰੋਵਾਇਡਰ-ਨਿਰਧਾਰਤ idempotency ਕੀਜ਼ ਅਤੇ ਡੈਡਪਲੀਕੇਸ਼ਨ ਨੀਤੀਆਂ ਵਰਤੋਂ:

ਇੱਕ ਵਿਲੱਖਣ ਕੁੰਜੀ ਸਟੋਰ ਕਰੋ ਜਿਵੇਂ provider + alert_id + occurrence_id
ਨਿਰਧਾਰਿਤ ਕਰੋ ਕਿ ਨਵੇਂ ਅਲਰਟ ਕਦੋਂ ਮੌਜੂਦਾ ਇਨਸੀਡੈਂਟ 'ਤੇ ਜੋੜੇ ਜਾਣਗੇ ਅਤੇ ਕਦੋਂ ਨਵਾਂ ਬਣੇਗਾ (ਉਦਾਹਰਨ: ਇੱਕੋ ਸੇਵਾ + ਇੱਕੋ ਸਿਗਨੇਚਰ 15 ਮਿੰਟ ਵਿੱਚ)
webhook ਪ੍ਰੋਸੈਸਿੰਗ ਨੂੰ idempotent ਬਣਾਓ ਤਾਂ ਕਿ ਆਉਟ-ਆਫ-ਆਰਡਰ ਅਤੇ ਰੀਟ੍ਰਾਈ ਸਟੋਰਮਾਂ ਸੰਭਾਲੇ ਜਾਣ

ਜਦੋਂ APIs ਨਾਕਾਰ ਹੋਣ, ਹਮੇਸ਼ਾ ਮੈਨੁਅਲ ਲਿੰਕਿੰਗ ਨੂੰ ਇਕ ਫਾਲਬੈਕ ਵਜੋਂ ਛੱਡੋ।