Kafka ਕੀ ਹੈ ਅਤੇ ਆਧੁਨਿਕ ਪ੍ਰਣਾਲੀਆਂ ਵਿੱਚ ਇਹ ਕਿਵੇਂ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ?

Q: ਟਾਪਿਕ ਅਤੇ ਪਾਰਟੀਸ਼ਨ ਵਿੱਚ ਕੀ ਫ਼ਰਕ ਹੈ?

ਟਾਪਿਕ ਇਕ ਨਾਮਵਾਰ ਸ਼੍ਰੇਣੀ ਹੁੰਦੀ ਹੈ (ਜਿਵੇਂ ਜਾਂ )। ਪਾਰਟੀਸ਼ਨ ਇੱਕ ਟਾਪਿਕ ਦੀ ਇੱਕ ਕੱਟ ਹੈ ਜੋ: - ਵੱਧ ਥਰੂਪੁੱਟ ਲਈ (ਲਿਖਾਈ/ਪੜ੍ਹਾਈ ਨੂੰ ਬ੍ਰੋਕਰਾਂ 'ਤੇ ਫੈਲਾਉਂਦਾ ਹੈ) - ਸਮਾਂਤਰੀ ਖਪਤ ਲਈ (ਇਕ ਗਰੂਪ ਵਿੱਚ ਕਈ ਕਨਜ਼ਿਊਮਰ) Kafka ਸਿਰਫ਼ ਇੱਕ ਪਾਰਟੀਸ਼ਨ ਵਿੱਚ ਕ੍ਰਮ ਨੂੰ ਗਾਰੰਟੀ ਕਰਦਾ ਹੈ।

Q: ਕੀਜ਼ ਅਨੁਕੂਲ ਕ੍ਰਮ ਅਤੇ ਸਕੇਲਿੰਗ 'ਤੇ ਕਿਵੇਂ ਪ੍ਰਭਾਵ ਪਾਉਂਦੇ ਹਨ?

Kafka ਰਿਕੌਰਡ ਕੀ ( ਵਰਗਾ) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸੰਬੰਧਿਤ ਇਵੈਂਟਸ ਨੂੰ ਇੱਕੋ ਪਾਰਟੀਸ਼ਨ ਵਿੱਚ ਮੁਸੱਲਤ ਤੌਰ 'ਤੇ ਰੂਟ ਕਰਦਾ ਹੈ। ਵਿਆਵਹਾਰਕ ਨਿਯਮ: ਜੇ ਤੁਹਾਨੂੰ ਪ੍ਰਤੀ-ਇਕਾਈ ਕ੍ਰਮ (ਜਿਵੇਂ ਇੱਕ ਆਰਡਰ/ਗਾਹਕ ਲਈ ਸਾਰੇ ਇਵੈਂਟਸ ਲੜੀਵਾਰ) ਦੀ ਲੋੜ ਹੈ, ਤਾਂ ਉਹੀ ਇਕਾਈ ਦਰਸਾਉਣ ਵਾਲਾ ਕੀ ਚੁਣੋ ਤਾਂ ਜੋ ਉਹ ਇਵੈਂਟਸ ਇੱਕ ਪਾਰਟੀਸ਼ਨ ਵਿੱਚ ਜਾ ਸਕਣ।

ਲੌਗ ਇਨ ਸ਼ੁਰੂ ਕਰੋ

Kafka ਕੀ ਹੈ ਅਤੇ ਆਧੁਨਿਕ ਪ੍ਰਣਾਲੀਆਂ ਵਿੱਚ ਇਹ ਕਿਵੇਂ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ? | Koder.ai

Kafka ਨੂੰ ਆਸਾਨ ਭਾਸ਼ਾ ਵਿੱਚ ਸਮਝਣਾ

Apache Kafka ਇੱਕ ਵੰਡਿਆ ਹੋਇਆ ਇਵੈਂਟ ਸਟ੍ਰੀਮਿੰਗ ਪਲੇਟਫਾਰਮ ਹੈ। ਛੇਤੀ ਵਿੱਚ, ਇਹ ਇੱਕ ਸਾਂਝਾ, ਟਿਕਾਊ “ਪਾਇਪ” ਹੈ ਜੋ ਕਈ ਸਿਸਟਮਾਂ ਨੂੰ ਉਹਤੋਂ ਦੇਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ ਕਿ ਕੀ ਹੋਇਆ ਅਤੇ ਹੋਰ ਸਿਸਟਮ ਉਹਨਾਂ ਤੱਥਾਂ ਨੂੰ — ਤੇਜ਼ੀ ਨਾਲ, ਪੈਮਾਨੇ 'ਤੇ ਅਤੇ ਕ੍ਰਮ ਵਿੱਚ — ਪੜ੍ਹ ਸਕਦੇ ਹਨ।

ਟੀਮਾਂ Kafka ਨੂੰ ਇਸ ਵੇਲੇ ਵਰਤਦੀਆਂ ਹਨ ਜਦੋਂ ਡੇਟਾ ਨੂੰ ਭਰੋਸੇਯੋਗ ਤਰੀਕੇ ਨਾਲ ਸਿਸਟਮਾਂ ਵਿੱਚ ਲਿਜਾਣਾ ਹੁੰਦਾ ਹੈ ਬਿਨਾਂ ਕੜੇ ਤੌਰ 'ਤੇ ਜੁੜੇ ਹੋਏ। ਇਕ ਐਪ ਸਿੱਧਾ ਦੂਜੇ ਨੂੰ ਕਾਲ ਕਰਨ ਦੀ ਬਜਾਏ (ਅਤੇ ਜਦੋਂ ਉਹ ਡਾਊਨ ਜਾਂ ਧੀਮਾ ਹੋਵੇ ਤਾਂ ਫੇਲ ਹੋਣ ਦਾ ਖਤਰਾ), ਪ੍ਰੋਡਿਊਸਰ ਇਵੈਂਟਸ ਨੂੰ Kafka 'ਤੇ ਲਿਖਦੇ ਹਨ। ਕਨਜ਼ਿਊਮਰ ਜਦੋਂ ਤਿਆਰ ਹੁੰਦੇ ਹਨ ਉਹਨਾਂ ਨੂੰ ਪੜ੍ਹਦੇ ਹਨ। Kafka ਇਵੈਂਟਸ ਨੂੰ ਇੱਕ ਨਿਰਧਾਰਤ ਸਮੇਂ ਲਈ ਰੱਖਦਾ ਹੈ, ਇਸ ਲਈ ਸਿਸਟਮ ਆਉਟੇਜ਼ ਤੋਂ ਬਾਅਦ ਬਹਾਲ ਹੋ ਸਕਦੇ ਹਨ ਅਤੇ ਇਤਿਹਾਸ ਨੂੰ ਮੁੜ-ਪ੍ਰੋਸੈਸ ਵੀ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।

ਕੁਝ ਸ਼ਰਤਾਂ ਜੋ ਤੁਸੀਂ ਵੇਖੋਗੇ

ਇਵੈਂਟ / ਮੈਸੇਜ: ਉਹ ਰਿਕਾਰਡ ਜੋ ਕੁਝ ਹੋਣ ਦੀ ਨਿਸ਼ਾਨਦੀ ਹੈ (ਉਦਾਹਰਣ ਲਈ, “OrderPlaced” ਜਾਂ “PaymentFailed”)। Kafka ਵਰਤੋਂਕਾਰ ਆਮ ਤੌਰ 'ਤੇ “ਮੇਸੇਜ” ਕਹਿੰਦੇ ਹਨ, ਪਰ “ਇਵੈਂਟ” ਉੱਪਰੋਕਤ ਵਾਸਤਵਿਕ-ਜਗਤ ਬਦਲਾਅ ਨੂੰ ਜ਼ਿਆਦਾ ਉਭਾਰਦਾ ਹੈ।
ਸਟ੍ਰੀਮ: ਸਮੇਂ ਦੇ ਨਾਲ-ਨਾਲ ਇਵੈਂਟਸ ਦਾ ਲਗਾਤਾਰ ਪ੍ਰਵਾਹ।
ਲੌਗ: Kafka ਇਵੈਂਟਸ ਨੂੰ ਐਪੈਂਡ-ਓਨਲੀ ਲੌਗ ਵਜੋਂ ਸੰਗਠਿਤ ਕਰਦਾ ਹੈ—ਨਵੇਂ ਇਵੈਂਟ ਆਖਿਰ 'ਚ ਜੋੜੇ ਜਾਂਦੇ ਹਨ, ਅਤੇ ਪਾਠਕ ਆਪਣੇ ਰਫ਼ਤਾਰ 'ਤੇ ਅੱਗੇ ਵਧਦੇ ਹਨ।

ਇਹ ਗਾਈਡ ਕਿਸ ਲਈ ਹੈ (ਅਤੇ ਤੁਸੀਂ ਕੀ ਸਿੱਖੋਗੇ)

ਇਹ ਗਾਈਡ ਪ੍ਰੋਡਕਟ-ਮਨਸੂਬਾ ਇੰਜੀਨੀਅਰਾਂ, ਡੇਟਾ ਲੋਕਾਂ ਅਤੇ ਤਕਨੀਕੀ ਨੇਤਾਵਾਂ ਲਈ ਹੈ ਜੋ Kafka ਦਾ ਇੱਕ ਪ੍ਰਯੋਗਕ ਉਪਯੋਗੀ ਮਾਨਸਿਕ ਮਾਡਲ ਚਾਹੁੰਦੇ ਹਨ।

ਤੁਸੀਂ ਮੁੱਖ ਬਲਾਕ (ਪ੍ਰੋਡਿਊਸਰ, ਕਨਜ਼ਿਊਮਰ, ਟਾਪਿਕਸ, ਬ੍ਰੋਕਰ), ਪਾਰਟੀਸ਼ਨਾਂ ਨਾਲ Kafka ਕਿਵੇਂ ਸਕੇਲ ਹੁੰਦਾ ਹੈ, ਇਹ ਕਿਵੇਂ ਸਟੋਰ ਅਤੇ ਰੀਪਲੇ ਕਰਦਾ ਹੈ, ਅਤੇ ਇਵੈਂਟ-ਡਰਿਵਨ ਆਰਕੀਟੈਕਚਰ ਵਿੱਚ ਕਿੱਥੇ ਫਿੱਟ ਹੁੰਦਾ ਹੈ, ਇਹ ਸਭ ਸਿੱਖੋਗੇ। ਅਸੀਂ ਆਮ ਉਪਯੋਗ ਕੇਸ, ਡਿਲਿਵਰੀ ਗਾਰੰਟੀਜ਼, ਸੁਰੱਖਿਆ ਮੁਲ-ਤੱਤ, ਓਪਰੇਸ਼ਨ ਯੋਜਨਾ ਅਤੇ ਕਦੋਂ Kafka ਠੀਕ ਹੈ ਜਾਂ ਨਹੀਂ ਵੀ ਕਵਰ ਕਰਾਂਗੇ।

ਮੁੱਖ ਸੰਕਲਪ: ਪ੍ਰੋਡਿਊਸਰ, ਕਨਜ਼ਿਊਮਰ, ਟਾਪਿਕਸ, ਬ੍ਰੋਕਰ

Kafka ਨੂੰ ਇੱਕ ਸਾਂਝੇ ਇਵੈਂਟ ਲੌਗ ਵਜੋਂ ਸਮਝਣਾ ਸਭ ਤੋਂ ਆਸਾਨ ਹੈ: ਐਪਲੀਕੇਸ਼ਨ ਇਸ 'ਤੇ ਇਵੈਂਟ ਲਿਖਦੇ ਹਨ, ਅਤੇ ਹੋਰ ਐਪਲੀਕੇਸ਼ਨ ਉਹਨਾਂ ਇਵੈਂਟਸ ਨੂੰ ਬਾਅਦ ਵਿੱਚ ਪੜ੍ਹਦੇ ਹਨ—ਅਕਸਰ ਰੀਅਲ-ਟਾਈਮ ਵਿੱਚ, ਕਈ ਵਾਰੀ ਘੰਟਿਆਂ ਜਾਂ ਦਿਨਾਂ ਬਾਅਦ।

ਪ੍ਰੋਡਿਊਸਰ ਅਤੇ ਕਨਜ਼ਿਊਮਰ

ਪ੍ਰੋਡਿਊਸਰ ਲਿਖਣ ਵਾਲੇ ਹਨ। ਇੱਕ ਪ੍ਰੋਡਿਊਸਰ “order placed”, “payment confirmed”, ਜਾਂ “temperature reading” ਵਰਗਾ ਇਕ ਇਵੈਂਟ ਪਬਲਿਸ਼ ਕਰ ਸਕਦਾ ਹੈ। ਪ੍ਰੋਡਿਊਸਰ ਇਵੈਂਟਸ ਨੂੰ ਸਿੱਧਾ ਕਿਸੇ ਖ਼ਾਸ ਐਪ ਨੂੰ ਨਹੀਂ ਭੇਜਦੇ—ਉਹਨਾਂ ਨੂੰ Kafka 'ਤੇ ਭੇਜਦੇ ਹਨ।

ਕਨਜ਼ਿਊਮਰ ਪੜ੍ਹਨ ਵਾਲੇ ਹਨ। ਇੱਕ ਕਨਜ਼ਿਊਮਰ ਡੈਸ਼ਬੋਰਡ ਚਲਾ ਸਕਦਾ ਹੈ, ਸ਼ਿਪਮੈਂਟ ਵਰਕਫਲੋ ਚਲਾਉਂਦਾ ਹੈ, ਜਾਂ ਡੇਟਾ ਨੂੰ ਐਨਾਲਿਟਿਕਸ ਵਿੱਚ ਲੋਡ ਕਰ ਸਕਦਾ ਹੈ। ਕਨਜ਼ਿਊਮਰ ਇਵੈਂਟਸ ਨਾਲ ਕੀ ਕਰਣਾ ਹੈ ਫੈਸਲਾ ਕਰਦੇ ਹਨ, ਅਤੇ ਉਹ ਆਪਣੇ ਰਫ਼ਤਾਰ 'ਤੇ ਪੜ੍ਹ ਸਕਦੇ ਹਨ।

ਟਾਪਿਕਸ: ਇਵੈਂਟਸ ਨੂੰ ਸੰਗਠਿਤ ਕਰਨਾ

Kafka ਵਿੱਚ ਇਵੈਂਟਸ ਨੂੰ ਟਾਪਿਕਸ ਵਿੱਚ ਸਮੂਹਬੱਧ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਜੋ ਮੁਢਲਾ ਤੌਰ 'ਤੇ ਨਾਮਵਾਰ ਵਰਗ ਹਨ। ਉਦਾਹਰਨਾਂ:

orders = ਆਰਡਰ-ਸੰਬੰਧੀ ਇवੈਂਟਸ
payments = ਭੁਗਤਾਨ ਇਵੈਂਟਸ
inventory = ਸਟਾਕ ਬਦਲਾਅ

ਇੱਕ ਟਾਪਿਕ ਉਸ ਕਿਸਮ ਦੇ ਇਵੈਂਟ ਲਈ “ਸਰੋਤ-ਦਾ-ਸੱਚ” ਸਟ੍ਰੀਮ ਬਣ ਜਾਂਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਕਈ ਟੀਮਾਂ ਇਕ ਹੀ ਡੇਟਾ ਦੁਬਾਰਾ ਵਰਤ ਸਕਦੀਆਂ ਹਨ ਬਿਨਾਂ ਇੱਕ-ਵਾਰਗ ਇੰਟੇਗ੍ਰੇਸ਼ਨਾਂ ਦੇ।

ਬ੍ਰੋਕਰ ਅਤੇ ਕਲੱਸਟਰ

ਬ੍ਰੋਕਰ ਇੱਕ Kafka ਸਰਵਰ ਹੈ ਜੋ ਇਵੈਂਟਸ ਨੂੰ ਸਟੋਰ ਕਰਦਾ ਅਤੇ ਕਨਜ਼ਿਊਮਰਾਂ ਨੂੰ ਸਰਵ ਕਰਦਾ ਹੈ। ਅਮਲ ਵਿੱਚ, Kafka ਇੱਕ ਕਲੱਸਟਰ (ਕਈ ਬ੍ਰੋਕਰ ਇਕੱਠੇ) ਵਜੋਂ ਚਲਦਾ ਹੈ ਤਾਂ ਜੋ ਜ਼ਿਆਦਾ ਟਰੈਫਿਕ ਨੂੰ ਹੈਂਡਲ ਕੀਤਾ ਜਾ ਸਕੇ ਅਤੇ ਜੇਕਰ ਕੋਈ ਮਸ਼ੀਨ ਫੇਲ ਹੋਵੇ ਤਾਂ ਸੇਵਾ ਚਲਦੀ ਰਹੇ।

ਕਨਜ਼ਿਊਮਰ ਗਰੂਪ: ਕਾਮ ਨੂੰ ਡੁਪਲੀਕੇਟ ਕੀਤੇ ਬਿਨਾਂ ਸਕੇਲ ਕਰਨਾ

ਕਨਜ਼ਿਊਮਰ ਅਕਸਰ ਇੱਕ ਕਨਜ਼ਿਊਮਰ ਗਰੂਪ ਵਿੱਚ ਚੱਲਦੇ ਹਨ। Kafka ਗਰੂਪ ਵਿੱਚ ਪੜ੍ਹਨ ਦਾ ਕੰਮ ਵੰਡਦਾ ਹੈ, ਤਾਂ ਜੋ ਤੁਸੀਂ ਵੱਧ ਕਨਜ਼ਿਊਮਰ ਇੰਸਟੈਂਸ ਸ਼ਾਮਿਲ ਕਰਕੇ ਪ੍ਰੋਸੈਸਿੰਗ ਨੂੰ ਸਕੇਲ ਕਰ ਸਕੋ—ਬਿਨਾਂ ਹਰ ਇੰਸਟੈਂਸ ਦੇ ਉਹੀ ਕੰਮ ਕਰਨ ਦੇ।

ਕਿਵੇਂ ਟਾਪਿਕਸ ਅਤੇ ਪਾਰਟੀਸ਼ਨ Kafka ਨੂੰ ਸਕੇਲ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੇ ਹਨ

Kafka ਟਾਪਿਕਸ (ਸੰਬੰਧਿਤ ਇਵੈਂਟਸ ਦੀਆਂ ਸਟ੍ਰੀਮਾਂ) ਨੂੰ ਵੰਡ ਕੇ ਅਤੇ ਹਰੇਕ ਟਾਪਿਕ ਨੂੰ ਪਾਰਟੀਸ਼ਨਾਂ (ਉਸ ਸਟ੍ਰੀਮ ਦੇ ਛੋਟੇ, ਸੁਤੰਤਰ ਟੁਕੜੇ) ਵਿੱਚ ਵੰਡ ਕੇ ਸਕੇਲ ਹੁੰਦਾ ਹੈ।

ਪਾਰਟੀਸ਼ਨ = ਸਮਾਂਤਰੀਤਾ ਅਤੇ ਥਰੂਪੁੱਟ

ਇੱਕ ਟਾਪਿਕ ਜਿਸ ਵਿੱਚ ਇਕ ਪਾਰਟੀਸ਼ਨ ਹੋਵੇ, ਉਹ ਇੱਕ ਸਮੇਂ ਵਿੱਚ ਗਰੂਪ ਦੇ ਇੱਕ ਹੀ ਕਨਜ਼ਿਊਮਰ ਦੁਆਰਾ ਹੀ ਪੜ੍ਹਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਹੋਰ ਪਾਰਟੀਸ਼ਨ ਜੋੜੋ, ਅਤੇ ਤੁਸੀਂ ਹੋਰ ਕਨਜ਼ਿਊਮਰ ਜੋੜ ਕੇ ਇਵੈਂਟਸ ਨੂੰ ਸਮਾਂਤਰੀ ਤੌਰ 'ਤੇ ਪ੍ਰੋਸੈਸ ਕਰ ਸਕਦੇ ਹੋ। ਇਹੀ ਤਰੀਕਾ ਹੈ ਜਿਸ ਨਾਲ Kafka ਉੱਚ-ਮਾਤਰਾ ਦੀ ਇਵੈਂਟ ਸਟ੍ਰੀਮਿੰਗ ਅਤੇ ਰੀਅਲ-ਟਾਈਮ ਡੇਟਾ ਪਾਈਪਲਾਈਨਸ ਨੂੰ ਸਹਾਰਦਾ ਹੈ ਬਿਨਾਂ ਹਰ ਸਿਸਟਮ ਨੂੰ ਬੋਤਲਨੈਕ ਬਣਾਏ।

ਪਾਰਟੀਸ਼ਨ ਲੋਡ ਨੂੰ ਬ੍ਰੋਕਰਾਂ 'ਤੇ ਵੰਡਣ ਵਿੱਚ ਵੀ ਮਦਦ ਕਰਦੇ ਹਨ। ਇਕ ਹੀ ਮਸ਼ੀਨ ਦੇ ਵਲੋਂ ਸਾਰੇ ਲਿਖਣ ਅਤੇ ਪੜ੍ਹਨ ਕੰਮ ਨਹੀਂ ਹੋਣੇ, ਬਲਕਿ ਕਈ ਬ੍ਰੋਕਰ ਵੱਖ-ਵੱਖ ਪਾਰਟੀਸ਼ਨਾਂ ਦੀ ਮਿਹਮਾਨੀ ਕਰ ਸਕਦੇ ਹਨ ਤੇ ਟਰੈਫਿਕ ਸਾਂਝਾ ਹੁੰਦਾ ਹੈ।

ਕ੍ਰਮ: Kafka ਕਿਹੜੀ ਗਾਰੰਟੀ ਦਿੰਦਾ ਹੈ (ਅਤੇ ਕਿਹੜੀ ਨਹੀਂ)

Kafka ਇੱਕ-ਪਾਰਟੀਸ਼ਨ ਦੇ ਅੰਦਰ ਕ੍ਰਮ ਦੀ ਗਾਰੰਟੀ ਦਿੰਦਾ ਹੈ। ਜੇ ਇਵੈਂਟ A, B, ਅਤੇ C ਇੱਕੋ ਪਾਰਟੀਸ਼ਨ ਵਿੱਚ ਉਸੀ ਕ੍ਰਮ ਵਿੱਚ ਲਿਖੇ ਗਏ ਹਨ, ਤਾਂ ਕਨਜ਼ਿਊਮਰ ਉਹਨਾਂ ਨੂੰ A → B → C ਢੰਗ ਨਾਲ ਪੜ੍ਹੇਗਾ।

ਪਾਰਟੀਸ਼ਨਾਂ ਦੇ ਪਾਰੋਂ ਕ੍ਰਮ ਗਾਰੰਟੀ ਨਹੀਂ ਹੁੰਦੀ। ਜੇ ਤੁਹਾਨੂੰ ਕਿਸੇ ਵਿਸ਼ੇਸ਼ ਇਕਾਈ (ਜਿਵੇਂ ਗਾਹਕ ਜਾਂ ਆਰਡਰ) ਲਈ ਸਖਤ ਕ੍ਰਮ ਦੀ ਲੋੜ ਹੈ, ਤਾਂ ਆਮ ਤੌਰ 'ਤੇ ਤੁਸੀਂ ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦੇ ਹੋ ਕਿ ਉਸ ਇਕਾਈ ਦੇ ਸਾਰੇ ਇਵੈਂਟ ਇੱਕੋ ਹੀ ਪਾਰਟੀਸ਼ਨ ਨੂੰ ਜਾਂਦੇ ਹਨ।

ਕੀਜ਼ ਫੈਸਲਾ ਕਰਦੇ ਹਨ ਕਿ ਇਵੈਂਟ ਕਿੱਥੇ جائیں

ਜਦੋਂ ਪ੍ਰੋਡਿਊਸਰ ਇੱਕ ਇਵੈਂਟ ਭੇਜਦਾ ਹੈ, ਉਹ ਇੱਕ ਕੀ (ਉਦਾਹਰਨ ਲਈ, order_id) ਸ਼ਾਮਿਲ ਕਰ ਸਕਦਾ ਹੈ। Kafka ਕੀ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸੰਬੰਧਿਤ ਇਵੈਂਟਸ ਨੂੰ ਇੱਕੋ ਪਾਰਟੀਸ਼ਨ ਵੱਲ ਲਗਾਤਾਰ ਰੂਪ ਵਿੱਚ ਰੂਟ ਕਰਦਾ ਹੈ। ਇਸ ਨਾਲ ਉਸ ਕੀ ਲਈ ਪੂਰਵ-ਨਿਰਧਾਰਿਤ ਕ੍ਰਮ ਮਿਲਦਾ ਹੈ, ਜਦਕਿ ਕੁੱਲ ਮਿਲਾ ਕੇ ਟਾਪਿਕ ਕਈ ਪਾਰਟੀਸ਼ਨਾਂ 'ਤੇ ਫੈਲ ਸਕਦਾ ਹੈ।

ਰੇਪਲਿਕਾ ਡੇਟਾ ਨੂੰ ਉਪਲਬਧ ਰੱਖਦੇ ਹਨ

ਹਰ ਪਾਰਟੀਸ਼ਨ ਨੂੰ ਹੋਰ ਬ੍ਰੋਕਰਾਂ 'ਤੇ ਰੇਪਲਿਕੇਟ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਜੇ ਕੋਈ ਬ੍ਰੋਕਰ ਫੇਲ ਹੋ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਹੋਰ ਬ੍ਰੋਕਰ 'ਤੇ ਮੌਜੂਦ ਰੇਪਲਿਕਾ ਲੀਡਰ ਬਣ ਕੇ ਕੰਮ ਜਾਰੀ ਰੱਖ ਸਕਦਾ ਹੈ। ਰੈਪਲੀਕੇਸ਼ਨ ਹੀ ਮਨ-ਕਾਰਨ ਹੈ ਕਿ Kafka ਮਿਸ਼ਨ-ਕ੍ਰਿਟਿਕਲ ਸਿਸਟਮਾਂ ਲਈ ਭਰੋਸੇਯੋਗ ਹੈ: ਇਹ ਉਪਲਬਧਤਾ ਸੁਧਾਰਦਾ ਹੈ ਅਤੇ ਫਾਲਟ ਟੋਲਰੈਂਸ ਦਿੰਦਾ ਹੈ ਬਿਨਾਂ ਹਰ ਐਪ ਨੂੰ ਆਪਣੀ ਫੇਲਓਵਰ ਲਾਜ਼ਮੀ ਤੌਰ 'ਤੇ ਬਣਾਉਣ ਦੀ ਲੋੜ।

ਸਟੋਰੇਜ, ਰਿਟੇਂਸ਼ਨ, ਅਤੇ ਇਵੈਂਟਸ ਨੂੰ ਮੁੜ-ਚਲਾਉਣਾ

Apache Kafka ਵਿੱਚ ਇੱਕ ਮੁੱਖ ਵਿਚਾਰ ਇਹ ਹੈ ਕਿ ਇਵੈਂਟਸ ਸਿਰਫ ਅੱਗੇ-ਅੱਗੇ ਨਹੀਂ ਜਾਂਦੇ—ਉਹ ਡਿਸਕ 'ਤੇ ਲਿਖੇ ਜਾਂਦੇ ਹਨ, ਇਸ ਲਈ ਕਨਜ਼ਿਊਮਰ ਉਹਨਾਂ ਨੂੰ ਹੁਣ ਪੜ੍ਹ ਸਕਦੇ ਹਨ ਜਾਂ ਬਾਅਦ ਵਿੱਚ ਵੀ। ਇਹ Kafka ਨੂੰ ਸਿਰਫ ਡੇਟਾ ਹਿਲਾਉਣ ਲਈ ਹੀ ਨਹੀਂ, ਬਲਕਿ ਹੋਣ ਵਾਲੀ ਘਟਨਾ ਦਾ ਟਿਕਾਊ ਇਤਿਹਾਸ ਰੱਖਣ ਲਈ ਵੀ ਵਰਤੋਂਯੋਗ ਬਣਾਉਂਦਾ ਹੈ।

ਇਵੈਂਟਸ ਇਨ-ਟ੍ਰਾਂਜ਼ਿਟ ਨਹੀਂ, ਪERSIST ਕੀਤੀਆਂ ਜਾਂਦੀਆਂ ਹਨ

ਜਦੋਂ ਇੱਕ ਪ੍ਰੋਡਿਊਸਰ ਟਾਪਿਕ 'ਤੇ ਇਵੈਂਟ ਭੇਜਦਾ ਹੈ, Kafka ਉਹਨੂੰ ਬ੍ਰੋਕਰ 'ਤੇ ਸਟੋਰੇਜ ਵਿੱਚ ਐਪੈਂਡ ਕਰਦਾ ਹੈ। ਫਿਰ ਕਨਜ਼ਿਊਮਰ ਉਸ ਸਟੋਰ ਕੀਤੇ ਲੌਗ ਤੋਂ ਆਪਣੀ ਰਫ਼ਤਾਰ 'ਤੇ ਪੜ੍ਹਦੇ ਹਨ। ਜੇ ਇੱਕ ਕਨਜ਼ਿਊਮਰ ਇਕ ਘੰਟੇ ਲਈ ਡਾਊਨ ਰਹਿੰਦਾ ਹੈ, ਤਾਂ ਵੀ ਇਵੈਂਟਸ ਮੌਜੂਦ ਹੁੰਦੇ ਹਨ ਅਤੇ ਉਹ ਬਰਾਮਦ ਹੋ ਕੇ ਕੈਚ-ਅੱਪ ਕਰ ਸਕਦਾ ਹੈ ਜਦੋਂ ਇਹ ਮੁੜ ਚੱਲ ਪੈਂਦਾ ਹੈ।

ਰਿਟੇਂਸ਼ਨ: Kafka ਡੇਟਾ ਕਿੰਨੇ ਸਮੇਂ ਰੱਖਦਾ ਹੈ

Kafka ਇਵੈਂਟਸ ਨੂੰ ਰਿਟੇਂਸ਼ਨ ਨੀਤੀਆਂ ਦੇ ਅਨੁਸਾਰ ਰੱਖਦਾ ਹੈ:

ਸਮੇਂ-ਅਧਾਰਿਤ ਰਿਟੇਂਸ਼ਨ: ਇਵੈਂਟਸ ਨੂੰ ਨਿਸ਼ਚਿਤ ਸਮੇਂ ਲਈ ਰੱਖੋ (ਉਦਾਹਰਨ ਲਈ, 7 ਦਿਨ)।
ਆਕਾਰ-ਅਧਾਰਿਤ ਰਿਟੇਂਸ਼ਨ: ਲੌਗ ਇੱਕ ਨਿਰਧਾਰਤ ਆਕਾਰ ਤੱਕ ਰਹਿੰਦਾ ਹੈ, ਫਿਰ ਸਭ ਤੋਂ ਪੁਰਾਣਾ ਡੇਟਾ ਹਟਾਇਆ ਜਾਂਦਾ ਹੈ।

ਰਿਟੇਂਸ਼ਨ ਪ੍ਰਤੀ ਟਾਪਿਕ ਕਨਫਿਗਰ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਇਸ ਲਈ ਤੁਸੀਂ “ਆਡਿਟ ਟਰੇਲ” ਵਾਲੇ ਟਾਪਿਕਾਂ ਨੂੰ ਵੱਖਰਾ ਇਲਾਜ ਦੇ ਸਕਦੇ ਹੋ ਹੌਰ-ਵਾਲੇ ਟੈਲੀਮੀਟਰੀ ਟਾਪਿਕਾਂ ਦੀ ਤੁਲਨਾ ਵਿੱਚ।

ਕੰਪੈਕਸ਼ਨ: ਹਰ ਕੀ ਲਈ ਤਾਜ਼ਾ ਮੁੱਲ ਰੱਖਣਾ

ਕਈ ਟਾਪਿਕ ਸਿਰਫ ਇਤਿਹਾਸਕ ਆਰਕਾਈਵ ਨਹੀਂ ਹੁੰਦੇ—ਉਹ ਚੇਂਜਲੌਗ ਵਾਂਗ ਹੋ ਸਕਦੇ ਹਨ, ਉਦਾਹਰਨ ਲਈ “ਮੌਜੂਦਾ ਗਾਹਕ ਸੈਟਿੰਗਜ਼।” ਲੌਗ ਕੰਪੈਕਸ਼ਨ ਘੱਟੋ-ਘੱਟ ਹਰ ਕੀ ਲਈ ਆਖਰੀ ਇਵੈਂਟ ਰੱਖਦੀ ਹੈ, ਜਦਕਿ ਪੁਰਾਣੇ ਓਲਟੇ-ਸਰੇ ਰਿਕਾਰਡ ਹਟਾਏ ਜਾ ਸਕਦੇ ਹਨ। ਇਸ ਨਾਲ ਤੁਹਾਨੂੰ ਹਮੇਸ਼ਾ ਤਾਜ਼ਾ ਸਥਿਤੀ ਲਈ ਇੱਕ ਟਿਕਾਊ ਸਰੋਤ ਮਿਲਦਾ ਹੈ ਬਿਨਾਂ ਬੇਅੰਤ ਵਾਧੇ ਦੇ।

ਇਵੈਂਟਸ ਨੂੰ ਮੁੜ-ਚਲਾਉਣਾ: ਸਥਿਤੀ ਮੁੜ-ਬਣਾਉਣਾ ਅਤੇ ਬੱਗ ਤੋਂ ਬਹਾਲੀ

ਕਿਉਂਕਿ ਇਵੈਂਟਸ ਸਟੋਰ ਕੀਤੇ ਰਹਿੰਦੇ ਹਨ, ਤੁਸੀਂ ਉਹਨਾਂ ਨੂੰ ਮੁੜ-ਚਲਾ ਸਕਦੇ ਹੋ:

ਇੱਕ ਖੋਜ ਇੰਡੈਕਸ ਜਾਂ ਮੈਟੀਰੀਲਾਈਜ਼ਡ ਵਿਊ ਨੂੰ ਸ਼ੁਰੂ ਤੋਂ ਦੁਬਾਰਾ ਬਣਾਓ
ਇੱਕ ਖਰਾਬ ਡਿਪਲੋਇਮੈਂਟ ਤੋਂ ਬਾਅਦ ਸੇਵਾ ਨੂੰ ਮੁੜ-ਪ੍ਰੋਸੈਸ ਕਰਕੇ ਠੀਕ ਕਰੋ
ਨਵੇਂ ਕਨਜ਼ਿਊਮਰ ਨੂੰ ਆਨਬੋਰਡ ਕਰੋ ਅਤੇ ਉਸਨੂੰ ਇਤਿਹਾਸਿਕ ਡੇਟਾ ਪੜ੍ਹਨ ਦਿਓ

ਅਮਲ ਵਿੱਚ, ਰੀਪਲੇ ਇਸ 'ਤੇ ਨਿਯੰਤਰਿਤ ਹੁੰਦੀ ਹੈ ਕਿ ਇੱਕ ਕਨਜ਼ਿਊਮਰ "ਕਿੱਥੋਂ ਪੜ੍ਹਨਾ ਸ਼ੁਰੂ ਕਰਦਾ ਹੈ" (ਉਸਦਾ ਆਫਸੈੱਟ), ਜੋ ਟੀਮਾਂ ਨੂੰ ਪ੍ਰਣਾਲੀਆਂ ਬਦਲਣ ਦੇ ਸਮੇਂ ਇੱਕ ਤਾਕਤਵਰ ਸੇਫਟੀ ਨੈੱਟ ਦਿੰਦਾ ਹੈ।

ਭਰੋਸੇਯੋਗਤਾ ਅਤੇ ਫਾਲਟ-ਟੋਲਰੈਂਸ ਮੁਢਲੇ ਤੱਤ

Kafka ਇਸ ਤਰ੍ਹਾਂ ਬਣਾਇਆ ਗਿਆ ਹੈ ਕਿ ਸਿਸਟਮ ਦੇ ਹਿੱਸੇ ਫੇਲ ਹੋਣ 'ਤੇ ਵੀ ਡੇਟਾ ਬਹਿ ਰਹੇ। ਇਹ ਰੈਪਲੀਕੇਸ਼ਨ, ਹਰੇਕ ਪਾਰਟੀਸ਼ਨ ਲਈ “ਕੌਣ ਇੰਚਾਰਜ ਹੈ” ਦੇ ਸਾਫ਼ ਨਿਯਮਾਂ, ਅਤੇ ਕੰਫ਼ਿਗਰੇਬਲ ਲਿਖਾਈ ਪੁਸ਼ਟੀਕਰਨਾਂ (acknowledgments) ਨਾਲ ਹੁੰਦਾ ਹੈ।

ਰੈਪਲੀਕੇਸ਼ਨ: ਲੀਡਰ ਅਤੇ ਫਾਲੋਅਰ (ਉੱਪਰਲਾ ਦਰਜਾ)

ਹਰ ਟਾਪਿਕ ਪਾਰਟੀਸ਼ਨ ਦਾ ਇਕ ਲੀਡਰ ਬ੍ਰੋਕਰ ਹੁੰਦਾ ਹੈ ਅਤੇ ਇੱਕ ਜਾਂ ਵੱਧ ਫਾਲੋਅਰ ਰੇਪਲਿਕਾ ਹੋ ਸਕਦੇ ਹਨ। ਪ੍ਰੋਡਿਊਸਰ ਅਤੇ ਕਨਜ਼ਿਊਮਰ ਉਸ ਪਾਰਟੀਸ਼ਨ ਲਈ ਲੀਡਰ ਨਾਲ ਗੱਲ ਕਰਦੇ ਹਨ।

ਫਾਲੋਅਰ ਲੀਡਰ ਦਾ ਡੇਟਾ ਲਗਾਤਾਰ ਨਕਲ ਕਰਦੇ ਰਹਿੰਦੇ ਹਨ। ਜੇ ਲੀਡਰ ਡਾਊਨ ਹੋ ਜਾਂਦਾ ਹੈ, ਤਾਂ Kafka ਇੱਕ ਅਪ-ਟੂ-ਡੇਟ ਫਾਲੋਅਰ ਨੂੰ ਨਵਾਂ ਲੀਡਰ ਬਣਾਉਣ ਲਈ ਪ੍ਰੋਮੋਟ ਕਰ ਸਕਦਾ ਹੈ, ਤਾਂ ਕਿ ਪਾਰਟੀਸ਼ਨ ਉਪਲਬਧ ਰਹੇ।

ਬ੍ਰੋਕਰ ਫੇਲ ਹੋਣ 'ਤੇ ਕੀ ਹੁੰਦਾ ਹੈ (ਸੰਖੇਪ)

ਜੇਕਰ ਕੋਈ ਬ੍ਰੋਕਰ ਫੇਲ ਹੋ ਜਾਵੇ, ਤਾਂ ਜਿਹੜੀਆਂ ਪਾਰਟੀਸ਼ਨਾਂ ਉਸ ਨੇ ਲੀਡਰ ਵਜੋਂ ਹੋਸਟ ਕੀਤੀਆਂ ਸਨ ਉਹ थोੜ੍ਹੇ ਸਮੇਂ ਲਈ ਅਣਉਪਲਬਧ ਹੋ ਸਕਦੀਆਂ ਹਨ। Kafka ਦਾ ਕੰਟਰੋਲਰ ਫੇਲਯ ਨੂੰ ਡਿੱਟੈਕਟ ਕਰਦਾ ਹੈ ਅਤੇ ਉਹਨਾਂ ਪਾਰਟੀਸ਼ਨਾਂ ਲਈ ਲੀਡਰ ਚੁਣਾਅ ਚਲਾਉਂਦਾ ਹੈ।

ਜੇ ਘੱਟੋ-ਘੱਟ ਇਕ ਫਾਲੋਅਰ ਰੇਪਲਿਕਾ ਸੰਕਲਿਤ ਹੋਈ ਹੋਵੇ, ਤਾਂ ਉਹ ਲੀਡਰ ਬਣ ਸਕਦੀ ਅਤੇ ਕਲਾਇੰਟਸ ਲਿਖਨਾ/ਪੜ੍ਹਨਾ ਜਾਰੀ ਰੱਖ ਸਕਦੇ ਹਨ। ਜੇ ਕੋਈ ਇਨ-ਸਿੰਕ ਰੇਪਲਿਕਾ ਉਪਲਬਧ ਨਾ ਹੋਵੇ, ਤਾਂ Kafka ਤੁਹਾਡੇ ਸੈਟਿੰਗਜ਼ ਦੇ ਅਨੁਸਾਰ writes ਰੋਕ ਸਕਦਾ ਹੈ ਤਾਂ ਜੋ ਤੁਹਾਡੀ ਐਕਨਾਲਿਜ਼ਡ ਡੇਟਾ ਗੁੰਮ ਨਾ ਹੋਏ।

ਟਿਕਾਊਤਾ: acknowledgments ਅਤੇ ਰੈਪਲੀਕੇਸ਼ਨ ਫੈਕਟਰ

ਦੋ ਮੁੱਖ ਕਨਫ਼ਿਗਰੇਸ਼ਨ ਟਿਕਾਊਤਾ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰਦੀਆਂ ਹਨ:

ਰੈਪਲੀਕੇਸ਼ਨ ਫੈਕਟਰ: ਹਰ ਪਾਰਟੀਸ਼ਨ ਦੀਆਂ ਕਿੰਨੀ ਨਕਲੀਆਂ ਕਾਪੀਆਂ ਹੁੰਦੀਆਂ ਹਨ (ਉਦਾਹਰਨ ਲਈ, 3 ਕਾਪੀਆਂ 3 ਬ੍ਰੋਕਰਾਂ 'ਤੇ)।
acknowledgments (acks): ਪ੍ਰੋਡਿਊਸਰ ਕਿਸ ਵੇਲੇ ਲਿਖਾਈ ਨੂੰ ਸਫਲ ਮੰਨਦਾ ਹੈ।

ਸਧਾਰਨ ਪੱਧਰ ਤੇ:

acks=0: ਪ੍ਰੋਡਿਊਸਰ ਉਡੀਕ ਨਹੀਂ ਕਰਦਾ—ਤੇਜ਼, ਪਰ ਤੁਸੀਂ ਮੇਸੇਜ ਗੁਆ ਸਕਦੇ ਹੋ।
acks=1: ਲੀਡਰ ਲਿਖਾਈ ਦੀ ਪੁਸ਼ਟੀ ਕਰਦਾ ਹੈ—ਵਧੀਆ, ਪਰ ਜੇ ਲੀਡਰ ਫੇਲ ਹੋ ਜਾਵੇ ਅਤੇ ਫਾਲੋਅਰ ਡੇਟਾ ਨਾ ਨਕਲ ਕੀਤੇ ਹੋਣ ਤਾਂ ਤੁਸੀਂ ਹਾਲੀਆ ਲਿਖੀਆਂ ਸੁਨੇਹਿਆਂ ਨੂੰ ਗੁਆ ਸਕਦੇ ਹੋ।
acks=all (ਜਾਂ -1): ਲੀਡਰ ਇਨ-ਸਿੰਕ ਰੇਪਲਿਕਾਜ਼ ਤੋਂ ਪੁਸ਼ਟੀ ਦੀ ਉਡੀਕ ਕਰਦਾ ਹੈ—ਸੁਰੱਖਿਅਤ, ਪਰ ਆਮ ਤੌਰ 'ਤੇ ਥੋੜ੍ਹਾ ਢੀਲਾ।

ਰੀਟ੍ਰਾਈਜ਼ ਦੌਰਾਨ ਡੁਪਲੀਕੇਟ्स ਘਟਾਉਣ ਲਈ ਟੀਮਾਂ ਅਕਸਰ ਸੁਰੱਖਿਅਤ acks ਨਾਲ idempotent ਪ੍ਰੋਡਿਊਸਰ ਅਤੇ ਮਜ਼ਬੂਤ ਕਨਜ਼ਿਊਮਰ ਹੈਂਡਲਿੰਗ ਨੂੰ ਮਿਲਾਉਂਦੀਆਂ ਹਨ।

ਲੇਟੈਂਸੀ ਬਨਾਮ ਸੁਰੱਖਿਆ ਦਾ ਤਰਾਜੂ

ਜ਼ਿਆਦਾ ਸੁਰੱਖਿਆ ਆਮ ਤੌਰ 'ਤੇ ਵੱਧ ਪੁਸ਼ਟੀਆਂ ਦੀ ਉਡੀਕ ਕਰਨ ਅਤੇ ਹੋਰ ਰੇਪਲਿਕਾਜ਼ ਨੂੰ ਸਿੰਕ ਰੱਖਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਜੋ ਕਿ ਲੇਟੈਂਸੀ ਵਧਾ ਸਕਦੀ ਹੈ ਅਤੇ ਚੋਟੀ ਦੀ ਥਰੂਪੁੱਟ ਘਟਾ ਸਕਦੀ ਹੈ。

ਘੱਟ ਲੇਟੈਂਸੀ ਸੈਟਿੰਗਜ਼ ਟੈਲੀਮੀਟਰੀ ਜਾਂ ਕਲਿਕਸਟ੍ਰੀਮ ਵਰਗੇ ਮਾਮਲਿਆਂ ਲਈ ਠੀਕ ਹੋ ਸਕਦੀਆਂ ਹਨ ਜਿੱਥੇ ਕਦਚਿੱਤ ਨੁੱਕਸਾਨ ਮਨਜ਼ੂਰ ਹੈ, ਪਰ ਭੁਗਤਾਨ, ਸਟਾਕ, ਅਤੇ ਆਡਿਟ ਲੋਗ ਆਮ ਤੌਰ 'ਤੇ ਵੱਧ ਸੁਰੱਖਿਆ ਦੀ ਮੰਗ ਕਰਦੇ ਹਨ।

ਇਵੈਂਟ-ਡਰਿਵਨ ਆਰਕੀਟੈਕਚਰ ਵਿੱਚ Kafka ਦੀ ਭੂਮਿਕਾ

ਕਨਜ਼ਿਊਮਰ ਡੈਸ਼ਬੋਰਡ ਸ਼ਿਪ ਕਰੋ

ਇੱਕ ਹਲਕਾ-ਫੁਲਕਾ ਇਨਟਰਨਲ ਡੈਸ਼ਬੋਰਡ ਬਣਾਓ ਜੋ Kafka ਤੋਂ ਪੜ੍ਹਦਾ ਹੈ ਅਤੇ ਲੈਗ ਅਤੇ ਥਰੂਪੁੱਟ ਦਿਖਾਉਂਦਾ ਹੈ।

ਹੁਣ ਬਣਾਓ

ਇਵੈਂਟ-ਡਰਿਵਨ ਆਰਕੀਟੈਕਚਰ (EDA) ਉਹ ਤਰੀਕਾ ਹੈ ਜਿੱਥੇ ਕਾਰੋਬਾਰ ਵਿੱਚ ਹੋਣ ਵਾਲੀਆਂ ਘਟਨਾਵਾਂ—ਜਿਵੇਂ ਇਕ ਆਰਡਰ ਰੱਖਿਆ ਗਿਆ, ਭੁਗਤਾਨ ਪੁਸ਼ਟੀ ਹੋਈ, ਪੈਕੇਜ ਭੇਜਿਆ ਗਿਆ—ਇਹਨਾਂ ਨੂੰ ਇਵੈਂਟਸ ਵਜੋਂ ਦਰਸਾਇਆ ਜਾਂਦਾ ਹੈ ਜਿਨ੍ਹਾਂ 'ਤੇ ਸਿਸਟਮ ਦੇ ਹੋਰ ਹਿੱਸੇ ਪ੍ਰਤੀਕਿਰਿਆ ਕਰ ਸਕਦੇ ਹਨ।

ਇਵੈਂਟ ਪਬਲਿਸ਼ ਕਰੋ, ਕਨਜ਼ਿਊਮਰ ਨਾਲ ਪ੍ਰਤੀਕਿਰਿਆ ਕਰੋ

Kafka ਅਕਸਰ EDA ਦੇ ਕੇਂਦਰ ਵਿੱਚ ਏਕ ਸਾਂਝਾ “ਇਵੈਂਟ ਸਟ੍ਰੀਮ” ਵਜੋਂ ਖੜਾ ਹੁੰਦਾ ਹੈ। ਸੇਵਾ A ਸਿੱਧਾ ਸੇਵਾ B ਨੂੰ ਕਾਲ ਕਰਨ ਦੀ ਬਜਾਏ ਇੱਕ ਇवੈਂਟ (OrderCreated ਵਰਗਾ) ਇੱਕ Kafka ਟਾਪਿਕ 'ਤੇ ਪਬਲਿਸ਼ ਕਰਦੀ ਹੈ। ਕੋਈ ਵੀ ਗਿਣਤੀ ਸੇਵਾਵਾਂ ਉਸ ਇਵੈਂਟ ਨੂੰ ਕਨਜ਼ਿਊਮ ਕਰ ਸਕਦੀਆਂ ਹਨ ਅਤੇ ਕਾਰਵਾਈ ਕਰ ਸਕਦੀਆਂ ਹਨ—ਈਮੇਲ ਭੇਜੋ, ਇਨਵੈਂਟਰੀ ਰਿਜ਼ਰਵ ਕਰੋ, ਫਰਾਡ ਚੈੱਕ ਸ਼ੁਰੂ ਕਰੋ—ਬਿਨਾਂ ਸੇਵਾ A ਨੂੰ ਇਹ ਜ਼ਰੂਰਤ ਹੋਣ ਦੀ ਕਿ ਉਹ ਉਹਨਾਂ ਦੀ ਮੌਜੂਦਗੀ ਜਾਣਦੀ ਹੋਵੇ।

ਢਿੱਲਾ ਜੋੜ (ਖੱਟੇ ਡਾਇਰੈਕਟ ਨਿਰਭਰਤਾ)

ਕਿਉਂਕਿ ਸੇਵਾਵਾਂ ਇਵੈਂਟਸ ਰਾਹੀਂ ਗੱਲ ਕਰਦੀਆਂ ਹਨ, ਉਨ੍ਹਾਂ ਨੂੰ ਹਰ ਇੰਟਰੈਕਸ਼ਨ ਲਈ ਰਿਕੁਏਸਟ/ਰਿਸਪਾਂਸ APIs ਦੀ ਸਹਿ-ਰਚਨਾ ਕਰਨ ਦੀ ਲੋੜ ਨਹੀਂ ਰਹਿੰਦੀ। ਇਸ ਨਾਲ ਟੀਮਾਂ ਦਰਮਿਆਨ ਕਠੋਰ ਨਿਰਭਰਤਾਵਾਂ ਘਟਦੀਆਂ ਹਨ ਅਤੇ ਨਵੀਆ ਫੀਚਰ ਜੋੜਨਾ ਆਸਾਨ ਹੋ ਜਾਂਦਾ ਹੈ: ਤੁਸੀਂ ਇੱਕ ਮੌਜੂਦਾ ਇਵੈਂਟ ਲਈ ਨਵਾਂ ਕਨਜ਼ਿਊਮਰ ਪੇਸ਼ ਕਰ ਸਕਦੇ ਹੋ ਬਿਨਾਂ ਪ੍ਰੋਡਿਊਸਰ ਨੂੰ ਬਦਲੇ।

ਅਸਿੰਕ੍ਰੋਨਸ ਵਰਕਫ਼ਲੋਸ ਅਤੇ ਸਪਾਈਕ ਰੋਧਨ

EDA ਕੁਦਰਤੀ ਤੌਰ 'ਤੇ ਅਸਿੰਕ੍ਰੋਨਸ ਹੁੰਦੀ ਹੈ: ਪ੍ਰੋਡਿਊਸਰ ਤੇਜ਼ੀ ਨਾਲ ਇਵੈਂਟ ਲਿਖਦੇ ਹਨ, ਅਤੇ ਕਨਜ਼ਿਊਮਰ ਉਹਨਾਂ ਨੂੰ ਆਪਣੇ ਰਫ਼ਤਾਰ 'ਤੇ ਪ੍ਰੋਸੈਸ ਕਰਦੇ ਹਨ। ਟ੍ਰੈਫਿਕ ਦੇ ਸਪਾਈਕ ਦੌਰਾਨ, Kafka ਬਫ਼ਰ ਵਾਂਗ ਕੰਮ ਕਰਕੇ ਝਟਕੇ ਨੂੰ ਨਿਮ੍ਹਾਉਂਦਾ ਹੈ ਤਾਂ ਜੋ ਡਾਊਨਸਟਰੀਮ ਸਿਸਟਮ ਤੁਰੰਤ ਢਹਿ ਨਾ ਜਾਣ। ਕਨਜ਼ਿਊਮਰ ਸਕੇਲ ਆਉਟ ਕਰ ਸਕਦੇ ਹਨ ਅਤੇ ਫੇਲ ਹੋਣ 'ਤੇ ਮੁੜ ਓਥੇੋਂ ਜਾਰੀ ਰੱਖ ਸਕਦੇ ਹਨ ਜਿੱਥੋਂ ਉਹ ਰੁਕੇ ਸਨ।

ਇੱਕ ਪ੍ਰਯੋਗਕ ਮਨੋ-ਮਾਡਲ

Kafka ਨੂੰ ਸਿਸਟਮ ਦਾ "ਐਕਟਿਵਿਟੀ ਫੀਡ" ਸੋਚੋ। ਪ੍ਰੋਡਿਊਸਰ ਤੱਥ ਪ੍ਰਕਾਸ਼ਿਤ ਕਰਦੇ ਹਨ; ਕਨਜ਼ਿਊਮਰ ਉਹ ਤੱਥ subscribe ਕਰਦੇ ਹਨ ਜੋ ਉਹਨਾਂ ਨੂੰ ਚਾਹੀਦੇ ਹਨ। ਇਹ ਪੈਟਰਨ ਰੀਅਲ-ਟਾਈਮ ਡੇਟਾ ਪਾਈਪਲਾਈਨਜ਼ ਤੇ ਇਵੈਂਟ-ਡਰਿਵਨ ਵਰਕਫ਼ਲੋਸ ਨੂੰ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ ਜਦੋਂ ਕਿ ਸੇਵਾਵਾਂ ਸਾਦਾ ਅਤੇ ਸੁਤੰਤਰ ਰਹਿੰਦੀਆਂ ਹਨ।

ਆਧੁਨਿਕ ਪ੍ਰਣਾਲੀਆਂ ਵਿੱਚ Kafka ਦੇ ਆਮ ਉਪਯੋਗ ਕੇਸ

Kafka ਉਹਥੇ ਆਉਂਦਾ ਹੈ ਜਿੱਥੇ ਟੀਮਾਂ ਨੂੰ ਬਹੁਤ ਸਾਰੇ ਛੋਟੇ “ਹੋਈਆਂ ਗੱਲਾਂ” (ਇਵੈਂਟਸ) ਸਿਸਟਮਾਂ ਵਿਚਕਾਰ—ਤੇਜ਼ੀ ਨਾਲ, ਭਰੋਸੇਯੋਗ ਤਰੀਕੇ ਨਾਲ ਅਤੇ ਇਸ ਤਰ੍ਹਾਂ ਕਿ ਕਈ ਕਨਜ਼ਿਊਮਰ ਇਕੋ ਡੇਟਾ ਦੁਬਾਰਾ ਵਰਤ ਸਕਣ—ਇਹਨਾਂ ਨੂੰ ਮੂਵ ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

ਐਕਟਿਵਿਟੀ ਟ੍ਰੈਕਿੰਗ ਅਤੇ ਆਡਿਟ ਲੋਗ

ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਅਕਸਰ ਇੱਕ ਐਪੈਂਡ-ਓਨਲੀ ਇਤਿਹਾਸ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ: ਯੂਜ਼ਰ ਸਾਈਨ-ਇਨਸ, ਪਰਮੀਸ਼ਨ ਬਦਲਾਅ, ਰਿਕਾਰਡ ਤਬਦੀਲੀਆਂ, ਜਾਂ ਐਡਮਿਨ ਕਾਰਵਾਈਆਂ। Kafka ਇਹਨਾਂ ਇਵੈਂਟਸ ਦਾ ਕੇਂਦਰੀ ਸਟ੍ਰੀਮ ਬਣ ਕੇ ਚੰਗੀ ਤਰ੍ਹਾਂ ਕੰਮ ਕਰਦਾ ਹੈ, ਤਾਂ ਕਿ ਸੁਰੱਖਿਆ ਟੂਲ, ਰਿਪੋਰਟਿੰਗ ਅਤੇ ਕੰਪਲਾਇੰਸ ਐਕਸਪੋਰਟ ਸਾਰੇ ਇੱਕੋ ਸਰੋਤ ਤੋਂ ਪੜ੍ਹ ਸਕਣ ਬਿਨਾਂ ਪ੍ਰੋਡਕਸ਼ਨ ਡੇਟਾਬੇਸ 'ਤੇ ਟੀਚੇ ਦਾ ਵਾਧਾ ਕੀਤੇ। ਕਿਉਂਕਿ ਇਵੈਂਟਸ ਨਿਰਧਾਰਤ ਸਮੇਂ ਲਈ ਰੱਖੇ ਜਾਂਦੇ ਹਨ, ਤੁਸੀਂ ਬੱਗ ਜਾਂ ਸਕੀਮਾ ਬਦਲਾਅ ਤੋਂ ਬਾਅਦ ਵੀ ਇੱਕ ਆਡਿਟ ਵਿਊ ਮੁੜ-ਬਣਾਉਣ ਲਈ ਉਹਨਾਂ ਨੂੰ ਮੁੜ ਚਲਾ ਸਕਦੇ ਹੋ।

ਮਾਇਕ੍ਰੋਸਰਵਿਸਿਜ਼ ਕਮਯੂਨਿਕੇਸ਼ਨ ਇਵੈਂਟਸ ਰਾਹੀਂ

ਸੇਵਾਵਾਂ ਸਿੱਧਾ-ਸਿੱਧਾ ਇੱਕ ਦੂਜੇ ਨੂੰ ਕਾਲ ਕਰਨ ਦੀ ਬਜਾਏ "order created" ਜਾਂ "payment received" ਵਰਗੇ ਇਵੈਂਟ ਪਬਲਿਸ਼ ਕਰ ਸਕਦੀਆਂ ਹਨ। ਹੋਰ ਸੇਵਾਵਾਂ ਸਬਸਕ੍ਰਾਈਬ ਕਰਕੇ ਆਪਣੇ ਸਮੇਂ 'ਤੇ ਪ੍ਰਤੀਕਿਰਿਆ ਕਰਦੀਆਂ ਹਨ। ਇਹ ਤੰਗ ਜੋੜ ਘਟਾਉਂਦਾ ਹੈ, ਭਾਗੀਦਾਰ ਨਿਰਭਰਤਾਵਾਂ ਦੌਰਾਨ ਸਿਸਟਮਾਂ ਨੂੰ ਕੰਮ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ, ਅਤੇ ਨਵੀਆਂ ਸਮਰੱਥਾਵਾਂ (ਜਿਵੇਂ ਫਰਾਡ ਚੈੱਕ) ਜੋੜਨਾ ਆਸਾਨ ਬਣਾਉਂਦਾ ਹੈ।

ਡੇਟਾ ਪਾਈਪਲਾਈਨਜ਼ ਵੱਲ ਐਨਾਲਿਟਿਕਸ ਅਤੇ ਵੇਅਰਹਾਊਸ

Kafka ਆਮ ਤੌਰ 'ਤੇ ਓਪਰੇਸ਼ਨਲ ਸਿਸਟਮਾਂ ਤੋਂ ਐਨਾਲਿਟਿਕਸ ਪਲੇਟਫਾਰਮਾਂ ਤੱਕ ਡੇਟਾ ਲਿਜਾਣ ਲਈ ਬੈਕਬੋਨ ਹੁੰਦਾ ਹੈ। ਟੀਮਾਂ ਐਪਲੀਕੇਸ਼ਨ ਡੇਟਾਬੇਸ ਤੋਂ ਬਦਲਾਅ ਸਟ੍ਰੀਮ ਕਰਕੇ ਉਨ੍ਹਾਂ ਨੂੰ ਵੇਅਰਹਾਊਸ ਜਾਂ ਲੇਕ ਤੱਕ ਛੋਟੇ ਸਮੇਂ ਵਿੱਚ ਭੇਜ ਸਕਦੀਆਂ ਹਨ, ਜਦਕਿ ਪ੍ਰੋਡਕਸ਼ਨ ਐਪ ਨੂੰ ਭਾਰੀ ਐਨਾਲਿਟਿਕ ਸਵਾਲਾਂ ਤੋਂ ਅਲੱਗ ਰੱਖਦੇ ਹਨ।

IoT ਅਤੇ ਟੈਲੀਮੀਟਰੀ ਜਿਸ ਵਿੱਚ ਬਰਸਟ ਟਰੈਫਿਕ ਹੁੰਦਾ ਹੈ

ਸੈਂਸਰ, ਡਿਵਾਈਸ ਅਤੇ ਐਪ ਟੈਲੀਮੀਟਰੀ ਅਕਸਰ ਝਟਕੇ ਵਿੱਚ ਆਉਂਦੀ ਹੈ। Kafka ਬਰਸਟਾਂ ਨੂੰ ਅਬਜ਼ੌਰਬ ਕਰ ਸਕਦਾ ਹੈ, ਉਨ੍ਹਾਂ ਨੂੰ ਸੁਰੱਖਿਅਤ ਤਰੀਕੇ ਨਾਲ ਬਫ਼ਰ ਕਰ ਸਕਦਾ ਹੈ, ਅਤੇ ਡਾਊਨਸਟਰੀਮ ਪ੍ਰੋਸੈਸਿੰਗ ਨੂੰ ਕੈਚ-ਅੱਪ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ—ਮਾਨੀਟਰਨਗ, ਅਲਰਟਿੰਗ ਅਤੇ ਲੰਬੇ ਸਮੇਂ ਲਈ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਲਾਭਦਾਇਕ।

Kafka ਦਾ ਇਕੋ-ਸੈੱਟ: Connect, Streams, ਅਤੇ ਟੂਲਿੰਗ

Kafka ਸਿਰਫ਼ ਬ੍ਰੋਕਰ ਅਤੇ ਟਾਪਿਕਸ ਹੀ ਨਹੀਂ ਹੈ। ਜ਼ਿਆਦਾਤਰ ਟੀਮਾਂ ਉਹਨਾਂ ਸਾਥੀ ਟੂਲਾਂ 'ਤੇ ਨਿਰਭਰ ਹੁੰਦੀਆਂ ਹਨ ਜੋ ਦੈਨੀਕ ਡੇਟਾ ਮੂਵਮੈਂਟ, ਸਟ੍ਰੀਮ ਪ੍ਰੋਸੈਸਿੰਗ ਅਤੇ ਓਪਰੇਸ਼ਨ ਲਈ Kafka ਨੂੰ ਪ੍ਰਯੋਗਯੋਗ ਬਣਾਉਂਦੇ ਹਨ।

Kafka Connect: ਬਿਨਾਂ ਕਸਟਮ ਕੋਡ ਦੇ ਡੇਟਾ ਮੂਵ ਕਰਨਾ

Kafka Connect Kafka ਦਾ ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਫਰੇਮਵਰਕ ਹੈ ਜੋ ਡੇਟਾ ਨੂੰ Kafka ਵਿੱਚ (ਸੋਰਸ) ਅਤੇ Kafka ਤੋਂ ਬਾਹਰ (ਸਿੰਕ) ਲਿਜਾਣ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ। ਇਕ-ਵਾਰੀ ਪਾਈਪਲਾਈਨ ਬਣਾਉਣ ਅਤੇ ਸੰਭਾਲਣ ਦੀ ਬਜਾਏ, ਤੁਸੀਂ Connect ਚਲਾਉਂਦੇ ਹੋ ਅਤੇ ਕਨੈਕਟਰਸ ਕਨਫਿਗਰ ਕਰਦੇ ਹੋ।

ਸਧਾਰਨ ਉਦਾਹਰਨਾਂ ਵਿੱਚ ਡੇਟਾਬੇਸ ਤੋਂ ਬਦਲਾਅ ਖਿੱਚਣਾ, SaaS ਇਵੈਂਟਸ ਆਉਂਦੇ ਲੈਣਾ, ਜਾਂ Kafka ਡੇਟਾ ਨੂੰ ਡੇਟਾ ਵੇਅਰਹਾਊਸ ਜਾਂ ਆਬਜੈਕਟ ਸਟੋਰੇਜ ਨੂੰ ਡਿਲਿਵਰ ਕਰਨਾ ਸ਼ਾਮਿਲ ਹੈ। Connect ਰੀਟ੍ਰਾਈਜ਼, ਆਫਸੈਟਸ, ਅਤੇ ਸਮਾਂਤਰੀਤਾ ਜਿਵੇਂ ਓਪਰੇਸ਼ਨਲ ਚਿੰਤਾਵਾਂ ਨੂੰ ਵੀ ਸਟੈਂਡਰਡ ਕਰਦਾ ਹੈ।

Kafka Streams: ਤੁਹਾਡੇ ਐਪ ਵਿੱਚ ਰੀਅਲ-ਟਾਈਮ ਪ੍ਰੋਸੈਸਿੰਗ

ਜੇ Connect ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਲਈ ਹੈ, ਤਾਂ Kafka Streams ਹਿਸਾਬ ਕਿਤਾਬ ਲਈ ਹੈ। ਇਹ ਇੱਕ ਲਾਇਬ੍ਰੇਰੀ ਹੈ ਜੋ ਤੁਸੀਂ ਆਪਣੀ ਐਪ ਵਿੱਚ ਸ਼ਾਮਿਲ ਕਰਦੇ ਹੋ ਤਾ ਕਿ ਸਟ੍ਰੀਮਾਂ ਨੂੰ ਰੀਅਲ-ਟਾਈਮ ਵਿੱਚ ਤਬਦੀਲ ਕੀਤਾ ਜਾ ਸਕੇ—ਇਵੈਂਟਸ ਨੂੰ ਫਿਲਟਰ ਕਰਨ, ਉਨ੍ਹਾਂ ਨੂੰ ਐਨਰਿਚ ਕਰਨ, ਸਟ੍ਰੀਮਾਂ ਨੂੰ ਜੋੜਨ ਅਤੇ ਐਗਰੀਗੇਟ ਬਣਾਉਣ (ਜਿਵੇਂ "ਪ੍ਰਤੀ ਮਿੰਟ ਆਰਡਰਾਂ")।

ਕਿਉਂਕਿ Streams ਐਪਸ ਟਾਪਿਕਸ ਤੋਂ ਪੜ੍ਹਦੀਆਂ ਅਤੇ ਟਾਪਿਕਸ 'ਤੇ ਲਿਖਦੀਆਂ ਹਨ, ਉਹ ਇਵੈਂਟ-ਡਰਿਵਨ ਸਿਸਟਮਾਂ ਵਿੱਚ ਕੁਦਰਤੀ ਤੌਰ 'ਤੇ ਫਿੱਟ ਹੁੰਦੀਆਂ ਹਨ ਅਤੇ ਹੋਰ ਇੰਸਟੈਂਸ ਸ਼ਾਮਿਲ ਕਰਕੇ ਸਕੇਲ ਕੀਤੀਆਂ ਜਾ ਸਕਦੀਆਂ ਹਨ।

ਸਕੀਮਾ ਪ੍ਰਬੰਧਨ: ਇਵੈਂਟਸ ਨੂੰ ਇੱਕਸਾਰ ਰੱਖਣਾ

ਜਦੋਂ ਕਈ ਟੀਮਾਂ ਇਵੈਂਟਸ ਪਬਲਿਸ਼ ਕਰਦੀਆਂ ਹਨ, ਤਾਂ ਇੱਕਸਾਰਤਾ ਮਹੱਤਵਪੂਰਨ ਹੋ ਜਾਂਦੀ ਹੈ। ਸਕੀਮਾ ਪ੍ਰਬੰਧਨ (ਅਕਸਰ ਇੱਕ ਸਕੀਮਾ ਰਜਿਸਟਰੀ ਰਾਹੀਂ) ਇਹ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦਾ ਹੈ ਕਿ ਇੱਕ ਇਵੈਂਟ ਵਿੱਚ ਕਿਹੜੇ ਫੀਲਡ ਹੋਣ ਚਾਹੀਦੇ ਹਨ ਅਤੇ ਉਹ ਕਿਵੇਂ ਸਮੇਂ ਦੇ ਨਾਲ ਬਦਲਣਗੇ। ਇਸ ਨਾਲ ਉਹ ਖ਼ਤਰਾ ਘਟਦਾ ਹੈ ਕਿ ਇੱਕ ਪ੍ਰੋਡਿਊਸਰ ਇੱਕ ਫੀਲਡ ਦਾ ਨਾਮ ਬਦਲ ਦੇਵੇ ਜੋ ਕਿਸੇ ਕਨਜ਼ਿਊਮਰ 'ਤੇ ਨਿਰਭਰ ਹੈ।

ਟੂਲਿੰਗ: ਜੋ ਮਹੱਤਵਪੂਰਨ ਹੈ ਉਹ ਮਾਨੀਟਰ ਕਰਨਾ

Kafka ਓਪਰੇਸ਼ਨली ਸੰਵੇਦਨਸ਼ੀਲ ਹੈ, ਇਸ ਲਈ ਬੁਨਿਆਦੀ ਮੋਨੀਟਰਿੰਗ ਜ਼ਰੂਰੀ ਹੈ:

ਕਨਜ਼ਿਊਮਰ ਲੈਗ: ਕੀ ਕਨਜ਼ਿਊਮਰ ਪਿੱਛੇ ਹਨ?
ਥਰੂਪੁੱਟ: ਸੈਕਿੰਡ ਪ੍ਰਤੀ ਕਿੰਨੇ ਇਵੈਂਟਸ ਬਹਿ ਰਹੇ ਹਨ?
ਗਲਤੀਆਂ: ਫੇਲ ਫੈਚ, ਪ੍ਰੋਡਿਊਸ ਐਰਰ, ਕਨੈਕਟਰ ਟਾਸਕ ਫੇਲ

ਜ਼ਿਆਦਾਤਰ ਟੀਮਾਂ ਪ੍ਰਬੰਧਨ UI ਅਤੇ ਡਿਪਲੋਇਮੈਂਟ, ਟਾਪਿਕ ਕੰਫਿਗਰੇਸ਼ਨ, ਅਤੇ ਐਕਸੈਸ ਕੰਟਰੋਲ ਨੀਤੀਆਂ ਲਈ ਆਟੋਮੇਸ਼ਨ ਵੀ ਵਰਤਦੀਆਂ ਹਨ (ਦੇਖੋ /blog/kafka-security-governance)।

ਡਿਲਿਵਰੀ ਗਾਰੰਟੀਜ਼ ਅਤੇ ਪ੍ਰੋਸੈਸਿੰਗ ਪੈਟਰਨ

ਆਪਣਾ Kafka ਪਾਈਪਲਾਈਨ ਪਲਾਨ ਕਰੋ

ਲਿਖਣ ਤੋਂ ਪਹਿਲਾਂ ਆਪਣੇ ਟਾਪਿਕ, ਕੀਜ਼, ਪਾਰਟੀਸ਼ਨ ਅਤੇ ਕਨਜ਼ਿਊਮਰਾਂ ਨੂੰ ਪਲੈਨਿੰਗ ਮੋਡ ਵਿੱਚ ਨਕਸ਼ਾ ਬਣਾਓ।

ਪਲੈਨਿੰਗ ਖੋਲ੍ਹੋ

Kafka ਨੂੰ ਅਕਸਰ “ਟਿਕਾਊ ਲੌਗ + ਕਨਜ਼ਿਊਮਰ” ਵਜੋਂ ਵਰਣਨ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਪਰ ਜ਼ਿਆਦਾਤਰ ਟੀਮਾਂ ਦਰਅਸਲ ਪਤਾ ਲਾਉਣ ਲਈ ਚਾਹੁੰਦੀਆਂ ਹਨ: ਕੀ ਮੈਂ ਹਰ ਇਵੈਂਟ ਨੂੰ ਇਕ ਵਾਰੀ ਪ੍ਰੋਸੈਸ ਕਰਾਂਗਾ, ਅਤੇ ਕੁਝ ਫੇਲ ਹੋਣ 'ਤੇ ਕੀ ਹੁੰਦਾ ਹੈ? Kafka ਤੁਹਾਨੂੰ ਬਣਾਉਣ ਲਈ ਨਿਰਮਾਣ ਖੰਡ ਦਿੰਦਾ ਹੈ, ਅਤੇ ਤੁਸੀਂ ਟਰੇਡ-ਅਫ਼ ਚੁਣਦੇ ਹੋ।

ਡਿਲਿਵਰੀ ਗਾਰੰਟੀਜ਼ (ਉੱਚ-ਪੱਧਰ)

At-most-once ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਤੁਸੀਂ ਹੋ ਸਕਦਾ ਹੈ ਇਵੈਂਟਸ ਗੁਆ ਦਿਓ, ਪਰ ਤੁਸੀਂ ਡੁਪਲੀਕੇਟ ਪ੍ਰੋਸੈਸ ਨਹੀਂ ਕਰੋਗੇ। ਇਹ ਹੋ ਸਕਦਾ ਹੈ ਜੇ ਇੱਕ ਕਨਜ਼ਿਊਮਰ ਪਹਿਲਾਂ ਆਪਣੀ ਪੋਜ਼ੀਸ਼ਨ ਕਮੇਟ ਕਰ ਦੇਵੇ ਅਤੇ ਫਿਰ ਕੰਮ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਕਰੈਸ਼ ਹੋ ਜਾਵੇ।

At-least-once ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਤੁਸੀਂ ਇਵੈਂਟਸ ਗੁਆ ਨਹੀਂ ਕਰੋਗੇ, ਪਰ ਡੁਪਲੀਕੇਟ ਹੋ ਸਕਦੇ ਹਨ (ਉਦਾਹਰਨ ਲਈ, ਕਨਜ਼ਿਊਮਰ ਇੱਕ ਇवੈਂਟ ਪ੍ਰੋਸੈਸ ਕਰਦਾ ਹੈ, ਫੇਲ ਹੋ ਜਾਂਦਾ ਹੈ, ਅਤੇ ਫਿਰ ਰੀ-ਸਟਾਰਟ 'ਤੇ ਮੁੜ-ਪ੍ਰੋਸੈਸ ਕਰ ਲੈਂਦਾ ਹੈ)। ਇਹ ਸਭ ਤੋਂ ਆਮ ਡਿਫ਼ੋਲਟ ਪੈਟਰਨ ਹੈ।

Exactly-once ਦੁਨੀਆ-ਭਰ ਦਾ ਉਦੇਸ਼ ਹੈ ਜੋ ਇਵੈਂਟ-ਟੂ-ਇवੈਂਟ ਖਤਮ-ਤੱਕ ਨਾ ਹਾਰ ਅਤੇ ਨਾ ਡੁਪਲੀਕੇਟ ਹੋਵੇ। Kafka ਵਿੱਚ, ਇਹ ਆਮ ਤੌਰ 'ਤੇ ਟ੍ਰਾਂਜ਼ੈਕਸ਼ਨਲ ਪ੍ਰੋਡਿਊਸਰਜ਼ ਅਤੇ ਮਿਲਦੇ-ਜੁਲਦੇ ਪ੍ਰੋਸੈਸਿੰਗ (ਅਕਸਰ Kafka Streams ਰਾਹੀਂ) ਨਾਲ ਹੁੰਦਾ ਹੈ। ਇਹ ਸ਼ਕਤੀਸ਼ালী ਹੈ, ਪਰ ਜ਼ਿਆਦਾ ਰੋਕ-ਟੋਕ ਵਾਲਾ ਅਤੇ ਧਿਆਨ ਨਾਲ ਸੈੱਟਅੱਪ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

ਆਈਡੈਪੋਟੈਂਸੀ ਅਤੇ ਡਿਡੁਪਲੀਕੇਸ਼ਨ

ਅਮਲ ਵਿੱਚ, ਬਹੁਤ ਸਾਰੇ ਸਿਸਟਮ at-least-once ਨੂੰ ਗਲੇ ਲਗਾਉਂਦੇ ਹਨ ਅਤੇ ਸੁਰੱਖਿਆ ਲਈ ਕਦਮ ਜੋੜਦੇ ਹਨ:

ਆਈਡੈਪੋਟੈਂਟ ਲਿਖਾਈ: “ਇਵੈਂਟ ਲਾਗੂ ਕਰੋ” ਕਦਮ ਨੂੰ ਦੁਹਰਾਇਆ ਜਾਣ ਬਰਾਬਰ ਸੁਰੱਖਿਅਤ ਬਣਾਓ (ਜਿਵੇਂ upserts, ਸ਼ਰਤੀ ਅਪਡੇਟ, ਯੂਨੀਕ ਕੀਜ਼)।
ਡਿਡੁਪਲੀਕੇਸ਼ਨ: ਇਕ ਇਵੈਂਟ ਆਈਡੀ (ਜਾਂ ਬਿਜ਼ਨਸ ਕੀ) ਸਟੋਰ ਕਰੋ ਅਤੇ ਇੱਕ ਵਿਂਡੋ ਵਿੱਚ ਦੁਹਰਾਅ ਨੂੰ ਅਣਡਿੱਠਾ ਕਰੋ।

ਕਨਜ਼ਿਊਮਰ ਆਫਸੈਟਸ: ਤੁਹਾਡੀ “ਬੁੱਕਮਾਰਕ”

ਕਨਜ਼ਿਊਮਰ ਆਫਸੈਟ ਇੱਕ ਪਾਰਟੀਸ਼ਨ ਵਿੱਚ ਆਖ਼ਰੀ ਪ੍ਰੋਸੈਸ ਰਿਕਾਰਡ ਦੀ ਪੋਜ਼ੀਸ਼ਨ ਹੈ। ਜਦੋਂ ਤੁਸੀਂ ਆਫਸੈਟਸ ਕਮੇਟ ਕਰਦੇ ਹੋ, ਤੁਸੀਂ ਕਹਿ ਰਹੇ ਹੋ, "ਮੈਂ ਇਥੇ ਤੱਕ ਹੋ ਕੇ ਖਤਮ ਕੀਤਾ।" ਜਲਦੀ ਕਮੇਟ ਕਰੋ ਤਾਂ ਨੁਕਸਾਨ ਦਾ ਖਤਰਾ ਵੱਧ ਜਾਂਦਾ ਹੈ; ਦੇਰ ਨਾਲ ਕਮੇਟ ਕਰੋ ਤਾਂ ਫੇਲ੍ਹ ਤੋਂ ਬਾਅਦ ਡੁਪਲੀਕੇਟ ਵੱਧ ਹੋ ਸਕਦੇ ਹਨ।

ਰੀਟ੍ਰਾਈਜ਼ ਅਤੇ ਪੋਇਜ਼ਨ ਮੈਸੇਜਜ਼

ਰੀਟ੍ਰਾਈਜ਼ ਨੂੰ ਸੀਮਿਤ ਅਤੇ ਦਿਖਾਈ ਦੇਣਯੋਗ ਰਹਿਣਾ ਚਾਹੀਦਾ ਹੈ। ਇੱਕ ਆਮ ਪੈਟਰਨ:

ਸੰਖੇਪੀ ਤਰਤੀਬ ਲਈ ਬੈਕਆਫ ਨਾਲ ਰੀਟ੍ਰਾਈ ਕਰੋ,
ਫੇਰ ਜੇ ਫੇਲ ਹੋਵੇ ਤਾਂ ਅਸਫਲ ਰਿਕਾਰਡ ਨੂੰ ਡੈਡ-ਲੇਟਰ ਟਾਪਿਕ 'ਤੇ ਭੇਜੋ ਤਾਂ ਕਿ ਨਿਰੀਖਣ ਅਤੇ ਮੁੜ-ਪਲੇਅ ਸੰਭਵ ਹੋਵੇ।

ਇਸ ਨਾਲ ਇੱਕ "ਪੋਇਜ਼ਨ ਮੈਸੇਜ" ਪੂਰੇ ਕਨਜ਼ਿਊਮਰ ਗਰੂਪ ਨੂੰ ਰੋਕਦਾ ਨਹੀਂ, ਪਰ ਡੇਟਾ ਨੂੰ ਬਾਅਦ ਵਿੱਚ ਠੀਕ ਕਰਨ ਲਈ ਸੰਭਾਲਿਆ ਜਾ ਸਕਦਾ ਹੈ।

ਸੁਰੱਖਿਆ ਅਤੇ ਗਵਰਨੈਂਸ ਵਿਚਾਰ

Kafka ਅਕਸਰ ਕਾਰੋਬਾਰੀ-ਮਹੱਤਵਪੂਰਨ ਇਵੈਂਟਸ (ਆਰਡਰ, ਭੁਗਤਾਨ, ਯੂਜ਼ਰ ਐਕਟਿਵਿਟੀ) ਢੋ ਰਹਾ ਹੁੰਦਾ ਹੈ। ਇਸ ਲਈ ਸੁਰੱਖਿਆ ਅਤੇ ਗਵਰਨੈਂਸ ਡਿਜ਼ਾਈਨ ਦਾ ਹਿੱਸਾ ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ, ਨਾ ਕਿ ਬਾਅਦ ਵਿੱਚ ਸੋਚਿਆ ਜਾਣਾ।

ਪ੍ਰਮਾਣਿਕਤਾ ਅਤੇ ਅਥੋਰਾਈਜ਼ੇਸ਼ਨ

ਪ੍ਰਮਾਣਿਕਤਾ ਇਹ ਸਵਾਲ ਉੱਤਰਦੀ ਹੈ "ਤੁਸੀਂ ਕੌਣ ਹੋ?"; ਅਥੋਰਾਈਜ਼ੇਸ਼ਨ ਇਹ ਪੁੱਛਦੀ ਹੈ "ਤੁਸੀਂ ਕੀ ਕਰ ਸਕਦੇ ਹੋ?" Kafka ਵਿੱਚ, ਪ੍ਰਮਾਣਿਕਤਾ ਅਕਸਰ SASL (ਉਦਾਹਰਨ ਲਈ, SCRAM ਜਾਂ Kerberos) ਨਾਲ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਜਦਕਿ ਅਥੋਰਾਈਜ਼ੇਸ਼ਨ ਟਾਪਿਕ, ਕਨਜ਼ਿਊਮਰ ਗਰੂਪ, ਅਤੇ ਕਲੱਸਟਰ ਸਤਰਾਂ 'ਤੇ ACLs ਨਾਲ ਲਾਗੂ ਕੀਤੀ ਜਾਂਦੀ ਹੈ।

ਇੱਕ ਪ੍ਰਯੋਗਕ ਨਮੂਨਾ ਘੱਟ-ਸਭ ਤੋਂ-ਅਧਿਕਾਰ (least privilege) ਹੈ: ਪ੍ਰੋਡਿਊਸਰ ਸਿਰਫ ਉਹਨਾਂ ਟਾਪਿਕਸ 'ਤੇ ਲਿਖ ਸਕਦੇ ਹਨ ਜੋ ਉਹਨਾਂ ਦੀ ਮਦਾਦ ਹਨ, ਅਤੇ কਨਜ਼ਿਊਮਰ ਸਿਰਫ ਉਹਨਾਂ ਟਾਪਿਕਸ ਨੂੰ ਪੜ੍ਹ ਸਕਦੇ ਹਨ ਜੋ ਉਹਨਾਂ ਨੂੰ ਚਾਹੀਦੇ ਹਨ। ਇਸ ਨਾਲ ਗੁਪਤ ਡੇਟਾ ਦੇ ਦਿੱਖਣ ਦੇ% ਘਟਾਉਂਦੇ ਹਨ ਅਤੇ ਜੇਕਰ ਕੁਝ ਅਕਸੁਲਟ ਹੋ ਜਾਂਦਾ ਹੈ ਤਾਂ ਨੁਕਸਾਨ ਦੀ ਰੇਂਜ ਸੀਮਿਤ ਰਹਿੰਦੀ ਹੈ।

ਟਰਾਂਜ਼ਪੋਰਟ ਵਿੱਚ ਇੰਕ੍ਰਿਪਸ਼ਨ (TLS)

TLS ਐਪਸ, ਬ੍ਰੋਕਰ, ਅਤੇ ਟੂਲਿੰਗ ਦਰਮਿਆਨ ਡੇਟਾ ਨੂੰ ਇੰਕ੍ਰਿਪਟ ਕਰਦਾ ਹੈ। ਬਿਨਾਂ TLS ਦੇ, ਇਵੈਂਟਸ ਅੰਦਰੂਨੀ ਨੈੱਟਵਰਕ 'ਤੇ ਵੀ ਇੰਟਰਸੈਪਟ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ, ਨਾ ਕੇਵਲ ਪਬਲਿਕ ਇੰਟਰਨੈੱਟ 'ਤੇ। TLS ਬ੍ਰੋਕਰਾਂ ਦੀ ਪਛਾਣ ਵੀ ਵੈਰੀਫਾਈ ਕਰਕੇ "ਮੈਨ-ਇਨ-ਦ-ਮਿਡਲ" ਹਮਲਿਆਂ ਤੋਂ ਰੋਕਦਾ ਹੈ।

ਮਲਟੀ-ਟੇਨੈਂਟ Kafka ਅਤੇ ਨੈਮਿੰਗ ਰਿਵਾਜ

ਜਦੋਂ ਕਈ ਟੀਮਾਂ ਇੱਕ ਕਲੱਸਟਰ ਸਾਂਝਾ ਕਰਦੀਆਂ ਹਨ, ਤਾਂ ਗਾਰਡਰੇਲਜ਼ ਜ਼ਰੂਰੀ ਹਨ। ਸਾਫ਼ ਟਾਪਿਕ ਨੈਮਿੰਗ ਰਿਵਾਜ (ਉਦਾਹਰਣ ਲਈ, <team>.<domain>.<event>.<version>) ਮਲਕੀਅਤ ਨੂੰ ਸਪਸ਼ਟ ਬਣਾਉਂਦੇ ਹਨ ਅਤੇ ਟੂਲਿੰਗ ਨੂੰ ਨੀਤੀਆਂ ਲਗਾਉਣ ਵਿਚ ਸਹਾਇਤਾ ਦਿੰਦੇ ਹਨ।

ਨਾਮਕਰਨ ਦੇ ਨਾਲ ਕਵੋਟਾ ਅਤੇ ACL ਟੈਮਪਲੇਟ ਜੁੜੋ ਤਾਂ ਇੱਕ ਸ਼ੋਰ ਕਰੋਡ ਵਰਕਲੋਡ ਦੂਸਰਿਆਂ ਨੂੰ ਭੁੱਖਾ ਨਾ ਕਰੇ, ਅਤੇ ਨਵੀਆਂ ਸਰਵਿਸਾਂ ਸੁਰੱਖਿਅਤ ਡਿਫਾਲਟਸ ਨਾਲ ਸ਼ੁਰੂ ਹੋ ਜਾਣ।

ਡੇਟਾ ਗਵਰਨੈਂਸ: PII, ਰਿਟੇਂਸ਼ਨ, ਅਤੇ ਸੰਗਤ

ਜੇ ਇਵੈਂਟਸ ਵਿੱਚ PII ਸ਼ਾਮਿਲ ਹੈ, ਤਾਂ ਡੇਟਾ ਘਟਾਉਣਾ (IDs ਭੇਜੋ ਨਾ ਕਿ ਪੂਰੇ ਪ੍ਰੋਫਾਈਲ), ਫੀਲਡ-ਲੈਵਲ ਇੰਕ੍ਰਿਪਸ਼ਨ ਬਾਰੇ ਸੋਚੋ, ਅਤੇ ਦਸਤਾਵੇਜ਼ ਕਰੋ ਕਿ ਕਿਹੜੇ ਟਾਪਿਕ ਸੰਵੇਦਨਸ਼ੀਲ ਹਨ।

ਰਿਟੇਂਸ਼ਨ ਸੈਟਿੰਗਜ਼ ਨੂੰ ਕਾਨੂੰਨੀ ਅਤੇ ਕਾਰੋਬਾਰੀ ਲੋੜਾਂ ਦੇ ਅਨੁਕੂਲ ਰੱਖੋ। ਜੇ ਨੀਤੀ ਕਹਿੰਦੀ ਹੈ "30 ਦਿਨਾਂ ਬਾਅਦ ਮਿਟਾ ਦਿਓ" ਤਾਂ 6 ਮਹੀਨੇ ਰੱਖਣਾ "ਸਿਰਫ਼ ਇਹੋ ਕੰਮ ਲਈ" ਨਹੀਂ ਕਰਨਾ ਚਾਹੀਦਾ। ਨਿਯਮਤ ਸਮੀਖਿਆਵਾਂ ਅਤੇ ਆਡਿਟਸ ਨਾਲ ਕਨਫਿਗਰੇਸ਼ਨ ਨੂੰ ਅਨੁਕੂਲ ਰੱਖੋ ਜਿਵੇਂ ਸਿਸਟਮ ਵਿਕਸਿਤ ਹੁੰਦੇ ਹਨ।

Kafka ਚਲਾਉਣਾ: ਟੀਮਾਂ ਲਈ ਕੀ ਯੋਜਨਾ ਬਣਾਉਣੀ ਚਾਹੀਦੀ ਹੈ

ਆਪਣਾ ਪਹਿਲਾ ਪਾਈਪਲਾਈਨ ਡਿਪਲੌਇ ਕਰੋ

ਵਿਚਾਰ ਤੋਂ ਲੈ ਕੇ ਡੈਪਲਾਂਇਡ ਪ੍ਰੋਟੋਟਾਈਪ ਤੱਕ ਜਾਓ ਤਾਂ ਜੋ ਟੀਮ ਮੇੰਬਰ ਇਵੈਂਟ ਫਲੋਜ਼ ਨੂੰ ਐਂਡ-ਟੂ-ਐਂਡ ਟੈਸਟ ਕਰ ਸਕਣ।

ਐਪ ਡਿਪਲੌਇ ਕਰੋ

Apache Kafka ਚਲਾਉਣਾ ਸਿਰਫ਼ "ਇੰਸਟਾਲ ਕਰਦੇ ਹੀ ਭੁੱਲੋ" ਵਾਲਾ ਕੰਮ ਨਹੀਂ। ਇਹ ਇਕ ਸਾਂਝੀ ਸੇਵਾ ਵਾਂਗ ਵਰਤਦੀ ਹੈ: ਕਈ ਟੀਮਾਂ ਇਸ 'ਤੇ ਨਿਰਭਰ ਹੁੰਦੀਆਂ ਹਨ, ਅਤੇ ਛੋਟੀ ਗਲਤੀ ਵੀ ਡਾਊਨਸਟਰੀਮ ਐਪਸ 'ਤੇ ਪ੍ਰਭਾਵ ਪਾ ਸਕਦੀ ਹੈ।

ਸਮਰੱਥਾ ਪਲੈਨਿੰਗ ਮੁਢਲੇ ਨੁਕਤੇ

Kafka ਦੀ ਸਮਰੱਥਾ ਜ਼ਿਆਦਾਤਰ ਗਣਿਤ ਦਾ ਮਸਲਾ ਹੈ ਜੋ ਤੁਸੀਂ ਨਿਯਮਤ ਰੂਪ ਵਿੱਚ ਮੁੜ-ਜਾਂਚਦੇ ਹੋ। ਸਭ ਤੋਂ ਵੱਡੇ ਲਿਵਰ ਹਨ ਪਾਰਟੀਸ਼ਨਾਂ (ਸਮਾਂਤਰੀਤਾ), ਥਰੂਪੁੱਟ (MB/s in ਅਤੇ out), ਅਤੇ ਸਟੋਰੇਜ ਫ਼ੈਲੋਥ (ਰਿਟੇਂਸ਼ਨ ਨਾਲ ਵਾਧਾ)।

ਜੇ ਟਰੈਫਿਕ ਦੋਗੁਣਾ ਹੋ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਤੁਹਾਨੂੰ ਲੋਡ ਵੰਡਣ ਲਈ ਹੋਰ ਪਾਰਟੀਸ਼ਨ, ਰਿਟੇਂਸ਼ਨ ਸਮੇਂ ਲਈ ਹੋਰ ਡਿਸ्क, ਅਤੇ ਰੈਪਲੀਕੇਸ਼ਨ ਲਈ ਨੈਟਵਰਕ ਹੈੱਡਰੂਮ ਦੀ ਲੋੜ ਪੈ ਸਕਦੀ ਹੈ। ਇੱਕ ਪ੍ਰਯੋਗਕ ਆਦਤ ਟੋਪਿਕ ਹੈ ਕਿ "ਪੀਕ" ਲਿਖਾਈ ਦਰ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਓ ਅਤੇ ਰਿਟੇਂਸ਼ਨ ਨਾਲ ਗੁਣਾ ਕਰੋ ਤਾਂ ਕਿ ਡਿਸਕ ਵਾਧੇ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗੇ, ਫਿਰ ਰੈਪਲੀਕੇਸ਼ਨ ਅਤੇ "ਅਚਾਨਕ ਸਫਲਤਾ" ਲਈ ਬਫਰ ਸ਼ਾਮਿਲ ਕਰੋ।

ਦਿਨ-ਪ੍ਰਤੀ ਦਿਨ ਓਪਰੇਸ਼ਨਲ ਕੰਮ

ਸਰਵਰ ਚਲਾਉਣ ਤੋਂ ਅਲਾਵਾ, ਰੋਜ਼ਾਨਾ ਕੰਮ ਉਮੀਦ ਕਰੋ:

ਅਪਗਰੇਡਜ਼: ਰੋਲਿੰਗ ਅਪਗਰੇਡ ਦੀ ਯੋਜਨਾ ਬਣਾਓ, ਕਲਾਇੰਟ ਕੰਪੈਟਿਬਿਲਿਟੀ ਦੀ ਜਾਂਚ ਕਰੋ, ਅਤੇ ਤਬਦੀਲੀਆਂ ਉਸ ਸਮੇਂ ਸ਼ਡਿਊਲ ਕਰੋ ਜਦੋਂ ਟ੍ਰੈਫਿਕ ਘੱਟ ਹੋਵੇ।
ਰੀਬੈਲੇਂਸਿੰਗ: ਕਨਜ਼ਿਊਮਰ ਗਰੂਪ ਰੀਬੈਲੈਂਸ ਕੁਝ ਸਮੇਂ ਲਈ ਰੋਕ ਸਕਦੀ ਹੈ; ਸੁਰੱਖਿਅਤ ਡਿਪਲੋਇਮੈਂਟ ਪੈਟਰਨ ਅਤੇ ਸਪਸ਼ਟ ਮਲਕੀਅਤ ਲਓ।
ਇੰਸੀਡੈਂਟ ਰਿਸਪਾਂਸ: ਬ੍ਰੋਕਰ ਫੇਲ, ਡਿਸਕ-ਫੁੱਲ ਇਵੈਂਟ, ਅਤੇ ਗਲਤ ਕਨਫ਼ਿਗਰ ਕੀਤੇ ਪ੍ਰੋਡਿਊਸਰਾਂ ਲਈ ਰਣਨੀਤੀਆਂ ਦੀਆਂ ਪਲੇਅਬੁੱਕ ਹੋਣੀਆਂ ਚਾਹੀਦੀਆਂ ਹਨ।

ਲਾਗਤ ਚਲਾਉਣ ਵਾਲੇ ਘਟਕ ਅਤੇ ਡਿਪਲੋਇਮੈਂਟ ਚੋਣਾਂ

ਲਾਗਤਾਂ ਡਿਸਕ, ਨੈਟਵਰਕ ਏਗਰੈਸ, ਅਤੇ ਬ੍ਰੋਕਰਾਂ ਦੀ ਗਿਣਤੀ/ਸਾਈਜ਼ ਨਾਲ ਚਲਦੀਆਂ ਹਨ। ਮੈਨੇਜਡ Kafka ਸਟਾਫ਼ਿੰਗ ਓਵਰਹੈਡ ਘਟਾ ਸਕਦਾ ਹੈ ਅਤੇ ਅਪਗਰੇਡ ਸਧਾਰਨ ਕਰ ਸਕਦਾ ਹੈ, ਜਦਕਿ ਸਵੈ-ਹੋਸਟਿੰਗ ਵੱਡੇ ਪੈਮਾਨੇ 'ਤੇ ਸਸਤੀ ਹੋ ਸਕਦੀ ਹੈ ਜੇਕਰ ਤੁਸੀਂ ਅਨੁਭਵੀ ਓਪਰੇਟਰ ਰੱਖਦੇ ਹੋ। ਤਕਨੀਕੀ ਵਪਾਰ ਇਹ ਹੈ ਕਿ ਟਾਈਮ-ਟੂ-ਰੀਕਵਰੀ ਅਤੇ ਔਨ-ਕਾਲ ਭਾਰ ਬਿਨਾਂ ਮੈਨੇਜਡ ਵਿਕਲਪ ਦੇ ਵੱਧ ਹੋ ਸਕਦੇ ਹਨ।

ਕੀ ਮਾਪਣਾ ਹੈ (ਤਾਂ ਜੋ ਅਨੁਮਾਨ ਨਾ ਲਗਾਉਣਾ ਪਵੇ)

ਟੀਮਾਂ ਆਮ ਤੌਰ 'ਤੇ ਨਿਗਰਾਨੀ ਕਰਦੀਆਂ ਹਨ:

ਐਂਡ-ਟੂ-ਐਂਡ ਲੇਟੈਂਸੀ (ਪ੍ਰੋਡਿੂਸ ਤੋਂ ਕਨਜ਼ਿਊਮ ਤੱਕ)
ਕਨਜ਼ਿਊਮਰ ਲੈਗ (ਕਨਜ਼ਿਊਮਰ ਕਿੰਨਾ ਪਿੱਛੇ ਹੈ)
ਬ੍ਰੋਕਰ ਸਿਹਤ (ਡਿਸਕ ਯੂਜ਼, ਅੰਡਰ-ਰੈਪਲਿਕੇਟਿਡ ਪਾਰਟੀਸ਼ਨ, ਰਿਕਵੇਸਟ ਐਰਰ ਰੇਟ)

ਚੰਗੀਆਂ ਡੈਸ਼ਬੋਰਡਜ਼ ਅਤੇ ਅਲਰਟਸ Kafka ਨੂੰ ਇਕ "ਰਹਸਮਈ ਡੱਬੇ" ਤੋਂ ਸਮਝਦਾਰ ਸੇਵਾ ਵਿੱਚ ਬਦਲ ਦਿੰਦੇ ਹਨ।

Kafka ਕਦੋਂ ਵਰਤਣਾ (ਅਤੇ ਕਦੋਂ ਨਹੀਂ)

Kafka ਵਧੀਆ ਹੈ ਜਦੋਂ ਤੁਹਾਨੂੰ ਘਣੇ ਇਵੈਂਟਸ ਭਰੋਸੇਯੋਗ ਤਰੀਕੇ ਨਾਲ ਹਿਲਾਉਣੇ ਹੋਣ, ਉਨ੍ਹਾਂ ਨੂੰ ਕੁਝ ਸਮੇਂ ਲਈ ਰੱਖਣਾ ਹੋਵੇ, ਅਤੇ ਕਈ ਸਿਸਟਮ ਇਕੋ ਡੇਟਾ ਉਪਯੋਗ ਕਰ ਸਕਣ। ਇਹ ਖਾਸ ਤੌਰ 'ਤੇ ਮਦਦਗਾਰ ਹੁੰਦਾ ਹੈ ਜਦੋਂ ਇਵੈਂਟਸ ਨੂੰ ਮੁੜ-ਚਲਾਉਣਾ ਲਾਜ਼ਮੀ ਹੋ (ਬੈਕਫਿਲ, ਆਡਿਟ, ਜਾਂ ਨਵੀਂ ਸੇਵਾ ਮੁੜ-ਤਿਆਰ ਕਰਨ ਲਈ) ਅਤੇ ਜਦੋਂ ਤੁਸੀਂ ਉਮੀਦ ਕਰਦੇ ਹੋ ਕਿ ਅਗਲੇ ਸਮੇਂ ਹੋਰ ਪ੍ਰੋਡਿਊਸਰ/ਕਨਜ਼ਿਊਮਰ ਜੋੜੇ ਜਾਣਗੇ।

Kafka ਚੁਣਨ ਲਈ ਸਾਰੇ ਵਧੀਆ ਸਮੇਂ

Kafka ਆਮ ਤੌਰ 'ਤੇ ਚਮਕਦਾ ਹੈ ਜਦੋਂ ਤੁਹਾਡੇ ਕੋਲ:

ਉੱਚ-ਥਰੂਪੁੱਟ ਵਾਲੀਆਂ ਇਵੈਂਟ ਸਟ੍ਰੀਮਾਂ (ਕਲਿਕਸ, ਆਰਡਰ, ਸੈਂਸਰ ਡੇਟਾ)
ਕਈ ਕਨਜ਼ਿਊਮਰ ਜੋ ਉਹੀ ਇਵੈਂਟਸ ਲੈਣ ਵਾਲੇ ਹਨ (ਐਨਾਲਿਟਿਕਸ, ਮਾਨੀਟਰਨਗ, ਫਰਾਡ, ਨੋਟੀਫਿਕੇਸ਼ਨ)
ਮੁੜ-ਚਲਾਉਣ ਅਤੇ ਲੰਬੇ-ਅਰਸੇ ਲਈ ਇਤਿਹਾਸ ਦੀ ਲੋੜ
ਉਹ ਇੰਟੇਗ੍ਰੇਸ਼ਨ ਜਿੱਥੇ ਟੀਮਾਂ ਅਤੇ ਸੇਵਾਵਾਂ ਨੂੰ ਡਿਕਪਲ ਕਰਨ ਦੀ ਲੋੜ ਹੈ

ਜਦੋਂ Kafka ਭਾਰੀ ਪੈ ਸਕਦਾ ਹੈ

ਜੇ ਤੁਹਾਡੀਆਂ ਲੋੜਾਂ ਸਧਾਰਨ ਹਨ, ਤਾਂ Kafka ਓਵਰਕੀਲ ਹੋ ਸਕਦਾ ਹੈ:

ਦੋ ਸੇਵਾਵਾਂ ਦਰਮਿਆਨ ਇਕ ਜ਼ਰੂਰਤ-ਘੱਟ ਕਿਊ
ਛੋਟੇ-ਅਵਧੀ ਵਾਲੇ ਟਾਸਕ ਜਿੱਥੇ ਰੀਪਲੇ ਕੀਮਤਵਾਨ ਨਹੀਂ
ਉਹ ਟੀਮਾਂ ਜਿਨ੍ਹਾਂ ਕੋਲ ਇੱਕ ਵੰਡੇ ਹੋਏ ਸਿਸਟਮ ਨੂੰ ਚਲਾਉਣ ਅਤੇ ਨਿਗਰਾਨੀ ਕਰਨ ਲਈ ਸਮਾਂ ਨਹੀਂ

ਇਨ੍ਹਾਂ ਸਥਿਤੀਆਂ ਵਿੱਚ, ਕਲੱਸਟਰ ਸਾਈਜ਼ਿੰਗ, ਅਪਗਰੇਡਜ਼, ਮੋਨੀਟਰਿੰਗ, ਅਤੇ ਔਨ-ਕਾਲ ਬੋਝ ਲਾਭ ਤੋਂ ਜ਼ਿਆਦਾ ਹੋ ਸਕਦੇ ਹਨ।

alternatives ਅਤੇ ਪੂਰਕ

RabbitMQ: ਕਲਾਸਿਕ ਵਰਕ ਕਿਊਜ਼ ਅਤੇ ਰੂਟਿੰਗ ਪੈਟਰਨ ਲਈ ਵਧੀਆ।
NATS: ਲੋੜੀਂਦੇ ਮੈਸੇਜਿੰਗ, ਘੱਟ ਲੇਟੈਂਸੀ ਵਾਲਾ।
Cloud pub/sub: ਜੇ ਤੁਸੀਂ ਮੈਨੇਜਡ ਇੰਫ੍ਰਾਸਟਰਕਚਰ ਚਾਹੁੰਦੇ ਹੋ ਤਾਂ ਸਧਾਰਨ ਓਪਰੇਸ਼ਨ ਲਈ ਚੰਗਾ।

Kafka ਡੇਟਾਬੇਸ (ਰਿਕਾਰਡ ਦਾ ਸਿਸਟਮ), ਕੈਸ਼ (ਫਾਸਟ ਰੀਡ), ਅਤੇ ਬੈਚ ETL ਟੂਲਜ਼ (ਵੱਡੇ ਆਰੰਭਿਕ ਬਦਲਾਵ) ਦਾ ਬਦਲ ਨਹੀਂ, ਬਲਕਿ ਉਨ੍ਹਾਂ ਦੀ ਪੂਰਕਤਾ ਹੈ।

ਫ਼ੈਸਲਾ ਕਰਨ ਲਈ ਤੇਜ਼ ਚੈੱਕਲਿਸਟ

ਪੂਛੋ:

ਕੀ ਸਾਨੂੰ ਕਈ ਕਨਜ਼ਿਊਮਰ ਅਤੇ ਰੀਪਲੇ ਦੀ ਲੋੜ ਹੈ?
ਕੀ ਥਰੂਪੁੱਟ ਮਹੱਤਵਪੂਰਨ ਤਰੀਕੇ ਨਾਲ ਵਧੇਗਾ?
ਕੀ ਸਾਨੂੰ ਇਤਿਹਾਸ/ਰਿਟੇਂਸ਼ਨ ਇੱਕ ਫੀਚਰ ਵਜੋਂ ਚਾਹੀਦਾ ਹੈ?
ਕੀ ਅਸੀਂ ਓਪਰੇਸ਼ਨਲ ਮਲਕੀਅਤ ਦਾ ਸਮਰਥਨ ਕਰ ਸਕਦੇ ਹਾਂ (ਜਾਂ ਮੈਨੇਜਡ Kafka)?
ਕੀ ਅਸੀਂ ਇਵੈਂਟਸ ਸਟ੍ਰੀਮ ਕਰ ਰਹੇ ਹਾਂ, ਸਿਰਫ਼ ਕਮਾਂਡ/ਟਾਸਕ ਨਹੀਂ?

ਜੇ ਤੁਹਾਡਾ ਜਵਾਬ ਜ਼ਿਆਦਾਤਰ ਪ੍ਰਸ਼ਨਾਂ ਲਈ "ਹਾਂ" ਹੈ, ਤਾਂ Kafka ਆਮ ਤੌਰ 'ਤੇ ਇੱਕ ਸੋਝੀਦਾਰ ਚੋਣ ਹੁੰਦੀ ਹੈ।

ਸ਼ੁਰੂ ਕਰਨਾ: ਇੱਕ ਸਧਾਰਨ ਅਨੁਕੂਲਤਾ ਰਾਹ

Kafka ਸਭ ਤੋਂ ਵਧੀਆ ਤਦੋਂ ਫਿੱਟ ਹੁੰਦਾ ਹੈ ਜਦੋਂ ਤੁਹਾਨੂੰ ਰੀਅਲ-ਟਾਈਮ ਇਵੈਂਟ ਸਟ੍ਰੀਮਾਂ ਲਈ ਇੱਕ ਸਾਂਝਾ "ਸਰੋਤ-ਦਾ-ਸੱਚ" ਚਾਹੀਦਾ ਹੈ: ਕਈ ਸਿਸਟਮ ਤੱਥ ਪੈਦਾ ਕਰਦੇ ਹਨ (orders created, payments authorized, inventory changed) ਅਤੇ ਕਈ ਸਿਸਟਮ ਉਹਨਾਂ ਤੱਥਾਂ ਨੂੰ ਉਪਭੋਗ ਕਰਦੇ ਹਨ ਪਾਈਪਲਾਈਨ, ਐਨਾਲਿਟਿਕਸ, ਅਤੇ ਪ੍ਰਤੀਕਿਰਿਆਸ਼ੀਲ ਫੀਚਰਾਂ ਲਈ।

ਪਦਰਹ 1: ਇੱਕ ਠੋਸ, ਵਸੀਤਯਤ ਵਰਕ-ਕੇਸ ਚੁਣੋ

ਇੱਕ ਸਾਰਥਕ, ਸੰਕੀर्ण ਫਲੋ ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ—ਜਿਵੇਂ "OrderPlaced" ਇवੈਂਟਸ ਨੂੰ ਪ੍ਰਕਾਸ਼ਿਤ ਕਰਨਾ downstream ਸੇਵਾਵਾਂ (ਈਮੇਲ, ਫਰਾਡ ਚੈੱਕ, ਫਲਫਿਲਮੈਂਟ) ਲਈ। ਪਹਿਲੇ ਦਿਨ Kafka ਨੂੰ ਸਭ ਕੁਝ ਸਮੇਤ ਇੱਕ ਫਿਰ-ਚੌੱਕ ਕਿਊ ਬਣਾਉਣ ਤੋਂ ਬਚੋ।

ਪਦਰਹ 2: ਆਪਣੇ ਇवੈਂਟਸ ਅਤੇ ਟਾਪਿਕ ਨਿਰਧਾਰਤ ਕਰੋ

ਲਿਖੋ:

ਇवੈਂਟਸ: ਕੀ ਹੋਇਆ, ਸਿੱਧੀ ਕਾਰੋਬਾਰੀ ਭਾਸ਼ਾ ਵਿੱਚ
ਟਾਪਿਕਸ: ਉਨ੍ਹਾਂ ਇवੈਂਟਸ ਦਾ ਘਰ (ਅਕਸਰ ਹਰ ਇवੈਂਟ ਕਿਸਮੇ/ਡੋਮੇਨ ਲਈ ਇੱਕ ਟਾਪਿਕ)
ਕਨਜ਼ਿਊਮਰ: ਕਿਹੜੀਆਂ ਟੀਮਾਂ/ਸੇਵਾਵਾਂ ਇਨ੍ਹਾਂ ਇਵੈਂਟਸ ਦੀ ਲੋੜ ਹਨ, ਅਤੇ ਕਿਉਂ

ਸ਼ੁਰੂਆਤੀ ਸਕੀਮਾਂ ਸਧਾਰਨ ਅਤੇ ਸੰਗਤ ਰੱਖੋ (ਟਾਈਮਸਟੈਂਪ, IDs, ਅਤੇ ਸਾਫ਼ ਇਵੈਂਟ ਨਾਮ)। ਫੈਸਲਾ ਕਰੋ ਕਿ ਤੁਸੀਂ ਸਕੀਮਾਂ ਨੂੰ ਪਹਿਲਾਂ ਤੋਂ ਲਾਗੂ ਕਰੋਗੇ ਜਾਂ ਸਮੇਂ-ਸਿਰ ਧੀਰੇ-ਧੀਰੇ ਵਿਕਸਤ ਕਰਨਗੇ।

ਪਦਰਹ 3: ਮਲਕੀਅਤ ਅਤੇ ਓਪਰੇਟਿੰਗ ਮੁਢਲੀ ਚੀਜਾਂ ਸਥਾਪਿਤ ਕਰੋ

Kafka ਉਸ ਵੇਲੇ ਸਫਲ ਹੁੰਦਾ ਹੈ ਜਦੋਂ ਕਿਸੇ ਕੋਲ ਮਲਕੀਅਤ ਹੁੰਦੀ ਹੈ:

ਟਾਪਿਕ ਬਣਾਉਣ ਅਤੇ ਨੈਮਿੰਗ ਰਿਵਾਜ
ਰਿਟੇਂਸ਼ਨ ਅਤੇ ਐਕਸੈਸ ਨੀਤੀਆਂ
ਓਨ-ਕਾਲ ਜ਼ਿੰਮੇਵਾਰੀਆਂ ਅਤੇ ਰਨਬੁੱਕ

ਫੁੱਲ-ਟੂ-ਅੰਤ ਮਾਨੀਟਰਿੰਗ (ਕਨਜ਼ਿਊਮਰ ਲੈਗ, ਬ੍ਰੋਕਰ ਸਿਹਤ, ਥਰੂਪੁੱਟ, ਐਰਰ ਰੇਟ) ਤੁਰੰਤ ਸ਼ੁਰੂ ਕਰੋ। ਜੇ ਤੁਹਾਡੇ ਕੋਲ ਹੋਰਾਂ ਪليਟਫਾਰਮ ਟੀਮ ਨਹੀਂ ਹੈ, ਤਾਂ ਪਹਿਲਾਂ ਮੈਨੇਜਡ ਸੇਵਾ ਲੈਓ ਅਤੇ ਸਪੱਸ਼ਟ ਸੀਮਾ ਤੈਅ ਕਰੋ।

ਪਦਰਹ 4: ਇੱਕ "ਪਤਲਾ" ਪਹਿਲਾ ਪਾਈਪਲਾਈਨ ਬਣਾਓ

ਇੱਕ ਸਿਸਟਮ ਤੋਂ ਇਵੈਂਟਸ ਪੈਦਾ ਕਰੋ, ਇੱਕ ਜਗ੍ਹਾ ਤੇ ਉਹਨਾਂ ਨੂੰ ਕਨਜ਼ਿਊਮ ਕਰੋ, ਅਤੇ ਲੂਪ ਨੂੰ ਐਂਡ-ਟੂ-ਐਂਡ ਸਾਬਿਤ ਕਰੋ। ਫਿਰ ਹੀ ਹੋਰ ਕਨਜ਼ਿਊਮਰਾਂ, ਪਾਰਟੀਸ਼ਨਾਂ ਅਤੇ ਇੰਟégrੇਸ਼ਨਾਂ ਵੱਲ ਵਧੋ।

ਜੇ ਤੁਸੀਂ ਤੇਜ਼ੀ ਨਾਲ "ਵਿਚਾਰ" ਤੋਂ ਕੰਮ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ Koder.ai ਵਰਗੇ ਟੂਲ ਤੁਹਾਨੂੰ ਆਲੇ-ਦੁਆਲੇ ਦੀ ਐਪ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਪ੍ਰੋਟੋਟਾਈਪ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦੇ ਹਨ (React UI, Go ਬੈਕਐਂਡ, PostgreSQL) ਅਤੇ ਗੱਲ-ਬਾਤ-ਆਧਾਰਿਤ ਵਰਕਫਲੋ ਰਾਹੀਂ Kafka ਪ੍ਰੋਡਿਊਸਰ/ਕਨਜ਼ਿਊਮਰ ਜੋੜ ਸਕਦੇ ਹਨ। ਇਹ ਖਾਸ ਤੌਰ 'ਤੇ ਅੰਦਰੂਨੀ ਡੈਸ਼ਬੋਰਡ ਅਤੇ ਹਲਕੇ-ਫੁਲਕੇ ਸੇਵਾਵਾਂ ਲਈ ਲਾਭਦਾਇਕ ਹੈ, ਜਿਸ ਵਿੱਚ ਯੋਜਨਾ ਮੋਡ, ਸੋర్స్ ਕੋਡ ਐਕਸਪੋਰਟ, ਡਿਪਲੋਇਮੈਂਟ/ਹੋਸਟਿੰਗ, ਅਤੇ ਰੋਲੇਬੈਕ ਨਾਲ ਸਨੇਪਸ਼ਾਟ ਵਰਗੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਹਨ।

ਜੇ ਤੁਸੀਂ ਇਸਨੂੰ ਇੱਕ ਇਵੈਂਟ-ਡਰਿਵਨ ਪਹੁੰਚ ਵਿੱਚ ਨਕਸ਼ਾ ਕਰ ਰਹੇ ਹੋ, ਤਾਂ ਵੇਖੋ /blog/event-driven-architecture। ਖ਼ਰਚਿਆਂ ਅਤੇ ਵਾਤਾਵਰਣਾਂ ਦੀ ਯੋਜਨਾ ਲਈ, ਦੇਖੋ /pricing.

ਅਕਸਰ ਪੁੱਛੇ ਜਾਣ ਵਾਲੇ ਸਵਾਲ

ਸਧਾਰਨ ਪੰਜਾਬੀ ਵਿੱਚ Apache Kafka ਕੀ ਹੈ?

Kafka ਇੱਕ ਵੰਡਿਆ ਹੋਇਆ ਇਵੈਂਟ-ਸਟ੍ਰੀਮਿੰਗ ਪਲੇਟਫਾਰਮ ਹੈ ਜੋ ਇਵੈਂਟਸ ਨੂੰ ਟਿਕਾਊ, ਐਪੈਂਡ-ਓਨਲੀ ਲੌਗਾਂ ਵਿੱਚ ਸਟੋਰ ਕਰਦਾ ਹੈ।

ਪ੍ਰੋਡਿਊਸਰ ਇਵੈਂਟਸ ਨੂੰ ਟਾਪਿਕਸ 'ਤੇ ਲਿਖਦੇ ਹਨ, ਅਤੇ ਕਨਜ਼ਿਊਮਰ ਉਹਨਾਂ ਨੂੰ ਸੁਤੰਤਰ ਰੂਪ ਵਿੱਚ ਪੜ੍ਹਦੇ ਹਨ (ਅਕਸਰ ਰੀਅਲ-ਟਾਈਮ ਵਿੱਚ, ਪਰ ਕਈ ਵਾਰੀ ਬਾਅਦ ਵੀ), ਕਿਉਂਕਿ Kafka ਜਾਣਕਾਰੀ ਨੂੰ ਨਿਰਧਾਰਤ ਸਮੇਂ ਲਈ ਰੱਖਦਾ ਹੈ।

ਕਿਸ ਵੇਲੇ ਇੱਕ ਟੀਮ ਸੇਵਾ-ਟੂ-ਸੇਵਾ ਸਿੱਧੇ ਕਾਲਾਂ ਦੀ ਥਾਂ Kafka ਚੁਣੇ?

ਜਦੋਂ ਕਈ ਸਿਸਟਮਾਂ ਨੂੰ ਇੱਕੋ ਹੀ ਇਵੈਂਟ ਸਟ੍ਰੀਮ ਦੀ ਲੋੜ ਹੋਵੇ, ਤੁਸੀਂ ਢਿੱਲੇ-ਢੰਗ ਨਾਲ ਜੋੜਤੋੜ ਚਾਹੁੰਦੇ ਹੋ, ਅਤੇ ਇਤਿਹਾਸ ਨੂੰ ਮੁੜ ਚਲਾਉਣ ਦੀ ਲੋੜ ਹੋ ਸਕਦੀ ਹੈ, ਤਾਂ Kafka ਵਰਤੋ।

ਇਹ ਖਾਸ ਤੌਰ 'ਤੇ ਮਦਦਗਾਰ ਹੈ:

ਇਵੈਂਟ-ਡਰਿਵਨ ਮਾਇਕ੍ਰੋਸਰਵਿਸਿਜ਼ (ਤੱਥ ਪ੍ਰਕਾਸ਼ਿਤ ਕਰੋ, ਅਸਿੰਕ੍ਰੋਨਸ ਤਰੀਕੇ ਨਾਲ ਪ੍ਰਤੀਕਿਰਿਆ ਕਰੋ)
ਰੀਅਲ-ਟਾਈਮ ਪਾਈਪਲਾਈਨਜ਼ ਨੂੰ ਐਨਾਲਿਟਿਕਸ/ਵੇਅਰਹਾਊਸ ਵੱਲ
ਐਕਟਿਵਿਟੀ ਟ੍ਰੈਕਿੰਗ, ਆਡਿਟ ਲੋਗਸ, ਅਤੇ ਬਰਸਟੀ ਟਰੈਫਿਕ ਵਾਲੀ ਟੈਲੀਮੀਟਰੀ

ਟਾਪਿਕ ਅਤੇ ਪਾਰਟੀਸ਼ਨ ਵਿੱਚ ਕੀ ਫ਼ਰਕ ਹੈ?

ਟਾਪਿਕ ਇਕ ਨਾਮਵਾਰ ਸ਼੍ਰੇਣੀ ਹੁੰਦੀ ਹੈ (ਜਿਵੇਂ orders ਜਾਂ payments)।

ਪਾਰਟੀਸ਼ਨ ਇੱਕ ਟਾਪਿਕ ਦੀ ਇੱਕ ਕੱਟ ਹੈ ਜੋ:

ਵੱਧ ਥਰੂਪੁੱਟ ਲਈ (ਲਿਖਾਈ/ਪੜ੍ਹਾਈ ਨੂੰ ਬ੍ਰੋਕਰਾਂ 'ਤੇ ਫੈਲਾਉਂਦਾ ਹੈ)
ਸਮਾਂਤਰੀ ਖਪਤ ਲਈ (ਇਕ ਗਰੂਪ ਵਿੱਚ ਕਈ ਕਨਜ਼ਿਊਮਰ)

Kafka ਸਿਰਫ਼ ਇੱਕ ਪਾਰਟੀਸ਼ਨ ਵਿੱਚ ਕ੍ਰਮ ਨੂੰ ਗਾਰੰਟੀ ਕਰਦਾ ਹੈ।

ਕੀਜ਼ ਅਨੁਕੂਲ ਕ੍ਰਮ ਅਤੇ ਸਕੇਲਿੰਗ 'ਤੇ ਕਿਵੇਂ ਪ੍ਰਭਾਵ ਪਾਉਂਦੇ ਹਨ?

Kafka ਰਿਕੌਰਡ ਕੀ (order_id ਵਰਗਾ) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਸੰਬੰਧਿਤ ਇਵੈਂਟਸ ਨੂੰ ਇੱਕੋ ਪਾਰਟੀਸ਼ਨ ਵਿੱਚ ਮੁਸੱਲਤ ਤੌਰ 'ਤੇ ਰੂਟ ਕਰਦਾ ਹੈ।

ਵਿਆਵਹਾਰਕ ਨਿਯਮ: ਜੇ ਤੁਹਾਨੂੰ ਪ੍ਰਤੀ-ਇਕਾਈ ਕ੍ਰਮ (ਜਿਵੇਂ ਇੱਕ ਆਰਡਰ/ਗਾਹਕ ਲਈ ਸਾਰੇ ਇਵੈਂਟਸ ਲੜੀਵਾਰ) ਦੀ ਲੋੜ ਹੈ, ਤਾਂ ਉਹੀ ਇਕਾਈ ਦਰਸਾਉਣ ਵਾਲਾ ਕੀ ਚੁਣੋ ਤਾਂ ਜੋ ਉਹ ਇਵੈਂਟਸ ਇੱਕ ਪਾਰਟੀਸ਼ਨ ਵਿੱਚ ਜਾ ਸਕਣ।

ਕਨਜ਼ਿਊਮਰ ਗਰੂਪ ਕੀ ਹੈ ਅਤੇ ਇਹ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹੈ?

ਕਨਜ਼ਿਊਮਰ ਗਰੂਪ ਉਹ ਕਨਜ਼ਿਊਮਰ ਇੰਸਟੈਂਸਾਂ ਦਾ ਸਮੂਹ ਹੈ ਜੋ ਇੱਕ ਟਾਪਿਕ ਲਈ ਕੰਮ ਸਾਂਝਾ ਕਰਦੇ ਹਨ।

ਇੱਕ ਗਰੂਪ ਦੇ ਅੰਦਰ:

ਹਰ ਪਾਰਟੀਸ਼ਨ ਇੱਕ ਸਮੇਂ 'ਤੇ ਘੱਟੋ-ਘੱਟ ਇੱਕ ਇੰਸਟੈਂਸ ਦੁਆਰਾ ਪ੍ਰੋਸੈਸ ਹੁੰਦੀ ਹੈ
ਇੰਸਟੈਂਸ ਵਧਾਉਣ ਨਾਲ ਸਮਾਂਤਰੀਤਾ ਵਧਦੀ ਹੈ ਪਾਰਟੀਸ਼ਨਾਂ ਦੀ ਗਿਣਤੀ ਤੱਕ

ਜੇ ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਦੋ ਵੱਖ-ਵੱਖ ਐਪ ਹਰ ਇਵੈਂਟ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ, ਤਾਂ ਉਹਨਾਂ ਨੂੰ ਵੱਖ-ਵੱਖ ਕਨਜ਼ਿਊਮਰ ਗਰੂਪ ਵਰਤਣੇ ਚਾਹੀਦੇ ਹਨ।

Kafka ਕਿੰਨਾ ਸਮਾਂ ਡੇਟਾ ਰੱਖਦਾ ਹੈ, ਅਤੇ ਰਿਟੇਂਸ਼ਨ ਦਾ ਕੀ ਉਦੇਸ਼ ਹੈ?

Kafka ਡਿਸਕ 'ਤੇ ਟਾਪਿਕ ਨੀਤੀਆਂ ਦੇ ਅਨੁਸਾਰ ਇਵੈਂਟਸ ਰੱਖਦਾ ਹੈ, ਤਾਂ ਜੋ ਕਨਜ਼ਿਊਮਰ ਡਾਊਨ ਹੋਣ 'ਤੇ ਵੀ ਕੈਚ ਅੱਪ ਕਰ ਸਕਣ ਜਾਂ ਇਤਿਹਾਸ ਨੂੰ ਮੁੜ ਪ੍ਰੋਸੈਸ ਕਰ ਸਕਣ।

ਆਮ ਰਿਟੇਂਸ਼ਨ ਕਿਸਮਾਂ:

ਸਮੇਂ-ਅਧਾਰਿਤ (ਕੁਝ ਦਿਨਾਂ ਲਈ ਰੱਖੋ)
ਆਕਾਰ-ਅਧਾਰਿਤ (ਲੌਗ N GB ਤੱਕ ਹੋਣ ਤੱਕ)

ਰਿਟੇਂਸ਼ਨ ਪ੍ਰਤੀ-ਟਾਪਿਕ ਕਨਫਿਗਰ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਇਸ ਲਈ ਆਡਿਟ ਟ੍ਰੇਲ ਵਰਗੇ ਟਾਪਿਕਜ਼ ਨੂੰ ਉੱਚ ਰਿਟੇਂਸ਼ਨ ਦਿੱਤੀ ਜਾ ਸਕਦੀ ਹੈ।

ਲੌਗ ਕੰਪੈਕਸ਼ਨ ਕੀ ਹੈ, ਅਤੇ ਇਹ ਆਮ ਰਿਟੇਂਸ਼ਨ ਨਾਲੋਂ ਕਦੋਂ ਵਧੀਆ ਹੈ?

ਲੌਗ ਕੰਪੈਕਸ਼ਨ ਹਰ ਕੀ ਲਈ ਘੱਟੋ-ਘੱਟ ਨਾਲੋਂ ਨਵਾਂ ਰਿਕੌਰਡ ਰੱਖਦੀ ਹੈ, ਅਤੇ ਸਮੇਂ ਦੇ ਨਾਲ ਪੁਰਾਣੇ ਪ੍ਰਵਰਤਤ ਰਿਕੌਰਡ ਹਟਾਏ ਜਾ ਸਕਦੇ ਹਨ।

ਇਹ "ਮੌਜੂਦਾ ਸਥਿਤੀ" ਸਟ੍ਰੀਮਾਂ (ਜਿਵੇਂ ਸੈਟਿੰਗਜ਼ ਜਾਂ ਪ੍ਰੋਫਾਈਲ) ਲਈ ਵਧੀਆ ਹੈ ਜਿੱਥੇ ਤੁਹਾਨੂੰ ਹਰ ਇਤਿਹਾਸਿਕ ਬਦਲਾਅ ਦੀ ਲੋੜ ਨਹੀਂ, ਸਗੋਂ ਹਰ ਕੀ ਦਾ ਤਾਜ਼ਾ ਮੁੱਲ ਚਾਹੀਦਾ ਹੈ।

ਕੀ Kafka ਇਵੈਂਟਸ ਨੂੰ ਬਿਲਕੁਲ ਇਕ ਵਾਰੀ ਹੀ ਡਿਲਿਵਰ ਕਰੇਗਾ?

Kafka ਦਾ ਆਮ ਸਮਾਪਤੀ ਪੈਟਰਨ ਅਟ-ਲੀਸਟ-ਓਨਸ ਹੈ: ਤੁਸੀਂਈਵੈਂਟਸ ਖੋਵੋਗੇ ਨਹੀਂ, ਪਰ ਡੁਪਲੀਕੇਟ ਹੋ ਸਕਦੇ ਹਨ।

ਇਸ ਨੂੰ ਸੁਰੱਖਿਅਤ ਬਣਾਉਣ ਲਈ:

ਕਨਜ਼ਿਊਮਰਾਂ ਨੂੰ ਆਈਡੈਂਟਿਪੋਟੈਂਟ ਬਣਾਓ (ਉਸੇ ਇਵੈਂਟ ਨੂੰ ਦੁਬਾਰਾ ਲਾਗੂ ਕਰਨ 'ਤੇ ਵੀ ਅවිਕਾਰੀ ਨਤੀਜਾ)
ਜ਼ਰੂਰੀ ਹੋਵੇ ਤਾਂ ਯੂਨੀਕ ਇਵੈਂਟ ਆਈਡੀ ਜਾਂ ਬਿਜ਼ਨਸ ਕੀ ਨਾਲ ਡਿਡੁਪ ਕੀਤਾ ਜਾਵੇ
ਕੰਮ ਮੁਕੰਮਲ ਹੋਣ ਦੇ ਬਾਅਦ ਆਫਸੈਟਸ ਕਮੇਟ ਕਰੋ ਤਾਂ ਕਿ ਘੱਟ ਨੁਕਸਾਨ ਹੋਵੇ

ਕਨਜ਼ਿਊਮਰ ਆਫਸੈਟਸ ਕੀ ਹਨ, ਅਤੇ ਰੀਟ੍ਰਾਈਜ਼ ਤੇ ਡੈਡ-ਲੇਟਰ ਟਾਪਿਕ ਕਿਵੇਂ ਫਿੱਟ ਹੁੰਦੇ ਹਨ?

ਆਫਸੈਟ ਇੱਕ ਪਾਰਟੀਸ਼ਨ ਵਿੱਚ ਆਖ਼ਰੀ ਪ੍ਰੋਸੈਸ ਕੀਤੇ ਰਿਕੌਰਡ ਦੀ ਪੋਜ਼ੀਸ਼ਨ ਹੁੰਦੀ ਹੈ।

ਜੇ ਤੁਸੀਂ ਆਫਸੈਟਸ ਬਹੁਤ ਜਲਦੀ ਕਮੇਟ ਕਰਦੇ ਹੋ ਤਾਂ ਕ੍ਰੈਸ਼ ਹੋਣ 'ਤੇ ਕੰਮ ਗੁੰਮ ਹੋ ਸਕਦਾ ਹੈ; ਬਹੁਤ ਦੇਰ ਨਾਲ ਕਮੇਟ ਕਰਨ 'ਤੇ ਰੀ-ਪ੍ਰੋਸੈਸ ਹੋਵੇਗਾ ਅਤੇ ਡੁਪਲੀਕੇਟ ਹੋ ਸਕਦੇ ਹਨ।

ਆਮ ਘਟਨਾ-ਹੱਲ: ਸੀਮਿਤ ਬੈਕਆਫ ਨਾਲ ਰੀਟ੍ਰਾਈਜ਼, ਫੇਲ ਹੋਣ ਵਾਲੇ ਰਿਕਾਰਡ ਨੂੰ ਇਕ ਡੈਡ-ਲੇਟਰ ਟਾਪਿਕ 'ਚ ਭੇਜੋ ਤਾਂ ਕਿ ਇੱਕ ਪੋਇਜ਼ਨ ਮੈਸੇਜ ਸਾਰੇ ਕਨਜ਼ਿਊਮਰ ਗਰੂਪ ਨੂੰ ਬਲਾਕ ਨਾ ਕਰੇ।

Kafka Connect ਅਤੇ Kafka Streams ਕੀ ਹਨ, ਅਤੇ ਮੈਂ ਕਦੋਂ ਕਿਹੜਾ ਵਰਤਾਂ?

Kafka Connect ਡੇਟਾ ਨੂੰ Kafka ਵਿੱਚ ਲਿਆਉਣ ਅਤੇ Kafka ਤੋਂ ਬਾਹਰ ਭੇਜਣ ਲਈ ਕਨੈਕਟਰਾਂ ਨਾਲ ਇੱਕ ਇੰਟੇਗ੍ਰੇਸ਼ਨ ਫਰੇਮਵਰਕ ਹੈ—ਇਸ ਨਾਲ ਕਸਟਮ ਪਾਈਪਲਾਈਨ ਕੋਡ ਦੀ ਲੋੜ ਘੱਟ ਹੁੰਦੀ ਹੈ।

Kafka Streams ਇੱਕ ਲਾਇਬ੍ਰੇਰੀ ਹੈ ਜੋ ਤੁਹਾਡੇ ਐਪ ਵਿੱਚ ਰੀਅਲ-ਟਾਈਮ ਸਟ੍ਰੀਮ ਪ੍ਰੋਸੈਸਿੰਗ ਕਰਨ ਲਈ ਵਰਤੀ ਜਾਂਦੀ ਹੈ (ਫਿਲਟਰ, ਜੁੜਾਈ, ਐਨਰਿਚ, ਐਗਰੀਗੇਟ)।

ਸਰਲ ਨਿਯਮ: Connect ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਲਈ; Streams ਗਣਨਾ ਲਈ।