NoSQL ਡੇਟਾਬੇਸ ਕਿਵੇਂ ਉਭਰੇ—ਸਕੇਲਿੰਗ ਅਤੇ ਲਚੀਲਾਪਨ ਦਾ ਹੱਲ

Q: What was NoSQL originally trying to solve?

NoSQL ਨੇ ਦੋ ਆਮ ਦਬਾਵਾਂ ਦਾ ਹੱਲ ਲੱਭਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ: - ਸਕੇਲ : ਉੱਚ ਲੇਵਲ ਦੀ ਲਿਖਾਈ, ਟ੍ਰੈਫਿਕ ਵਿੱਚ ਧੱਕੇ ਅਤੇ ਐਸੇ ਡਾਟਾਸੇਟ ਜੋ ਇਕ ਇਕੱਲੇ "ਵੱਡੇ ਸਰਵਰ" ਤੋਂ ਵੱਧ ਹਨ। - ਬਦਲਾਅ : ਤੇਜ਼ੀ ਨਾਲ ਬਦਲ ਰਹੀਆਂ ਪ੍ਰੋਡਕਟ ਲੋੜਾਂ ਜਿਨ੍ਹਾਂ ਨੇ ਰਿਲੇਸ਼ਨਲ ਸਕੀਮਾ ਮਾਈਗ੍ਰੇਸ਼ਨਾਂ ਨੂੰ ਮਹਿੰਗਾ ਅਤੇ ਖਤਰਨਾਕ ਬਣਾਇਆ। ਇਹ ਦੱਸਣਾ ਮੁੱਖ ਹੈ ਕਿ ਇਹ ਇਸ ਲਈ ਨਹੀਂ ਸੀ ਕਿ SQL "ਖਰਾਬ" ਸੀ—ਬੱਸ ਵੱਖ-ਵੱਖ ਵਰਕਲੋਡ ਵੱਖ-ਵੱਖ ਟਰੇਡ-ਆਫ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦੇ ਹਨ।

Q: Why did scaling a single relational database server start to break down?

ਪ੍ਰੰਪਰਾਗਤ "ਸਕੇਲ-ਅੱਪ" ਤਰਕ ਸਾਡੇ ਲਈ ਹੇਠਾਂ ਆ ਗਿਆ: - ਮਹਿੰਗਾ ਹਾਈ-ਐਂਡ ਹਾਰਡਵੇਅਰ ਅਤੇ ਅਪਗਰੇਡ ਡਿਸਰਪਟਿਵ ਹੁੰਦੇ ਹਨ। - ਇਕੱਲਾ ਮਸ਼ੀਨ ਲਿਖਾਈ, ਡਿਸਕ ਅਤੇ ਫੇਲਓਵਰ ਲਈ ਬੋਤਲਨੈਕ ਬਣ ਜਾਂਦਾ ਹੈ। - ਪ੍ਰਧਾਨ ਡੇਟਾਬੇਸ ਇੱਕ ਖੇਤਰ ਵਿੱਚ ਹੋਣ ਕਾਰਨ ਗਲੋਬਲ ਯੂਜ਼ਰਾਂ ਲਈ ਲੈਟੈਂਸੀ ਵਧ ਜਾਂਦੀ ਹੈ। NoSQL ਸਿਸਟਮਾਂ ਨੇ ਬਾਕੀ ਦੇ ਢਾਂਚੇ 'ਤੇ ਨੋਡ ਜੋੜ ਕੇ ਸਕੇਲ ਆਊਟ ਦੀ ਔਖੀਨ ਨੂੰ ਸਵੀਕਾਰ ਕੀਤਾ।

Q: How do I choose between key-value, document, wide-column, and graph databases?

- Key-value : ID ਦੇ ਨਾਲ ਸਭ ਤੋਂ ਤੇਜ਼ ਲੁੱਕਅਪ (sessions, caching, feature flags)। - Document : ਲਚਕੀਲੇ JSON-ਵਾਂਗ ਰਿਕਾਰਡ (profiles, catalogs, content)। - Wide-column : ਬਹੁਤ ਵੱਡੀ ਲਿਖਾਈ ਦੀ ਰਫ਼ਤਾਰ (events, logs, time-series)। - Graph : ਰਿਸ਼ਤਿਆਂ ਦੀ ਖੋਜ (recommendations, fraud rings, dependency graphs)। ਆਪਣੀਆਂ ਡੋਮਿਨ-ਸਪੈਸੀਫਿਕ ਐਕਸੈਸ ਪੈਟਰਨਸ ਦੇ ਅਧਾਰ 'ਤੇ ਚੁਣੋ—ਨਾਮ ਹੀ ਨਹੀਂ।

ਲੌਗ ਇਨ ਸ਼ੁਰੂ ਕਰੋ

NoSQL ਡੇਟਾਬੇਸ ਕਿਵੇਂ ਉਭਰੇ—ਸਕੇਲਿੰਗ ਅਤੇ ਲਚੀਲਾਪਨ ਦਾ ਹੱਲ | Koder.ai

NoSQL ਕਿਸ ਸਮੱਸਿਆ ਦਾ ਹੱਲ ਕਰਨ ਲਈ ਉਭਰਿਆ?

NoSQL ਉੱਥੇ ਉਭਰਿਆ ਜਦੋਂ ਕਈ ਟੀਮਾਂ ਨੇ ਪਾਇਆ ਕਿ ਉਹਨਾਂ ਦੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀਆਂ ਲੋੜਾਂ ਅਤੇ ਰਵਾਇਤੀ ਰਿਲੇਸ਼ਨਲ ਡੇਟਾਬੇਸਾਂ (SQL ਡੇਟਾਬੇਸ) ਦੀਆਂ ਔਪਟੀਮਾਈਜ਼ੇਸ਼ਨਾਂ ਵਿਚਕਾਰ ਮੇਲ ਨਹੀਂ ਰਿਹਾ। SQL "ਫੇਲ" ਨਹੀਂ ਹੋਇਆ—ਪਰ ਵੈੱਬ ਸਕੇਲ 'ਤੇ ਕੁਝ ਟੀਮਾਂ ਨੇ ਵੱਖ-ਵੱਖ ਲਕੜੀਆਂ ਨੂੰ ਜ਼ਿਆਦਾ ਤਰਜੀਹ ਦਿੱਤੀ।

ਦੋ ਦਬਾਵ: ਸਕੇਲ ਅਤੇ ਬਦਲਾਅ

ਸਭ ਤੋਂ ਪਹਿਲਾਂ, ਸਕੇਲ। ਲੋਕਪ੍ਰਿਯ ਉਪਭੋਗੀ ਐਪਾਂ ਨੂੰ ਟ੍ਰੈਫਿਕ ਦੇ ਧੱਕੇ, ਲਗਾਤਾਰ ਲਿਖਾਈਆਂ ਅਤੇ ਵੱਡੇ ਪੈਮਾਨੇ 'ਤੇ ਯੁਜ਼ਰ-ਜਨਰੇਟਿਡ ਡਾਟਾ ਮਿਲਣ ਲੱਗਿਆ। ਇਨ੍ਹਾਂ ਵਰਕਲੋਡਾਂ ਲਈ، "ਸਿਰਫ਼ ਵੱਡਾ ਸਰਵਰ ਖਰੀਦੋ" ਮਹਿੰਗਾ, ਲਾਗੂ ਕਰਨ ਵਿੱਚ ਢੀਰ ਅਤੇ ਆਖ਼ਿਰਕਾਰ ਸਭ ਤੋਂ ਵੱਡੀ ਮਸ਼ੀਨ ਤੱਕ ਸੀਮਿਤ ਹੋ ਗਿਆ।

ਦੂਜਾ, ਬਦਲਾਅ। ਪ੍ਰੋਡਕਟ ਫੀਚਰ ਤੇਜ਼ੀ ਨਾਲ ਵਿਕਸਤ ਹੁੰਦੇ ਸਨ, ਅਤੇ ਉਹਨਾਂ ਦੇ ਮੂਹਰੇ ਡਾਟਾ ਹਮੇਸ਼ਾ ਇੱਕ ਕਠੋਰ ਟੇਬਲ ਸੈੱਟ ਵਿੱਚ ਫਿੱਟ ਨਹੀਂ ਕਰਦੇ। ਯੂਜ਼ਰ ਪ੍ਰੋਫ਼ਾਈਲ ਵਿੱਚ ਨਵੇਂ ਗੁਣ ਜੋੜਨਾ, ਕਈ ਈਵੈਂਟ ਕਿਸਮਾਂ ਸੰਭਾਲਣਾ, ਜਾਂ ਵੱਖ-ਵੱਖ ਸੋਰਸਾਂ ਤੋਂ ਅਰਧ-ਸੰਰਚਿਤ JSON ਲੈਣਾ ਅਕਸਰ ਵਾਰ-ਵਾਰ ਸਕੀਮਾ ਮਾਈਗ੍ਰੇਸ਼ਨ ਅਤੇ ਟੀਮ-ਸਹਯੋਗ ਮੰਗਦਾ।

ਕੁਝ ਮਾਮਲਿਆਂ ਵਿੱਚ ਰਿਲੇਸ਼ਨਲ ਡੇਟਾਬੇਸ ਕਿਉਂ ਮੁਸ਼ਕਲ੍ਹ ਬਣੇ

ਰਿਲੇਸ਼ਨਲ ਡੇਟਾਬੇਸਾਂ ਬਣਤਰ ਨੂੰ ਲਾਗੂ ਕਰਨ ਅਤੇ ਸੰਗੀਨ ਕਵੇਰੀਆਂ ਕਰਨ ਵਿੱਚ ਮਹਿਰ ਹਨ। ਪਰ ਕੁਝ ਹਾਈ-ਸਕੇਲ ਵਰਕਲੋਡ ਨੇ ਇਹ ਫਾਇਦੇ ਲੈਣਾ ਔਖਾ ਕਰ ਦਿੱਤਾ:

ਬਹੁਤ ਸਾਰੀਆਂ ਸਮਕਾਲੀ ਲਿਖਾਈਆਂ ਕਈ ਟੇਬਲਾਂ 'ਤੇ ਤਣਾਅ ਪੈਦਾ ਕਰ ਸਕਦੀਆਂ ਹਨ।
ਭਾਰੀ ਜੋਇਨ-ਅਧਾਰਿਤ ਕਵੇਰੀਆਂ ਡਾਟਾ ਵਧਣ ਨਾਲ ਮਹਿੰਗੀਆਂ ਹੋ ਸਕਦੀਆਂ ਹਨ।
ਕਈ ਮਸ਼ੀਨਾਂ 'ਤੇ ਸਕੇਲ ਆਊਟ ਕਰਨਾ ਸੰਭਵ ਹੈ, ਪਰ ਸਖਤ ਕਾਂਸਿਸਟੈਂਸੀ ਰੱਖਦਿਆਂ ਓਪਰੇਸ਼ਨ ਚਲਾਉਣਾ ਜ਼ਿਆਦਾ ਜਟਿਲ ਹੋ ਸਕਦਾ ਹੈ।

ਨਤੀਜਾ: ਕੁਝ ਟੀਮਾਂ ਨੇ ਇਹ ਸੋਚਿਆ ਕਿ ਕੁਝ ਗਾਰੰਟੀਜ਼ ਅਤੇ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਤਿਆਗ ਕੇ ਉਹਨਾਂ ਨੂੰ ਸਰਲ ਸਕੇਲਿੰਗ ਅਤੇ ਤੇਜ਼ ਇਟਰੇਸ਼ਨ ਮਿਲ ਸਕਦਾ ਹੈ।

NoSQL: ਇੱਕ ਪਰਿਵਾਰਿਕ ਪਹੁੰਚ, ਇੱਕ ਚੀਜ਼ ਨਹੀਂ

NoSQL ਇੱਕ ਏਕ-ਡੇਟਾਬੇਸ ਜਾਂ ਡਿਜ਼ਾਈਨ ਨਹੀਂ ਹੈ। ਇਹ ਐਸੇ ਸਿਸਟਮਾਂ ਲਈ ਛਤਰੀ ਸ਼ਬਦ ਹੈ ਜੋ ਇਹਨਾਂ ਗੁਣਾਂ ਨੂੰ ਜ਼ੋਰ ਦਿੰਦੇ ਹਨ:

ਹੋਰੀਜ਼ੌਂਟਲ ਸਕੇਲਿੰਗ (ਹੋਰ ਮਸ਼ੀਨਾਂ ਜੋੜਨਾ)
ਲਚਕੀਲੇ ਡੇਟਾ ਮਾਡਲ
ਖਾਸ ਐਪਲੀਕੇਸ਼ਨ ਲੋੜਾਂ ਲਈ ਅਨੁਕੂਲ ਐਕਸੈਸ ਪੈਟਰਨ

ਉਮੀਦਾਂ 'ਤੇ ਇੱਕ ਰੀਸੈੱਟ

NoSQL ਕਦੇ ਵੀ SQL ਲਈ ਬਿਲਕੁਲ ਬਦਲ ਨਹੀਂ ਸੀ ਮੰਨਿਆ ਗਿਆ। ਇਹ ਟਰੇਡ-ਆਫ ਦਾ ਸਮੂਹ ਹੈ: ਤੁਸੀਂ ਸਕੇਲਿੰਗ ਜਾਂ ਸਕੀਮਾ ਲਚਕੀਲਾਪਨ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੇ ਹੋ, ਪਰ ਤੁਸੀਂ ਕਾਨਸਿਸਟੈਂਸੀ ਦੀਆਂ ਕਮਜ਼ੋਰੀਆਂ, ਘੱਟ-ਆਜ਼ਾਦ-ਕਵੇਰੀ ਵਿਕਲਪਾਂ, ਜਾਂ ਐਪ-ਪੱਧਰੀ ਡੇਟਾ ਮਾਡਲਿੰਗ ਵਿੱਚ ਵੱਧ ਜ਼ਿੰਮੇਵਾਰੀ ਨੂੰ ਸਵੀਕਾਰ ਕਰ ਸਕਦੇ ਹੋ।

ਰਵਾਇਤੀ ਸਕੇਲਿੰਗ ਕਿਉਂ ਟੁੱਟਣ ਲੱਗੀ

ਸਾਲਾਂ ਲਈ, ਇੱਕ ਸਲੋ ਡੇਟਾਬੇਸ ਦਾ ਸਧਾਰਨ ਜਵਾਬ ਸਪਸ਼ਟ ਸੀ: ਵੱਡਾ ਸਰਵਰ ਖਰੀਦੋ। ਵਧੇਰੇ CPU, ਵੱਧ RAM, ਤੇਜ਼ ਡਿਸਕ, ਅਤੇ ਉਹੀ ਸਕੀਮਾ ਅਤੇ ਓਪਰੇਸ਼ਨਲ ਮਾਡਲ ਰੱਖੋ। ਇਹ "ਸਕੇਲ-ਅੱਪ" ਤਰੀਕਾ ਚੱਲਦਾ ਰਿਹਾ—ਜਦ ਤੱਕ ਇਹ ਪ੍ਰਯੋਗੀ ਨਹੀਂ ਰਿਹਾ।

ਵਰਟੀਕਲ ਸਕੇਲਿੰਗ ਨੂੰ ਸਖਤ ਸੀਮਾਵਾਂ ਦਾ ਸਾਹਮਣਾ

ਉੱਚ-ਅੰਤ ਦੀਆਂ ਮਸ਼ੀਨیں ਜਲਦੀ ਮਹਿੰਗੀਆਂ ਹੋ ਜਾਂਦੀਆਂ ਹਨ, ਅਤੇ ਮੁੱਲ/ਪ੍ਰਦਰਸ਼ਨ ਘੱਟ ਹੋ ਜਾਂਦਾ ਹੈ। ਅਪਗਰੇਡ ਅਕਸਰ ਵੱਡੇ, ਘੱਟ-ਬਾਰੰਬਾਰ ਬਜਟ ਮਨਜ਼ੂਰੀਆਂ ਅਤੇ ਡਾਟਾ ਹਿਲਾਉਣ ਤੇ ਕੰਮ-ਕੱਟ ਕਰਨ ਲਈ ਮਾਇੰਟੇਨੈਂਸ ਵਿੰਡੋਆਂ ਮੰਗਦੇ ਹਨ। ਜੇ ਤੁਸੀਂ ਵੱਡਾ ਹਾਰਡਵੇਅਰ ਖਰੀਦ ਵੀ ਸਕਦੇ ਹੋ, ਇੱਕ ਇਕੱਲਾ ਸਰਵਰ ਫਿਰ ਵੀ ਇਕ ਸੀਲਿੰਗ ਹੋਵੇਗਾ: ਇੱਕ ਮੈਮੋਰੀ ਬੱਸ, ਇੱਕ ਸਟੋਰੇਜ ਸਿਸਟਮ, ਅਤੇ ਇੱਕ ਪ੍ਰਾਇਮਰੀ ਨੋਡ ਜੋ ਲਿਖਾਈ ਦੇ ਵੋਲੇਅਮ ਨੂੰ ਅਟੈਂਡ ਕਰਦਾ ਹੈ।

ਵਾਧੇ ਨੇ ਵਰਕਲੋਡ ਦੀ ਸ਼ਕਲ ਬਦਲੀ

ਜਿਵੇਂ-ਜਿਵੇਂ ਪ੍ਰੋਡਕਟ ਵਧੇ, ਡੇਟਾਬੇਸ 24/7 ਪੜ੍ਹਾਈ/ਲਿਖਾਈ ਦੇ ਦਬਾਅ ਨਾਲ ਸਾਹਮਣਾ ਕਰਨ ਲੱਗੇ। ਟ੍ਰੈਫਿਕ ਸਚਮੁੱਚ ਸਥਿਰ ਹੋ ਗਿਆ, ਅਤੇ ਕੁਝ ਫੀਚਰ ਅਨੇਕ ਅਨੁਪਾਤੀ ਪਹੁੰਚ ਪੈਟਰਨ ਬਣਾਉਂਦੇ। ਕੁਝ ਘੱਟ-ਮਾਤਰਾ ਵਾਲੀਆਂ ਬਹੁਤ ਜ਼ਿਆਦਾ ਐਕਸੈੱਸ ਕੀਤੀਆਂ ਰੋਜ਼/ਪਾਰਟਿਸ਼ਨਾਂ ਸਾਰੇ ਟ੍ਰੈਫਿਕ ਨੂੰ ਘੇਰ ਸਕਦੀਆਂ ਹਨ, ਜਿਸ ਨਾਲ hot tables ਜਾਂ hot keys ਬਣਦੇ ਜੋ ਹੋਰ ਕੁਝ ਸੁਥਰੇ ਕੰਮ ਨੂੰ ਖਿੱਚਦੇ।

ਓਪਰੇਸ਼ਨਲ ਬੋਤਲਨੈਕ ਆਮ ਹੋ ਗਏ:

ਨਵੀਆਂ ਫੀਚਰਾਂ ਨਾਲ ਸੈਕੰਡਰੀ ਇੰਡੈਕਸ ਦਾ ਫੂਲਣਾ
ਇਕੱਠੇ ਕੰਮ ਕਰਨ ਵਾਲੇ ਬਹੁਤ ਸਾਰੇ ਲਿਖਾਈਆਂ ਤੋਂ ਤਣਾਅ
ਲਾਕ ਵੈਟਸ ਜੋ ਲੋਡ ਹੇਠਾਂ ਲੈਟੈਂਸੀ ਨੂੰ ਅਣਪ੍ਰੀਡਿਕਟੇਬਲ ਬਣਾਉਂਦੇ
ਡਾਟਾਸੇਟ ਵਧਣ ਨਾਲ ਰੀਪਲੀਕੇਸ਼ਨ ਲੈਗ ਅਤੇ ਹੌਲੀ ਫੇਲਓਵਰ

ਵੱਡੇ ਸਰਵਰ ਗਲੋਬਲ ਉਪਲਬਧਤਾ ਨਹੀਂ ਸੁਧਾਰਦੇ

ਕਈ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਸਿਰਫ਼ ਇੱਕ ਡੇਟਾ ਸੈਂਟਰ ਵਿੱਚ ਤੇਜ਼ ਹੋਣ ਦੀ ਲੋੜ ਨਹੀਂ ਸੀ—ਉਹਨਾਂ ਨੂੰ ਕਈ ਖੇਤਰਾਂ ਵਿੱਚ ਉਪਲਬਧ ਹੋਣਾ ਲਾਜ਼ਮੀ ਸੀ। ਇੱਕ ਇਕੱਲਾ "ਮੁੱਖ" ਡੇਟਾਬੇਸ ਇੱਕ ਥਾਂ ਤੇ ਰੱਖਣਾ ਦੂਰੇ ਯੂਜ਼ਰਾਂ ਲਈ ਲੈਟੈਂਸੀ ਵਧਾਉਂਦਾ ਅਤੇ ਆਉਟੇਜ ਨੂੰ ਹੋਰ ਵੀ ਭਿਆਨਕ ਬਣਾਉਂਦਾ। ਸਵਾਲ ਬਦਲ ਗਿਆ: "ਅਸੀਂ ਵੱਡਾ ਬਾਕਸ ਕਿਵੇਂ ਖਰੀਦਾਂ?" ਦੀ ਥਾਂ "ਅਸੀਂ ਡੇਟਾਬੇਸ ਕਈ ਮਸ਼ੀਨਾਂ ਅਤੇ ਖੇਤਰਾਂ 'ਚ ਕਿਵੇਂ ਚਲਾਈਏ?"।

ਲਚਕੀਲੇ ਡੇਟਾ ਮਾਡਲਾਂ ਦੀ ਲੋੜ

ਰਿਲੇਸ਼ਨਲ ਡੇਟਾਬੇਸ ਉਦੋਂ ਜ਼ਿਆਦਾ ਚਮਕਦੇ ਹਨ ਜਦੋਂ ਤੁਹਾਡਾ ਡੇਟਾ ਆਕਾਰ ਸਥਿਰ ਹੋਵੇ। ਪਰ ਕਈ ਆਧੁਨਿਕ ਉਤਪਾਦ ਇੱਕਥੈ ਨਹੀਂ ਰਹਿੰਦੇ। ਇੱਕ ਟੇਬਲ ਸਕੀਮਾ ਸਖਤ ਹੁੰਦਾ ਹੈ: ਹਰ ਚਰ ਰਹਿ ਇੱਕੋ ਹੀ ਕਾਲਮ, ਕਿਸਮਾਂ ਅਤੇ ਕੰਸਟ੍ਰੇੰਟ ਫੋਲੋ ਕਰਦੀ ਹੈ। ਇਹ ਪੇਸ਼ਗੀ ਕੀਮਤੀ ਹੈ—ਜਦ ਤੱਕ ਤੁਸੀਂ ਤੇਜ਼ੀ ਨਾਲ ਇਤਰੈਟ ਨਹੀਂ ਕਰ ਰਹੇ।

ਕਠੋਰ ਸਕੀਮਾਂ ਅਤੇ ਬਦਲਾਅ ਦੀ ਅਸਲੀ ਲਾਗਤ

ਅਮਲੀ ਰੂਪ ਵਿੱਚ, ਬਾਰੰਬਾਰ ਸਕੀਮਾ ਬਦਲਾਅ ਮਹਿੰਗੇ ਹੋ ਸਕਦੇ ਹਨ। ਇੱਕ ਛੋਟਾ ਅਪਡੇਟ ਵੀ ਮਾਈਗ੍ਰੇਸ਼ਨ, ਬੈਕਫਿਲ, ਇੰਡੈਕਸ ਅਪਡੇਟ, ਕੋਆਰਡੀਨੇਟਡ ਡੀਪਲੋਇਮੈਂਟ ਸਮਾਂ, ਅਤੇ ਪੁਰਾਣੇ ਕੋਡ ਰਾਹਾਂ ਦੀ ਸੰਗਤਤਾ ਦੀ ਯੋਜਨਾ ਮੰਗ ਸਕਦਾ ਹੈ। ਵੱਡੇ ਟੇਬਲਾਂ 'ਤੇ ਕਾਲਮ ਜੋੜਨਾ ਜਾਂ ਕਿਸਮ ਬਦਲਣਾ ਜੰਚੀ ਕਾਰਵਾਈ ਬਣ ਸਕਦੀ ਹੈ ਜਿਸ ਵਿੱਚ ਵਾਸਤਵਿਕ ਓਪਰੇਸ਼ਨਲ ਜੋਖਮ ਹੁੰਦਾ ਹੈ।

ਇਹ ਘਰੜ ਟੀਮਾਂ ਨੂੰ ਬਦਲਾਅ ਦੈਰ ਕਰਨ, ਵਰਕਅਰਾਊਂਡ ਇਕੱਤਰ ਕਰਨ ਜਾਂ ਟੈਕਸਟ ਫੀਲਡਾਂ ਵਿੱਚ ਗੱਦੀ-ਭਰੀਆਂ ਬਲੋਬਾਂ ਸਟੋਰ ਕਰਨ ਵੱਲ ਧੱਕਦਾ—ਜੋ ਤੇਜ਼ ਇਟਰੇਸ਼ਨ ਲਈ ਆਦਰਸ਼ ਨਹੀਂ।

ਅਰਧ-ਸੰਰਚਿਤ ਡੇਟਾ ਪ੍ਰੋਡਕਟ ਦੇ ਵਿਕਾਸ ਨੂੰ ਫਿੱਟ ਕਰਦਾ ਹੈ

ਬਹੁਤ ਸਾਰਾ ਐਪਲੀਕੇਸ਼ਨ ਡੇਟਾ ਕੁਦਰਤੀ ਤੌਰ 'ਤੇ ਅਰਧ-ਸੰਰਚਿਤ ਹੁੰਦਾ ਹੈ: ਨੇਸਟਡ ਆਬਜੈਕਟਸ, ਵਿਕਲਪਿਕ ਫੀਲਡ, ਅਤੇ ਐਤਰੇ-ਟਾਈਮ ਵਰਤੇ ਜਾਣ ਵਾਲੇ ਗੁਣ।

ਉਦਾਹਰਣ ਲਈ, ਇੱਕ "user profile" ਸ਼ੁਰੂ ਵਿੱਚ ਨਾਂ ਅਤੇ ਈਮੇਲ ਨਾਲ ਹੋ ਸਕਦੀ ਹੈ, ਫਿਰ ਪREFERੇਰਨਸ, ਲਿੰਕ ਕੀਤੇ ਖਾਤੇ, ਸ਼ิปਿੰਗ ਪਤੇ, ਨੋਟੀਫਿਕੇਸ਼ਨ ਸੈਟਿੰਗਜ਼ ਅਤੇ ਐਕਸਪੇਰੀਮੈਂਟ ਫਲੈਗਸ ਸ਼ਾਮਲ ਹੋ ਸਕਦੇ ਹਨ। ਹਰ ਯੂਜ਼ਰ ਕੋਲ ਹਰੇਕ ਫੀਲਡ ਨਹੀਂ ਹੁੰਦੀ ਅਤੇ ਨਵੇਂ ਫੀਲਡ ਧੀਰੇ-धीਰੇ ਆਉਂਦੇ ਹਨ। ਦਸਤਾਵੇਜ਼-ਸ਼ੈਲੀ ਮਾਡਲ ਨੇਸਟਡ ਅਤੇ ਅਸਮਾਨ ਸਾਝੇ ਰੂਪਾਂ ਨੂੰ ਸਿੱਧਾ ਸਟੋਰ ਕਰ ਸਕਦੇ ਹਨ ਬਿਨਾਂ ਹਰ ਰਿਕਾਰਡ ਨੂੰ ਇੱਕ ਕਠੋਰ ਟੈਮਪਲੇਟ ਵਿਚ ਫ਼ਿੱਟ ਕਰਨ ਦੇ।

ਤੇਜ਼ ਇਟਰੇਸ਼ਨ, ਘੱਟ ਔਕੜ-ਵਾਲੇ ਜੋਇਨ

ਲਚਕ ਵੀ ਕੁਝ ਡੇਟਾ ਸ਼ੇਪਾਂ ਲਈ ਜਟਿਲ ਜੋਇਨਾਂ ਦੀ ਲੋੜ ਘਟਾਉਂਦਾ ਹੈ। ਜਦੋਂ ਇੱਕ ਸਕ੍ਰੀਨ ਨੂੰ ਇੱਕ ਰਚਿਆ ਗਿਆ ਆਬਜੈਕਟ (ਇੱਕ ਆਰਡਰ ਜਿਸ ਵਿੱਚ ਆਈਟਮ, ਸ਼ਿਪਿੰਗ ਜਾਣਕਾਰੀ, ਅਤੇ ਸਥਿਤੀ ਇਤਿਹਾਸ ਹੈ) ਦੀ ਲੋੜ ਹੋਵੇ, ਰਿਲੇਸ਼ਨਲ ਡਿਜ਼ਾਈਨ ਬਹੁਤ ਟੇਬਲਾਂ ਅਤੇ ਜੋਇਨਾਂ ਦੀ ਮੰਗ ਕਰ ਸਕਦਾ ਹੈ—ਅਤੇ ORM ਲੇਅਰ ਜੋ ਇਸ ਪੇਚੀਦਗੀ ਨੂੰ ਛੁਪਾਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੇ ਹਨ ਪਰ ਅਕਸਰ ਰੁਕਾਵਟ ਵਧਾਉਂਦੇ ਹਨ।

NoSQL ਵਿਕਲਪ ਡੇਟਾ ਨੂੰ ਇਸ ਤਰਾਂ ਮਾਪਦੇ ਹਨ ਜਿੰਨਾ ਕਿ ਐਪਲੀਕੇਸ਼ਨ ਪੜ੍ਹਦੀ/ਲਿਖਦੀ ਹੈ, ਜਿਸ ਨਾਲ ਟੀਮਾਂ ਤੇਜ਼ੀ ਨਾਲ ਚੀਜ਼ਾਂ ਜਾਰੀ ਕਰਦੀਆਂ ਹਨ।

ਵੈੱਬ-ਸਕੇਲ ਬਦਲਾਅ ਜਿਸ ਨੇ ਡੇਟਾਬੇਸ ਮੰਗ ਤਬਦੀਲ ਕੀਤੀ

ਵੈੱਬ ਐਪਸ ਸਿਰਫ਼ ਵੱਡੀਆਂ ਨਹੀਂ ਹੋਈਆਂ—ਉਹਨਾਂ ਦੀ ਰਚਨਾ ਵੀ ਬਦਲੀ। ਅੰਦਰੂਨੀ ਯੂਜ਼ਰਾਂ ਦੀ ਪੂਰੀ ਸੰਖਿਆ ਦੇ ਸਥਾਨ 'ਤੇ, ਉਤਪਾਦ ਮਿਲੀਅਨਾਂ ਗਲੋਬਲ ਯੂਜ਼ਰਾਂ ਨੂੰ 24/7 ਸਰਵ ਕਰਦੇ ਹਨ, ਜਿਸ ਦੇ ਨਾਲ ਲਾਂਚ, ਖ਼ਬਰਾਂ ਜਾਂ ਸੋਸ਼ਲ ਸ਼ੇਅਰਿੰਗ ਨਾਲ ਅਚਾਨਕ ਚਰਮਕਾਲ ਆ ਜਾਂਦੇ ਹਨ।

ਹਮੇਸ਼ਾ-ਚੱਲਦੀਆਂ ਉਮੀਦਾਂ ਨੇ ਰੁਕਾਵਟ ਦੀ ਭਾਵਨਾ ਤਿਆਰ ਕੀਤੀ: ਡਾਉਨਟਾਈਮ ਸਿਰਫ਼ ਅਸਹੂਲਤ ਨਹੀਂ ਰਹਿ ਗਿਆ। ਉਸੇ ਸਮੇਂ, ਟੀਮਾਂ ਨੂੰ ਜ਼ਿਆਦਾ ਤੇਜ਼ੀ ਨਾਲ ਫੀਚਰ ਲਗਾਉਣ ਲਈ ਕਿਹਾ ਗਿਆ—ਕਈ ਵਾਰੀ ਉਹ ਸਮੇਂ ਜਦੋਂ ਤੱਕ ਕਿਸੇ ਨੇ ਕਿਹਾ ਨਾ ਹੋਵੇ ਕਿ ਅੰਤਿਮ ਡੇਟਾ ਮਾਡਲ ਕੀ ਹੈ।

ਵੱਧਣ ਲਈ ਵਿਤਰਿਤ ਹੋਣਾ ਡਿਫੌਲਟ ਬਣ ਗਿਆ

ਐਸੇ ਲਈ, ਇੱਕ ਇਕੱਲਾ ਡੇਟਾਬੇਸ ਸਰਵਰ ਨੂੰ ਵਧਾਉਣਾ ਕਾਫ਼ੀ ਨਹੀਂ ਸੀ। ਜਿੰਨੀ ਟ੍ਰੈਫਿਕ ਤੁਹਾਡੇ ਕੋਲ ਸੀ, ਤੁਹਾਨੂੰ ਐਸੀ ਸਮਰਥਾ ਚਾਹੀਦੀ ਸੀ ਜੋ ਤੁਸੀਂ ਕਦਮ-ਬਦਲ ਕੇ ਵਧਾ ਸਕੋ—ਹੋਰ ਨੋਡ ਜੋੜੋ, ਲੋਡ ਫੈਲਾਓ, ਫੇਲਿਅਰ ਨੂੰ ਅਲੱਗ ਕਰੋ।

ਇਸ ਨੇ ਆਰਕੀਟੈਕਚਰ ਨੂੰ ਕਈ ਮਸ਼ੀਨਾਂ ਦੀ ਓਰ ਧੱਕਿਆ ਅਤੇ ਟੀਮਾਂ ਦੀਆਂ ਉਮੀਦਾਂ ਡੇਟਾਬੇਸ ਤੋਂ ਬਦਲ ਦਿੱਤੀਆਂ: ਸਿਰਫ਼ ਸਹੀ ਨਤੀਜਾ ਨਹੀਂ, ਬਲਕਿ ਉੱਚ ਸਮਕਾਲਤਾ ਹੇਠ ਵਿਵਹਾਰ ਦੀ ਪੇਸ਼ਗੀ ਅਤੇ ਸਿਸਟਮ ਦੇ ਕੁਝ ਹਿੱਸੇ ਅਣਹੈਲਦੀ ਹੋਣ 'ਤੇ ਵੀ ਨਰਮ ਤਰੀਕੇ ਨਾਲ ਕੰਮ ਕਰਨ ਦੀ ਯੋਗਤਾ।

ਟੀਮਾਂ ਨੇ ਜੋ ਪੈਟਰਨ ਅਪਨਾਏ—ਡੇਟਾਬੇਸ ਫੜਨ ਤੋਂ ਪਹਿਲਾਂ

"NoSQL" ਮੈਨਸਟਰੀਮ ਹੋਣ ਤੋਂ ਪਹਿਲਾਂ ਹੀ ਕਈ ਟੀਮਾਂ ਨੇ ਵੈੱਬ-ਸਕੇਲ ਹਕੀਕਤਾਂ ਲਈ ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਮੋੜਣਾ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤਾ ਸੀ:

ਕੇਸ਼ਿੰਗ ਲੇਅਰਜ਼ (ਅਕਸਰ ਮੈਮਰੀ ਵਿੱਚ) ਦੁਹਰਾਈ ਪੜ੍ਹਾਈਆਂ ਘਟਾਉਣ ਲਈ
ਡੇਨਾਰਮਲਾਈਜ਼ੇਸ਼ਨ ਮਹਿੰਗੀਆਂ ਜੋਇਨਾਂ ਤੋਂ ਬਚਣ ਅਤੇ ਰਾਊਂਡ-ਟ੍ਰਿਪ ਘਟਾਉਣ ਲਈ
ਪ्रीਕੰਪਿਊਟਿਡ ਵਿਊਜ਼ ਅਤੇ ਮੈਟੀਰੀਅਲਾਈਜ਼ਡ ਰੋਲਅਪਸ ਫੀਡਜ਼, ਟਾਈਮਲਾਈਨ ਅਤੇ ਡੈਸ਼ਬੋਰਡਸ ਲਈ

ਇਹ ਤਕਨੀਕਾਂ ਕਾਮਯਾਬ ਰਹੀਆਂ, ਪਰ ਉਹਨਾਂ ਨੇ ਜਟਿਲਤਾ ਨੂੰ ਐਪਲੀਕੇਸ਼ਨ ਕੋਡ ਵਿੱਚ ਸਥਾਨਾਂਤਰਿਤ ਕੀਤਾ: ਕੈਸ਼ ਇਨਵੈਲਿਡੇਸ਼ਨ, ਡੁਪਲਿਕੇਟ ਡਾਟਾ ਨੂੰ ਸੰਕਲਿਤ ਰੱਖਣਾ, ਅਤੇ "ਚਲਾਣ-ਲਾਇਕ" ਰਿਕਾਰਡਸ ਲਈ ਪਾਈਪਲਾਈਨ ਬਣਾਉਣਾ।

ਇਸ ਨੇ ਡੇਟਾਬੇਸ ਨੂੰ ਕਿਸ ਤਰ੍ਹਾਂ ਵਿਕਸਤ ਹੋਣ ਲਈ ਮਜਬੂਰ ਕੀਤਾ

ਜਿਵੇਂ-ਜਿਵੇਂ ਇਹ ਪੈਟਰਨ ਸਧਾਰਣ ਬਣੇ, ਡੇਟਾਬੇਸਾਂ ਨੂੰ ਡੇਟਾ ਨੂੰ ਮਸ਼ੀਨਾਂ 'ਤੇ ਵੰਡਣ, ਆੰਸ਼ਿਕ ਫੇਲਿਅਰ ਨੂੰ ਝੱਲਣ, ਉੱਚ ਲਿਖਾਈ ਵਾਲੀ ਬੋਲ ਭਾਰ ਸੰਭਾਲਣ ਅਤੇ ਵਿਕਸਿਤ ਹੋ ਰਹੀ ਡੇਟਾ ਨੂੰ ਸਾਫ਼-ਸੁਥਰੇ ਤਰੀਕੇ ਨਾਲ ਦਰਸਾਉਣ ਦੀ ਸਮਰੱਥਾ ਹੋਣੀ ਲਾਜ਼ਮੀ ਹੋ ਗਈ। NoSQL ਡੇਟਾਬੇਸ ਇਸਦਾ ਹਿੱਸਾ ਇਸ ਲਈ ਉਭਰੇ ਕਿ ਆਮ ਵੈੱਬ-ਸਕੇਲ ਰਣਨੀਤੀਆਂ ਨੂੰ ਨਿਰਮਾਣ-ਸਥਰ 'ਤੇ ਲਿਆ ਜਾ ਸਕੇ—ਨਕਲਾਂ ਅਤੇ ਹਮੇਸ਼ਾ ਕਰਨੀ ਪੈਂਦੀ ਕੰਮ-ਕੋਸ਼ਿਸ਼ਾਂ ਦੀ ਥਾਂ।

ਵਿਤਰਿਤ ਟਰੇਡ-ਆਫ ਅਤੇ CAP ਸਿਧਾਂਤ

ਆਪਣੀ ਡੇਟਾ ਰਣਨੀਤੀ ਪ੍ਰੋਟੋਟਾਈਪ ਕਰੋ

ਚੈਟ ਤੋਂ ਪੂਰਾ-ਸਟੈਕ ਐਪ ਬਣਾਕੇ SQL ਤੇ NoSQL ਨੀਤੀ ਤੇਜ਼ੀ ਨਾਲ ਪਰਖੋ।

ਮੁਫ਼ਤ ਅਜ਼ਮਾਓ

ਜਦੋਂ ਡੇਟਾ ਇੱਕ ਮਸ਼ੀਨ 'ਤੇ ਰਹਿੰਦਾ ਹੈ, ਨਿਯਮ ਸਧਾਰਨ ਮਹਿਸੂਸ ਹੁੰਦੇ ਹਨ: ਇੱਕ ਇਕੱਲਾ ਸੱਚ ਦਾ ਸਰੋਤ ਹੈ, ਅਤੇ ਹਰ ਰੀਡ ਜਾਂ ਰਾਈਟ ਨੂੰ ਤੁਰੰਤ ਚੈੱਕ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਪਰ ਜਦੋਂ ਤੁਸੀਂ ਡੇਟਾ ਨੂੰ ਸਰਵਰਾਂ ਵਿੱਚ ਫੈਲਾਉਂਦੇ ਹੋ (ਅਕਸਰ ਖੇਤਰਾਂ 'ਚ), ਤਾਂ ਇਕ ਨਵੀਂ ਹਕੀਕਤ ਉभरਦੀ ਹੈ: ਸੁਨੇਹੇ ਦੇਰੀ ਨਾਲ ਪਹੁੰਚ ਸਕਦੇ ਹਨ, ਨੋਡ ਫੇਲ ਹੋ ਸਕਦੇ ਹਨ, ਅਤੇ ਸਿਸਟਮ ਦੇ ਹਿੱਸੇ ਅਸਥਾਈ ਤੌਰ 'ਤੇ ਗੱਲਬਾਤ ਬੰਦ ਕਰ ਸਕਦੇ ਹਨ।

ਮੁੱਖ ਵਿਤਰਿਤ ਟਰੇਡ-ਆਫ (ਸਪਸ਼ਟ ਭਾਸ਼ਾ ਵਿੱਚ)

ਇੱਕ ਵਿਤਰਿਤ ਡੇਟਾਬੇਸ ਨੂੰ ਫੈਸਲਾ ਕਰਨਾ ਪੈਂਦਾ ਹੈ ਜੇ ਉਹਨਾਂ ਨੂੰ ਜਦੋਂ ਠੀਕ ਤਰੀਕੇ ਨਾਲ ਕੋਆਰਡੀਨੇਟ ਨਾ ਕੀਤਾ ਜਾ ਸਕੇ ਤਾਂ ਕੀ ਕਰਨਾ ਹੈ। ਕੀ ਇਹ ਸਰਵਿਸ ਦੇਣ ਜਾਰੀ ਰੱਖੇਗਾ ਤਾਂ ਜੋ ਐਪ "ਅਪ" ਰਹੇ, ਭਾਵੇਂ ਨਤੀਜੇ ਥੋੜ੍ਹੇ ਪੁਰਾਣੇ ਹੋ ਸਕਦੇ ਹਨ? ਜਾਂ ਕੀ ਇਹ ਕੁਝ ਆਪਰੇਸ਼ਨਾਂ ਨੂੰ ਰੱਦ ਕਰ ਦੇਵੇਗਾ ਜਦ ਤੱਕ ਇਹ ਰੀਪਲਿਕਾ ਦੀ ਸਹਿਮਤੀ ਪੱਕੀ ਨਹੀਂ ਕਰ ਲੈਂਦਾ, ਜੋ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਡਾਊਨਟਾਈਮ ਵਾਂਗ ਲੱਗ ਸਕਦਾ ਹੈ?

ਇਹ ਸਥਿਤੀਆਂ ਰਾਊਟਰ ਫੇਲਯਰ, ਓਵਰਲੋਡ ਨੈੱਟਵਰਕ, ਰੋਲਿੰਗ ਡੀਪਲੋਇਮੈਂਟ, ਫਾਇਰਵਾਲ ਮਿਸਕਨਫਿਗਰੇਸ਼ਨ, ਅਤੇ ਕ੍ਰਾਸ-ਰੀਜਨ ਰੀਪਲੀਕੇਸ਼ਨ ਦੇਰੀ ਦੌਰਾਨ ਹੁੰਦੀਆਂ ਹਨ।

CAP ਇੱਕ ਝਲਕ ਵਿੱਚ: C, A, ਅਤੇ P

CAP ਥਿਅਰਮ ਤਿੰਨ ਗੁਣਾਂ ਲਈ ਇੱਕ ਸੁਖੇ ਸਾਰ ਹੈ ਜੋ ਤੁਸੀਂ ਇੱਕੋ ਸਮੇਂ ਚਾਹੁੰਦੇ ਹੋ:

Consistency (C): ਹਰ ਪੜ੍ਹਾਈ ਤਾਜ਼ਾ ਲਿਖਾਈ ਵਾਪਸ ਕਰਦੀ ਹੈ (ਜਾਂ ਏਰਰ)। ਅਮਲ ਵਿੱਚ, "ਸਭ ਨੂੰ ਹੁਣੇ ਇੱਕੋ ਜਵਾਬ ਮਿਲੇ"।
Availability (A): ਹਰ ਰਿਕuest ਨੂੰ ਜਵਾਬ ਮਿਲਦਾ ਹੈ (ਜਰੂਰੀ ਨਹੀਂ ਕਿ ਉਹ ਨਵੀਨਤਮ ਡਾਟਾ ਹੋਵੇ)।
Partition Tolerance (P): ਜੇ ਨੈੱਟਵਰਕ ਮੁੱਖ-ਭਾਗਾਂ 'ਚ ਵੰਡੀ ਜਾਂਦੀ ਹੈ ਤਾਂ ਵੀ ਸਿਸਟਮ ਚੱਲਦਾ ਰਹੇ।

ਮੁੱਖ ਬਿੰਦੂ ਇਹ ਨਹੀਂ ਕਿ "ਹਮੇਸ਼ਾ ਦੋ ਚੁਣੋ"। ਇਹ ਹੈ: ਜਦੋਂ ਨੈੱਟਵਰਕ ਪਾਰਟੀਸ਼ਨ ਹੁੰਦੀ ਹੈ, ਤਾਂ ਤੁਹਾਨੂੰ ਕਾਨੂੰਨੀ ਤਰੀਕੇ ਨਾਲ consistency ਅਤੇ availability ਵਿੱਚੋਂ ਇੱਕ ਚੁਣਨਾ ਪੈਂਦਾ ਹੈ। ਵੈੱਬ-ਸਕੇਲ ਸਿਸਟਮਾਂ ਵਿੱਚ ਪਾਰਟੀਸ਼ਨਾਂ ਨੂੰ ਅਣਿਵਾਰਯ ਮੰਨਿਆ ਜਾਂਦਾ ਹੈ—ਖ਼ਾਸ ਕਰਕੇ ਬਹੁ-ਖੇਤਰੀ ਸੈਟਅਪਾਂ ਵਿੱਚ।

ਪਾਰਟੀਸ਼ਨ ਸਿੱਧੇ-ਸਿੱਧੇ ਅਸਲ ਆਊਟੇਜ ਨਾਲ ਜੁੜੇ ਹਨ

ਕਲਪਨਾ ਕਰੋ ਤੁਹਾਡੀ ਐਪ ਦੋ ਖੇਤਰਾਂ 'ਚ ਚੱਲਦੀ ਹੈ। ਇਕ ਫਾਈਬਰ ਕੱਟ ਜਾਂ ਰਾਊਟਿੰਗ ਮੁੱਦਾ ਸਿੰਕ੍ਰੋਨਾਈਜ਼ੇਸ਼ਨ ਨੂੰ ਰੋਕਦਾ ਹੈ।

ਜੇ ਤੁਸੀਂ Availability ਨੂੰ ਤਰਜੀਹ ਦਿੰਦੇ ਹੋ, ਤਾਂ ਦੋਵਾਂ ਖੇਤਰ ਲਿਖਾਈਆਂ ਲੈਣਾ ਜਾਰੀ ਰੱਖ ਸਕਦੇ ਹਨ ਅਤੇ ਡੇਟਾ ਅਸਥਾਈ ਤੌਰ 'ਤੇ ਵੱਖਰਾ ਹੋ ਸਕਦਾ ਹੈ।
ਜੇ ਤੁਸੀਂ Consistency ਨੂੰ ਤਰਜੀਹ ਦਿੰਦੇ ਹੋ, ਤਾਂ ਇੱਕ ਖੇਤਰ ਲਿਖਾਈਆਂ/ਪੜ੍ਹਾਈਆਂ ਨੂੰ ਰੱਦ ਕਰ ਸਕਦਾ ਹੈ (ਜਾਂ ਸੀਮਿਤ ਕਰ ਸਕਦਾ ਹੈ) ਜਦ ਤੱਕ ਇਹ ਸਹਿਮਤੀ ਦੀ ਪੁਸ਼ਟੀ ਨਹੀਂ ਕਰ ਲੈਂਦਾ।

ਵੱਖ-ਵੱਖ NoSQL ਸਿਸਟਮ (ਅਤੇ ਇੱਕੋ ਹੀ ਸਿਸਟਮ ਦੀ ਵੱਖ-ਵੱਖ ਸੰਰਚਨਾਵਾਂ) ਵੱਖ-ਵੱਖ ਬਣਧਨ ਤਿਆਗਦੀਆਂ ਹਨ, ਇਹ ਇਸ 'ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ ਕਿ ਕਿਹੜੀ ਚੀਜ਼ ਸਭ ਤੋਂ ਜ਼ਿਆਦਾ ਮਹੱਤਵਪੂਰਨ ਹੈ: ਫੇਲਿਅਰਾਂ ਦੌਰਾਨ ਯੂਜ਼ਰ ਅਨੁਭਵ, ਸਹੀਤਾ ਗਾਰੰਟੀਜ਼, ਓਪਰੇਸ਼ਨਲ ਸਧਾਰਣਤਾ, ਜਾਂ ਰਿਕਵਰੀ ਵਿਵਹਾਰ।

ਸਕੇਲ ਆਊਟ: ਸ਼ਾਰਡਿੰਗ ਅਤੇ ਰੀਪਲੀਕੇਸ਼ਨ ਮੁੱਖ ਧਾਰਣਾਵਾਂ

ਸਕੇਲ ਆਊਟ (ਹੋਰ ਮਸ਼ੀਨਾਂ ਜੋੜਕੇ) ਦਾ ਅਰਥ ਹੈ ਸਮਰਥਾ ਵਧਾਉਣ ਲਈ ਹੋਰ ਨੋਡ ਜੋੜੇ ਜਾਣ। ਕਈ ਟੀਮਾਂ ਲਈ ਇਹ ਆਰਥਿਕ ਅਤੇ ਓਪਰੇਸ਼ਨਲ ਤੌਰ 'ਤੇ ਦਰਪੇਸ਼ ਬਦਲਾਅ ਸੀ: ਕਾਮਮੀਡੀਟੀ ਨੋਡ ਸਟੈਪ-ਵਾਇਜ਼ ਜੋੜੇ ਜਾ ਸਕਦੇ ਸਨ, ਫੇਲਿਅਰ ਉਮੀਦਯੋਗ ਸੀ, ਅਤੇ ਵਾਧਾ ਖਤਰਨਾਕ "ਵੱਡੇ ਬਾਕਸ" ਮਾਈਗ੍ਰੇਸ਼ਨ नहीं ਮੰਗਦਾ ਸੀ।

ਸ਼ਾਰਡਿੰਗ (ਪਾਰਟੀਸ਼ਨਿੰਗ): ਕੰਮ ਫੈਲਾਉਣਾ

ਕਈ ਨੋਡਸ ਨੂੰ ਕਾਰਗਰ ਬਣਾਉਣ ਲਈ NoSQL ਸਿਸਟਮ ਸ਼ਾਰਡਿੰਗ ਨੂੰ ਵਰਤੇ। ਇੱਕ ਪਾਰਟੀਸ਼ਨ ਕੀ (ਜਿਵੇਂ user_id) ਦੁਆਰਾ ਡਾਟਾ ਨੂੰ ਵੰਡਣਾ ਇੱਕ ਸਧਾਰਣ ਉਦਾਹਰਣ ਹੈ:

ਨੋਡ A user_id 1–1,000,000 ਨੂੰ ਰੱਖਦਾ ਹੈ
ਨੋਡ B user_id 1,000,001–2,000,000 ਨੂੰ ਰੱਖਦਾ ਹੈ

ਪੜ੍ਹਾਈਆਂ ਅਤੇ ਲਿਖਾਈਆਂ ਫੈਲ ਜਾਂਦੀਆਂ ਹਨ, ਹਾਟਸਪੌਟ ਘੱਟ ਹੁੰਦੇ ਹਨ ਅਤੇ ਨੋਡ ਜੋੜਨ ਨਾਲ ਥਰੂਪੁੱਟ ਵਧਦਾ ਹੈ। ਪਰ ਪਾਰਟੀਸ਼ਨ ਕੀ ਇੱਕ ਡਿਜ਼ਾਈਨ ਫੈਸਲਾ ਬਣ ਜਾਂਦੀ ਹੈ: ਐਗਰ ਤੁਸੀਂ ਖ਼ਰਾਬ ਕੀ ਚੁਣਦੇ ਹੋ ਤਾਂ ਇੱਕ ਹੀ ਸ਼ਾਰਡ ਵਿੱਚ ਜ਼ਿਆਦਾ ਟ੍ਰੈਫਿਕ ਜਾਂਦਾ ਹੈ।

ਰੀਪਲੀਕੇਸ਼ਨ: ਉਪਲਬਧਤਾ ਅਤੇ ਰੀਡ ਸਕੇਲਿੰਗ

ਰੀਪਲੀਕੇਸ਼ਨ ਦੇ ਅਰਥ ਹਨ ਇੱਕੋ ਡੇਟਾ ਦੀਆਂ ਕਈ ਨਕਲਾਂ ਵੱਖ-ਵੱਖ ਨੋਡਸ 'ਤੇ ਰੱਖਣਾ। ਇਹ ਵਧਾਉਂਦਾ ਹੈ:

ਉਪਲਬਧਤਾ: ਜੇ ਇੱਕ ਨੋਡ ਫੇਲ ਹੋ ਜਾਵੇ ਤਾਂ ਦੂਜਾ ਰੀਪਲਿਕਾ ਰਿਕuest ਨੂੰ ਸਰਵ ਕਰ ਸਕਦਾ ਹੈ।
ਰਿਡ ਸਮਰੱਥਾ: ਕਈ ਰੀਪਲਿਕਾਜ਼ ਤੋਂ ਰੀਡਜ਼ ਸਰਵ ਕੀਤੀਆਂ ਜਾ ਸਕਦੀਆਂ ਹਨ।

ਰੀਪਲੀਕੇਸ਼ਨ ਡਾਟਾ ਨੂੰ ਰੈਕ ਜਾਂ ਖੇਤਰਾਂ ਵਿੱਚ ਫੈਲਾਉਣ ਯੋਗ ਬਣਾਉਂਦੀ ਹੈ ਤਾਂ ਜੋ ਲੋਕਲ ਆਉਟੇਜ ਤੋਂ ਬਚਿਆ ਜਾ ਸਕੇ।

ਛੁਪਿਆ ਲਾਗਤ: ਰੀਬੈਲੈਂਸਿੰਗ ਅਤੇ ਓਪਰੇਸ਼ਨ

ਸ਼ਾਰਡਿੰਗ ਅਤੇ ਰੀਪਲੀਕੇਸ਼ਨ ਚਲਾਉਣ ਯੋਗਤਾ ਦੇ ਨਾਲ ਲਗਾਤਾਰ ਓਪਰੇਸ਼ਨਲ ਕੰਮ ਲਿਆਉਂਦੇ ਹਨ। ਜਿਵੇਂ-जਿਵੇਂ ਡਾਟਾ ਵੱਧਦਾ ਜਾਂ ਨੋਡ ਬਦਲਦੇ ਹਨ, ਸਿਸਟਮ ਨੂੰ ਰੀਬੈਲੈਂਸ ਕਰਨਾ ਪੈਂਦਾ—ਪਾਰਟੀਸ਼ਨ ਲਿਜਾਣਾ ਅਤੇ ਹੁਣੇ-ਹੁਣੇ ਆਨਲਾਈਨ ਰਹਿਣਾ। ਜੇ ਇਹ ਠੀਕ ਤਰੀਕੇ ਨਾਲ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਤਾਂ ਰੀਬੈਲੈਂਸ ਦੌਰਾਨ ਲੈਟੈਂਸੀ ਸਪਾਈਕ, ਅਸਮਾਨ ਲੋਡ ਜਾਂ ਅਸਥਾਈ क्षमता ਘਾਟ ਹੋ ਸਕਦੀ ਹੈ।

ਇਹ ਮੁੱਖ ਟਰੇਡ-ਆਫ ਹੈ: ਮਸ਼ੀਨਾਂ ਦੁਆਰਾ ਸਸਤੇ ਸਕੇਲਿੰਗ ਬਦਲੇ ਵਿੱਚ ਵੰਡ, ਮਾਨੀਟਰਿੰਗ ਅਤੇ ਫੇਲਿਅਰ ਹੈਂਡਲਿੰਗ ਵਿੱਚ ਵੱਧ ਜਟਿਲਤਾ।

ਕਾਂਸਿਸਟੈਂਸੀ ਮਾਡਲ: ਕਠੋਰ ਤੋਂ ਆਖ਼ਰੀ ਤੱਕ

ਜਦੋਂ ਡੇਟਾ ਵਿਤਰਿਤ ਹੋ ਜਾਂਦਾ ਹੈ, ਇੱਕ ਡੇਟਾਬੇਸ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨਾ ਪੈਂਦਾ ਹੈ ਕਿ "ਸਹੀ" ਦਾ ਕੀ ਮਤਲਬ ਹੈ ਜਦੋਂ ਸਮਕਾਲੀ ਅਪਡੇਟ, ਨੈੱਟਵਰਕ ਦੇਰੀ ਜਾਂ ਨੋਡਸ ਦੀ ਗੱਲਬਾਤ ਰੁਕੇ।

ਕਠੋਰ (strong) ਕਾਂਸਿਸਟੈਂਸੀ

Strong consistency ਵਿਚ, ਜਿਵੇਂ ਹੀ ਇੱਕ ਲਿਖਾਈ ਮਨਜ਼ੂਰ ਹੋ ਜਾਵੇ, ਹਰ ਰੀਡਰ ਨੇ ਇਸ ਨੂੰ ਤੁਰੰਤ ਦੇਖਣਾ ਚਾਹੀਦਾ ਹੈ। ਇਹ "ਇਕ ਇਕੱਲਾ ਸੱਚ ਦਾ ਸਰੋਤ" ਦਾ ਅਨੁਭਵ ਦੇਂਦਾ ਹੈ ਜੋ ਬਹੁਤ ਲੋਕ ਰਿਲੇਸ਼ਨਲ ਡੇਟਾਬੇਸਾਂ ਨਾਲ ਜੋੜਦੇ ਹਨ।

ਚੁਣੌਤੀ ਕੋਆਰਡੀਨੇਸ਼ਨ ਹੈ: ਨੋਡਸ ਵਿੱਚ ਸਖਤ ਗਾਰੰਟੀਜ਼ ਲਈ ਕਈ ਸੁਨੇਹੇ, ਜਵਾਬਾਂ ਦੀ ਉਡੀਕ ਅਤੇ ਫੇਲ-ਮਿਡ-ਫਲਾਈਟ ਹੈਂਡਲਿੰਗ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਜਦ Nੋਡਸ ਦੂਰੇ ਹੋਣ ਜਾਂ ਬਹੁਤ ਬਿਜੀ ਹੋਣ, ਤਾਂ ਹਰ ਲਿਖਾਈ 'ਤੇ ਵਧੀ ਲੈਟੈਂਸੀ ਆ ਸਕਦੀ ਹੈ।

ਆਖ਼ਰੀ-ਤੱਕ-ਕਾਂਸਿਸਟੈਂਸੀ (Eventual consistency)

Eventual consistency ਨੇ ਇਹ ਗਾਰੰਟੀ ਢੀਲੀ ਕੀਤੀ: ਇੱਕ ਲਿਖਾਈ ਤੋਂ ਬਾਅਦ ਵੱਖ-ਵੱਖ ਨੋਡ ਅਸਥਾਈ ਤੌਰ 'ਤੇ ਵੱਖ-ਵੱਖ ਜਵਾਬ ਦੇ ਸਕਦੇ ਹਨ, ਪਰ ਸਮੇਂ ਦੇ ਨਾਲ ਸਿਸਟਮ ਇਕੱਠਾ ਹੋ ਜਾਵੇਗਾ।

ਉਦਾਹਰਣ:

ਇੱਕ "ਲਾਈਕ" ਕਾਊਂਟਰ ਇੱਕ ਰੀਪਲਿਕਾ 'ਤੇ 101 ਦਿਖਾ ਸਕਦਾ ਹੈ ਜਦਕਿ ਦੂਜਾ ਅਜੇ 100 ਦਿਖਾ ਰਿਹਾ ਹੋਵੇ—ਕੁਝ ਸਕਿੰਟਾਂ ਲਈ।
ਇੱਕ ਨਵੀਂ ਪੋਸਟ ਕੁਝ ਯੂਜ਼ਰਾਂ ਲਈ ਫੀਡ ਵਿੱਚ ਦਿਖ ਸਕਦੀ ਹੈ ਪਰ ਹੋਰਾਂ ਲਈ ਨਹੀਂ, ਖ਼ਾਸ ਕਰਕੇ ਖੇਤਰਾਂ ਦੇ ਇੰਤਰ।

ਕਈ ਯੂਜ਼ਰ ਅਨੁਭਵਾਂ ਲਈ ਇਹ ਅਸਥਾਈ ਪਾਰਸਪਰਤਾ ਮੰਨਣਯੋਗ ਹੈ ਜੇ ਸਿਸਟਮ ਤੇਜ਼ ਅਤੇ ਉਪਲਬਧ ਰਹੇ।

ਟਕਰਾਅ ਅਤੇ ਉਹਨਾਂ ਦਾ ਹੱਲ

ਜੇ ਦੋ ਰੀਪਲਿਕਾਜ਼ ਨੇ ਲਗਭਗ ਇੱਕੋ ਸਮੇਂ ਅਪਡੇਟ ਸਵੀਕਾਰ ਕੀਤੀ, ਤਾਂ ਡੇਟਾਬੇਸ ਨੂੰ ਮਿਲਾਉਣ ਵਾਲਾ ਨਿਯਮ ਚਾਹੀਦਾ ਹੈ।

ਆਮ ਪਹੁੰਚਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:

ਟਾਈਮਸਟੈਂਪ (last-write-wins): ਨਵੀਨਤਮ ਟਾਈਮਸਟੈਂਪ ਵਾਲੀ ਅਪਡੇਟ ਰੱਖੋ। ਸਰਲ, ਪਰ ਜੇ ਘੜੀਆਂ ਭਿੰਨ ਹੋਣ ਤਾਂ ਡੇਟਾ ਖੋ ਜਾ ਸਕਦਾ ਹੈ।
ਵਰਜ਼ਨ ਵੈਕਟਰ/ਯਾਦ ਰੱਖਣਾ: ਪਤਾ ਲਗਾਉ ਕਿ ਕਿਹੜੇ ਰੀਪਲਿਕਾ ਨੇ ਕਿਹੜੀਆਂ ਅਪਡੇਟ ਵੇਖੀਆਂ, ਸਮਕਾਲੀ ਲਿਖਤਾਂ ਪਛਾਣੋ ਅਤੇ ਮਿਲਾਓ ਜਾਂ ਟਕਰਾਅ ਉਭਾਰੋ।

ਜਿੱਥੇ ਮਜ਼ਬੂਤ ਕਾਂਸਿਸਟੈਂਸੀ ਲਾਜ਼ਮੀ ਹੈ

Strong consistency ਉਹਨਾਂ ਸਥਿਤੀਆਂ ਲਈ ਮੁੱਖ ਹੈ ਜਿੱਥੇ ਦੋ ਅਸਥਾਈ ਸੱਚ ਨੁਕਸਾਨ ਪਹੁੰਚਾ ਸਕਦੇ ਹਨ: ਪੈਸੇ ਦੀਆਂ ਲੇਣ-ਦੇਣ, ਇਨਵੈਂਟਰੀ ਸੀਮਾਵਾਂ, ਯੂਨੀਕ ਯੂਜ਼ਰਨੇਮਜ਼, ਪਰਮਿਸ਼ਨ, ਅਤੇ ਕੋਈ ਵੀ ਵਰਕਫਲੋ ਜਿੱਥੇ ਉਤਪਾਦਨ 'ਚ ਦੋ ਸੱਚ ਸਮੇਂ-ਸ਼ਕਤੀ ਹੋਣ ਨਾਲ ਵੱਡਾ ਨੁਕਸਾਨ ਹੋਵੇ।

ਮੁੱਖ NoSQL ਪਰਿਵਾਰ (ਅਤੇ ਉਹ ਕੀ ਓਪਟੀਮਾਈਜ਼ ਕਰਦੇ ਹਨ)

ਬਦਲਾਵਾਂ ਨੂੰ ਸੁਰੱਖਿਅਤ ਬਣਾਓ

ਸਕੀਮਾ ਅਤੇ ਲੌਜਿਕ 'ਤੇ ਪ੍ਰਯੋਗ ਕਰੋ, ਫਿਰ ਜਦੋਂ ਮਾਡਲ ਗਲਤ ਹੋਵੇ ਤੇ ਤੇਜ਼ੀ ਨਾਲ ਰੋਲਬੈਕ ਕਰੋ।

ਸਨੈਪਸ਼ਾਟ ਵਰਤੋ

NoSQL ਵੱਖ-ਵੱਖ ਮਾਡਲਾਂ ਦਾ ਸੈੱਟ ਹੈ ਜੋ ਸਕੇਲ, ਲੈਟੈਂਸੀ, ਅਤੇ ਡੇਟਾ ਰੂਪ ਲਈ ਵੱਖ-ਵੱਖ ਟਰੇਡ-ਆਫ ਕਰਦੇ ਹਨ। ਪਰਿਵਾਰ ਨੂੰ ਸਮਝਣਾ ਤੁਹਾਨੂੰ ਪਤਾ ਲਗਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ ਕਿ ਕੀ ਤੇਜ਼ ਹੋਏਗਾ, ਕੀ ਦੁਖ ਦੈਵੇਗਾ, ਅਤੇ ਕਿਉਂ।

ਕੀ-ਵੈਲਿਫ਼ ਸਟੋਰ: ਸਰਲਤਾ ਰਾਹੀਂ ਗਤੀ

Key-value ਡੇਟਾਬੇਸ ਇੱਕ ਸਮਾਨ ਵਿਸ਼ਾਲ ਵਿਟਹੈਸ਼ਮੇਪ ਵਾਂਗ ਇੱਕ ਕੁੰਜੀ ਦੇ ਪਿੱਛੇ ਇੱਕ ਮੁੱਲ ਸਟੋਰ ਕਰਦੇ ਹਨ। ਕਿਉਂਕਿ ਐਕਸੈਸ ਪੈਟਰਨ ਆਮ ਤੌਰ 'ਤੇ "ਕੁੰਜੀ ਨਾਲ ਲਿਆਓ"/"ਕੁੰਜੀ ਨਾਲ ਸੈੱਟ ਕਰੋ" ਹੁੰਦਾ ਹੈ, ਉਹ ਬਹੁਤ ਤੇਜ਼ ਅਤੇ ਹੋਰੀਜ਼ੌਂਟਲ ਸਕੇਲ ਕਰਨ ਯੋਗ ਹੋ ਸਕਦੇ ਹਨ।

ਉਹ ਉਨ੍ਹਾਂ ਸਥਿਤੀਆਂ ਲਈ ਵਧੀਆ ਹਨ ਜਿਥੇ ਤੁਸੀਂ ਪਹਿਲਾਂ ਹੀ ਲੁੱਕਅਪ ਕੀ ਜਾਣਦੇ ਹੋ (sessions, caching, feature flags), ਪਰ ਵੱਖ-ਵੱਖ ਫੀਲਡਾਂ 'ਤੇ ਆਡ-ਹਾਕ ਕਵੇਰੀਆਂ ਲਈ ਉਹ ਘੱਟ ਬੇਨਤੀ ਵਾਲੇ ਹੁੰਦੇ ਹਨ।

ਦਸਤਾਵੇਜ਼ ਡੇਟਾਬੇਸ: ਲਚਕੀਲੇ ਰਿਕਾਰਡ, JSON-ਵਾਂਗਾ ਆਕਾਰ

Document databases JSON-ਵਾਂਗ ਦਸਤਾਵੇਜ਼ਾਂ ਨੂੰ (ਅਕਸਰ ਕਲੈਕਸ਼ਨਾਂ ਵਿੱਚ) ਸਟੋਰ ਕਰਦੇ ਹਨ। ਹਰ ਦਸਤਾਵੇਜ਼ ਦਾ ਢਾਂਚਾ ਥੋੜ੍ਹਾ ਵੱਖਰਾ ਹੋ ਸਕਦਾ ਹੈ, ਜੋ ਪ੍ਰੋਡਕਟ ਦੇ ਵਿਕਾਸ ਨੂੰ ਸਮਰਥਨ ਦਿੰਦਾ ਹੈ।

ਇਹ ਪੂਰੇ ਦਸਤਾਵੇਜ਼ ਨੂੰ ਪੜ੍ਹਨ-ਲਿਖਨ ਅਤੇ ਉਸਦੇ ਅੰਦਰਲੇ ਫੀਲਡਾਂ 'ਤੇ ਕਵੇਰੀ ਕਰਨ ਲਈ ਓਪਟੀਮਾਈਜ਼ਡ ਹਨ—ਬਿਨਾਂ ਕਠੋਰ ਟੇਬਲਾਂ ਨੂੰ ਜ਼ਬਰਦستی ਕਰਨ ਦੇ। ਟਰੇਡ-ਆਫ: ਸੰਬੰਧਾਂ ਨੂੰ ਮਾਡਲ ਕਰਨਾ ਮੁਸ਼ਕਲ ਹੋ ਸਕਦਾ ਹੈ, ਅਤੇ ਜੋਇਨਾਂ (ਜੋ ਮੌਜੂਦ ਹੋਣ) ਰਿਲੇਸ਼ਨਲ ਸਿਸਟਮਾਂ ਨਾਲੋਂ ਘੱਟ ਹੋ ਸਕਦੇ ਹਨ।

ਵਾਈਡ-ਕਾਲਮ ਸਟੋਰ: ਵੱਡੇ ਪੈਮਾਨੇ 'ਤੇ ਉੱਚ ਲਿਖਾਈ ਥਰੂਪੁੱਟ

Wide-column ਡੇਟਾਬੇਸ (Bigtable ਤੋਂ ਪ੍ਰਭਾਵਿਤ) ਡੇਟਾ ਨੂੰ ਰੋ ਕੁੰਜੀਆਂ ਵੱਲੋਂ ਸੰਗਠਿਤ ਕਰਦੇ ਹਨ, ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਹਰ ਰੋ ਲਈ ਬਹੁਤ ਸਾਰੇ ਕਾਲਮ ਹੋ ਸਕਦੇ ਹਨ। ਇਹ ਵੱਡੇ ਲਿਖਾਈ ਦਰਾਂ ਅਤੇ ਵਿਤਰਿਤ ਸਟੋਰੇਜ ਲਈ ਉਚਿਤ ਹਨ—ਟਾਈਮ-ਸੀਰੀਜ਼, ਈਵੈਂਟ ਅਤੇ ਲੌਗ ਵਰਕਲੋਡ ਲਈ ਮਜ਼ਬੂਤ ਫਿੱਟ।

ਇਹ ਅਕਸਰ ਪ੍ਰਧਾਨ ਕੀ ਅਤੇ ਕਲਸਟਰਿੰਗ ਨਿਯਮਾਂ ਦੇ ਆਧਾਰ 'ਤੇ ਕੁਸ਼ਲ ਪ੍ਰਸ਼ਨ ਕਰਨ ਨੂੰ ਇਨਾਮ ਦਿੰਦੇ ਹਨ, ਨਾ ਕਿ ਮਨਮਾਨੇ ਫਿਲਟਰਾਂ ਨੂੰ।

ਗ੍ਰਾਫ ਡੇਟਾਬੇਸ: ਰਿਸ਼ਤਿਆਂ-ਫਰਸਟ ਕਵੇਰੀ

Graph databases ਰਿਸ਼ਤੀਆਂ ਨੂੰ ਪਹਿਲੀ ਜਨਤਕਤਾ ਵਜੋਂ ਮੰਨਦੇ ਹਨ। ਟੇਬਲਾਂ ਨੂੰ ਜ਼ੋਰ-ਜ਼ੋਰ ਜੋੜਨ ਦੀ ਥਾਂ, ਇਹ ਨੋਡਸ ਦੇ ਦਰਮਿਆਨ ਏਜਜ਼ ਦੀ ਯਾਤਰਾ ਕਰਦੇ ਹਨ, ਜਿਸ ਨਾਲ "ਇਹ ਚੀਜ਼ਾਂ ਕਿਵੇਂ ਜੁੜੀਆਂ ਹਨ?" ਤਰ੍ਹਾਂ ਦੀਆਂ ਕਵੇਰੀਆਂ ਕੂਦਰਤੀ ਅਤੇ ਤੇਜ਼ ਹੋ ਜਾਂਦੀਆਂ ਹਨ (ਧੋਖਾ-ਚਲਾਉਣ ਵਾਲੇ ਘਰੰਟ, ਸਿਫਾਰਸ਼ਾਂ, ਨਿਰਭਰਤਾ ਗ੍ਰਾਫ)।

ਛੇਤੀ ਗਾਈਡ: ਹਰ ਮਾਡਲ ਕਿੱਥੇ ਫਿੱਟ ਹੁੰਦਾ ਹੈ

Key-value: ID ਨਾਲ ਤੇਜ਼ ਲੁੱਕਅਪ; caching, sessions, counters
Document: ਵਿਕਸਿਤ ਹੋ ਰਹੇ ਪ੍ਰੋਡਕਟ ਡਾਟਾ; profiles, catalogs, content
Wide-column: ਭਾਰੀਆਂ ਇੰਜੈਸਟਨ; telemetry, logs, time-series
Graph: ਗਹਿਰੀਆਂ ਰਿਸ਼ਤੇਦਾਰੀਆਂ ਕਵੇਰੀਆਂ; social graphs, routing, fraud analysis

ਡੇਟਾ ਮਾਡਲਿੰਗ ਵਿੱਚ ਬਦਲਾਅ: ਘੱਟ ਜੋਇਨ, ਵਧੇਰੇ ਇਰਾਦਾ-ਆਧਾਰਤ ਡਿਜ਼ਾਈਨ

ਰਿਲੇਸ਼ਨਲ ਡੇਟਾਬੇਸ ਨਾਰਮਲਾਈਜ਼ੇਸ਼ਨ ਨੂੰ ਪ੍ਰੋਤਸਾਹਿਤ ਕਰਦੇ ਹਨ: ਡੇਟਾ ਨੂੰ ਬਹੁਤ ਸਾਰੀਆਂ ਟੇਬਲਾਂ ਵਿੱਚ ਵੰਡੋ ਅਤੇ ਜਵਾਬ ਵੇਲੇ ਜੋਇਨਾਂ ਨਾਲ ਮੁੜ ਜੋੜੋ। کئی NoSQL ਸਿਸਟਮ ਤੁਹਾਨੂੰ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਐਕਸੈਸ ਪੈਟਰਨਸ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਡਿਜ਼ਾਈਨ ਕਰਨ ਲਈ ਧੱਕਦੇ ਹਨ—ਝਣਕਤਾ ਤੇ ਨੀਤੀ-ਕਾਪੀ ਕਰਕੇ, ਜ਼ਿਆਦਾ ਨਕਲ ਕਰਨ ਦੇ ਮੁੱਲ 'ਤੇ—ਤਾਂ ਜੋ ਨੋਡਸ 'ਤੇ ਲੈਟੈਂਸੀ ਪੇਸ਼ਗੀ ਬਣੀ ਰਹੇ।

ਡੇਨਾਰਮਲਾਈਜ਼ੇਸ਼ਨ ਕਿਉਂ ਆਮ ਹੈ

ਵਿਤਰਿਤ ਡੇਟਾਬੇਸਾਂ ਵਿੱਚ, ਇੱਕ ਜੋਇਨ ਨੂੰ ਕਈ ਪਾਰਟੀਸ਼ਨਾਂ ਜਾਂ ਮਸ਼ੀਨਾਂ ਤੋਂ ਡੇਟਾ ਖਿੱਚਣ ਦੀ ਲੋੜ ਪੈਂਦੀ ਹੈ। ਇਸ ਨਾਲ ਨੈੱਟਵਰਕ ਹਿਟਸ, ਕੋਆਰਡੀਨੇਸ਼ਨ, ਅਤੇ ਅਣਪ੍ਰੀਡਿਕਟੇਬਲ ਲੈਟੈਂਸੀ ਵਧਦੀ ਹੈ। ਡੇਨਾਰਮਲਾਈਜ਼ੇਸ਼ਨ (ਸੰਬੰਧਿਤ ਡੇਟਾ ਨੂੰ ਇਕੱਠੇ ਸਟੋਰ ਕਰਨਾ) ਰਾਊਂਡ-ਟ੍ਰਿਪ ਘਟਾਉਂਦਾ ਅਤੇ ਪੜ੍ਹਾਈ ਨੂੰ ਆਮ ਤੌਰ 'ਤੇ "ਲੋਕਲ" ਰੱਖਦਾ ਹੈ।

ਇੱਕ ਪ੍ਰਭਾਵੀ ਨਤੀਜਾ: ਤੁਸੀਂ orders ਰਿਕਾਰਡ ਵਿੱਚ ਇੱਕੋ ਹੀ ਖਰੀਦਦਾਰ ਦਾ ਨਾਮ ਸਟੋਰ ਕਰ ਸਕਦੇ ਹੋ, ਚਾਹੇ ਇਹ customers ਵਿੱਚ ਵੀ ਹੋਵੇ, ਕਿਉਂਕਿ "ਆਖਰੀ 20 orders" ਇੱਕ ਬੁਨਿਆਦੀ ਕਵੇਰੀ ਹੈ।

ਕਵੇਰੀ ਸੀਮਾਵਾਂ: ਘੱਟ ਜੋਇਨ, ਐਪ ਵਿੱਚ ਵੱਧ ਮਾਡਲਿੰਗ

ਕਈ NoSQL ਡੇਟਾਬੇਸ ਸੀਮਤ ਜੋਇਨ (ਜਾਂ ਕੋਈ) ਸਮਰਥਨ ਕਰਦੇ ਹਨ, ਇਸ ਲਈ ਐਪਲੀਕੇਸ਼ਨ ਨੂੰ ਵਧੇਰੇ ਜ਼ਿੰਮੇਵਾਰੀ ਲੈਣੀ ਪੈਂਦੀ ਹੈ:

ਕੁੰਜੀ ਦੁਆਰਾ ਇੱਕ ਦਸਤਾਵੇਜ਼/ਰੋ ਲੈਓ ਅਤੇ ਸਿੱਧਾ ਰੇਂਡਰ ਕਰੋ
ਦੋ ਡੈਟਾਸੈਟਸ ਅਲੱਗ-ਅਲੱਗ ਪੜ੍ਹੋ ਅਤੇ ਕੋਡ ਵਿੱਚ ਮਿਲਾਓ
ਮਹਿੰਗੀਆਂ ਸਕੈਨ ਤੋਂ ਬਚਣ ਲਈ "ਰੀਡ ਮਾਡਲ" (ਗਿਣਤੀ, ਸੰਖੇਪ) ਪ੍ਰੀਕੰਪਿਊਟ ਕਰੋ

ਇਸ ਲਈ NoSQL ਮਾਡਲਿੰਗ ਆਮ ਤੌਰ 'ਤੇ ਇਹ ਪ੍ਰਸ਼ਨ ਨਾਲ ਸ਼ੁਰੂ ਹੁੰਦੀ ਹੈ: "ਸਾਡੇ ਨੂੰ ਕਿਹੜੇ ਸਕ੍ਰੀਨ ਲੋਡ ਕਰਨੇ ਹਨ?" ਅਤੇ "ਉਹਨਾਂ ਦੀਆਂ ਟਾਪ ਕਵੇਰੀਜ਼ ਕੀ ਹਨ?"

ਸੈਕੰਡਰੀ ਇੰਡੈਂਕਸ—ਅਤੇ ਉਹਨਾਂ ਦੀਆਂ ਛੁਪੀਆਂ ਲਾਗਤਾਂ

ਸੈਕੰਡਰੀ ਇੰਡੈਕਸ ਨਵੇਂ ਕਵੇਰੀਆਂ ਨੂੰ ਯੋਗ ਕਰ ਸਕਦੇ ਹਨ ("ইਮੇਲ ਰਾਹੀਂ ਯੂਜ਼ਰ ਲੱਭੋ"), ਪਰ ਉਹ ਮੁਫ਼ਤ ਨਹੀਂ ਹੁੰਦੇ। ਵਿੱਤ ਕੀਤਾ ਲਿਖਾਈ ਹਰ ਲਿਖਾਈ 'ਤੇ ਕਈ ਇੰਡੈਕਸ ਨੂੰ ਅਪਡੇਟ ਕਰਨਾ ਪੈਂਦਾ, ਜਿਸ ਨਾਲ:

Write amplification: ਇੱਕ ਲਾਜ਼ਮੀ ਲਿਖਾਈ ਕਈ ਭੌਤਿਕ ਲਿਖਾਈਆਂ ਬਣ ਜਾਂਦੀ ਹੈ
ਵੱਧ ਸਟੋਰੇਜ: ਇੰਡੈਕਸ ਐਂਟਰੀਜ਼ ਡੇਟਾ ਅਕਾਰ ਦੇ ਨੇੜੇ ਹੋ ਸਕਦੀਆਂ ਹਨ
ਓਪਰੇਸ਼ਨਲ ਜਟਿਲਤਾ: ਇੰਡੈਕਸ ਲੈਗ ਕਰ ਸਕਦੇ ਹਨ ਜਾਂ ਨਾਜੁਕ ਟਿਊਨਿੰਗ ਮੰਗ ਸਕਦੇ ਹਨ

ਪ੍ਰਦਰਸ਼ਨ ਸੁਧਾਰਨ ਵਾਲੀਆਂ ਮਾਡਲਿੰਗ ਚੋਣਾਂ

Embed over reference: ਇੱਕ ਆਰਡਰ ਦਸਤਾਵੇਜ਼ ਵਿੱਚ ਆਈਟਮ ਇਕੱਠੇ ਰੱਖੋ ਤਾਂ ਜੋ ਇੱਕ ਰਿਕਵੈਸਟ ਵਿੱਚ ਆਰਡਰ ਪੜ੍ਹਿਆ ਜਾ ਸਕੇ
Time-series ਡੇਟਾ ਬਕਟ ਕਰੋ: ਇੱਕੋ ਡਿਵਾਈਸ ਲਈ ਪ੍ਰਤੀ ਦਿਨ ਇਵੈਂਟ ਰੱਖੋ ਤਾਂ ਕਿ ਅਨੰਤ ਪਾਰਟੀਸ਼ਨਾਂ ਤੋਂ ਬਚਿਆ ਜਾ ਸਕੇ
Materialize read models: ਇੱਕ user_profile_summary ਰਿਕਾਰਡ ਰੱਖੋ ਤਾਂ ਕਿ ਪ੍ਰੋਫ਼ਾਈਲ ਪੇਜ਼ ਬਿਨਾਂ ਪੋਸਟਸ, ਲਾਈਕਸ, ਫਾਲੋਜ਼ ਦੇ ਸਕੈਨ ਤੋਂserve ਹੋ ਜਾਵੇ

ਟੀਮਾਂ ਨੇ ਕਿਹੜੇ ਫਾਇਦੇ ਅਤੇ ਟਰੇਡ-ਆਫ ਸਵੀਕਾਰ ਕੀਤੇ

ਇੱਕ ਕਾਰਜਕਾਰੀ ਪ੍ਰੂਫ਼ ਬਣਾਓ

ਆਪਣੇ ਐਕਸੈਸ-ਪੈਟਰਨ ਨੋਟਾਂ ਨੂੰ ਮਿੰਟਾਂ ਵਿੱਚ React UI ਅਤੇ Go API ਵਿੱਚ ਬਦਲੋ।

ਨਿਰਮਾਣ ਸ਼ੁਰੂ ਕਰੋ

NoSQL ਇਸ ਲਈ ਗ੍ਰਹਿਣ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਕਿ ਇਹ ਹਮੇਸ਼ਾਂ "ਬਿਹਤਰ" ਸੀ। ਇਹ ਇਸ ਲਈ ਚੁਣਿਆ ਗਿਆ ਕਿ ਟੀਮਾਂ ਨੇ ਰਿਲੇਸ਼ਨਲ ਡੇਟਾਬੇਸਾਂ ਦੀਆਂ ਕੁਝ ਸੁਵਿਧਾਵਾਂ ਨੂੰ ਬਦਲੇ ਵਿੱਚ ਤੇਜ਼ੀ, ਸਕੇਲ ਅਤੇ ਲਚਕੀਲਾਪਨ ਲਈ ਤਿਆਗ ਦਿੱਤਾ।

ਟੀਮਾਂ ਨੇ ਕੀ ਪ੍ਰਾਪਤ ਕੀਤਾ

ਡਿਜ਼ਾਈਨ ਅਨੁਸਾਰ ਸਕੇਲ-ਆਊਟ। ਕਈ NoSQL ਸਿਸਟਮਾਂ ਨੇ ਮਸ਼ੀਨਾਂ ਜੋੜ ਕੇ ਸਕੇਲ ਕਰਨਾ ਪ੍ਰਯੋਗੀ ਬਣਾਇਆ। ਸ਼ਾਰਡਿੰਗ ਅਤੇ ਰੀਪਲੀਕੇਸ਼ਨ ਮੁੱਖ ਸਮਰੱਥਾਵਾਂ ਬਣ ਗਈਆਂ।

ਲਚਕੀਲੇ ਸਕੀਮਾਂ। ਦਸਤਾਵੇਜ਼ ਅਤੇ ਕੀ-ਵੈਲਿਫ਼ ਸਿਸਟਮਾਂ ਨੇ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਹਰੇਕ ਫੀਲਡ ਬਦਲਾਅ ਲਈ ਕਠੋਰ ਟੇਬਲ ਡਿਫਿਨੀਸ਼ਨ ਰਾਹੀਂ ਗੁਜ਼ਰਨਾ ਘਟਾ ਦਿੱਤਾ, ਜੋ ਹਫ਼ਤਾਵਾਰੀ ਬਦਲਾਅ ਦੇ ਵੇਲੇ ਰੂਕਾਵਟ ਨੂੰ ਘਟਾਉਂਦਾ।

ਉਪਲਬਧਤਾ ਪੈਟਰਨ। ਨੋਡਸ ਅਤੇ ਖੇਤਰਾਂ 'ਚ ਰੀਪਲੀਕੇਸ਼ਨ ਨੇ ਸੇਵਾਵਾਂ ਨੂੰ ਹਾਰਡਵੇਅਰ ਫੇਲਿਅਰ ਜਾਂ ਮੈਂਟੇਨੈਂਸ ਦੌਰਾਨ ਚੱਲਦਿਆਂ ਰੱਖਣਾ ਆਸਾਨ ਕੀਤਾ।

ਟੀਮਾਂ ਨੇ ਕੀ ਖਰਚ ਕੀਤਾ

ਡੇਟਾ ਨਕਲ ਅਤੇ ਡੇਨਾਰਮਲਾਈਜ਼ੇਸ਼ਨ। ਜੋਇਨਾਂ ਤੋਂ ਬਚਣ ਲਈ ਡਾਟਾ ਅਕਸਰ ਕ੍ਰਮੜੀ ਹੁੰਦੀ ਹੈ। ਇਸ ਨਾਲ ਰੀਡ ਪ੍ਰਦਰਸ਼ਨ ਸੁਧਰਦਾ ਹੈ ਪਰ ਸਟੋਰੇਜ ਵਧਦਾ ਅਤੇ "ਹਰ ਥਾਂ ਅੱਪਡੇਟ ਕਰੋ" ਦੀ ਜਟਿਲਤਾ ਹੈ।

ਕਾਂਸਿਸਟੈਂਸੀ ਦੇ ਆਸ਼ਚਰਜ। ਆਖ਼ਰੀ-ਤੱਕ-ਕਾਂਸਿਸਟੈਂਸੀ ਕਈ ਵਾਰੀ ਚਲ ਜਾਏ—ਜਦ ਤੱਕ ਇਹ ਨਹੀਂ ਹੁੰਦਾ। ਯੂਜ਼ਰ ਸਟੇਲ ਡੇਟਾ ਜਾਂ ਗੁੰਝਲਦਾਰ ਕੋਨੇ-ਕੋਨੇ ਦੇ ਕੇਸ ਵੇਖ ਸਕਦੇ ਹਨ ਜੇ ਐਪਲੀਕੇਸ਼ਨ ਠੀਕ ਤਰ੍ਹਾਂ ਨਹੀਂ ਡਿਜ਼ਾਈਨ ਕੀਤਾ।

ਕਦੇ-ਕਦੇ ਮੁਸ਼ਕਲ ਏਨਾਲਿਟਿਕਸ। ਕੁਝ NoSQL ਸਟੋਰ ਆਪਰੇਸ਼ਨਲ ਰੀਡ/ਰਾਈਟ ਵਿੱਚ ਬਹੁਤ ਚੰਗੇ ਹਨ ਪਰ ਐਡ-ਹਾਕ ਕਵੇਰੀ, ਰਿਪੋਰਟਿੰਗ, ਜਾਂ ਜਟਿਲ ਐਗਰੀਗੇਸ਼ਨਾਂ ਨੂੰ SQL-ਮੁੱਖ ਸਿਸਟਮਾਂ ਨਾਲੋਂ ਔਖਾ ਕਰ ਦਿੰਦੇ ਹਨ।

ਓਪਰੇਸ਼ਨ ਅਤੇ ਟੂਲਿੰਗ ਕਿਉਂ ਮਹੱਤਵਪੂਰਣ ਸੀ

ਸ਼ੁਰੂਆਤੀ NoSQL ਅਪਨਾਵਟ ਨੇ ਅਕਸਰ ਕੋਸ਼ਿਸ਼ ਡੇਟਾਬੇਸ ਫੀਚਰਾਂ ਤੋਂ ਇੰਜੀਨੀਅਰਿੰਗ ਅਨੁਸ਼ਾਸਨ ਵੱਲ ਸ਼ਿਫਟ ਕੀਤੀ: ਰੀਪਲੀਕੇਸ਼ਨ ਮਾਨੀਟਰਿੰਗ, ਪਾਰਟੀਸ਼ਨਾਂ ਦਾ ਪ੍ਰਬੰਧ, ਕੰਪੈਕਸ਼ਨ ਚਲਾਉਣਾ, ਬੈਕਅਪ/ਰਿਸਟੋਰ ਯੋਜਨਾ, ਅਤੇ ਫੇਲਿਅਰ ਸੇਨੇਰੀਓਜ਼ ਲਈ ਲੋਡ-ਟੈਸਟਿੰਗ। ਓਪਰੇਸ਼ਨਲ ਮੁਹੱਈਆ থੀਮ ਵਾਲੀਆਂ ਟੀਮਾਂ ਸਭ ਤੋਂ ਜ਼ਿਆਦਾ ਲਾਭ ਉਠਾਉਂਦੀਆਂ ਹਨ।

ਟਰੇਡ-ਆਫ ਕੀ ਅਧਾਰ 'ਤੇ ਜੰਚੋ

ਲੋਡ ਕਰੋ: ਉਮੀਦ ਕੀਤੀ ਲੈਟੈਂਸੀ, ਚੋਟੀ ਦੀ ਥਰੂਪੁੱਟ, ਪ੍ਰਮੁੱਖ ਕਵੇਰੀ ਪੈਟਰਨ, ਪੁਰਾਣੇ-ਡੇਟਾ ਲਈ ਸਹਿਣਸ਼ੀਲਤਾ, ਅਤੇ ਰਿਕਵਰੀ ਦੀਆਂ ਲੋੜਾਂ (RPO/RTO)। ਸਹੀ NoSQL ਚੋਣ ਉਹ ਹੁੰਦੀ ਹੈ ਜੋ ਤੁਹਾਡੇ ਐਪਲੀਕੇਸ਼ਨ ਦੇ ਫੇਲ-ਸਿਸਟਮ, ਸਕੇਲ ਅਤੇ ਕਿਵੇਂ ਕਵੇਰੀ ਕਰਨਾ ਹੈ ਨਾਲ ਮੇਲ ਖਾਂਦੀ ਹੋਵੇ—ਨਹੀਂ ਕਿ ਜਿਸਦੇ ਕੋਲ ਸਭ ਤੋਂ ਸ਼ਾਨਦਾਰ ਚੈੱਕਲਿਸਟ ਹੋਵੇ।

ਅੱਜ NoSQL ਤੁਹਾਡੇ ਲਈ ਠੀਕ ਹੈ ਜਾਂ ਨਹੀਂ—ਕਿਵੇਂ ਫੈਸਲਾ ਕਰੋ

NoSQL ਚੁਣਨਾ ਡੇਟਾਬੇਸ ਬਰਾਂਡਾਂ ਜਾਂ ਹਾਈਪ ਨਾਲ ਸ਼ੁਰੂ ਨਹੀਂ ਕਰਨਾ ਚਾਹੀਦਾ—ਇਹ ਤੁਹਾਡੇ ਐਪ ਦੀਆਂ ਜ਼ਰੂਰਤਾਂ, ਵਧਤ, ਅਤੇ ਯੂਜ਼ਰਾਂ ਲਈ "ਸਹੀ" ਦਾ ਕੀ ਮਤਲਬ ਹੈ ਨਾਲ ਸ਼ੁਰੂ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ।

ਲੋੜਾਂ ਅਤੇ ਐਕਸੈਸ ਪੈਟਰਨ ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ

ਡੇਟਾਸਟੋਰ ਚੁਣਨ ਤੋਂ ਪਹਿਲਾਂ ਲਿਖੋ:

ਉਹ 5–10 ਸਭ ਤੋਂ ਮੁੱਖ ਕਵੇਰੀਜ਼/ਆਪਰੇਸ਼ਨ ਜੋ ਤੁਹਾਨੂੰ ਸਪੋਰਟ ਕਰਨੇ ਹਨ (ਰੀਡ, ਰਾਈਟ, ਸਰਚ, ਐਗਰੀਗੇਸ਼ਨ)
ਹੁਣ ਅਤੇ 12–24 ਮਹੀਨੇ 'ਚ ਉਮੀਦ ਕੀਤੀ ਟ੍ਰੈਫਿਕ
ਪੁਰਾਣੇ-ਡੇਟਾ ਲਈ ਤੁਹਾਡੀ ਸਹਿਣਸ਼ੀਲਤਾ (ਮਿਲੀਸੈਕਿੰਡ, ਸਕਿੰਟ, ਕਦੇ ਨਹੀਂ)
ਫੇਲ੍ਹ ਹੋਣ 'ਤੇ ਤੁਹਾਡੀ ਉਮੀਦ (ਨੋਡ ਜਾਂ ਰੀਜਨ ਜਾਂ ਗਿਆ ਤਾਂ ਕੀ ਹੋਵੇਗਾ?)

ਜੇ ਤੁਸੀਂ ਆਪਣੀਆਂ ਐਕਸੈਸ ਪੈਟਰਨਸ ਸਪਸ਼ਟ ਤੌਰ 'ਤੇ ਨਹੀਂ ਲਿਖ ਸਕਦੇ, ਤਾਂ ਕੋਈ ਵੀ ਚੋਣ ਅਨੁਮਾਨੀ ਰਹੇਗੀ—ਖ਼ਾਸ ਕਰਕੇ NoSQL ਵਿੱਚ, ਜਿਥੇ ਮਾਡਲਿੰਗ ਅਕਸਰ ਪੜ੍ਹਨ/ਲਿਖਨ ਦੇ ਆਧਾਰ 'ਤੇ ਬਣਦੀ ਹੈ।

ਇੱਕ ਸਧਾਰਨ ਫੈਸਲਾ ਚੈੱਕਲਿਸਟ (SQL vs NoSQL vs ਹਾਈਬ੍ਰਿਡ)

SQL ਚੁਣੋ ਜੇ ਤੁਹਾਨੂੰ ਮੂਲ ਰੂਪ ਵਿੱਚ ਮਜ਼ਬੂਤ ਕਾਂਸਿਸਟੈਂਸੀ, ਜਟਿਲ ਐਡ-ਹਾਕ ਕਵੇਰੀਆਂ, ਅਤੇ ਬਹੁਤ ਸਾਰੇ ਰਿਸ਼ਤੇ ਦੀ ਲੋੜ ਹੈ ਜੋ ਜੋਇਨਾਂ ਤੋਂ ਫਾਇਦਾ ਲੈਂਦੇ ਹਨ।
NoSQL ਚੁਣੋ ਜੇ ਤੁਹਾਨੂੰ ਖਾਸ ਐਕਸੈਸ ਪੈਟਰਨ ਲਈ ਆਸਾਨ ਹੋਰੀਜ਼ੌਂਟਲ ਸਕੇਲ ਚਾਹੀਦਾ ਹੈ, ਤੁਸੀਂ ਉਹਨਾਂ ਪੈਟਰਨਾਂ ਦੇ ਆਧਾਰ 'ਤੇ ਡੇਟਾ ਡਿਜ਼ਾਈਨ ਕਰ ਸਕਦੇ ਹੋ, ਅਤੇ ਕੁਝ ਵਰਕਫਲੋਜ਼ ਲਈ ਢੀਲੀ ਕਾਂਸਿਸਟੈਂਸੀ ਸਵੀਕਾਰ ਕਰ ਸਕਦੇ ਹੋ।
ਹਾਈਬ੍ਰਿਡ ਚੁਣੋ ਜੇ ਐਪ ਦੇ ਵੱਖ-ਵੱਖ ਹਿੱਸਿਆਂ ਦੀਆਂ ਲੋੜਾਂ ਵੱਖ-ਵੱਖ ਹਨ (ਅਮਲ ਵਿੱਚ ਆਮ)।

ਇੱਕ ਵਰਤਨੀਕ ਸੰਕੇਤ: ਜੇ ਤੁਹਾਡਾ "ਕੋਰ ਸੱਚ" (orders, payments, inventory) ਹਰ ਵੇਲੇ ਸਹੀ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ, ਤਾਂ ਉਸਨੂੰ SQL ਜਾਂ ਕਿਸੇ ਹੋਰ ਮਜ਼ਬੂਤ ਸਟੋਰ ਵਿੱਚ ਰੱਖੋ। ਜੇ ਤੁਸੀਂ ਉੱਚ-ਵਾਲੀਉ ਸੰਪੱਤੀ, sessions, caching, activity feeds, ਜਾਂ ਲਚਕੀਲੇ ਯੂਜ਼ਰ-ਜਨਰੇਟੇਡ ਡੇਟਾ ਸੇਵਾ ਕਰ ਰਹੇ ਹੋ, NoSQL ਚੰਗਾ ਫਿਟ ਹੋ ਸਕਦਾ ਹੈ।

ਪੋਲਿਗਲੌਟ ਪਰਸਿਸਟੈਂਸ 'ਤੇ ਵਿਚਾਰ ਕਰੋ (ਮਕਸਦ ਨਾਲ)

ਕਈ ਟੀਮਾਂ ਕਈ ਸਟੋਰਾਂ ਨਾਲ ਸਫਲ ਹੁੰਦੀਆਂ ਹਨ: ਉਦਾਹਰਣ ਲਈ, ਟਰਾਂਜ਼ੈਕਸ਼ਨ ਲਈ SQL, ਪ੍ਰੋਫਾਈਲ/ਕੰਟੈਂਟ ਲਈ ਦਸਤਾਵੇਜ਼ ਡੇਟਾਬੇਸ, ਅਤੇ sessions ਲਈ ਕੀ-ਵੈਲਿਫ਼ ਸਟੋਰ। ਮਕਸਦ ਸਿਰਫ਼ ਜਟਿਲਤਾ ਨਹੀਂ—ਹਰ ਵਰਕਲੋਡ ਨੂੰ ਉਸ ਟੂਲ ਨਾਲ ਮਿਲਾਉਣਾ ਹੈ ਜੋ ਉਸਨੂੰ ਸਾਫ਼ ਸੰਭਾਲੇ।

ਇਹ ਓਥੇ ਹੈ ਜਿੱਥੇ ਡਿਵੈਲਪਰ ਵਰਕਫਲੋ ਮਹੱਤਵਪੂਰਣ ਹੋਂਦਾ ਹੈ। ਜੇ ਤੁਸੀਂ ਆਰਕੀਟੈਕਚਰ 'ਤੇ ਇਤਰੈਟ ਕਰ ਰਹੇ ਹੋ, ਤਾਂ ਇਕ ਕਾਰਯਸ਼ੀਲ ਪ੍ਰੋਟੋਟਾਈਪ ਤੇਜ਼ੀ ਨਾਲ ਖੜਾ ਕਰਨਾ—API, ਡੇਟਾ ਮਾਡਲ, ਅਤੇ UI—ਫੈਸਲਿਆਂ ਨੂੰ ਘੱਟ ਜੋਖਿਮ ਵਾਲਾ ਬਣਾ ਸਕਦਾ ਹੈ। ਪਲੇਟਫਾਰਮਾਂ ਜਿਵੇਂ Koder.ai ਟੀਮਾਂ ਨੂੰ ਚੈਟ ਤੋਂ ਪੂਰਾ-ਸਟੈਕ ਐਪ ਜਨਰੇਟ ਕਰਕੇ ਇਹ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੀਆਂ ਹਨ, ਆਮ ਤੌਰ 'ਤੇ React frontend ਅਤੇ Go + PostgreSQL backend ਨਾਲ, ਫਿਰ ਤੁਹਾਨੂੰ ਸਰੋਤ ਕੋਡ ਐਕਸਪੋਰਟ ਕਰਨ ਦਿੰਦੇ ਹਨ। ਭਾਵੇਂ ਤੁਸੀਂ ਬਾਅਦ ਵਿੱਚ ਨਿਯਮਤ NoSQL ਸਟੋਰ ਕਿਸੇ ਨਿਰਧਾਰਿਤ ਵਰਕਲੋਡ ਲਈ ਸ਼ਾਮਿਲ ਕਰੋ, ਪ੍ਰਮਾਣਿਤ SQL "ਸਿਸਟਮ ਆਫ ਰਿਕਾਰਡ" ਨਾਲ ਤੇਜ਼ ਪ੍ਰੋਟੋਟਾਈਪਿੰਗ, ਸਨੈਪਸ਼ਾਟਸ, ਅਤੇ ਰੋਲਬੈਕ ਪ੍ਰयोगਾਂ ਨੂੰ ਸੁਰੱਖਿਅਤ ਅਤੇ ਤੇਜ਼ ਬਣਾਉਂਦਾ ਹੈ।

ਧਾਰਣਾ ਨਾਲ ਨਹੀਂ—ਟੈਸਟ ਨਾਲ ਪ੍ਰਮਾਣਿਤ ਕਰੋ

ਜੋ ਵੀ ਤੁਸੀਂ ਚੁਣੋ, ਉਸ ਨੂੰ ਪਰਖੋ:

ਹਕੀਕਤੀ ਕਵੇਰੀਆਂ ਅਤੇ ਡਾਟਾ ਸਾਈਜ਼ਾਂ ਨਾਲ ਲੋਡ ਟੈਸਟ ਚਲਾਓ।
ਫੇਲਿਅਰ ਡ੍ਰਿਲ ਕਰੋ (ਨੋਡ ਮਾਰੋ, ਨੈੱਟਵਰਕ ਇਸ਼ੂਜ਼ ਸਿਮੁਲੇਟ ਕਰੋ, ਰੀਸਟੋਰ ਟੈਸਟ ਕਰੋ)।
ਇੱਕ ਸਕੀਮਾ ਈਵੋਲਿਊਸ਼ਨ ਯੋਜਨਾ ਬਣਾਓ: ਤੁਸੀਂ ਫੀਲਡ ਕਿਵੇਂ ਜੋੜੋਗੇ, ਰਿਕਾਰਡਸ ਨੂੰ ਕਿਵੇਂ ਮਾਈਗ੍ਰੇਟ ਕਰੋਗੇ, ਅਤੇ ਰੋਲਆਊਟ ਦੌਰਾਨ ਪੁਰਾਣੇ/ਨਵਾਂ ਵਰਨ ਵਰਕ ਕਰਨ ਲਈ ਕੀ ਕਰਨਾ ਹੈ।

ਜੇ ਤੁਸੀਂ ਇਹ ਸਾਰੇ ਸੈਨੇਰੀਓ ਨਹੀਂ ਟੈਸਟ ਕਰ ਸਕਦੇ, ਤਾਂ ਤੁਹਾਡਾ ਡੇਟਾਬੇਸ ਫੈਸਲਾ ਥਿਓਰਟਿਕ ਹੀ ਰਹਿ ਜਾਵੇਗਾ—ਅਤੇ ਪ੍ਰੋਡਕਸ਼ਨ ਤੁਹਾਡੇ ਲਈ ਟੈਸਟ ਕਰੇਗਾ।

ਅਕਸਰ ਪੁੱਛੇ ਜਾਣ ਵਾਲੇ ਸਵਾਲ

What was NoSQL originally trying to solve?

NoSQL ਨੇ ਦੋ ਆਮ ਦਬਾਵਾਂ ਦਾ ਹੱਲ ਲੱਭਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ:

ਸਕੇਲ: ਉੱਚ ਲੇਵਲ ਦੀ ਲਿਖਾਈ, ਟ੍ਰੈਫਿਕ ਵਿੱਚ ਧੱਕੇ ਅਤੇ ਐਸੇ ਡਾਟਾਸੇਟ ਜੋ ਇਕ ਇਕੱਲੇ "ਵੱਡੇ ਸਰਵਰ" ਤੋਂ ਵੱਧ ਹਨ।
ਬਦਲਾਅ: ਤੇਜ਼ੀ ਨਾਲ ਬਦਲ ਰਹੀਆਂ ਪ੍ਰੋਡਕਟ ਲੋੜਾਂ ਜਿਨ੍ਹਾਂ ਨੇ ਰਿਲੇਸ਼ਨਲ ਸਕੀਮਾ ਮਾਈਗ੍ਰੇਸ਼ਨਾਂ ਨੂੰ ਮਹਿੰਗਾ ਅਤੇ ਖਤਰਨਾਕ ਬਣਾਇਆ।

ਇਹ ਦੱਸਣਾ ਮੁੱਖ ਹੈ ਕਿ ਇਹ ਇਸ ਲਈ ਨਹੀਂ ਸੀ ਕਿ SQL "ਖਰਾਬ" ਸੀ—ਬੱਸ ਵੱਖ-ਵੱਖ ਵਰਕਲੋਡ ਵੱਖ-ਵੱਖ ਟਰੇਡ-ਆਫ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦੇ ਹਨ।

Why did scaling a single relational database server start to break down?

ਪ੍ਰੰਪਰਾਗਤ "ਸਕੇਲ-ਅੱਪ" ਤਰਕ ਸਾਡੇ ਲਈ ਹੇਠਾਂ ਆ ਗਿਆ:

ਮਹਿੰਗਾ ਹਾਈ-ਐਂਡ ਹਾਰਡਵੇਅਰ ਅਤੇ ਅਪਗਰੇਡ ਡਿਸਰਪਟਿਵ ਹੁੰਦੇ ਹਨ।
ਇਕੱਲਾ ਮਸ਼ੀਨ ਲਿਖਾਈ, ਡਿਸਕ ਅਤੇ ਫੇਲਓਵਰ ਲਈ ਬੋਤਲਨੈਕ ਬਣ ਜਾਂਦਾ ਹੈ।
ਪ੍ਰਧਾਨ ਡੇਟਾਬੇਸ ਇੱਕ ਖੇਤਰ ਵਿੱਚ ਹੋਣ ਕਾਰਨ ਗਲੋਬਲ ਯੂਜ਼ਰਾਂ ਲਈ ਲੈਟੈਂਸੀ ਵਧ ਜਾਂਦੀ ਹੈ।

NoSQL ਸਿਸਟਮਾਂ ਨੇ ਬਾਕੀ ਦੇ ਢਾਂਚੇ 'ਤੇ ਨੋਡ ਜੋੜ ਕੇ ਸਕੇਲ ਆਊਟ ਦੀ ਔਖੀਨ ਨੂੰ ਸਵੀਕਾਰ ਕੀਤਾ।

Why did rigid schemas become a problem for modern applications?

ਰਿਲੇਸ਼ਨਲ ਸਕੀਮਾਂ ਜਾਣ-ਬਝ ਕੇ ਕਠੋਰ ਹੁੰਦੀਆਂ ਹਨ, ਜੋ ਸਥਿਰਤਾ ਲਈ ਬਹਿਲਾ ਹੈ ਪਰ ਤੇਜ਼ ਇਤਰੇਸ਼ਨ ਦੇ ਸਮੇਂ ਵਿੱਚ ਦੁਖਦਾਈ ਬਣ ਸਕਦਾ ਹੈ। ਵੱਡੇ ਟੇਬਲਾਂ 'ਤੇ ਇੱਕ ਛੋਟਾ ਬਦਲਾਅ ਵੀ:

ਮਾਈਗ੍ਰੇਸ਼ਨ ਅਤੇ ਬੈਕਫਿਲ
ਇੰਡੈਕਸ ਅਪਡੇਟਸ
ਟੀਮਾਂ ਵਿਚਕਾਰ ਕੋਆਰਡੀਨੇਟਡ ਡੀਪਲੋਇਮੈਂਟ
ਰਖਰਖਾਅ ਦਾ ਜੋਖਮ

Document-ਸਟਾਈਲ ਮਾਡਲ ਆਮ ਤੌਰ 'ਤੇ ਇਸ ਘਰੜ ਨੂੰ ਘਟਾਉਂਦੇ ਹਨ ਕਿਉਂਕਿ ਉਹ ਵਿਕਾਸਸ਼ੀਲ ਅਤੇ ਵਿਕਲਪਿਕ ਫੀਲਡਸ ਨੂੰ ਸਿੱਧਾ ਸਟੋਰ ਕਰ ਲੈਂਦੇ ਹਨ।

Is NoSQL only about horizontal scaling (scaling out)?

ਜ਼ਰੂਰੀ ਨਹੀਂ। ਬਹੁਤ ਸਾਰੇ SQL ਡੇਟਾਬੇਸ ਵੀ ਸਕੇਲ ਆਊਟ ਕਰ ਸਕਦੇ ਹਨ, ਪਰ ਇਹ ਓਪਰੇਸ਼ਨਲ ਤੌਰ 'ਤੇ ਔਖਾ ਹੋ ਸਕਦਾ ਹੈ (ਸ਼ਾਰਡਿੰਗ, ਕ੍ਰਾਸ-ਸ਼ਾਰਡ ਜੌਇਨ, ਵਿਤਰਿਤ ਲੈਣਦੇਣ).

NoSQL ਸਿਸਟਮਾਂ ਨੇ ਆਮ ਤੌਰ 'ਤੇ ਡਿਸਟ੍ਰੀਬਿਊਸ਼ਨ (ਪਾਰਟੀਸ਼ਨਿੰਗ + ਰੀਪਲੀਕੇਸ਼ਨ) ਨੂੰ ਪਹਿਲੀ ਪੰਗਤੀ ਵਜੋਂ ਕਾਇਮ ਕੀਤਾ ਅਤੇ ਖਾਸ, ਭਵਿੱਖਵਾਣੀ ਪੈਟਰਨ ਲਈ ਓਪਟੀਮਾਈਜ਼ ਕੀਤਾ।

Why do NoSQL designs often use denormalization and fewer joins?

ਡੇਟਾ ਨੂੰ ਉਸ ਰੂਪ ਵਿੱਚ ਰੱਖੋ ਜਿਸ ਤਰ੍ਹਾਂ ਤੁਸੀਂ ਉਸਨੂੰ ਪੜ੍ਹਦੇ ਹੋ—ਯਾਨੀ ਅਕਸਰ ਡੇਨਾਰਮਲਾਈਜ਼ੇਸ਼ਨ ਹੋਣੀ ਪੈਂਦੀ ਹੈ, ਜਿਸ ਨਾਲ ਇੱਕੋ-ਇੱਕ ਰੀਕਵੈਸਟ 'ਤੇ ਜਾਣ ਵਾਲੀ ਰਿਕਾਰਡ ਨੂੰ ਸਟੋਰ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।

ਉਦਾਹਰਣ: orders ਰਿਕਾਰਡ ਵਿੱਚ ਗਾਹਕ ਦਾ ਨਾਮ ਰੱਖਣਾ ਤਾਂ ਜੋ "ਆਖਰੀ 20 orders" ਇੱਕ ਹੀ ਤੇਜ਼ ਪੜ੍ਹਾਈ ਵਿੱਚ ਮਿਲ ਜਾਵੇ।

ਇਸ ਦਾ ਟਰੇਡ-ਆਫ: ਅੱਪਡੇਟਾਂ ਨੂੰ ਹਰ ਥਾਂ ਸਹੀ ਰੱਖਣ ਲਈ ਐਪਲੀਕੇਸ਼ਨ ਲੌਜਿਕ ਜਾਂ ਪਾਈਪਲਾਈਨ ਬਨਾਉਣੇ ਪੈਂਦੇ ਹਨ।

What does the CAP theorem mean in practical terms for NoSQL?

ਨੈੱਟਵਰਕ ਪਾਰਟੀਸ਼ਨਾਂ ਦੇ ਸਮੇਂ, ਡੇਟਾਬੇਸ ਨੇ ਸੋਚਣਾ ਪੈਂਦਾ ਹੈ ਕਿ ਕਦੋਂ ਵੀ ਇਹ ਸਹੀ ਤੌਰ 'ਤੇ ਕੋਆਰਡੀਨੇਟ ਨਹੀਂ ਕਰ ਸਕਦਾ ਤਾਂ ਕੀ ਕਰੇ।

Availability ਨੂੰ ਤਰਜੀਹ: ਰਿਕuestਸ ਨੂੰ ਜਵਾਬ ਦਿੰਦੇ ਰਹੋ, ਭਲੇ ਹੀ ਡੇਟਾ ਥੋੜ੍ਹਾ ਪੁਰਾਣਾ ਹੋਵੇ।
Consistency ਨੂੰ ਤਰਜੀਹ: ਛੇਤੀ-ਛੇਤੀ ਰਿਕuestਸ ਨੂੰ ਰੱਦ ਕਰ ਦਿਓ ਜਦ ਤੱਕ ਰੀਪਲਿਕਾਜ਼ ਸਹਿਮਤ ਨਾ ਹੋ ਜਾਣ।

CAP ਸਾਨੂੰ ਯਾਦ ਦਿਲਾਉਂਦਾ ਹੈ ਕਿ ਪਾਰਟੀਸ਼ਨ ਦੇ ਦੌਰਾਨ ਤੁਸੀਂ ਇੱਕੋ-ਸਮੇਂ ਦੋਵਾਂ ਨੂੰ ਪੂਰਾ ਨਹੀਂ ਕਰ ਸਕਦੇ।

What’s the difference between strong consistency and eventual consistency?

ਮਜ਼ਬੂਤ (strong) consistency ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਜਿਵੇਂ ਹੀ ਇੱਕ ਲਿਖਾਈ ਤਸਦੀਕ ਹੋ ਜਾਵੇ, ਸਾਰੇ ਰੀਡਰ ਉਸ ਨੂੰ ਤੁਰੰਤ ਵੇਖਣ। ਇਹ ਅਕਸਰ ਨੋਡਸ ਵਿੱਚ ਕੋਆਰਡੀਨੇਸ਼ਨ ਮੰਗਦਾ ਹੈ।

Eventual consistency ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਰੀਪਲਿਕਾ ਆਰੰਭਿਕ ਤੌਰ 'ਤੇ ਵੱਖਰੇ ਜਵਾਬ ਦੇ ਸਕਦੇ ਹਨ, ਪਰ ਕੁਝ ਸਮੇਂ ਬਾਅਦ ਸਿਸਟਮ ਮਿਲ ਜੁਲ ਕੇ ਸਮਾਨ ਹੋ ਜਾਏਗਾ। ਇਹ ਫੀਡਜ਼, ਕਾਊਂਟਰਜ਼ ਅਤੇ ਉੱਚ-ਉਪਲਬਧਤਾ ਵਾਲੀਆਂ ਯੂਜ਼ਰ ਅਨੁਭਵਾਂ ਲਈ ਕਾਫੀ ਹੁੰਦਾ ਹੈ—ਜੇ ਐਪਲੀਕੇਸ਼ਨ ਥੋੜ੍ਹੀ ਪੁਰਾਣੀ ਜਾਣਕਾਰੀ ਸਹਿਣ ਕਰ ਸਕਦੀ ਹੋਵੇ।

How do NoSQL databases handle conflicting writes?

ਟਕਰਾਅ ਉਸ ਵੇਲੇ ਹੁੰਦੇ ਹਨ ਜਦੋਂ ਵੱਖ-ਵੱਖ ਰੀਪਲਿਕਾਜ਼ ਨੇ ਇਕੱਠੇ-ਇੱਕੋ ਸਮੇਂ ਅੱਪਡੇਟ ਸਵੀਕਾਰ ਲਿਆ। ਆਮ ਰਣਨੀਤੀਆਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:

Last-write-wins (ਟਾਈਮਸਟੈਂਪ): ਨਵੀਨਤਮ ਟਾਈਮਸਟੈਂਪ ਵਾਲੀ ਅਪਡੇਟ ਰੱਖੋ—ਸਰਲ, ਪਰ ਡੇਟਾ ਖੋ ਸਕਦਾ ਹੈ ਜੇ ਘੜੀਆਂ ਵੱਖ-ਵੱਖ ਹੋਣ।
ਵਰਜ਼ਨਿੰਗ/ਵੈਕਟਰ ਵਿਵੇਕ: ਦਿਖਾਓ ਕਿ ਕਿਸ ਰੀਪਲਿਕਾ ਨੇ ਕਿਹੜੇ ਅਪਡੇਟ ਵੇਖੇ ਹਨ, ਸਮਕਾਲੀ ਲਿਖਤਾਂ ਪਛਾਣੋ ਅਤੇ ਮਿਲਾਓ ਜਾਂ ਟਕਰਾਅ ਉਭਾਰੋ।

ਤੁਹਾਡਾ ਚੋਣ ਇਸ 'ਤੇ ਨਿਰਭਰ ਕਰੇਗੀ ਕਿ ਕੀ ਮੱਧ-ਅਪਡੇਟ ਲੁੱਟ ਜਾਣਾ ਬਰਦਾਸ਼ਤ ਹੈ ਜਾਂ ਨਹੀਂ।

How do I choose between key-value, document, wide-column, and graph databases?

ਛੇਤੀ ਮੇਲ-ਮਿਲਾਪ ਲਈ ਇੱਕ ਤੇਜ਼ ਡਿਸਟ੍ਰੀਬਿਊਟਡ ਹੈਸ਼ਮੇਪ ਵਾਂਗ key-value ਸਟੋਰ ਬਣਾ ਦਿੰਦੇ ਹਨ।

ਇਹ ਉਹਥੇ ਚੰਗੇ ਹਨ ਜਿੱਥੇ ਤੁਸੀਂ ਪਹਿਲਾਂ ਹੀ ਲੁੱਕਅਪ ਕੀ ਜਾਣ ਹੋ (sessions, caching, feature flags), ਪਰ ਇਨ੍ਹਾਂ ਦਾ ਇरਾਦਾ ਅਕਸਰ ਕਈ ਫੀਲਡਾਂ 'ਤੇ ਫਿਲਟਰਿੰਗ ਨਹੀਂ ਹੁੰਦੀ।

How do I choose between key-value, document, wide-column, and graph databases?

Key-value: ID ਦੇ ਨਾਲ ਸਭ ਤੋਂ ਤੇਜ਼ ਲੁੱਕਅਪ (sessions, caching, feature flags)।
Document: ਲਚਕੀਲੇ JSON-ਵਾਂਗ ਰਿਕਾਰਡ (profiles, catalogs, content)।
Wide-column: ਬਹੁਤ ਵੱਡੀ ਲਿਖਾਈ ਦੀ ਰਫ਼ਤਾਰ (events, logs, time-series)।
Graph: ਰਿਸ਼ਤਿਆਂ ਦੀ ਖੋਜ (recommendations, fraud rings, dependency graphs)।

ਆਪਣੀਆਂ ਡੋਮਿਨ-ਸਪੈਸੀਫਿਕ ਐਕਸੈਸ ਪੈਟਰਨਸ ਦੇ ਅਧਾਰ 'ਤੇ ਚੁਣੋ—ਨਾਮ ਹੀ ਨਹੀਂ।

How can I tell if NoSQL is the right choice for my system today?

ਆਪਣੀ ਲੋੜਾਂ ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ ਅਤੇ ਹੋਰ ਕੀਮਤਾਂ/ਗ੍ਰੋਥ ਨਾਲ ਪ੍ਰਮਾਣਿਤ ਕਰੋ:

ਆਪਣੀਆਂ ਟਾਪ 5–10 ਕਵੇਰੀਜ਼/ਆਪਰੇਸ਼ਨਾਂ ਲਿਖੋ।
12–24 ਮਹੀਨਿਆਂ ਵਿੱਚ ਉਮੀਦ ਕੀਤੀ ਟ੍ਰੈਫਿਕ।
ਪੁਰਾਣੇ ਡਾਟੇ ਲਈ ਸਹਿਣਸ਼ੀਲਤਾ (ਮਿਲੀਸੈਕਿੰਡ, ਸਕਿੰਟ, ਕਦੇ ਨਹੀਂ)।
ਫੇਲ੍ਹ ਹੋਣ 'ਤੇ ਕੀ ਹੋਵੇਗਾ (ਨੋਡ/ਰੀਜਨ ਗੁਆਚ ਜਾਣ)।

ਅਕਸਰ ਹਾਈਬ੍ਰਿਡ ਹੀ ਸਹੀ ਹੁੰਦਾ ਹੈ: SQL ਟਰਾਂਜ਼ੈਕਸ਼ਨ ਲਈ, NoSQL ਉੱਚ-ਵਾਲਿਊ ਜਾਂ ਲਚਕੀਲੇ ਡਾਟਾ ਲਈ।