ਕਿਵੇਂ Emad Mostaque ਅਤੇ Stability AI ਨੇ ਖੁੱਲ੍ਹੇ-ਸਰੋਤ ਜਨਰੇਟਿਵ AI ਨੂੰ ਵਾਇਰਲ ਬਣਾਇਆ—Stable Diffusion ਕਿਸ ਤਰ੍ਹਾਂ ਫੈਲੀ, ਕੀ ਚੀਜ਼ਾਂ ਇਸਨੂੰ ਭੜਕਾਇਆ, ਅਤੇ ਕਿਹੜੇ ਵਿਵਾਦ ਉਭਰੇ।

Emad Mostaque ਦਾ ਨਾਮ ਖੁੱਲ੍ਹੇ-weights ਜਨਰੇਟਿਵ AI ਦੇ ਸਭ ਤੋਂ ਧਮਾਕੇਦਾਰ ਅਧਿਆਏ ਨਾਲ ਜੁੜ ਗਿਆ: Stable Diffusion ਦੀ ਜਨਤਕ ਰਿਲੀਜ਼ ਅਤੇ ਉਸ ਤੋਂ ਬਾਅਦ ਆਈ ਰਚਨਾਤਮਕਤਾ, ਟੂਲਿੰਗ ਅਤੇ ਵਿਵਾਦ ਦੀ ਲਹਿਰ। ਉਹ ਇਸ ਤਕਨਾਲੋਜੀ ਦੇ ਇਕੱਲੇ ਮੋਹਰੇ ਨਹੀਂ ਸਨ—ਅਧਾਰਭੂਤ ਰਿਸਰਚ ਕਮਿਊਨਿਟੀ ਕਿਸੇ ਇੱਕ ਵਿਅਕਤੀ ਤੋਂ ਕਾਫੀ ਵੱਡੀ ਹੈ—ਪਰ ਉਹ ਇਕ ਵਿਆਖਿਆਕਾਰੀ ਵਿਚਾਰ ਦਾ ਨਜ਼ਰ ਆਉਣ ਵਾਲਾ ਮੁਖਰਧਾਰ ਬਣ ਗਏ: ਮਜ਼ਬੂਤ ਜਨਰੇਟਿਵ ਮਾਡਲ ਵਿਸ਼ਾਲ ਪਹੁੰਚ ਵਿੱਚ ਹੋਣੇ ਚਾਹੀਦੇ ਹਨ, ਨਾ ਕਿ ਇੱਕ ਕੰਪਨੀ ਦੇ ਇਨਟਰਫੇਸ ਦੇ ਪਿੱਛੇ ਲਾਕ ਕੀਤੇ ਹੋਏ۔
ਇਥੇ “ਵਾਇਰਲ” ਇਕ headline ਜਾਂ ਸੋਸ਼ਲ ਮੀਡੀਆ ਦੇ ਇੱਕ ਲਮ੍ਹੇ ਬਾਰੇ ਨਹੀਂ—ਇਹ ਇੱਕ ਐਸਾ ਪੈਟਰਨ ਹੈ ਜੋ ਅਸਲ ਦੁਨਿਆ ਵਿੱਚ ਦੇਖਣਾ ਸੰਭਵ ਹੈ:
ਜਦ ਰਿਲੀਜ਼ ਇਹਨਾਂ ਚਾਰਾਂ ਨੂੰ ਟ੍ਰਿਗਰ ਕਰਦੀ ਹੈ, ਤਾਂ ਉਹ ਸਿਰਫ਼ “ਇੱਕ ਮਾਡਲ” ਨਹੀਂ ਰਹਿੰਦੀ—ਉਹ ਇੱਕ ਹਿਲਚਲ ਵਾਂਗ ਕੰਮ ਕਰਦੀ ਹੈ।
ਖੁੱਲ੍ਹੀਆਂ ਰਿਲੀਜ਼ਾਂ ਸਿੱਖਣ ਵਿਚ ਤੇਜ਼ੀ ਲਿਆ ਸਕਦੀਆਂ ਹਨ ਅਤੇ ਨਵੀਂ ਰਚਨਾਤਮਕਤਾ ਲਈ ਦਰਵਾਜੇ ਖੋਲ੍ਹ ਸਕਦੀਆਂ ਹਨ। ਪਰ ਉਹ ਦੁਰਵਰਤੋਂ, ਕਾਪੀਰਾਈਟ ਟਕਰਾਅ ਨੂੰ ਤੇਜ਼ ਕਰ ਸਕਦੀਆਂ ਹਨ, ਅਤੇ ਸੁਰੱਖਿਆ ਅਤੇ ਸਹਾਇਤਾ ਦੇ ਬੋਝ ਨੂੰ ਉਹਨਾਂ ਕਮਿਊਨਿਟੀਆਂ ਉੱਤੇ ਟਾਲ ਸਕਦੀਆਂ ਹਨ ਜੋ ਇਸਦੇ ਲਈ ਮੰਗ ਕਰਦੀਆਂ ਹੀ ਨਹੀਂ। Mostaque ਦੀ ਜਨਤਕ ਵਕਾਲਤ ਨੇ ਉਹਨਾਂ ਤਣਾਅਾਂ ਦਾ ਪ੍ਰਤੀਕ ਬਣਾਇਆ—ਜਿਨ੍ਹਾਂ ਦਾ ਸਰਾਹਨਾ ਉਹਨਾਂ ਨਿਰਮਾਤਾਾਂ ਨੇ ਕੀਤੀ ਜੋ ਪਹੁੰਚ ਚਾਹੁੰਦੇ ਸਨ, ਅਤੇ ਨਿੰਦਕਾਂ ਨੇ ਕੀਤੀ ਜੋ ਨੁਕਸਾਨ ਅਤੇ ਜਵਾਬਦੇਹੀ ਦੀ ਚਿੰਤਾ ਕਰਦੇ ਸਨ۔
ਇਹ ਲੇਖ Stable Diffusion ਕਿਸ ਤਰ੍ਹਾਂ ਕੰਮ ਕਰਦਾ ਹੈ (ਗਣਿਤ ਦੇ ਬਿਨਾਂ), ਕਿਵੇਂ ਖੁੱਲ੍ਹੀ ਪਹੁੰਚ ਨੇ ਇੱਕ ਰਚਨਾਤਮਕ ਪਰਿਵਾਰ ਖੋਲਿਆ, ਕਿਉਂ ਵਿਰੋਧ ਉਭਰਿਆ, ਅਤੇ ਜਦੋਂ ਤੁਸੀਂ ਇੱਕ ਅਸਲੀ ਪ੍ਰੋਜੈਕਟ ਲਈ ਔਜ਼ਾਰ ਚੁਣਦੇ ਹੋ ਤਾਂ “ਖੁੱਲ੍ਹਾ ਬਨਾਮ ਬੰਦ” ਦਾ ਅਰਥ ਕੀ ਹੁੰਦਾ ਹੈ। ਅੰਤ ਤੱਕ, ਤੁਹਾਡੇ ਕੋਲ ਵਾਇਰਲ ਲਹਿਰ ਦੀ ਪ੍ਰੈਕਟਿਕਲ ਸਮਝ ਹੋਏਗੀ—ਅਤੇ ਤੈਅ ਕਰ ਸਕੋਗੇ ਕਿ ਤੁਹਾਡੇ ਲਈ ਕਿਹੜਾ ਜਨਰੇਟਿਵ AI ਰਣਨੀਤੀ ਮੈਚ ਕਰਦੀ ਹੈ।
Stable Diffusion ਦੇ ਬ੍ਰੇਕਆਉਟ ਤੋਂ ਪਹਿਲਾਂ, ਜਨਰੇਟਿਵ AI ਪਹਿਲਾਂ ਹੀ ਰੋਮਾਂਚਕ ਲੱਗ ਰਿਹਾ ਸੀ—ਪਰ ਵਧੇਰੇ ਤਰ੍ਹਾਂ ਰੁਕਿਆ ਹੋਇਆ। ਜ਼ਿਆਦਾਤਰ ਲੋਕ ਛਤੀਨਲਿਸਟਾਂ, ਸੀਮਤ ਬੀਟਾ ਜਾਂ ਪੋਲਿਸ਼ਡ ਡੈਮੋ ਰਾਹੀਂ ਹੀ ਚਿੱਤਰ ਸਨਭਾਲਦੇ ਸਨ। ਜੇ ਤੁਸੀਂ “ਇਨ” ਗਰੁੱਪ ਦਾ ਹਿੱਸਾ ਨਹੀਂ ਸੀ (ਇੱਕ ਲੈਬ, ਚੰਗੀ ਤਰ੍ਹਾਂ ਫੰਡ ਕੀਤਾ ਸਟਾਰਟਅਪ, ਜਾਂ ਡਿਵੈਲਪਰ ਜਿਸਨੂੰ ਪਹੁੰਚ ਸੀ), ਤਾਂ ਤੁਸੀਂ ਜ਼ਿਆਦਾਤਰ ਸਮੇਂ ਸਾਈਡਲਾਈਨ 'ਤੇ ਦੇਖਦੇ ਰਹਿੰਦੇ।
ਇੱਕ ਬੰਦ API ਮਾਡਲ ਇੱਕ ਤਾਕਤਵਰ ਮਸ਼ੀਨ ਵਰਗਾ ਹੈ ਜੋ ਕਾਊਂਟਰ ਦੇ ਪਿੱਛੇ ਹੈ: ਤੁਸੀਂ ਬੇਨਤੀ ਭੇਜਦੇ ਹੋ, ਨਤੀਜਾ ਮਿਲਦਾ ਹੈ, ਅਤੇ ਪ੍ਰਦਾਤਾ ਕੀਮਤ, ਨਿਯਮ, ਰੇਟ ਲਿਮਿਟ ਅਤੇ ਕੀ ਮਨਜ਼ੂਰ ਹੈ ਇਹ ਨਿਰਧਾਰਤ ਕਰਦਾ ਹੈ। ਇਹ ਤਰੀਕਾ ਜ਼ਿਆਦਾ ਸੁਰੱਖਿਅਤ ਅਤੇ ਸਧਾਰਣ ਹੋ ਸਕਦਾ ਹੈ, ਪਰ ਇਸ ਦਾ ਮਤਲਬ ਇਹ ਵੀ ਹੈ ਕਿ ਪ੍ਰਯੋਗ ਉਸ ਦੇ ਹੱਦਾਂ ਅਨੁਸਾਰ ਹੀ ਹੁੰਦਾ ਹੈ।
Open-weight ਜਾਂ ਡਾਊਨਲੋਡੇਬਲ ਰਿਲੀਜ਼ ਨੇ ਅਨੁਭਵ ਨੂੰ ਉਲਟ ਦਿੱਤਾ। ਨਿਰਮਾਤਾ ਆਪਣੇ ਹਾਰਡਵੇਅਰ 'ਤੇ ਮਾਡਲ ਚਲਾ ਸਕਦੇ ਸਨ, ਸੈਟਿੰਗਸ ਨੂੰ ਬਦਲ ਸਕਦੇ ਸਨ, forks ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਸਕਦੇ ਸਨ, ਅਤੇ ਹਰ ਪ੍ਰੰਪਟ ਲਈ ਆਗਿਆ ਮੰਗਣ ਦੀ ਲੋੜ ਨਹੀਂ ਸੀ। ਭਾਵੇਂ ਕਿ ਕੋਈ ਰਿਲੀਜ਼ ਕਠੋਰ ਤੌਰ 'ਤੇ “open-source” ਨਾ ਹੋਵੇ, ਪਰ weights ਦੀ ਉਪਲਬਧਤਾ ਇੱਕ ਮਲਕੀਅਤ ਅਤੇ ਏਜੇੰਸੀ ਦੀ ਭਾਵਨਾ ਪੈਦਾ ਕਰਦੀ ਹੈ ਜੋ APIs ਵੱਲੋਂ ਕਦਾਚਿਤ ਹੀ ਮਿਲਦੀ ਹੈ।
ਕਮਿਊਨਿਟੀਆਂ ਲਈ ਮਾਲੀਅਤ ਇੱਕ ਨੋਟਸ ਨਹੀਂ ਸੀ—ਉਹ ਕਹਾਣੀ ਸੀ। API ਕੀਮਤਾਂ ਅਤੇ ਕੋਟੇ ਖੇਡ ਨੂੰ ਬੇਨਤੀ ਕਰ ਸਕਦੇ ਹਨ: ਤੁਸੀਂ 50 ਵਿਚਾਰਾਂ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਨ ਤੋਂ ਹਿਚਕੋਚਾਓਗੇ, ਨਿਸ਼ੀ ਸਟਾਈਲਾਂ ਨੂੰ ਖੋਜਣ ਤੋਂ ਰੁਕੋਗੇ, ਜਾਂ ਇੱਕ ਅਜੀਬ ਸਾਈਡ ਪ੍ਰੋਜੈਕਟ ਬਣਾਉਣ ਤੋਂ ਡਰੋਗੇ ਜੇ ਹਰ ਦੌੜ ਤੇ ਮੀਟਰ ਚੱਲਦਾ ਮਹਿਸੂਸ ਹੋਵੇ।
ਡਾਊਨਲੋਡੇਬਲ ਮਾਡਲਾਂ ਨਾਲ, ਪ੍ਰਯੋਗ ਇੱਕ ਸ਼ੌਂਕ ਮੁੜ ਬਣ ਗਿਆ। ਲੋਕ ਪ੍ਰੰਪਟ ਸਾਂਝੇ ਕਰਦੇ, ਸੈਟਿੰਗਸ ਤੁਲਨਾ ਕਰਦੇ, ਚੈੱਕਪੋਇੰਟ ਫਾਇਲਾਂ ਸਾਂਝਾ ਕਰਦੇ, ਅਤੇ ਕਰਕੇ ਸਿੱਖਦੇ। ਉਹ ਹੱਥ-ਵਾਲਾ ਲੂਪ “AI ਇਮੇਜ ਜਨਰੇਸ਼ਨ” ਨੂੰ ਇੱਕ ਉਤਪਾਦ ਤੋਂ ਪ੍ਰੈਕਟਿਸ ਵਿੱਚ ਬਦਲ ਦਿੱਤਾ।
ਆਉਟਪੁਟ ਸਾਂਝੇ ਕਰਨ ਲਾਇਕ ਸਨ: ਇਕ ਤਸਵੀਰ ਜਰੂਰਤ ਵਿਚ ਜਿਗਿਆਸਾ, ਵਾਦ-ਵਿਵਾਦ ਅਤੇ ਨਕਲ ਨੂੰ ਜਨਮ ਦੇ ਸਕਦੀ ਸੀ। Twitter, Reddit, Discord ਸਰਵਰ ਅਤੇ ਕ੍ਰੀਏਟਰ ਫੋਰਮ ਤਕਨੀਕਾਂ ਅਤੇ ਨਤੀਜਿਆਂ ਲਈ ਵੰਡ ਚੈਨਲ ਬਣ ਗਏ। ਮਾਡਲ ਸਿਰਫ਼ ਤਾਕਤਵਰ ਹੋਣ ਕਰਕੇ ਨਹੀਂ ਫੈਲਿਆ—ਉਹ ਇਸ ਲਈ ਫੈਲਿਆ ਕਿਉਂਕਿ ਕਮਿਊਨਿਟੀਆਂ ਇਸਨੂੰ Remix ਕਰ ਸਕਦੀਆਂ, ਦਿਖਾ ਸਕਦੀਆਂ ਅਤੇ ਤੇਜ਼ੀ ਨਾਲ ਇਕ दोसਰੇ ਦੀ ਮਦਦ ਕਰਕੇ ਸੁਧਾਰ ਕਰ ਸਕਦੀਆਂ।
Stable Diffusion ਇੱਕ ਟੈਕਸਟ-ਟੂ-ਇਮੇਜ ਜਨਰੇਟਰ ਹੈ: ਤੁਸੀਂ ਇੱਕ ਪ੍ਰੰਪਟ ਲਿਖਦੇ ਹੋ, ਅਤੇ ਇਹ ਉਸ ਬਿਆਨ ਨਾਲ ਮਿਲਦੀ-ਜੁਲਦੀ ਤਸਵੀਰ ਬਣਾਉਂਦਾ ਹੈ।
ਇਸਨੂੰ ਇਸ ਤਰ੍ਹਾਂ ਸੋਚੋ ਕਿ ਇਹ ਸਿਸਟਮ ਨੇ ਭਾਰ ਵੱਡੀ ਗਿਣਤੀ ਵਿੱਚ ਤਸਵੀਰਾਂ ਅਤੇ ਉਨ੍ਹਾਂ ਦੇ ਕੈਪਸ਼ਨਾਂ ਤੋਂ ਪੈਟਰਨ ਸਿੱਖੇ ਹਨ। ਟ੍ਰੇਨਿੰਗ ਦੌਰਾਨ, ਮਾਡਲ ਇੱਕ ਆਮ ਖੇਡ ਨਿਭਾਉਂਦਾ ਹੈ: ਇੱਕ ਸਾਫ਼ ਤਸਵੀਰ ਨੂੰ ਵਿਜ਼ੂਅਲ “ਨੋਇਜ਼” ਨਾਲ ਗੁੜਮੁੜਾ ਕਰੋ, ਫਿਰ ਧੀਰੇ-ਧੀਰੇ ਉਸ ਨੋਇਜ਼ ਨੂੰ ਹਟਾਉਣਾ ਸਿੱਖੋ ਜਦ ਤੱਕ ਰਚਨਾ ਸਾਫ਼ ਨਹੀਂ ਹੋ ਜਾਂਦੀ।
ਜਦੋਂ ਤੁਸੀਂ ਇਸਨੂੰ ਵਰਤਦੇ ਹੋ, ਤੁਸੀਂ ਨੋਇਜ਼ ਤੋਂ ਸ਼ੁਰੂ ਕਰਦੇ ਹੋ। ਤੁਹਾਡਾ ਪ੍ਰੰਪਟ ਉਸ ਸਾਫ਼-ਕਰਨ ਦੀ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਦਿਸ਼ਾ ਦਿੰਦਾ ਹੈ ਤਾਂ ਜੋ ਸਟੈਟਿਕ ਗਰੰਜੇ ਤੋਂ ਇਕ ਚਿੱਤਰ ਬਣੇ ਜੋ ਵੇਰਵਾ ਨਾਲ ਮਿਲਦਾ-ਜੁਲਦਾ ਹੋਏ। ਇਹ ਕਿਸੇ ਨਿਰਧਾਰਤ ਤਸਵੀਰ ਨੂੰ “ਕਾਪੀ” ਨਹੀਂ ਕਰ ਰਿਹਾ; ਇਹ ਸਿੱਖੇ ਗਏ ਵਿਜ਼ੂਅਲ ਪੈਟਰਨਾਂ ਦੀ ਪਾਲਨਾ ਕਰਕੇ ਨਵੀਂ ਤਸਵੀਰ ਪੈਦਾ ਕਰਦਾ ਹੈ—ਰੰਗ, ਰਚਨਾ, ਟੈਕਸਟਚਰ, ਸਟਾਈਲ—ਤੇ ਤੁਹਾਡੇ ਟੈਕਸਟ ਨਾਲ ਮੋੜਿਆ ਗਿਆ।
ਲੋਕ ਅਕਸਰ ਇਹ ਸ਼ਬਦ ਢਿੱਲੇ ਢੰਗ ਨਾਲ ਵਰਤਦੇ ਹਨ, ਇਸ ਲਈ ਉਨ੍ਹਾਂ ਨੂੰ ਵੱਖ ਕਰਨਾ ਸਹਾਇਕ ਹੈ:
Stable Diffusion ਤੇਜ਼ੀ ਨਾਲ ਫੈਲਿਆ ਕਿਉਂਕਿ ਇਸਨੂੰ ਖਾਸ ਨਿਯੋਤਾ ਜਾਂ ਵੱਡੇ ਕਰਪੋਰੇਟ ਅਕਾਊਂਟ ਦੀ ਲੋੜ ਨਹੀਂ ਸੀ। ਕਈ ਲੋਕ ਇਹ ਕਰ ਸਕਦੇ ਸਨ:
ਪਹਿਲੇ ਨਤੀਜੇ ਪੂਰੇ-ਨਿਪੁੰਨ ਹੋਣ ਦੀ ਲੋੜ ਨਹੀਂ—ਤੇਜ਼ੀ ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ ਤਾਂ ਜੋ ਤੁਸੀਂ ਮੁੜ-ਵਿਚਾਰ ਕਰ ਸਕੋ: ਪ੍ਰੰਪਟ ਨੂੰ ਬਦਲੋ, ਸਟਾਈਲ ਬਦਲੋ, ਨਵਾਂ ਸੀਡ ਦਿਓ, ਅਤੇ ਸਭ ਤੋਂ ਵਧੀਆ ਨਤੀਜੇ ਮਿੰਟਾਂ ਵਿੱਚ ਸਾਂਝੇ ਕਰੋ। ਇਹ ਗਤੀ—ਅਤੇ ਗੁਣਵੱਤਾ ਜੋ memes, ਕਾਂਸੈਪਟ ਆਰਟ, ਥੰਬਨੇਲ ਅਤੇ ਪ੍ਰੋਟੋਟਾਈਪ ਲਈ ‘‘ਚੰਗੀ-ਕਾਫੀ’’ ਹੋਵੇ—ਸਾਂਝਾ ਕਰਨ ਅਤੇ ਪ੍ਰਯੋਗ ਨੂੰ ਆਸਾਨ ਬਣਾਉਂਦੀ ਹੈ।
Emad Mostaque ਨੂੰ Stable Diffusion ਦੀ ਤੁਰੰਤ ਵਾਇਰਲ ਉਚਾਈ ਨਾਲ ਘਣੀ ਤਰ੍ਹਾਂ ਜੋੜਿਆ ਜਾਂਦਾ ਹੈ ਕਿਉਂਕਿ ਉਹ Stability AI ਲਈ ਸਭ ਤੋਂ ਨਜ਼ਰ ਆਉਣ ਵਾਲਾ ਵਕਤਾ ਸਨ—ਕੰਪਨੀ ਜਿਸ ਨੇ ਕੰਮ ਨੂੰ ਫੰਡ, ਪੈਕੇਜ ਅਤੇ ਵੰਡਣ ਵਿੱਚ ਮਦਦ ਕੀਤੀ ਤਾਂ ਜੋ ਨਿਰਮਾਤਾ ਤੁਰੰਤ ਕੋਸ਼ਿਸ਼ ਕਰ ਸਕਣ।
ਜਨਤਕ-ਮੁਖੀ ਭੂਮਿਕਾ ਮਹਤਵਪੂਰਨ ਹੁੰਦੀ ਹੈ। ਜਦੋਂ ਕੋਈ ਮਾਡਲ ਨਵਾਂ ਹੁੰਦਾ ਹੈ, ਤਾਂ ਜ਼ਿਆਦਾਤਰ ਲੋਕ ਪੇਪਰਾਂ ਨਹੀਂ ਪੜ੍ਹਦੇ ਜਾਂ ਰਿਸਰਚ ਰੇਪੋ ਟਰੇਕ ਨਹੀਂ ਕਰਦੇ। ਉਹ ਕਹਾਣੀਆਂ ਦੀ ਪਾਲਣਾ ਕਰਦੇ ਹਨ: ਇੱਕ ਸਾਫ਼ ਡੈਮੋ, ਇੱਕ ਸਧਾਰਨ ਵਿਆਖਿਆ, ਇੱਕ ਕੰਮ ਕਰਨ ਵਾਲਾ ਲਿੰਕ, ਅਤੇ ਇੱਕ ਨੇਤਾ ਜੋ ਜਨਤਕ ਤੌਰ 'ਤੇ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਦਿੰਦਾ ਹੈ। Mostaque ਅਕਸਰ ਉਹ "ਫਰੰਟ ਡੋਰ" ਕੰਮ ਕਰਦੇ—ਇੰਟਰਵਿ ਯੂ, ਸੋਸ਼ਲ ਪੋਸਟ ਅਤੇ ਕਮਿਊਨਿਟੀ ਐਂਗੇਜਮੈਂਟ—ਜਦਕਿ ਬਹੁਤ ਸਾਰੇ ਦੂਜੇ ਲੋਕ "ਇੰਜਿਨ ਰੂਮ" ਦਾ ਕੰਮ ਕਰਦੇ: ਮਾਡਲ ਰਿਸਰਚ, ਡੇਟਾਸੇਟ ਬਿਲਡਿੰਗ, ਟਰੇਨਿੰਗ ਇੰਫਰਾਸਟਰੱਕਚਰ, ਮੁਲਾਂਕਣ, ਅਤੇ ਉਹ open-source ਟੂਲਿੰਗ ਜਿਸ ਨੇ ਰਿਲੀਜ਼ ਨੂੰ ਉਪਯੋਗੀ ਬਣਾਇਆ।
Stability AI ਦੀ ਸ਼ੁਰੂਆਤੀ ਗਤੀਵਿਧੀ ਸਿਰਫ਼ ਮਾਡਲ ਗੁਣਵੱਤਾ ਬਾਰੇ ਨਹੀਂ ਸੀ। ਇਹ ਵੀ ਸੀ ਕਿ ਪ੍ਰੋਜੈਕਟ ਕਿੰਨਾ ਤੇਜ਼ੀ ਨਾਲ ਪਹੁੰਚਯੋਗ ਮਹਿਸੂਸ ਹੋਇਆ:
ਇਸੇ ਸਮੇਂ, "ਸਭ ਤੋਂ ਨਜ਼ਰ ਆਉਣ ਵਾਲਾ" ਹੋਣ ਨੂੰ "ਇਕੱਲਾ ਨਿਰਮਾਤਾ" ਨਾਲ ਭੁੱਲ ਨਾ ਕਰੋ। Stable Diffusion ਦੀ ਸਫਲਤਾ ਇੱਕ ਵੱਡੇ ਪਰਿਵਾਰ ਦੀ ਪਰਛਾਈ ਹੈ: ਅਕਾਦਮਿਕ ਲੈਬ (ਖਾਸ ਤੌਰ 'ਤੇ CompVis ਗਰੁੱਪ), LAION ਵਰਗੀਆਂ ਡੇਟਾਸੇਟ ਕੋਸ਼ਿਸ਼ਾਂ, open-source ਡਿਵੈਲਪਰ ਅਤੇ ਭਾਗੀਦਾਰ ਜਿਨ੍ਹਾਂ ਨੇ ਐਪ, ਇੰਟਰਫੇਸ ਅਤੇ ਇੰਟੇਗ੍ਰੇਸ਼ਨ ਬਣਾਈਆਂ।
ਇਹ ਦ੍ਰਿਸ਼—ਸਾਫ਼ ਜਨਤਕ ਕਥਾ, ਖੁੱਲ੍ਹੀਆਂ ਰਿਲੀਜ਼ਾਂ ਅਤੇ ਇੱਕ ਤਿਆਰ ਕਮਿਊਨਿਟੀ—ਇੱਕ ਮਾਡਲ ਨੂੰ ਹਿਲਚਲ ਬਣਾਉਣ ਦਾ ਇੱਕ ਵੱਡਾ ਹਿੱਸਾ ਰਚਦੇ ਹਨ।
ਖੁੱਲ੍ਹੀਆਂ ਰਿਲੀਜ਼ਾਂ ਸਿਰਫ਼ "ਇੱਕ ਟੂਲ ਸਾਂਝਾ" ਨਹੀਂ ਕਰਦੀਆਂ। ਉਹ ਇਹ ਤੈਅ ਕਰਦੀਆਂ ਹਨ ਕਿ ਕੌਣ ਭਾਗ ਲੈ ਸਕਦਾ ਹੈ—ਅਤੇ ਵਿਚਾਰ ਕਿੰਨੀ ਤੇਜ਼ੀ ਨਾਲ ਫੈਲਦੇ ਹਨ। ਜਦੋਂ Stable Diffusion ਦੇ weights ਡਾਊਨਲੋਡ ਕਰਨ ਯੋਗ ਹੋ ਗਏ, ਮਾਡਲ ਇੱਕ ਕੰਪਨੀ ਦੇ ਐਪ ਜਾਣ ਵਾਲੀ ਚੀਜ਼ ਬਣ ਕੇ ਨਹੀਂ ਰਹਿ ਗਿਆ—ਉਹ ਕੁਝ ਐਸਾ ਬਣ ਗਿਆ ਜੋ ਲੋਕ ਨਕਲ, ਸੋਧ ਅਤੇ ਅੱਗੇ ਵੰਡ ਸਕਦੇ ਸਨ।
ਖੁੱਲ੍ਹੇ weights ਨਾਲ, ਨਿਰਮਾਤਾ ਇੱਕ ਫਿਕਸਡ ਇੰਟਰਫੇਸ ਜਾਂ ਸ limitada ਫੀਚਰਾਂ ਤੱਕ ਸੀਮਿਤ ਨਹੀਂ ਰਹਿੰਦੇ। ਉਹ ਕਰ ਸਕਦੇ ਹਨ:
ਉਹ ਪਰਮਿਸ਼ਨ-ਰਹਿਤ "forkability" ਉਹ ਇੰਧਨ ਹੈ: ਹਰ ਸੁਧਾਰ ਫਿਰ ਵੰਡਿਆ ਜਾ ਸਕਦਾ ਹੈ, ਨਾ ਕਿ ਸਿਰਫ਼ ਦਿਖਾਇਆ।
ਕੁਝ ਦੁਹਰਾਏ ਜਾ ਸਕਣ ਵਾਲੇ ਲੂਪ momentum ਚਲਾ ਰਹੇ ਸਨ:
ਇੱਕ ਵਾਰੀ ਡਿਵੈਲਪਰ ਮਾਡਲ ਨੂੰ ਸਿੱਧਾ ਏਜੇ-ਇੰਟੇਗ੍ਰੇਟ ਕਰ ਸਕਣ, ਇਹ ਹਰ ਥਾਂ ਆਉਣ ਲਗਾ: ਡੈਸਕਟਾਪ ਐਪ, ਵੈੱਬ UI, Photoshop ਪਲੱਗਇਨ, Discord ਬੋਟ ਅਤੇ ਆਟੋਮੇਸ਼ਨ ਟੂਲ। ਹਰ ਇੰਟੇਗ੍ਰੇਸ਼ਨ ਇਕ ਹੋਰ ਦਾਖਲਾ ਬਿੰਦੂ ਬਣ ਜਾਂਦੀ—ਅਤੇ ਹਰ ਨਵੇਂ ਦਾਖਲਾ ਬਿੰਦੂ ਨਵੇਂ ਯੂਜ਼ਰ ਲਿਆਉਂਦਾ।
ਖੁੱਲ੍ਹੀਆਂ ਰਿਲੀਜ਼ਾਂ "ਆਗਿਆ ਮੰਗਣ" ਵਾਲੀ ਰੁਕਾਵਟ ਘਟਾ ਦਿੰਦੀਆਂ। ਅਧਿਆਪਕ ਅਸਾਈਨਮੈਂਟ ਬਣਾਉਣ, ਸ਼ੌਕੀਨ ਘਰੇਲੂ ਪ੍ਰਯੋਗ ਕਰਨ, ਅਤੇ ਸਟਾਰਟਅਪ ਬਿਨਾਂ ਪਹੁੰਚ ਦੀਆਂ ਨੀਤੀਆਂ ਨੇ ਬਿਨਾਂ ਡਾਹੜਾ-ਚੋਣੇ ਪ੍ਰੋਟੋਟਾਈਪ ਕਰ ਸਕਦੇ। ਉਹ ਵਿੱਤਿਆ ਅਧਾਰ ਦਾ ਹਿੱਸਾ ਉਹ ਨਹੀ ਜੋ ਇੱਕ ਇੱਕ-ਹਫ਼ਤੇ ਦਾ ਹਾਈਪ ਬਣਾਓ—ਇਹ ਸਥਿਰ ਚੱਲਣ ਵਾਲੀ ਲਹਿਰ ਬਣਾਉਂਦਾ ਹੈ।
ਜਦੋਂ Stable Diffusion ਦੇ weights ਉਪਲਬਧ ਹੋ ਗਏ, ਮਾਡਲ "ਇੱਕ ਚੀਜ਼ ਜੋ ਤੁਸੀਂ ਪੜ੍ਹਦੇ ਹੋ" ਤੋਂ ਬਦਲ ਕੇ ਕੁਝ ਇਸ ਤਰ੍ਹਾਂ ਹੋ ਗਿਆ ਜੋ ਲੋਕ ਅਨੇਕ ਤਰੀਕਿਆਂ ਨਾਲ ਵਰਤ ਸਕਦੇ ਸਨ। ਸਭ ਤੋਂ ਨਜ਼ਰ ਆਉਣ ਵਾਲੀ ਬਦਲਾਵ ਸਿਰਫ਼ ਚਿੱਤਰਾਂ ਦੀ ਬਿਹਤਰੀ ਨਹੀਂ ਸੀ; ਇਹ ਅਨੇਕ ਟੂਲਾਂ ਦੀ ਲਹਿਰ ਸੀ ਜੋ ਵੱਖ-ਵੱਖ ਕਿਸਮ ਦੇ ਰਚਨਾਤਮਕ ਲੋਕਾਂ ਲਈ ਇਮੇਜ ਜਨਰੇਸ਼ਨ ਨੂੰ ਪਹੁੰਚਯੋਗ ਬਣਾਉਂਦੀਆਂ।
ਤੁਸੀਂ ਦੇਖ ਸਕਦੇ ਸਨ ਕਿ ਇਕੋ ਸਿਸਟਮ ਕਾਰਜ ਦੇਸ਼ਾਂ ਵਿੱਚ ਵੰਡ ਗਿਆ:
ਬੇਸ ਮਾਡਲ ਨੂੰ ਇੱਕ ਬਹੁਤ-ਪ੍ਰਤੀਭਾਸ਼ਾਲੀ ਆਮ-ਉਦੇਸ਼ ਇਲਸਟ੍ਰੇਟਰ ਸਮਝੋ। ਫਾਈਨ-ਟਿਊਨਿੰਗ ਮਾਨੋ ਕਿ ਉਸ ਇਲਸਟ੍ਰੇਟਰ ਨੂੰ ਇੱਕ ਧਿਆਨ-ਕੇਂਦ੍ਰਿਤ ਅਪਰੈਂਟਿਸਸ਼ਿਪ ਦਿੱਤੀ ਜਾ ਰਹੀ ਹੈ: ਤੁਸੀਂ ਉਸਨੂੰ ਕੁਝ ਚੁਣੇ ਹੋਏ ਉਦਾਹਰਣ ਦਿਖਾਉਂਦੇ ਹੋ (ਉਦਾਹਰਨ ਲਈ, "ਤੁਹਾਡੇ ਬ੍ਰਾਂਡ ਦੀਆਂ ਉਤਪਾਦ ਫੋਟੋਆਂ" ਜਾਂ "ਕਿਸੇ ਖ਼ਾਸ ਕਾਮਿਕ ਸਟਾਈਲ") ਜਦ ਤੱਕ ਉਹ ਪੱਕਾ ਉਸ ਸਟਾਈਲ ਵਿੱਚ ਡ੍ਰਾਇੰਗ ਨਾ ਕਰੇ। ਇੱਕ ਕਸਟਮ ਮਾਡਲ ਨਤੀਜਾ ਹੈ: ਇੱਕ ਵਰਜਨ ਜੋ ਅਜੇ ਵੀ ਵਿਆਪਕ ਤਰੀਕੇ ਨਾਲ ਡ੍ਰਾਅ ਕਰਨਾ ਜਾਣਦਾ ਹੈ, ਪਰ ਤੁਹਾਡੇ ਨਿਸ਼ ਲਈ ਮਜ਼ਬੂਤ ਰੁਝਾਨ ਰੱਖਦਾ ਹੈ।
ਅਸਲ ਸਮਾਜਿਕ ਇੰਜਣ ਵਰਕਫਲੋ ਸ਼ੇਅਰਿੰਗ ਸੀ: “ਇਹ ਮੇਰਾ ਪ੍ਰਕਿਰਿਆ ਹੈ ਸਥਿਰ ਕਿਰਦਾਰਾਂ ਲਈ”, “ਇਸ ਤਰ੍ਹਾਂ ਹੋਵੇਗੀ ਸਿਨੇਮੈਟਿਕ ਲਾਈਟਿੰਗ”, “ਇਹ ਰਹੀ ਇੱਕ ਦੁਹਰਾਓਯੋਗ ਪ੍ਰੋਡਕ্ট ਮੌਕਅਪ ਪਾਈਪਲਾਈਨ”。 ਲੋਕ ਸਿਰਫ਼ Stable Diffusion ਦੇ ਆਲੇ-ਦੁਆਲੇ ਨਹੀਂ ਇਕੱਠੇ ਹੋਏ—ਉਹ ਇਸਦੀ ਵਰਤੋਂ ਕਰਨ ਦੇ ਤਰੀਕੇ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਇਕੱਠੇ ਹੋਏ।
ਕਮਿਊਨਿਟੀ ਦੇ ਯੋਗਦਾਨ ਵੀ ਤੁਰੰਤ ਪ੍ਰਯੋਗਿਕ ਖਾਮੀਆਂ ਨੂੰ ਪੂਰਾ ਕਰਦੇ ਗਏ: ਕਦਮ-ਦਰ-ਕਦਮ ਗਾਈਡ, curated ਡੇਟਾਸੇਟ, ਮਾਡਲ ਕਾਰਡ ਅਤੇ ਦਸਤਾਵੇਜ਼ੀਕਰਨ, ਅਤੇ ਸ਼ੁਰੂਆਤੀ ਸੇਫਟੀ ਫਿਲਟਰ ਅਤੇ ਸਮੱਗਰੀ-ਨਿਯੰਤਰਣ ਟੂਲ ਜੋ ਦੁਰਵਰਤੋਂ ਘੱਟ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ ਕਰ ਰਹੇ ਸਨ ਬਿਨਾਂ ਪ੍ਰਯੋਗ ਨੂੰ ਬੰਨ੍ਹੇ।
ਖੁੱਲ੍ਹੀਆਂ ਰਿਲੀਜ਼ਾਂ ਨੇ AI ਨਾਲ ਚਿੱਤਰ ਬਣਾਉਣ ਲਈ “ਆਗਿਆ-ਬਾਧਾ” ਨੂੰ ਘਟਾਇਆ। ਕਲਾਕਾਰ, ਡਿਜ਼ਾਈਨਰ, ਅਧਿਆਪਕ ਅਤੇ ਛੋਟੀ ਟੀਮਾਂ ਨੂੰ ਐਕਸਪੇਰੀਮੈਂਟ ਲਈ ਕਾਰਪੋਰੇਟ ਬਜਟ ਜਾਂ ਵਿਸ਼ੇਸ਼ ਭਾਗੀਦਾਰੀਆਂ ਦੀ ਲੋੜ ਨਹੀਂ ਸੀ। ਉਹ ਪਹੁੰਚ ਮਹੱਤਵਪੂਰਨ ਸੀ: ਇਹ ਲੋਕਾਂ ਨੂੰ ਤੁਰੰਤ ਵਿਚਾਰ ਅਜ਼ਮਾਉਣ, ਕਰਕੇ ਸਿੱਖਣ ਅਤੇ ਵਿਅਕਤੀਗਤ ਵਰਕਫਲੋਜ਼ ਬਨਾਉਣ ਦੀ ਆਗਿਆ ਦਿੱਤੀ ਜੋ ਉਹਨਾਂ ਦੀ ਸ਼ੈਲੀ ਨਾਲ ਮਿਲਦੇ ਹੋਣ।
ਬਹੁਤ ਸਾਰੇ ਨਿਰਮਾਤਾਾਂ ਲਈ, Stable Diffusion-ਸ਼ੈਲੀ ਟੂਲ ਸਵੇਰੇ ਸਰਵੇਖਣ ਸਾਥੀ ਬਣ ਗਏ। ਕਲਾ-ਕੰਮ ਨੂੰ ਬਦਲਣ ਦੀ ਬਜਾਏ, ਉਹ ਉਹਨਾਂ ਦਿਸ਼ਾਵਾਂ ਦੀ ਸੰਖਿਆ ਵਧਾਉਂਦੇ ਜੋ ਤੁਸੀਂ ਅੰਤਿਮ ਟੁਕੜੇ 'ਤੇ ਕੰਮ ਸ਼ੁਰੂ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਪਰਖ ਸਕਦੇ ਹੋ।
ਆਮ ਫਾਇਦੇ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:
ਜਿਵੇਂ ਮਾਡਲ weights ਉਪਲਬਧ ਸਨ, ਕਮਿਊਨਿਟੀ ਨੇ UIs, ਪ੍ਰੰਪਟ ਸਹਾਇਕ, ਫਾਈਨ-ਟਿਊਨ 방법 ਅਤੇ ਪਾਈਪਲਾਈਨ ਬਣਾਈਆਂ ਜੋ ਗੈਰ-ਰਿਸਰਚਰਾਂ ਲਈ AI ਇਮੇਜ ਜਨਰੇਸ਼ਨ ਨੂੰ ਪ੍ਰੈਕਟਿਕਲ ਬਣਾਉਂਦੀਆਂ। ਨਤੀਜਾ ਇਹ ਸੀ: ਘੱਟ "ਇੱਕ ਜਾਦੂਈ ਡੈਮੋ" ਅਤੇ ਜ਼ਿਆਦਾ ਦੁਹਰਾਓਯੋਗ ਰਚਨਾਤਮਕ ਕੰਮ।
ਸਿਹਤਮੰਦ ਕਮਿਊਨਿਟੀਆਂ ਨੇ ਅਣੌਪਚਾਰਿਕ ਨਿਯਮ ਬਣਾਏ: ਜਦ ਤੁਸੀਂ ਕਿਸੇ ਮਨੁੱਖੀ ਕਲਾਕਾਰ ਦਾ ਕੰਮ ਦਰਸਾਉਂਦੇ ਹੋ ਤਾਂ ਉਨ੍ਹਾਂ ਨੂੰ ਕ੍ਰੈਡਿਟ ਦਿਓ, ਜੇ ਤਸਵੀਰ ਜਨਰੇਟ ਕੀਤੀ ਗਈ ਹੈ ਤਾਂ ਇਹ ਦੱਸੋ ਕਿ ਉਹ ਹੱਥ-ਤਿਆਰ ਨਹੀਂ ਹੈ, ਅਤੇ ਟਰੇਨਿੰਗ ਡੇਟਾ ਜਾਂ ਬ੍ਰਾਂਡ ਐਸੈੱਟਸ ਲਈ ਆਗਿਆ ਲੈਣ ਦੀ ਕੋਸ਼ਿਸ ਕਰੋ। ਸਧਾਰਨ ਅਭਿਆਸ—ਸਰੋਤ ਨੋਟ ਰੱਖਣਾ, ਪ੍ਰੰਪਟ ਟ੍ਰੈਕ ਕਰਨਾ, ਅਤੇ ਸੋਧਾਂ ਦੀ ਦਸਤਾਵੇਜ਼ੀ—ਸਹਿਯੋਗ ਨੂੰ ਆਸਾਨ ਬਣਾਉਂਦੇ।
ਉਸੇ ਖੁੱਲ੍ਹੇਪਣ ਨੇ ਕੁਝ ਖਾਮੀਆਂ ਵੀ ਦਰਸਾਈਆਂ: ਆਰਟੀਫੈਕਟਸ (ਵਾਧੂ ਅੰਗ, ਟਿਪਪੀ-ਟਿਪਪੀ ਲਿਖਤ), ਨਤੀਜਿਆਂ ਵਿਚ ਪੱਖਪਾਤ, ਅਤੇ ਜਨਰੇਸ਼ਨਾਂ ਵਿਚ ਅਸਥਿਰਤਾ। ਪੇਸ਼ੇਵਰ ਕੰਮ ਲਈ, ਵਧੀਆ ਨਤੀਜੇ ਆਮ ਤੌਰ 'ਤੇ ਕਯਰੇਸ਼ਨ, ਮੁੜ-ਮੁਹਿੰਮ, ਇਨਪੇਨਟਿੰਗ ਅਤੇ ਮਨੁੱਖੀ ਪਾਲਿਸ਼ ਦੀ ਲੋੜ ਹੁੰਦੀ ਸੀ—ਇੱਕ ਇਕੱਲਾ ਕਲਿਕ ਆਮ ਤੌਰ 'ਤੇ ਕਾਫੀ ਨਹੀਂ ਹੁੰਦਾ।
Stable Diffusion ਵਰਗੀਆਂ ਖੁੱਲ੍ਹੀਆਂ ਰਿਲੀਜ਼ਾਂ ਨੇ ਸਖ਼ਤ ਸਵਾਲਾਂ ਨੂੰ ਜਨਤਕ ਢੰਗ ਨਾਲ ਉਠਾਇਆ। ਜਦੋਂ ਕੋਈ ਵੀ ਮਾਡਲ ਲੋਕਲ ਚਲਾ ਸਕਦਾ ਹੈ, ਤਾਂ ਉਹੀ ਆਜ਼ਾਦੀ ਜੋ ਪਰਯੋਗ ਨੂੰ ਸਗਵੀ ਬਣਾਉਂਦੀ ਹੈ, ਨੁਕਸਾਨ ਲਈ ਵੀ ਆਸਾਨੀ ਪੈਦਾ ਕਰ ਦਿੰਦੀ ਹੈ।
ਇਕ ਮੁੱਖ ਚਿੰਤਾ ਮਿਸਯੂਜ਼ ਦੀ ਵੱਡੀ ਪੈਮਾਨੇ 'ਤੇ ਸੀ: ਡੀਪਫੇਕਸ ਬਣਾਉਣਾ, ਨਿਸ਼ਾਨਾਬੰਦੀ ਧਮਕੀ ਅਤੇ ਬਿਨਾਂ ਸਹਿਮਤੀ ਦੇ ਯੌਨ ਸਮੱਗਰੀ ਬਣਾਉਣਾ। ਇਹ ਨਾ-ਕੇਵਲ ਸਿਧੇ-ਤੌਰ 'ਤੇ ਸੂਰਟਕ ਹੈ—ਖੁੱਲ੍ਹੇ weights ਮਾਡਲ ਖ਼ਰਾਬ ਐਕਟਰਾਂ ਲਈ ਰੁਕਾਵਟ ਘਟਾ ਦਿੰਦੇ ਹਨ, ਖ਼ਾਸ ਕਰ ਕੇ ਜਦ UI ਆਸਾਨੀ ਨਾਲ ਇੰਸਟਾਲ ਹੋ ਜਾਂ।
ਇਸੇ ਸਮੇਂ ਕਈ ਵੈਧ ਵਰਤੋਂ ਇਕੋ ਜਿਹੀ ਲੱਗ ਸਕਦੀ ਹੈ (ਜਿਵੇਂ ਪੈਰੋਡੀ, ਫੈਨ ਆਰਟ, ਰਾਜਨੀਤਿਕ ਵਿਹੰਗ), ਜਿਸ ਕਰਕੇ “ਕੀ ਮਨਜ਼ੂਰ ਹੋਵੇ?” ਇਕ ਗੁੰਝਲਦਾਰ ਸਵਾਲ ਬਣ ਜਾਂਦਾ ਹੈ, ਅਤੇ ਇਸਨੇ ਅਕਾਊਂਟਬਿਲਟੀ ਤੇ ਭਰੋਸੇ ਦੇ ਮੁੱਦੇ ਨੂं ਜਨਤਕ ਕੀਤਾ।
ਕਾਪੀਰਾਈਟ ਵਿਵਾਦ ਦੂਜਾ ਮੁੱਖ ਤਰੱਕਾ ਬਣਿਆ। ਆਲੋਚਕ ਕਹਿੰਦੇ ਹਨ ਕਿ ਵੱਡੇ ਇੰਟਰਨੈਟ ਡੇਟਾਸੇਟਾਂ 'ਤੇ ਟ੍ਰੇਨਿੰਗ ਵਿੱਚ ਸ਼ਾਇਦ ਬਿਨਾਂ ਆਗਿਆ ਦੇ ਕਾਪੀਰਾਈਟ ਕੀਤੇ ਕੰਮ ਸ਼ਾਮਲ ਹੋ ਸਕਦੇ ਹਨ, ਅਤੇ ਨਤੀਜੇ ਕਈ ਵਾਰੀ ਜੀਵਤ ਕਲਾਕਾਰਾਂ ਦੀਆਂ ਸਟਾਈਲਾਂ ਨਾਲ ਬਹੁਤ ਮਿਲਦੇ ਹਨ—ਇਸ ਨਾਲ ਨਿਰਮਾਤਾ/ਕਲਾਕਾਰ ਦੇ ਹੱਕਾਂ 'ਤੇ ਸਵਾਲ ਖੜੇ ਹੋਦੇ ਹਨ।
ਸਹਿਯੋਗੀਆਂ ਵਕਤਬਾ ਕਰਦੇ ਹਨ ਕਿ ਟ੍ਰੇਨਿੰਗ ਟਰਾਂਸਫਾਰਮਟਿਵ ਹੋ ਸਕਦੀ ਹੈ, ਮਾਡਲ ਤਸਵੀਰਾਂ ਨੂੰ ਡੈਟਾਬੇਸ ਵਾਂਗ ਨਹੀਂ ਰੱਖਦੇ, ਅਤੇ ਸਟਾਈਲ ਸਿੱਧੀ ਨਕਲ ਨਹੀਂ ਹੁੰਦੀ। ਹਕੀਕਤ ਇਹ ਹੈ ਕਿ ਇਹ ਮੁੱਦਾ ਕਾਨੂੰਨੀ ਅਤੇ ਸਾਂਸਕ੍ਰਿਤਿਕ ਦੋਹਾਂ ਪਾਸਿਆਂ 'ਤੇ ਵਿਰੋਧੀ ਹੈ—ਦੇਸ਼ ਮੁਤਾਬਕ ਨਿਯਮ ਵੱਖਰੇ ਹਨ। ਅਸੀਧੇ ਤੌਰ 'ਤੇ, “ਫ਼ੇਅਰ” ਦਾ ਕੀ ਮਤਲਬ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ, ਜਿਸ 'ਤੇ ਲੋਕ ਅਕਸਰ ਅੰਤਰ-ਰਾਯ ਹੋਂਦੇ ਹਨ।
ਖੁੱਲ੍ਹੇ-ਸਰੋਤ ਜਨਰੇਟਿਵ AI ਨੇ ਲੰਮੇ ਸਮੇਂ ਤੋਂ ਚੱਲ ਰਹੀ ਤਣਾਅ ਨੂੰ ਤੇਜ਼ ਕਰ ਦਿੱਤਾ: ਖੁੱਲ੍ਹਾਪਣ ਪਹੁੰਚ, ਨਿਰੀਖਣ ਅਤੇ ਨਵੀਨਤਾ ਨੂੰ ਬਹਿਤਰ ਕਰਦਾ ਹੈ, ਪਰ ਇਹ ਕੇਂਦਰੀ ਨਿਯੰਤਰਣ ਨੂੰ ਘਟਾ ਦਿੰਦਾ ਹੈ। ਇੱਕ ਵਾਰੀ weights ਜਨਤਕ ਹੋ ਗਈਆਂ, ਤਾਂ ਇੱਕ ਖ਼ਾਸ ਸਮਰੱਥਾ ਨੂੰ ਹਟਾਉਣਾ API ਅਪਡੇਟ ਕਰਨ ਦੀ ਤਰ੍ਹਾਂ ਆਸਾਨ ਨਹੀਂ ਰਹਿੰਦਾ।
ਆਮ ਨਿਯਮ-ਨਾਲ ਕੀਤੇ ਗਿਆਨਵਾਨ ਤਰੀਕੇ ਹਨ, ਪਰ ਹਰ ਇਕਦੇ ਆਪਣੇ ਕਾਰੋਬਾਰੀ ਖ਼ਮੀਆਂ ਹਨ:
ਇਹਨਾਂ ਵਿੱਚੋਂ ਕੋਈ ਵੀ ਇਕੱਲਾ ਢੰਗ ਸੰਪੂਰਨ ਹੱਲ ਨਹੀਂ ਹੈ, ਪਰ ਇਹ ਦਰਸਾਂਦੇ ਹਨ ਕਿ ਕਮਿਊਨਿਟੀਆਂ ਕਿਵੇਂ ਰਚਨਾਤਮਕ ਆਜ਼ਾਦੀ ਅਤੇ ਨੁਕਸਾਨ ਘਟਾਉਣ ਨੂੰ ਸਮਤੋਲ ਕਰਦੀਆਂ ਹਨ—ਬਿਨਾਂ ਇਹ ਮੰਨਣ ਦੇ ਕਿ ਇੱਕ ਆਮ, ਸਰਵਭੌਮ ਜਵਾਬ ਹੋਵੇ।
ਖੁੱਲ੍ਹੀਆਂ ਰਿਲੀਜ਼ਸ ਜਨਤਕ ਲਈ frictionless ਲਗ ਸਕਦੀਆਂ ਹਨ: ਇੱਕ ਚੈੱਕਪੋਇੰਟ ਡਿੱਪ ਹੁੰਦਾ ਹੈ, ਰੇਪੋਜ਼ ਆ ਜਾਂਦੇ ਹਨ, ਅਤੇ ਹਰ ਕੋਈ ਤਸਵੀਰਾਂ ਬਣਾਉਣ ਲੱਗ ਜਾਂਦਾ ਹੈ। ਪਰ ਉਸ ਉਤਸ਼ਵ ਦੇ ਪਿੱਛੇ, “ਖੁੱਲ੍ਹਾ” ਉਹ ਜ਼ਿੰਮੇਵਾਰੀਆਂ ਪੈਦਾ ਕਰਦਾ ਹੈ ਜੋ ਲਾਂਚ-ਦਿਨ ਦੇ ਥ੍ਰੈਡ 'ਤੇ ਨਹੀਂ ਦਿਖਾਈ ਦੇਂਦੀਆਂ।
ਇੱਕ ਅਗੇੜਾ ਚਿੱਤਰ ਮਾਡਲ ਟ੍ਰੇਨ (ਜਾਂ ਸਿਰਫ਼ ਸੁਧਾਰ) ਕਰਨ ਲਈ ਬਹੁਤ ਸਾਰਾ GPU ਸਮਾਂ ਲੈਦਾ ਹੈ, ਅਤੇ ਬਾਰ-ਬਾਰ ਮੁਲਾਂਕਣ ਦੌੜਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਜਦ weights ਜਨਤਕ ਹੁੰਦੀਆਂ ਹਨ, ਤਾਂ compute ਭੁਗਤਾਨ ਖਤਮ ਨਹੀਂ ਹੋ ਜਾਂਦਾ—ਟੀਮਾਂ ਨੂੰ ਹਾਲੇ ਵੀ ਇੰਫਰਾਸਟਰੱਕਚਰ ਦੀ ਲੋੜ ਰਹਿੰਦੀ ਹੈ:
ਇਹ ਸਹਾਇਤਾ ਭਾਰ ਖਾਸ ਕਰਕੇ ਭਾਰੀ ਹੈ ਕਿਉਂਕਿ ਯੂਜ਼ਰ ਬੇਸ ਇਕ ਠੋਸ ਗ੍ਰਾਹਕ ਨਹੀਂ, ਬਲਕਿ ਹਜ਼ਾਰਾਂ ਨਿਰਮਾਤਾ, ਸ਼ੌਕੀਆ, ਰਿਸਰਚਰ ਅਤੇ ਕਾਰੋਬਾਰ ਹਨ ਜਿਨ੍ਹਾਂ ਦੀਆਂ ਜ਼ਰੂਰਤਾਂ ਵੱਖਰੀਆਂ ਹਨ। “ਮੁਫ਼ਤ ਵਰਤਣ ਯੋਗ” ਆਮ ਤੌਰ 'ਤੇ ਅਰਥ ਇਹ ਹੈ ਕਿ “ਰੱਖ-ਰਖਾਵ ਮਹਿੰਗਾ ਹੈ।”
ਖੁੱਲ੍ਹੇ weights ਰਿਲੀਜ਼ ਕਰਨ ਨਾਲ ਦੇਖਭਾਲ ਘਟਦੀ ਹੈ। ਹੋਸਟ ਕੀਤੇ ਉਤਪਾਦਾਂ ਵਿੱਚ ਜੋ ਸੁਰੱਖਿਆ ਨਿਰਧਾਰਿਤ ਹਨ (ਫਿਲਟਰ, ਮਾਨੀਟਰਿੰਗ, ਰੇਟ ਲਿਮਿਟ) ਉਹ weights ਨਾਲ ਨਹੀਂ ਆਉਂਦੇ। ਕੋਈ ਵੀ ਗਾਰਡਰੇਲ ਹਟਾ ਸਕਦਾ ਹੈ, ਉਹਨਾਂ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਫਾਈਨ-ਟਿਊਨ ਕਰ ਸਕਦਾ ਹੈ, ਜਾਂ ਮਾਡਲ ਨੂੰ ਐਸੇ ਟੂਲਾਂ ਵਿੱਚ ਪੈਕੇਜ ਕਰ ਸਕਦਾ ਹੈ ਜੋ ਧਮਕੀ, ਡੀਪਫੇਕ ਜਾਂ ਬਿਨਾਂ ਸਹਿਮਤੀ ਦੀ ਸਮੱਗਰੀ ਲਈ ਉਦੇਸ਼ਤ ਹੋ ਸਕਦੇ ਹਨ।
ਨਿਆਇਕਤਾ ਨਾਲ ਸੰਬੰਧਤ ਸਵਾਲ ਵੀ ਹਨ। ਖੁੱਲ੍ਹੀ ਪਹੁੰਚ ਟਰੇਨਿੰਗ ਡੇਟਾ ਹੱਕਾਂ, ਅਟ੍ਰਿਬਿਊਸ਼ਨ ਜਾਂ ਮੁਆਵਜ਼ੇ ਦੇ ਪ੍ਰਸ਼ਨਾਂ ਨੂੰ ਸੁਲਝਾਉਂਦੀ ਨਹੀਂ। ਇੱਕ ਮਾਡਲ “ਖੁੱਲ੍ਹਾ” ਹੋ ਸਕਦਾ ਹੈ ਪਰ ਫਿਰ ਵੀ ਟਰਾਂ disputed ਡੇਟਾਸੇਟ, ਅਸਮਾਨ ਸ਼ਕਤੀ ਗਤੀਵਿਧੀਆਂ ਜਾਂ ਅਸਪਸ਼ਟ ਲਾਇਸੰਸਿੰਗ ਨੂੰ ਦਰਸਾ ਸਕਦਾ ਹੈ—ਇਸ ਨਾਲ ਕਲਾਕਾਰ ਅਤੇ ਛੋਟੇ ਨਿਰਮਾਤਾ ਆਪਣੇ ਆਪ ਨੂੰ ਸਮਰੱਥ ਮਹਿਸੂਸ ਕਰਨ ਦੀ ਬਜਾਏ, ਲੀਕਡ ਮਹਿਸੂਸ ਕਰ ਸਕਦੇ ਹਨ।
ਇੱਕ ਪ੍ਰਯੋਗਿਕ ਚੁਣੌਤੀ ਗਵਰਨੈਂਸ ਹੈ: ਰਿਲੀਜ਼ ਤੋਂ ਬਾਅਦ ਅਪਡੇਟ, ਸੁਰੱਖਿਆ ਨਿਯਮ ਅਤੇ ਵਿਤਰਣ ਨਿਯਮ ਕੌਣ ਫੈਸਲਾ ਕਰੇਗਾ?
ਜੇ ਕੋਈ ਨਵਾਂ ਕਮਜ਼ੋਰੀ ਮਿਲਦੀ ਹੈ, ਤਾਂ ਪ੍ਰੋਜੈਕਟ ਨੂੰ:
ਸਾਫ਼ stewardship—ਮੇੰਟੇਨਰ, ਫੰਡਿੰਗ ਅਤੇ ਪਾਰਦਰਸ਼ੀ ਫੈਸਲਾ-ਲੈਣ ਲਈ ਨਾ ਹੋਣ 'ਤੇ, ਕਮਿਊਨਿਟੀ forks ਵਿੱਚ ਵੰਡ ਜਾਂਦੀ ਹੈ ਅਤੇ ਹਰ fork ਵੱਖ-ਵੱਖ ਸੁਰੱਖਿਆ ਮਿਆਰ ਅਤੇ ਨਿਯਮ ਬਣਾ ਲੈਂਦਾ ਹੈ।
ਰਿਸਰਚਰ ਦੁਹਰਾਉਣਯੋਗਤਾ ਅਤੇ ਪਹੁੰਚ ਨੂੰ ਪ੍ਰਾਥਮਿਕਤਾ ਦਿੰਦੇ ਹੋਏ ਦੀ ਖੋਜ਼ ਕਰ ਸਕਦੇ ਹਨ। ਕਲਾਕਾਰ ਰਚਨਾਤਮਿਕ ਆਜ਼ਾਦੀ ਅਤੇ ਟੂਲ ਰੂਪ-ਵਿਵਿਧਤਾ ਨੂੰ ਪ੍ਰਾਥਮਿਕਤਾ ਦਿੰਦੇ ਹਨ। ਕਾਰੋਬਾਰ ਅਕਸਰ ਪੇਸ਼ਾਬੀ ਹੁੰਦੇ ਹਨ: ਸਪੋਰਟ, ਜ਼ਿੰਮੇਵਾਰੀ ਦੀ ਸਪਸ਼ਟਤਾ, ਅਤੇ ਸਥਿਰ ਰਿਲੀਜ਼। ਖੁੱਲ੍ਹੇ ਮਾਡਲ ਤਿੰਨਾਂ ਦੇ ਲਈ ਸੇਵਾ ਕਰ ਸਕਦੇ ਹਨ—ਪਰ ਉਹ ਇਕੋ defaults ਨਾਲ ਨਹੀਂ ਆ ਸਕਦੇ। “ਖੁੱਲ੍ਹਾ” ਦਾ ਛੁਪਿਆ ਖ਼ਰਚ ਉਹਨਾਂ ਤਰਜੀਹਾਂ ਦਾ ਸਮਝੌਤਾ ਹੈ, ਫਿਰ ਉਹਨਾਂ ਨੂੰ ਜਾਰੀ ਰੱਖਣ ਲਈ ਖਰਚ ਭਰਨਾ ਪੈਂਦਾ ਹੈ।
ਖੁੱਲ੍ਹਾ ਅਤੇ ਬੰਦ ਜਨਰੇਟਿਵ AI ਵਿਚਕਾਰ ਚੁਣਾਉਣਾ ਦਾਰਸ਼ਨਿਕ ਪ੍ਰੀਖਾ ਨਹੀਂ—ਇਹ ਇੱਕ ਉਤਪਾਦ ਫੈਸਲਾ ਹੈ। ਸਹੀ ਤਰੀਕੇ ਨਾਲ ਚੁਣਨ ਦਾ ਤੇਜ਼ ਰਸਤਾ ਇਹ ਹੈ ਕਿ ਪਹਿਲਾਂ ਤਿੰਨ ਸਵਾਲ ਸਾਫ਼ ਕਰੋ: ਤੁਸੀਂ ਕੀ ਬਣਾ ਰਹੇ ਹੋ, ਇਹ ਕੌਣ ਵਰਤੇਗਾ, ਅਤੇ ਤੁਸੀਂ ਕਿੰਨਾ ਜੋਖਿਮ ਸਹਿ ਸਕਦੇ ਹੋ?
Open-weight ਮਾਡਲ (ਉਦਾਹਰਨ ਲਈ Stable Diffusion-ਸ਼ੈਲੀ ਰਿਲੀਜ਼) ਸਭ ਤੋਂ ਵਧੀਆ ਹਨ ਜਦੋਂ ਤੁਹਾਨੂੰ ਨਿਯੰਤਰਣ ਚਾਹੀਦਾ ਹੈ: ਕਸਟਮ ਫਾਈਨ-ਟਿਊਨਿੰਗ, ਆਫਲਾਈਨ ਵਰਤੋਂ, on-prem ਤैनਾਤੀ, ਜਾਂ ਡੂੰਘੇ ਵਰਕਫਲੋ ਇੰਟੇਗ੍ਰੇਸ਼ਨ।
Hosted APIs ਸਭ ਤੋਂ ਵਧੀਆ ਹਨ ਜਦੋਂ ਤੁਸੀਂ ਤੇਜ਼ੀ ਅਤੇ ਸਾਦਗੀ ਚਾਹੁੰਦੇ ਹੋ: ਭਵਿੱਖਬਾਣੀਯੋਗ ਸਕੇਲਿੰਗ, ਪ੍ਰਬੰਧਤ ਅਪਡੇਟ, ਅਤੇ ਘੱਟ ਆਪਰੇਸ਼ਨਲ ਸਰਦਰਦ।
ਹਾਈਬਰਿਡ ਅਮਲ ਵਿਚ ਅਕਸਰ ਜਿਤਦਾ ਹੈ: ਬੇਸਲਾਈਨ ਭਰੋਸੇਮੰਦਤਾ ਲਈ API ਵਰਤੋ, ਅਤੇ ਵਿਸ਼ੇਸ਼ ਮੋਡ ਲਈ open weights—ਅੰਦਰੂਨੀ ਟੂਲ, ਪ੍ਰੀਮੀਅਮ ਕਸਟਮਾਈਜ਼ੇਸ਼ਨ, ਜਾਂ ਭਾਰੀ ਵਰਤੋਂ 'ਤੇ ਲਾਗਤ-ਨਿਯੰਤਰਣ।
ਜੇ ਤੁਸੀਂ ਉੱਪਰ ਉਪਜੀ ਇੱਕ ਉਤਪਾਦ ਦਾ ਨਿਰਮਾਣ ਕਰ ਰਹੇ ਹੋ, ਤਾਂ ਟੂਲਿੰਗ ਮਾਡਲ ਚੋਣ ਦੇ ਇਤਨੇ ਹੀ ਮੁੱਖ ਹਨ। ਉਦਾਹਰਨ ਲਈ, Koder.ai ਇੱਕ vibe-coding ਪਲੇਟਫਾਰਮ ਹੈ ਜੋ ਟੀਮਾਂ ਨੂੰ ਚੈਟ ਰਾਹੀਂ ਵੈੱਬ, ਬੈਕਐਂਡ ਅਤੇ ਮੋਬਾਈਲ ਐਪ ਬਣਾਉਣ ਦਿੰਦਾ—ਉਹਦੀਆਂ ਮਦਦ ਨਾਲ ਤੁਸੀਂ ਜਨਰੇਟਿਵ-AI ਵਰਕਫਲੋ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਪ੍ਰੋਟੋਟਾਈਪ ਕਰ ਸਕਦੇ ਹੋ, ਫਿਰ ਇਸਨੂੰ ਅਸਲ ਐਪ ਵਿੱਚ ਤਬਦੀਲ ਕਰ ਸਕਦੇ ਹੋ। ਅਮਲ ਵਿੱਚ, ਇਹ ਤੁਹਾਨੂੰ open vs closed ਜਾਂ ਹਾਈਬਰਿਡ ਲਾਹਣੇ-ਖਰਚ ਦੀ ਭਰਪਾਈ ਕਰਨ ਬਿਨਾਂ ਤੇਜ਼ੀ ਨਾਲ ਟੈਸਟ ਕਰਨਾ ਸੌਖਾ ਬਣਾਉਂਦਾ—ਖ਼ਾਸ ਕਰਕੇ ਜਦੋਂ ਤੁਹਾਡੇ ਐਪ ਨੂੰ ਆਮ ਉਤਪਾਦ ਫੀਚਰ ਜਿਵੇਂ auth, ਹੋਸਟਿੰਗ, ਕਸਟਮ ਡੋਮੇਨ ਅਤੇ rollback ਦੀ ਲੋੜ ਹੋਵੇ।
ਜੇ ਤੁਸੀਂ ਇਨ੍ਹਾਂ ਵਿੱਚੋਂ ਘੱਟੋ-ਘੱਟ ਚਾਰ ਦੇ ਜਵਾਬ ਨਹੀਂ ਦੇ ਸਕਦੇ, ਤਾਂ ਹੋਸਟਡ API ਨਾਲ ਸ਼ੁਰੂ ਕਰੋ, ਅਸਲੀ ਵਰਤੋਂ ਨੂੰ ਮਾਪੋ, ਫਿਰ ਜਦੋਂ ਕੰਟਰੋਲ ਮਫ਼ੀਦ ਹੋਵੇ ਤਾਂ open weights 'ਤੇ ਗ੍ਰੈਜੂਏਟ ਕਰੋ।
Stable Diffusion ਮੌਕੇ ਨੇ ਸਿਰਫ਼ AI ਚਿੱਤਰ ਪੈਦਾਵਾਰ ਨੂੰ ਲੋਕਪ੍ਰਿਯ ਨਹੀਂ ਕੀਤਾ—ਇਸ ਨੇ ਉਮੀਦਾਂ ਨੂੰ ਰੀਸੈੱਟ ਕਰ ਦਿੱਤਾ। ਜਦੋਂ open weights ਜਨਤਕ ਹੋਏ, “ਖੁਦ ਕੋਸ਼ਿਸ਼ ਕਰੋ” ਤਰੀਕਾ ਲੋਕਾਂ ਲਈ ਮੂਲ ਮਾਪਦੰਡ ਬਣ ਗਿਆ। ਨਿਰਮਾਤਾ ਮਾਡਲਾਂ ਨੂੰ ਰਚਨਾਤਮਕ ਟੂਲ ਵਾਂਗ ਦੇਖਣ ਲੱਗੇ (ਡਾਊਨਲੋਡ ਕਰਨ ਯੋਗ, remix ਕਰਨ ਯੋਗ, ਸੁਧਾਰ ਕਰਨ ਯੋਗ), ਜਦਕਿ ਕਾਰੋਬਾਰ ਤੇਜ਼ ਇਤਰਾਅਟ, ਘੱਟ ਖਰਚ ਅਤੇ ਮਾਡਲਾਂ ਨੂੰ ਉਥੇ ਚਲਾਉਣ ਦੀ ਉਮੀਦ ਕਰਨ ਲੱਗੇ ਜਿੱਥੇ ਉਹਨਾਂ ਦਾ ਡੇਟਾ ਰਹਿੰਦਾ ਹੈ।
ਇਹ ਬਦਲਾਅ ਸੰਭਵ ਤੌਰ 'ਤੇ ਟਿਕੇਗਾ। ਖੁੱਲ੍ਹੀਆਂ ਰਿਲੀਜ਼ਾਂ ਨੇ ਦਰਸਾਇਆ ਕਿ ਵੰਡਣਾ ਕੈਪੇਬਿਲਿਟੀ ਨੂੰ ਜਿੰਨਾ ਪ੍ਰਭਾਵੀ ਬਣਾ ਦਿੰਦਾ ਹੈ, ਉਹਨਾ ਬਰਾਬਰ raw capability ਤੋਂ ਵੀ ਜ਼ਿਆਦਾ ਮਹੱਤਵਪੂਰਨ ਹੋ ਸਕਦਾ ਹੈ: ਜਦੋਂ ਮਾਡਲ ਆਸਾਨੀ ਨਾਲ ਪਹੁੰਚਯੋਗ ਹੋਵੇ, ਕਮਿਊਨਿਟੀਆਂ ਹੋਰ-ਹੋਰ ਟਿਊਟੋਰੀਅਲ, UI, ਫਾਈਨ-ਟਿਊਨ ਅਤੇ ਬਿਹਤਰੀਆਂ ਬਣਾਉਂਦੀਆਂ ਹਨ ਜੋ ਇਸਨੂੰ ਰੋਜ਼ਮਰ੍ਹਾ ਕੰਮ ਲਈ ਯੋਗ ਬਣਾਉਂਦੀਆਂ। ਇਸ ਦੇ ਨਤੀਜੇ ਵਜੋਂ, ਲੋਕ ਹੁਣ ਨਵੇਂ ਮਾਡਲਾਂ ਤੋਂ ਅੰਗੇ ਤਰ੍ਹਾਂ ਦੀ ਸਮਝਦਾਰੀ ਦੀ ਉਮੀਦ ਰੱਖਦੇ ਹਨ—ਕਿਹੜੇ ਡੇਟਾ ਨੇ ਉਨ੍ਹਾਂ ਨੂੰ ਆਕਾਰ ਦਿੱਤਾ ਅਤੇ ਉਹ ਕੀ ਸੁਰੱਖਿਅਤ ਕਰ ਸਕਦੇ ਹਨ।
ਅਗਲਾ ਅਧਿਆਏ "ਸੀਮਾਂ ਦੇ ਨਾਲ ਕਿਵੇਂ?" ਬਾਰੇ ਜ਼ਿਆਦਾ ਹੋਏਗਾ—"ਕੀ ਨਿਯਮ ਹੋਣਗੇ?" ਨਿਯਮ ਅਜੇ ਵੀ ਖੇਤਰ ਮੁਤਾਬਕ ਵਿਕਸਤ ਹੋ ਰਹੇ ਹਨ, ਅਤੇ ਸਮਾਜਿਕ ਢੰਗ ਅਣਸਮਰੱਥੀ ਨਾਲ ਫੈਲੇ ਹੋਏ ਹਨ—ਖ਼ਾਸ ਕਰਕੇ ਸਹਿਮਤੀ, attribution, ਅਤੇ ਪ੍ਰੇਰਣਾ-ਅਰ-ਨਕਲ ਦੀ ਰੇਖਾ ਨਾਂ।
ਤਕਨੀਕੀ ਸੁਰੱਖਿਆ ਵੀ ਚਲ ਰਹੀ ਹੈ। ਵਾਟਰਮਾਰਕਿੰਗ, provenance metadata, ਵਧੀਆ ਡੇਟਾਸੇਟ ਡੌਕਯੂਮੈਂਟੇਸ਼ਨ, ਅਤੇ ਮਜ਼ਬੂਤ ਸਮੱਗਰੀ ਫਿਲਟਰ ਮਦਦ ਕਰ ਸਕਦੇ ਹਨ, ਪਰ ਕੋਈ ਵੀ ਪੂਰਾ ਹੱਲ ਨਹੀਂ। ਖੁੱਲ੍ਹੇ ਮਾਡਲ ਨਵੀਨਤਾ ਅਤੇ ਜੋਖਿਮ ਦੋਹਾਂ ਨੂੰ ਵਧਾਉਂਦੇ ਹਨ, ਇਸ ਲਈ ਚੱਲਦਾ ਰਹਿੰਦਾ ਪ੍ਰਸ਼ਨ ਇਹ ਹੈ ਕਿ ਨੁਕਸਾਨ ਘੱਟ ਕਰਨ ਲਈ ਕਿਵੇਂ ਕਾਰਵਾਈ ਕੀਤੀ ਜਾਵੇ ਬਿਨਾਂ ਪ੍ਰਯੋਗ ਨੂੰ ਠੱਬ ਕਰ ਦਿੱਤੇ।
ਜੇ ਤੁਸੀਂ ਖੁੱਲ੍ਹੇ ਜਨਰੇਟਿਵ AI ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋ, ਤਾਂ ਇਸਨੂੰ ਇੱਕ ਪੇਸ਼ੇਵਰ ਟੂਲ ਵਾਂਗ ਵਰਤੋ:
Emad Mostaque ਇਸ ਵਾਇਰਲ ਲਹਿਰ ਦਾ ਪ੍ਰਤੀਕ ਬਣੇ ਕਿਉਂਕਿ ਰਣਨੀਤੀ ਸਾਫ਼ ਸੀ: ਪਹੁੰਚ ਭੇਜੋ, ਕਮਿਊਨਿਟੀ ਨੂੰ ਚਲਾਉਣ ਦਿਓ, ਅਤੇ ਇਹ ਮੰਨੋ ਕਿ ਖੁੱਲ੍ਹਾਪਣ ਤਾਕਤ ਸੰਬੰਧੀ ਬਦਲਾਅ ਲਿਆਏਗੀ। ਜਨਰੇਟਿਵ AI ਦਾ ਭਵਿੱਖ ਇਸ ਤਣਾਅ—ਬਨਾਉਣ ਦੀ ਆਜ਼ਾਦੀ ਅਤੇ ਜੋ ਬਣਾਇਆ ਜਾਂਦਾ ਉਸਨੂੰ ਭਰੋਸੇਮੰਦ ਬਣਾਉਣ ਦੀ ਸਾਂਝੀ ਜ਼ਿੰਮੇਵਾਰੀ—ਦ्वਾਰਾ ਸ਼ਕਲ ਲਏਗਾ।
ਉਹ Stability AI ਦੇ ਸੀਈਓ ਦੇ ਤੌਰ 'ਤੇ ਬਹੁਤ ਨਜ਼ਰ ਆਉਂਦੇ ਸਨ ਅਤੇ ਜਨਰੇਟਿਵ ਮਾਡਲਾਂ ਦੀ ਵਿਸ਼ਾਲ ਪਹੁੰਚ ਲਈ ਜਨਰਲ ਵਕालत ਕੀਤੀ। ਬਹੁਤ ਸਾਰੇ ਰਿਸਰਚਰਾਂ ਅਤੇ ਖੁੱਲ੍ਹੇ ਸਰੋਤ ਯੋਗਦਾਨਕਾਰਾਂ ਨੇ “ਇੰਜਿਨ ਰੂਮ” ਦਾ ਕੰਮ ਕੀਤਾ—ਮਾਡਲ ਰਿਸਰਚ, ਡੇਟਾਸੇਟ ਤਿਆਰ ਕਰਨ, ਟਰੇਨਿੰਗ ਇੰਫਰਾਸਟਰੱਕਚਰ ਅਤੇ open-source ਟੂਲਿੰਗ—ਪਰ Mostaque ਨੇ ਅਕਸਰ “ਸਾਮ੍ਹਣੇ ਦਰਵਾਜ਼ੇ” ਵਾਲਾ ਰੋਜ ਮੰਭੌ ਕਿ ਲੋਕਾਂ ਨਾਲ ਸਮਝਾਉਣ, ਕਮਿਊਨਿਟੀ ਨਾਲ ਗੱਲਬਾਤ ਅਤੇ ਰੀਲੀਜ਼ਾਂ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਅੱਗੇ ਲਿਜਾਣਾ ਕੀਤਾ।
ਇਸ ਸੰਦਰਭ ਵਿੱਚ, “ਵਾਇਰਲ” ਦੇ ਮਤਲਬ ਹਨ ਇੱਕ ਨਾਪੇ ਜਾ ਸਕਣ ਵਾਲਾ ਪੈਟਰਨ:
ਜਦੋਂ ਇਹ ਚਾਰੋ ਇਕੱਠੇ ਹੋਂਦਿਆਂ ਹਨ, ਇੱਕ ਮਾਡਲ ਸਿਰਫ ਡੈਮੋ ਨਹੀਂ ਰਹਿੰਦਾ—ਉਹ ਇਕ ਹਿਲਚਲ ਦੀ ਤਰ੍ਹਾਂ ਕੰਮ ਕਰਦਾ ਹੈ।
ਬੰਦ API ਇੱਕ ਹੋਸਟ ਕੀਤੀ ਸੇਵਾ ਹੈ: ਤੁਸੀਂ ਪ੍ਰੰਪਟ ਭੇਜਦੇ ਹੋ, ਨਤੀਜਾ ਮਿਲਦਾ ਹੈ, ਅਤੇ ਪ੍ਰਦਾਤਾ ਕੀਮਤ, ਰੇਟ ਲਿਮਿਟ, ਨੀਤੀਆਂ ਅਤੇ ਅਪਡੇਟ ਨਿਰਧਾਰਤ ਕਰਦਾ ਹੈ।
ਡਾਊਨਲੋਡ ਕਰਨ ਯੋਗ/open-weight ਮਾਡਲ ਤੁਹਾਡੇ ਆਪਣੇ ਹਾਰਡਵੇਅਰ 'ਤੇ ਚਲ ਸਕਦੇ ਹਨ, ਇਸ ਲਈ ਤੁਸੀਂ ਹਾਸਲ ਕਰਦੇ ਹੋ:
ਪਰ ਇਸਦੇ ਨਾਲ ਤਿਆਰ ਕਰਨ ਅਤੇ ਸੁਰੱਖਿਆ ਦੀ ਜ਼ਿੰਮੇਵਾਰੀ ਵੀ ਤੁਹਾਡੇ 'ਤੇ ਆ ਜਾਂਦੀ ਹੈ।
Stable Diffusion ਆਮ ਭਾਸ਼ਾ ਵਿੱਚ ਇੱਕ ਟੈਕਸਟ-ਟੂ-ਇਮੇਜ ਜਨਰੇਟਰ ਹੈ: ਤੁਸੀਂ ‘a cozy cabin in snowy mountains at sunset’ ਵਰਗਾ ਪ੍ਰੰਪਟ ਦਿੰਦੇ ਹੋ, ਅਤੇ ਇਹ ਉਹਦੇ ਅਨੁਸਾਰ ਇੱਕ ਚਿੱਤਰ ਬਣਾਉਂਦਾ ਹੈ।
ਸੰਖੇਪ ਵਿਚ, ਇਹ ਰੈਂਡਮ ਨੋਇਜ਼ (ਟੈਲੀਵਿਜ਼ਨ ਸਟੈਟਿਕ ਵਰਗਾ) ਤੋਂ ਸ਼ੁਰੂ ਹੋ ਕੇ ਕਦਮ-ਦਰ-ਕਦਮ ਨੋਇਜ਼ ਹਟਾਉਂਦਾ ਹੈ। ਤੁਹਾਡਾ ਪ੍ਰੰਪਟ ਇਸ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਮਦਦ ਕਰਦਾ ਹੈ ਤਾਂ ਜੋ ਅੰਤੀਮ ਤਸਵੀਰ ਤੁਹਾਡੇ ਵਰਣਨ ਨਾਲ ਮਿਲਦੀ-ਜੁਲਦੀ ਹੋਵੇ। ਇਹ ਕਿਸੇ ਖਾਸ ਤਸਵੀਰ ਨੂੰ “ਕਾਪੀ” ਨਹੀਂ ਕਰਦਾ; ਇਹ ਸਿੱਖੇ ਗਏ ਵਿਜ਼ੂਅਲ ਪੈਟਰਨਾਂ (ਰੰਗ, ਰਚਨਾ, ਸਟਾਈਲ) ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਨਵੀਂ ਤਸਵੀਰ ਜਨਰੇਟ ਕਰਦਾ ਹੈ।
ਇਹ ਦੋ ਸ਼ਬਦਾਂ ਵਿੱਚ ਵੱਖਰੇ ਹਨ:
ਅਰੰਭਕ ਨਤੀਜੇ 'perfect' ਹੋਣ ਦੀ ਲੋੜ ਨਹੀਂ—’ਛੰਗਾ ਕਾਫੀ’ ਅਤੇ ਤੇਜ਼ ਵਾਪਸੀ ਬਹੁਤ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਜਦੋਂ ਜਨਰੇਸ਼ਨ ਤੇਜ਼ ਹੁੰਦੀ ਹੈ, ਤੁਸੀਂ ਤੁਰੰਤ ਮੁੜ-ਵਿਚਾਰ ਕਰ ਸਕਦੇ ਹੋ: ਪ੍ਰੰਪਟ ਵਿੱਚ ਬਦਲਾਅ, ਸਟਾਈਲ ਬਦਲਣਾ, ਨਵਾਂ ਸੀਡ ਰੱਖਣਾ, ਅਤੇ quelques ਮਿੰਟਾਂ ਵਿੱਚ ਸਭ ਤੋਂ ਵਧੀਆ ਰਿਜ਼ਲਟ ਸਾਂਝਾ ਕਰਨਾ।
ਇਹ ਗਤੀ—ਉੱਚ-ਗੁਣਵੱਤਾ ਨਾਲ ਜੋ 'ਉਪਯੋਗ ਲਈ ਚੰਗੀ ਕਾਫੀ' ਹੋਵੇ—ਪ੍ਰਯੋਗ ਨੂੰ ਆਸਾਨ ਅਤੇ ਲਗਾਤਾਰ ਬਣਾਉਂਦੀ ਹੈ।
ਇਹ ਇੱਕ ਆਮ-ਉਦੇਸ਼ ਦ੍ਰਿਸ਼ਕਾਰ ਹੈ: ਵਧੀਆ ਅਧਾਰ ਮਾਡਲ ਨੂੰ ਲੈ ਕੇ ਤੁਸੀਂ ਉਸਨੂੰ ਇੱਕ ਨਿਸ਼਼ ਵਿਸ਼ੇ 'ਚ ਮਹਿਰਤ ਦਿਵਾਉਂਦੇ ਹੋ। Fine-tuning ਇੱਕ ਛੋਟੀ, ਧਿਆਨ-ਪੂਰਨ dataset ਦਿਖਾ ਕੇ ਮਾਡਲ ਨੂੰ ਖ਼ਾਸ ਸਟਾਈਲ, ਕਿਰਦਾਰ ਸਥਿਰਤਾ ਜਾਂ ਬ੍ਰਾਂਡ ਲੁੱਕ 'ਤੇ ਮਾਹਿਰ ਬਣਾਉਣਾ ਹੈ।
ਸਧਾਰਨ ਕਦਮ:
ਜਦੋਂ weights ਉਪਲਬਧ ਹੋ ਗਏ, ਕਮਿਊਨਿਟੀ ਤੇਜ਼ੀ ਨਾਲ ਖ਼ਾਸ ਵਰਜਨ ਉਤਪੰਨ ਕਰ ਸਕੀ।
ਸਧਾਰਨ ਨੁਕਸਾਨਾਂ ਵਿੱਚ ਡੀਪਫੇਕਸ, ਧਮਕੀ ਭਰੀ ਤਸਵੀਰਾਂ ਅਤੇ ਬਿਨਾ ਸਹਿਮਤੀ ਦੇ ਜੈਨੇਰੇਟ ਕੀਤੀ ਗਈ ਯੌਨ/ਗੁਪਤ ਤਸਵੀਰਾਂ ਸ਼ਾਮਲ ਹਨ। ਖੁੱਲ੍ਹੇ ਵੀਟਸ ਮਾਡਲਾਂ ਨਾਲ ਮਿਸਯੂਜ਼ ਦਾ ਘੱਟ ਰੋਕਥਾਮ ਹੁੰਦਾ ਹੈ, ਖਾਸ ਕਰਕੇ ਜਦੋਂ ਆਸਾਨ-ਇੰਸਟਾਲ UI ਅਤੇ ਪ੍ਰੰਪਟ-ਸਾਂਝ ਕਰਨ ਵਾਲੀ ਕਮਿਊਨਿਟੀ ਹੋਵੇ।
ਇਸਦੇ ਨਾਲ-ਨਾਲ ਕਈ ਵੈਧ ਵਰਤੋਂ ਇਕੋ ਜਿਹਾ ਲੱਗ ਸਕਦੇ ਹਨ (ਉਦਾਹਰਨ ਲਈ, ਪਰੋਡੀ, ਫੈਨ ਆਰਟ, ਰਾਜਨੀਤਿਕ ਵਿਹੰਗਾਂ), ਜਿਸ ਨੇ “ਕੀ ਮਨਜ਼ੂਰ ਹੋਵੇਗਾ?” ਜਿਹਾ ਸੁਆਲ ਜਟਿਲ ਬਣਾ ਦਿੱਤਾ ਅਤੇ ਜਨਤਕ ਵਿਚ ਅਕਾਊਂਟਬਿਲਟੀ ਅਤੇ ਭਰੋਸੇ ਦੇ ਮੁੱਦੇ ਉਭਰੇ।
ਪ੍ਰਯੋਗੀ ਨਿਬੰਧਕ ਮਿਟੀਗੇਸ਼ਨ ਵਿੱਚ ਸ਼ਾਮਲ ਹਨ:
ਕਾਪੀਰਾਈਟ ਦੀ ਵੀਵਾਦ ਦਾ ਕੇਂਦਰ ਟਰੇਨਿੰਗ ਡੇਟਾ ਹੈ: ਵਖਰੇ ਵੱਖਰੇ ਇੰਟਰਨੈਟ ਡੇਟਾਸੇਟ ਵਿੱਚ ਸ਼ਾਇਦ ਕਾਪੀਰਾਈਟ ਕੀਤੇ ਕੰਮ ਬਿਨਾਂ ਆਗਿਆ ਸ਼ਾਮਲ ਹੋਣ। ਨਤੀਜੇ ਕਈ ਵਾਰੀ ਜੀਵਤ ਕਲਾਕਾਰਾਂ ਦੀ ਸਟਾਈਲ ਨਾਲ ਕਾਫੀ ਮਿਲਦੇ-ਜੁਲਦੇ ਹੋ ਸਕਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਨਿਰਮਾਣਕਾਰੀ ਜਾਂ ਅਨੁਚਿਤ ਮੁਕਾਬਲੇ ਦੀ ਭਾਵਨਾ ਪੈਦਾ ਹੁੰਦੀ ਹੈ।
ਸਹਿਯੋਗੀਆਂ ਦਾ ਵਕਤਬਾ ਹੈ ਕਿ ਟ੍ਰੇਨਿੰਗ ਟ੍ਰਾਂਸਫਾਰਮਟਿਵ ਹੋ ਸਕਦੀ ਹੈ, ਮਾਡਲ ਤਸਵੀਰਾਂ ਨੂੰ ਡੈਟਾਬੇਸ ਵਾਂਗ ਨਹੀਂ ਰੱਖਦਾ, ਅਤੇ ਸਟਾਈਲ ਸਿੱਧੀ ਨਕਲ ਨਹੀਂ ਹੁੰਦੀ। ਹਕੀਕਤ ਇਹ ਹੈ ਕਿ ਇਹ ਵਿਵਾਦਕ ਰਹਿੰਦਾ ਹੈ—ਕਾਨੂੰਨੀ ਅਤੇ ਸਾਂਸਕ੍ਰਿਤਿਕ ਦੋਹਾਂ ਪੱਧਰ 'ਤੇ—ਅਤੇ ਨਿਯਮ ਦੇਸ਼ ਮੁਤਾਬਕ ਵੱਖਰੇ ਹਨ। ਪ੍ਰਾਜੈਕਟਾਂ ਲਈ ਲਾਇਸੰਸਿੰਗ ਅਤੇ ਪ੍ਰੋਵੇਨੇਨਸ ਨੂੰ ਪ੍ਰਾਥਮਿਕਤਾ ਦੇਣ ਲਈ ਸਮਝੋ, ਨਾ ਕਿ ਅਫ਼ਟਰਥੌਟ।
“ਡਾਊਨਲੋਡ ਮੁਫ਼ਤ” ਦੇ ਮਤਲਬ ਨੂੰ ਚਲਾਉਣਾ ਹੋਰ ਮਹਿੰਗਾ ਪੈ ਸਕਦਾ ਹੈ:
ਉਪਭੋਗਤਾ-ਆਧਾਰਤ ਬਹੁਤ ਸਾਰੇ ਲੋਕਾਂ ਦੀ ਬਦਲਦੀ ਲੋੜਾਂ ਵਾਲੀ ਬਹੁਤ ਵੱਡੀ ਬੇਸ ਹੈ—ਇਹ ਸਾਰਾ ਕੰਮ ਮੁਫ਼ਤ ਨਹੀਂ।
ਸੁਰੱਖਿਆ ਅਤੇ ਨਿਆਂ ਦਾ ਵੀ ਇੱਕ ਖ਼ਾਲੀਪਨ ਹੈ: ਖੁੱਲ੍ਹੇ weights ਨਾਲ ਨਿਯੰਤਰਣ ਘੱਟ ਹੁੰਦਾ ਹੈ—ਕੋਈ ਵੀ ਗਾਰਡਰੇਲ ਹਟਾ ਸਕਦਾ ਹੈ ਜਾਂ ਉਨ੍ਹਾਂ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਕੰਮ ਕਰਨ ਲਈ ਮਾਡਲ ਨੂੰ ਫਾਈਨ-ਟਿਊਨ ਕਰ ਸਕਦਾ ਹੈ।
ਗਵਰਨੈਂਸ ਵੀ ਇਕ ਮੁੱਦਾ ਹੈ: ਰੀਲੀਜ਼ ਤੋਂ ਬਾਅਦ ਅਪਡੇਟ, ਸੁਰੱਖਿਆ ਬਦਲਾਵ ਜਾਂ ਵਿਤਰਣ ਨਿਯਮ ਕੌਣ ਫੈਸਲਾ ਕਰੇਗਾ? ਬਿਨਾਂ ਸਾਫ਼ stewardship ਅਤੇ ਫੰਡਿੰਗ ਦੇ, ਕਮਿਊਨਿਟੀ forks ਵਿੱਚ ਵੰਡ ਜਾਂਦੀ ਹੈ ਅਤੇ ਰੱਖ-ਰਖਾਵ ਅਸਮਾਨ ਹੋ ਜਾਂਦਾ ਹੈ।
ਕੋਈ ਵੀ ਢੰਗ ਪੂਰੀ ਤਰ੍ਹਾਂ ਸਮੱਸਿਆ ਹਲ ਨਹੀਂ ਕਰਦਾ, ਪਰ ਇਹ ਤਰੀਕੇ ਘੱਟ-ਨੁਕਸਾਨ ਲਈ ਯਤਨ ਦਰਸਾਉਂਦੇ ਹਨ।