Ilya Sutskever: ਜਿਸ ਖੋਜਕਾਰ ਨੇ LLMs ਦੇ ਰੂਪ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕੀਤਾ

Q: What did AlexNet prove, and why does it matter for LLMs?

AlexNet ਇਹ ਦਿਖਾਉਂਦਾ ਸੀ ਕਿ ਵੱਡੇ ਨੈੱਟਵਰਕ + GPUs + ਚੰਗੇ ਟ੍ਰੇਨਿੰਗ ਵੇਰਵਿਆਂ ਨਾਲ ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਵੱਡਾ ਛਾਲ ਆ ਸਕਦਾ ਹੈ। ਇਹ ਸਿਰਫ ImageNet ਦੀ ਜਿੱਤ ਨਹੀਂ ਸੀ—ਇਸਨੇ ਇਹ ਦਿਖਾਇਆ ਕਿ “ਸਕੇਲਿੰਗ ਕੰਮ ਕਰਦੀ ਹੈ” ਅਤੇ ਹੋਰ ਖੇਤਰ ਵੀ ਇਸ ਤਰੀਕੇ ਨੂੰ ਅਪਣਾ ਸਕਦੇ ਹਨ।

Q: What did big labs like Google Brain change about scaling research?

ਵੱਡੇ ਪੈਮਾਨੇ 'ਤੇ, ਇੱਕ ਲੈਬ ਦਾ ਫਾਇਦਾ ਅਕਸਰ ਓਪਰੇਸ਼ਨਲ ਹੁੰਦਾ ਹੈ: - ਵੰਡਿਆ ਗਿਆ ਟ੍ਰੇਨਿੰਗ ਤੇ ਸਾਂਝੀ ਇਨਫ੍ਰਾਸਟਰਕਚਰ - ਦੋਹਰਾਯੋਗ ਪਾਇਪਲਾਈਨਾਂ ਡਾਟਾ ਅਤੇ ਇਵੈਲ ਲਈ - ਐਕਸਪੇਰੀਮੈਂਟ ਅਨੁਸ਼ਾਸਨ (ਮੋਨੀਟਰਨਗ, ਲੌਗਿੰਗ, ਦੁਹਰਾਯੋਗਤਾ) ਇਹ ਇਸ ਲਈ ਜਰੂਰੀ ਹੈ ਕਿਉਂਕਿ ਬਹੁਤ ਵੱਡੇ ਮਾਡਲਾਂ ਅਤੇ ਡੈਟਾਸੈੱਟਾਂ 'ਤੇ ਕਈ ਫੇਲ੍ਹਯਾ ਕੇਸ ਸਿਰਫ ਉਸ ਸਮੇਂ ਨਜ਼ਰ ਆਉਂਦੇ ਹਨ—ਅਤੇ ਜਿਹੜੀਆਂ ਟੀਮਾਂ ਉਹਨਾਂ ਨੂੰ ਡਿਬੱਗ ਕਰ ਸਕਦੀਆਂ ਹਨ, ਉਹ ਅੱਗੇ ਰਹਿੰਦੀ ਹਨ।

Q: What are the biggest “hard parts” of training models at scale?

ਤਿੰਨ ਵਿਸ਼ੇਸ਼ ਲਿਵਰ ਜ਼ਿਆਦਾ ਅਹੰਕਾਰ ਰੱਖਦੇ ਹਨ: - ਡਾਟਾ ਗੁਣਵੱਤਾ: ਡੀਡੁਪਲੀਕੇਸ਼ਨ, ਫਿਲਟਰਿੰਗ, ਡੈਟਾਸੈੱਟ ਵਰਜ਼ਨਿੰਗ - ਆਪਟੀਮਾਈਜ਼ੇਸ਼ਨ ਸਥਿਰਤਾ: ਲਰਨਿੰਗ-ਰੇਟ ਸਕੈਜੂਲ, ਗਰੇਡੀਐਂਟ ਕਲਿੱਪਿੰਗ, ਮਿਕਸਡ ਪ੍ਰਿਸੀਜ਼ਨ, ਚੈਕਪੌਇਂਟਿੰਗ - ਲਗਾਤਾਰ ਇਵੈਲੂਐਸ਼ਨ: ਛੋਟੇ ਤੇਜ਼ ਇਵੈਲ ਅਤੇ ਵਿਸ਼ਾਲ ਸੂਟ ਦੀ ਨਿਯਮਤ ਜਾਂਚ ਇਹਨਾਂ ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਮਹਿੰਗੀਆਂ ਗਲਤੀਆਂ—ਜਿਵੇਂ ਸਿਖਲਾਈ ਦੀ ਅਸਫਲਤਾ, ਓਵਰਫਿਟਿੰਗ ਜਾਂ ਰੀਗ੍ਰੈਸ਼ਨ—ਕੰਨਟਰੋਲ ਕੀਤੀਆਂ ਜਾ ਸਕਦੀਆਂ ਹਨ।

ਲੌਗ ਇਨ ਸ਼ੁਰੂ ਕਰੋ

Ilya Sutskever: ਜਿਸ ਖੋਜਕਾਰ ਨੇ LLMs ਦੇ ਰੂਪ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕੀਤਾ | Koder.ai

ਕਿਉਂ Ilya Sutskever ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲਾਂ ਲਈ ਮਾਇਨੇ ਰੱਖਦਾ ਹੈ

Ilya Sutskever ਉਹਨਾਂ ਨਾਮਾਂ ਵਿੱਚੋਂ ਇੱਕ ਹੈ ਜੋ ਅਕਸਰ ਆਉਂਦੇ ਹਨ ਜਦੋਂ ਲੋਕ ਵੇਖਦੇ ਹਨ ਕਿ ਆਧੁਨਿਕ AI—ਖਾਸ ਕਰਕੇ ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲ (LLMs)—ਕਿਵੇਂ ਪ੍ਰਯੋਗਯੋਗ ਬਣੇ। ਇਹ ਇਸ ਲਈ ਨਹੀਂ ਕਿ ਉਸਨੇ ਇੱਕੱਲਾ LLM “ਅਵਿਸਕਾਰ” ਕੀਤਾ, ਪਰ ਕਿਉਂਕਿ ਉਸਦਾ ਕੰਮ ਇਹ ਮੰਨਣ ਵਿੱਚ ਮਦਦਗਾਰ ਰਿਹਾ ਕਿ: ਜੇ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਸਹੀ ਪੈਮਾਨੇ ਤੇ ਅਤੇ ਸਹੀ ਤਰੀਕਿਆਂ ਨਾਲ ਟ੍ਰੇਨ ਕੀਤੇ ਜਾਣ, ਤਾਂ ਉਹ ਹੈਰਾਨ ਕਰਨ ਵਾਲੀ ਦੌਰ-ਵਿਆਪਕ ਕੌਸ਼ਲ ਸਿੱਖ ਸਕਦੇ ਹਨ।

ਇਹ ਜੋੜ—ਉਮੀਦਵਾਰ ਸਕੇਲ ਅਤੇ ਹੱਥ-ਅਨੁਭਵੀ ਟ੍ਰੇਨਿੰਗ ਅਨੁਸ਼ਾਸਨ—ਅਜਿਹੇ ਕਈ ਮੀਲ-ਪੱਥਰਾਂ 'ਤੇ ਵਾਪਰਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੇ ਅੱਜ ਦੇ LLMs ਤਕ ਦਾ ਰਸਤਾ ਬਣਾਇਆ।

“ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲ” ਦਾ ਸਧਾਰਨ ਅਰਥ

ਵੱਡਾ ਭਾਸ਼ਾਈ ਮਾਡਲ ਇੱਕ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਹੈ ਜੋ ਬਹੁਤ ਜ਼ਿਆਦਾ ਟੈਕਸਟ 'ਤੇ ਅਗਲੇ ਸ਼ਬਦ (ਜਾਂ ਟੋਕਨ) ਦੀ ਭਵਿੱਖਵਾਣੀ ਕਰਨ ਲਈ ਟ੍ਰੇਨ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਇਹ ਸਧਾਰਨ ਲਕਸ਼ ਵੱਡੀ ਚੀਜ਼ ਬਣ ਜਾਂਦੀ ਹੈ: ਮਾਡਲ ਵਿਆਕਰਨ, ਤੱਥ, ਅੰਦਾਜ਼ ਅਤੇ ਸਮੱਸਿਆ-ਹੱਲ ਕਰਨ ਦੇ ਰੋਜ਼ਾਂਦਾਨ ਸਿੱਖ ਲੈਂਦਾ ਹੈ—ਇਨਾ ਚੰਗੀ ਤਰ੍ਹਾਂ ਕਿ ਉਹ ਲਿਖ ਸਕਦਾ ਹੈ, ਸੰਖੇਪ ਕਰ ਸਕਦਾ ਹੈ, ਅਨੁਵਾਦ ਕਰ ਸਕਦਾ ਹੈ ਅਤੇ ਪ੍ਰਸ਼ਨਾਂ ਦੇ ਜਵਾਬ ਦੇ ਸਕਦਾ ਹੈ।

LLMs “ਵੱਡੇ” ਦੋ ਅਰਥਾਂ ਵਿੱਚ ਹੁੰਦੇ ਹਨ:

ਬਹੁਤ ਸਾਰੇ ਪੈਰਾਮੀਟਰ (ਮਾਡਲ ਦੇ ਅੰਦਰਲੇ ਵਜ਼ਨ)
ਵੱਡੀ ਟਰੇਨਿੰਗ ਡਾਟਾ ਅਤੇ ਕੰਪਿਊਟ (ਜੋ ਸਰੋਤ ਟ੍ਰੇਨਿੰਗ ਲਈ ਵਰਤੇ ਜਾਂਦੇ ਹਨ)

ਇਸ ਲੇਖ ਵਿੱਚ ਕੀ ਕਵਰ ਕੀਤਾ ਜਾਵੇਗਾ

ਇਹ ਲੇਖ Sutskever ਦੇ ਕਰੀਅਰ ਨੂੰ LLM ਇਤਿਹਾਸ ਵਿੱਚ ਕਿਉਂ ਬਾਰ-ਬਾਰ ਦੇਖਿਆ ਜਾਂਦਾ ਹੈ, ਇਸ ਦੀ ਇੱਕ ਮਾਰਗਦਰਸ਼ਕ ਯਾਤਰਾ ਹੈ। ਤੁਸੀਂ ਪ੍ਰਾਪਤ ਕਰੋਗੇ:

ਇੱਕ ਛੋਟੀ, ਪੜ੍ਹਨਯੋਗ ਜੀਵਨੀ — ਵਿਦਿਆਰਥੀ ਤੋਂ ਅਗੇਤਮ AI ਖੋਜਕਾਰ ਤਕ
ਉਹ ਮੁੱਖ ਤਕਨੀਕੀ ਬਦਲਾਅ ਜੋ ਨਿਊਰਲ ਨੈੱਟਵਰਕਾਂ ਨੂੰ ਪ੍ਰਯੋਗਯੋਗ ਸਕੇਲ 'ਤੇ ਲਿਆਏ
ਕਿਵੇਂ ਇਮੇਜ ਪਹਿਚਾਣ ਅਤੇ ਲੜੀ-ਮਾਡਲਿੰਗ ਦੇ ਵਿਚਾਰ ਆਧੁਨਿਕ ਭਾਸ਼ਾਈ ਸਿਸਟਮਾਂ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰਦੇ ਹਨ
ਯੋਗਤਾ ਵਧਣ ਨਾਲ ਸੁਰੱਖਿਆ ਅਤੇ ਅਲਾਇਨਮੈਂਟ ਕਿਉਂ ਕੇਂਦਰੀ ਹੋ ਗਏ

ਕਿਸ ਲਈ ਹੈ

ਤੁਹਾਨੂੰ ਇੰਜੀਨੀਅਰ ਹੋਣ ਦੀ ਲੋੜ ਨਹੀਂ। ਜੇ ਤੁਸੀਂ ਨਿਰਮਾਤਾ, ਪ੍ਰੋਡਕਟ ਲੀਡ, ਜਾਂ ਜਾਣਨ-ਚਾਹੁਣ ਵਾਲੇ ਪਾਠਕ ਹੋ ਜੋ ਸਮਝਣਾ ਚਾਹੁੰਦੇ ਹੋ ਕਿ LLMs ਕਿਵੇਂ ਉਭਰੇ—ਅਤੇ ਕਿਉਂ ਕੁਝ ਨਾਂਮ ਵਾਪਸ-ਵਾਪਸ ਆ ਰਹੇ ਹਨ—ਤਾਂ ਇਹ ਸਧਾਰਨ ਸ਼ਬਦਾਂ ਵਿੱਚ ਕਹਾਣੀ ਸਪਸ਼ਟ ਕਰਦਾ ਹੈ ਬਿਨਾਂ ਜ਼ਿਆਦਾ ਗਣਿਤ ਵਿੱਚ ਡੁੱਬਾਏ।

ਸਾਰਭੌਮ ਜੀਵਨੀ: ਵਿਦਿਆਰਥੀ ਤੋਂ ਪ੍ਰਮੁੱਖ ਖੋਜਕਾਰ ਤੱਕ

Ilya Sutskever ਆਮ ਤੌਰ 'ਤੇ ਜਾਣੇ ਜਾਂਦੇ ਹਨ ਕਿ ਉਨ੍ਹਾਂ ਨੇ ਨਿਊਰਲ ਨੈੱਟਵਰਕਾਂ ਨੂੰ ਅਕਾਦਮਿਕ ਵਿਚਾਰ ਤੋਂ ਲੈ ਕੇ ਆਧੁਨਿਕ AI ਸਿਸਟਮਾਂ ਦੀ ਵਰਤੋਂ ਜੋੜਨ ਵਿੱਚ ਮਦਦ ਕੀਤੀ।

ਸਾਹਮਣੇ ਦੇ ਕੁਝ ਜਨਤਕ ਮੀਲ-ਪੱਥਰ

University of Toronto (ਵਿਦਿਆਰਥੀ → ਖੋਜਕਾਰ): Sutskever ਨੇ University of Toronto 'ਚ ਕੰਪਿਊਟਰ ਸਾਇੰਸ ਦੀ ਪੜਾਈ ਕੀਤੀ ਅਤੇ Geoffrey Hinton ਨਾਲ ਕੰਮ ਕੀਤਾ, ਜਦ deep learning ਮੁੜ ਉਭਰ ਰਿਹਾ ਸੀ।
ਸ਼ੁਰੂਆਤੀ ਡੀਪ ਲਰਨਿੰਗ ਉਪਲਬਧੀਆਂ (ਰਿਸਰਚ): ਉਹ ਅਜਿਹੇ ਕੰਮ ਨਾਲ ਜੁੜੇ ਜੋ ਦਿਖਾਉਂਦੇ ਸਨ ਕਿ ਵੱਡੇ ਨੈੱਟਵਰਕ, ਸਹੀ ਤਰੀਕੇ ਨਾਲ ਅਤੇ ਕਾਫੀ ਡਾਟਾ ਤੇ ਕੰਪਿਊਟ ਨਾਲ ਟ੍ਰੇਨ ਕੀਤੇ ਜਾਣ, ਨਿਰੂਪਕ ਸੁਧਾਰ ਦਿਖਾ ਸਕਦੇ ਹਨ।
Google Brain (ਖੋਜਕਾਰ/ਇੰਜੀਨੀਅਰ): ਉਸਨੇ Google ਦੇ ਡੀਪ ਲਰਨਿੰਗ ਗਰੁੱਪ ਵਿੱਚ ਸ਼ਾਮਿਲ ਹੋ ਕੇ ਵੱਡੇ ਮਾਡਲਾਂ ਦੀ ਟ੍ਰੇਨਿੰਗ ਨੂੰ ਵਿਸ਼ਵਾਸਯੋਗ ਤੇ ਸਕੇਲਯੋਗ ਬਣਾਉਣ ਵਾਲੀਆਂ ਤਕਨੀਕਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਇਆ।
OpenAI (ਕੋ-ਫਾਉਂਡਰ + ਰਿਸਰਚ ਲੀਡਰ): ਬਾਅਦ ਵਿੱਚ ਉਹ OpenAI ਦੇ ਸਹ-ਸੰਸਥਾਪਕਾਂ ਵਿੱਚੋਂ ਹੋਏ ਅਤੇ ਸੀਨੀਅਰ ਰਿਸਰਚ ਲੀਡਰਸ਼ਿਪ ਵਿੱਚ ਰਹਿ ਕੇ ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲਾਂ ਵਾਲੇ ਪ੍ਰੋਗਰਾਮਾਂ ਨੂੰ ਰਾਹ ਦਿਖਾਇਆ।

ਖੋਜਕਾਰ vs ਇੰਜੀਨੀਅਰ vs ਕੋ-ਫਾਉਂਡਰ

ਇਹ ਲੇਬਲ ਕੁਝ ਹੱਦ ਤੱਕ ਮਿਲਦੇ-ਜੁਲਦੇ ਹਨ, ਪਰ ਜ਼ੋਰ ਵੱਖਰਾ ਹੁੰਦਾ ਹੈ:

ਇੱਕ ਖੋਜਕਾਰ ਨਵੇਂ ਵਿਚਾਰ ਬਣਾਉਂਦਾ: ਮਾਡਲ ਡਿਜ਼ਾਈਨ, ਟ੍ਰੇਨਿੰਗ ਤਕਨੀਕਾਂ ਅਤੇ ਪ੍ਰਯੋਗ ਜੋ ਸੰਭਾਵਨਾਵਾਂ ਵਧਾਉਂਦੇ ਹਨ।
ਇੱਕ ਇੰਜੀਨੀਅਰ ਸਿਸਟਮਾਂ ਨੂੰ ਭਰੋਸੇਯੋਗ ਬਣਾਉਂਦਾ: ਸਥਿਰ ਟ੍ਰੇਨਿੰਗ, ਕੁਸ਼ਲ ਇੰਫ੍ਰਾਸਟਰਕਚਰ ਅਤੇ ਦੁਹਰਾਏ ਯੋਗ ਪਾਇਪਲਾਈਨ।
ਇੱਕ ਕੋ-ਫਾਉਂਡਰ ਦਿਸ਼ਾ ਅਤੇ ਪ੍ਰਾਥਮਿਕਤਾਵਾਂ ਨਿਰਧਾਰਤ ਕਰਦਾ: ਕੀ ਬਣਾਉਣਾ ਹੈ, ਟੀਮਾਂ ਕਿਵੇਂ ਸੰਗਠਿਤ ਹੋਣ, ਅਤੇ ਖੋਜ ਨੂੰ ਹਕੀਕਤ ਨਾਲ ਕਿਵੇਂ ਜੋੜਨਾ ਹੈ।

ਲਾਈਨ-ਥਰੂ

ਇਨ੍ਹਾਂ ਭੂਮਿਕਾਵਾਂ 'ਚ ਇੱਕ ਸਥਿਰ ਥੀਮ ਇਹ ਹੈ: ਨਿਊਰਲ ਨੈੱਟਵਰਕਾਂ ਨੂੰ ਸਕੇਲ ਕਰਨਾ ਤੇ ਟ੍ਰੇਨਿੰਗ ਨੂੰ ਵਿਹਾਰਿਕ ਬਣਾਉਣਾ—ਵੱਡੇ ਮਾਡਲਾਂ ਨੂੰ ਇਸ ਤਰ੍ਹਾਂ ਟ੍ਰੇਨ ਕਰਨਾ ਕਿ ਉਹ ਅਸਥਿਰ, ਅਣਪੜਤਲ ਜਾਂ ਮਹਿੰਗੇ ਨਾ ਪੈਣ।

ਡੀਪ ਲਰਨਿੰਗ ਦਾ ਮੁਹੂਰ: ਖੇਤਰ ਕਿਵੇਂ ਦਿੱਖਦਾ ਸੀ

2010 ਤੋਂ ਪਹਿਲਾਂ, “ਡੀਪ ਲਰਨਿੰਗ” ਮੁਸ਼ਕਲ ਸਮੱਸਿਆਵਾਂ ਲਈ ਡਿਫਾਲਟ ਉੱਤਰ ਨਹੀਂ ਸੀ। ਬਹੁਤ ਸਾਰੇ ਖੋਜਕਾਰ ਹੱਥ-ਨਿਰਮਿਤ ਫੀਚਰਾਂ 'ਤੇ ਜ਼ਿਆਦਾ ਭਰੋਸਾ ਕਰਦੇ ਸਨ। ਨਿਊਰਲ ਨੈੱਟ ਵੱਸ ਹੁੰਦੀਆਂ ਸਨ, ਪਰ ਬਹੁਤ ਵਾਰੀ ਛੋਟੇ ਡੈਮੋ ਤੋਂ ਬਾਅਦ ਅਮੂਮਨ ਜਨਰਲਾਈਜ਼ ਨਾ ਕਰ ਪਾਉਂਦੀਆਂ।

ਨਿਊਰਲ ਨੈੱਟਵਰਕਾਂ ਨੂੰ ਕੀ ਮੁਸ਼ਕਿਲਾਂ ਸੀ

ਤੀਨ ਪ੍ਰਾਇਕਟਿਕ ਬੋਤਲਨੇਕਸ ਨੇ ਨੈੱਟਵਰਕਾਂ ਨੂੰ ਸਕੇਲ 'ਤੇ ਚਮਕਣ ਤੋਂ ਰੋਕਿਆ:

ਡਾਟਾ: ਵੱਡੇ, ਲੇਬਲਡ ਡੈਟਾਸੈੱਟ ਘੱਟ ਮਿਲਦੇ ਸਨ। ਬਹੁਤ ਸਾਰਿਆਂ ਟਾਸਕਾਂ ਲਈ ਹਜ਼ਾਰਾਂ ਉਦਾਹਰਣ ਹੋਂਦੀਆਂ ਸਨ, ਮਿਲੀਆਂ ਨਹੀਂ।
ਕੰਪਿਊਟ: ਡੀਪ ਮਾਡਲਾਂ ਨੂੰ ਟ੍ਰੇਨ ਕਰਨ ਲਈ ਬਹੁਤ ਜ਼ਿਆਦਾ ਗਣਨਾਤਮਕ ਰਿਸੋਰਸ ਲੱਗਦੇ—CPUs 'ਤੇ ਇਹ ਸਮੇਂ ਸਹਿਤ ਅਸੰਭਵ ਸੀ।
ਟ੍ਰੇਨਿੰਗ ਸਥਿਰਤਾ: ਗਹਿਰੇ ਮਾਡਲ ਆਖਣੇ-ਆਸਾਨੀ ਨਾਲ ਅਪਟੀਮਾਈਜ਼ ਨਾ ਹੁੰਦੇ; ਉਹ ਫਸ ਸਕਦੇ, ਹੌਲੀ ਸਿੱਖਦੇ ਜਾਂ ਟ੍ਰੇਨਿੰਗ ਦੌਰਾਨ “ਫੱਟ” ਸਕਦੇ ਸਨ। ਅਜਿਹੀਆਂ ਤਕਨੀਕਾਂ ਜੋ ਅਸੀਂ ਅੱਜ ਮੰਨਦੇ ਹਾਂ, ਉਹ ਅਜੇ ਇਹਨਾਂ ਦੌਰਾਨ ਸੀਖੀਆਂ ਜਾ ਰਹੀਆਂ ਸਨ।

ਇਹ ਸੀਮਾਵਾਂ ਨੇ ਨੈੱਟਵਰਕਸ ਨੂੰ ਹੋਰ ਸਰਲ ਤਰੀਕਿਆਂ ਨਾਲ ਤੁਲਨਾ ਕਰਦੀਆਂ ਅਣਵਿਖਰ ਲੋਕ-ਭਰੋਸੇਯੋਗ ਬਣਾਇਆ।

ਕੁਝ ਮੁੱਖ ਅਵਧਾਰਨਾ ਜੋ ਬਾਅਦ ਵਿੱਚ ਜਰੂਰੀ ਹੋਈ

ਕੁਝ ਧਾਰਨਾਵਾਂ ਇਸ ਯੁੱਗ ਤੋਂ ਅਗੇ ਆ ਕੇ LLM ਕਹਾਣੀ ਵਿੱਚ ਬਾਰ-ਬਾਰ ਆਉਂਦੀਆਂ ਹਨ:

Backpropagation (backprop): ਇੱਕ ਐਲਗੋਰਿਦਮ ਜੋ ਨੈੱਟਵਰਕ ਦੇ ਵਜ਼ਨਾਂ ਨੂੰ ਠੀਕ ਕਰਦਾ ਹੈ, ਗਲਤੀ ਸੰਕੇਤਾਂ ਨੂੰ ਪਰਤ ਕੇ ਲੇਅਰਾਂ ਵਿੱਚ ਧੱਕਦਾ ਹੈ।
GPUs: Graphics Processing Units—ਪਹਿਲਾਂ ਇਮੇਜ ਰੇਂਡਰਿੰਗ ਲਈ, ਫਿਰ ਨਿਊਰਲ ਨੈੱਟਵਰਕਸ ਲਈ ਬਹੁਤ ਵਧੀਆ ਸਾਬਿਤ ਹੋਏ।
Representation learning: ਅਨਜਾਣੀ ਫੀਚਰਾਂ ਨੂੰ ਮਾਡਲ ਖੁਦ ਸਿੱਖਦਾ ਹੈ, ਬਜਾਏ ਇਨਸਾਨਾਂ ਦੇ ਹੱਥ-ਨਿਰਮਿਤ ਫੀਚਰਾਂ ਦੇ।

mentorship ਅਤੇ ਲੈਬ ਸੱਭਿਆਚਾਰ ਦਾ ਮੱਤਲਬ

ਕਿਉਂਕਿ ਨਤੀਜੇ ਬਹੁਤ ਪ੍ਰਯੋਗਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਸਨ, ਖੋਜਕਾਰਾਂ ਨੂੰ ਉਹਨਾ ਥਾਂਵਾਂ ਦੀ ਲੋੜ ਸੀ ਜਿੱਥੇ ਉਹ ਬਹੁਤ ਸਾਰੇ ਟ੍ਰਾਇਲ ਚਲਾ ਸਕਣ, ਸਿਖੀ ਹੋਈਆਂ ਤਕਨੀਕਾਂ ਸਾਂਝੀਆਂ ਕਰ ਸਕਣ ਅਤੇ ਧਾਰਣਾਵਾਂ ਨੂੰ ਚੁਣੌਤੀ ਦੇ ਸਕਣ। ਮਜ਼ਬੂਤ mentorship ਅਤੇ ਸਹਾਇਕ ਲੈਬਾਂ ਨੇ ਨਿਊਰਲ ਨੈੱਟਵਰਕਾਂ ਨੂੰ ਇੱਕ ਅਣਸ਼ੁਦਧ ਸ਼ਰਤ ਤੋਂ ਦੁਹਰਾਏ ਯੋਗ ਖੋਜ ਕਾਰਜਕ੍ਰਮ ਵਿੱਚ ਬਦਲਣ ਵਿੱਚ ਮਦਦ ਕੀਤੀ—ਜੋ ਅਗਲੇ ਬ੍ਰੇਕਥਰੂਜ਼ ਲਈ ਮੈਦਾਨ ਤਿਆਰ ਕਰਦਾ ਹੈ।

AlexNet ਅਤੇ ਇਸਨੇ ਦਿਖਾਇਆ ਕਿ ਨਿਊਰਲ ਨੈੱਟ ਸਕੇਲ ਕਰ ਸਕਦੇ ਹਨ

AlexNet ਅਕਸਰ ImageNet 'ਚ ਜਿੱਤ ਵਾਲਾ ਮਾਡਲ ਵਜੋਂ ਯਾਦ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਜ਼ਿਆਦਾ ਮਹੱਤਵਪੂਰਨ ਗੱਲ ਇਹ ਸੀ ਕਿ ਇਸਨੇ ਸਰਵਜਨਿਕ, ਮਾਪਣਯੋਗ ਪ੍ਰਦਰਸ਼ਨ ਦਿਖਾਇਆ ਕਿ ਨਿਊਰਲ ਨੈੱਟਵਰਕਸ ਸਿਧਾਂਤ ਵਿੱਚ ਕੰਮ ਕਰਨ ਤੋਂ ਇਲਾਵਾ ਵਧੀਆ ਨਤੀਜੇ ਵੇਖਾ ਸਕਦੇ ਹਨ ਜੇ ਉਨ੍ਹਾਂ ਨੂੰ ਕਾਫੀ ਡਾਟਾ ਅਤੇ ਕੰਪਿਊਟ ਦਿੱਤਾ ਜਾਵੇ ਅਤੇ ਟ੍ਰੇਨਿੰਗ ਧਿਆਨ ਨਾਲ ਕੀਤੀ ਜਾਵੇ।

AlexNet ਨੇ ਅਸਲ ਵਿੱਚ ਕੀ ਸਾਬਤ ਕੀਤਾ

2012 ਤੋਂ ਪਹਿਲਾਂ, ਕਈ ਖੋਜਕਾਰ ਗਹਿਰੇ ਨੈੱਟਵਰਕਸ ਨੂੰ ਦਿਲਚਸਪ ਪਰ ਅਣਭਰੋਸੇਯੋਗ ਸੋਚਦੇ ਸਨ। AlexNet ਨੇ ਇਹ ਕਹਾਣੀ ਬਦਲੀ ਤੇ ਇੱਕ ਨਿਰਣਾਇਕ ਕੂਦ ਦਿੱਤਾ।

ਮੁੱਖ ਸੁਨੇਹਾ ਇਹ ਨਹੀਂ ਸੀ ਕਿ “ਇਹ ਖਾਸ ਆਰਕੀਟੈਕਚਰ ਜਾਦੂਈ ਹੈ।” ਸਿੱਖਣਯੋਗ ਮੈਸੇਜ ਸੀ:

ਵੱਡੇ ਮਾਡਲ ਛੋਟੇ ਤੋਂ ਬਿਹਤਰ ਕਰ ਸਕਦੇ ਹਨ ਜੇ ਉਹਨਾਂ ਨੂੰ ਵੱਡੇ ਡੈਟਾ 'ਤੇ ਟ੍ਰੇਨ ਕੀਤਾ ਜਾਵੇ।
GPUs (ਅਤੇ ਗੰਭੀਰ ਕੰਪਿਊਟ ਵਰਤਣ ਦੀ ਇਛਾ) “ਬਹੁਤ ਹੌਲੀ ਟ੍ਰੇਨਿੰਗ” ਨੂੰ “ਵੱਧੀਆਂ ਸਮੇਂ-ਅੰਦਰ ਟ੍ਰੇਨ ਕਰਨਯੋਗ” ਵਿੱਚ ਬਦਲ ਸਕਦੇ ਹਨ।
ਟ੍ਰੇਨਿੰਗ ਵੇਰਵੇ ਮਹੱਤਵਪੂਰਨ ਹਨ: ਉਦਯੋਗਿਕ ਸਿਹਤਯੋਗ, ਰੈਗੂਲਰਾਈਜੇਸ਼ਨ ਅਤੇ ਸੰਭਾਲੀ ਇੰਜੀਨੀਅਰਿੰਗ ਸਕੇਲ ਦਾ ਫਾਇਦਾ ਦਿਖਾਉਂਦੇ ਹਨ।

ਵਿਜ਼ਨ ਤੋਂ ਚੌੜੀ ਭਰੋਸਾ-ਅਧਾਰਿਤ ਸੋਚ ਤੱਕ

ਜਦੋਂ ਖੇਤਰ ਨੇ ਦੇਖਿਆ ਕਿ ਡੀਪ ਲਰਨਿੰਗ ਇੱਕ ਉੱਚ-ਪ੍ਰੋਫਾਈਲ ਬੈਂਚਮਾਰਕ 'ਤੇ ਛਾ ਗਿਆ, ਤਾਂ ਇਹ ਮੰਨਣਾ ਆਸਾਨ ਹੋ ਗਿਆ ਕਿ ਹੋਰ ਖੇਤਰ—ਜਿਵੇਂ speech, translation ਅਤੇ ਬਾਅਦ ਵਿੱਚ language modeling—ਵੀ ਇਸੇ ਰਾਹ ਦੀ ਪਾਲਣਾ ਕਰ ਸਕਦੇ ਹਨ।

ਇਹ ਭਰੋਸਾ ਬਦਲਾਅ ਮਹੱਤਵਪੂਰਨ ਸੀ: ਇਸਨੇ ਵੱਡੇ ਪ੍ਰਯੋਗਾਂ ਨੂੰ ਬਣਾਉਣ, ਵੱਡੇ ਡੈਟਾ ਇਕੱਠੇ ਕਰਨ ਅਤੇ ਉਸ ਇਨਫ੍ਰਾਸਟਰੱਕਚਰ ਵਿੱਚ ਨਿਵੇਸ਼ ਕਰਨ ਨੂੰ ਜਾਇਜ਼ ਕੀਤਾ ਜੋ ਬਾਅਦ ਵਿੱਚ LLMs ਲਈ ਆਮ ਹੋ ਗਿਆ।

“ਸਕੇਲ + ਚੰਗੀ ਟ੍ਰੇਨਿੰਗ” ਇੱਕ ਦੁਹਰਾਏ ਯੋਗ ਨੁਸਖਾ

AlexNet ਨੇ ਇੱਕ ਸਧਾਰਨ ਪਰ ਦੁਹਰਾਏ ਯੋਗ ਨੁਸਖੇ ਦੀ ਸੁਝਾਵ ਦਿੱਤੀ: ਸਕੇਲ ਵਧਾਓ ਅਤੇ ਟ੍ਰੇਨਿੰਗ ਵਿੱਚ ਸੁਧਾਰ ਲਿਆਓ ਤਾਂ ਕਿ ਵੱਡਾ ਮਾਡਲ ਅਸਲ ਵਿੱਚ ਸਿੱਖੇ।

LLM ਲਈ ਸਮਾਨ ਪਾਠ ਇਹ ਹੈ ਕਿ ਜਦ ਕੰਪਿਊਟ ਅਤੇ ਡਾਟਾ ਇਕੱਠੇ ਵਧਾਏ ਜਾਂਦੇ ਹਨ, ਤਰੱਕੀ ਮਿਲਣ ਦੀ ਸੰਭਾਵਨਾ ਵਧਦੀ ਹੈ। ਕੇਵਲ ਵੱਧ ਕੰਪਿਊਟ ਬਿਨਾ ਕਾਫੀ ਡਾਟਾ ਦੇ ਓਵਰਫਿਟ ਹੋ ਸਕਦਾ; ਬਿਨਾ ਕਾਫੀ ਕੰਪਿਊਟ ਦੇ ਵੱਧ ਡਾਟਾ ਅੰਡਰ-ਟ੍ਰੇਨ ਹੋ ਸਕਦਾ। AlexNet ਯੁੱਗ ਨੇ ਉਸ ਜੋੜ ਨੂੰ ਜੋखिम ਤੋਂ empirical ਰਣਨੀਤੀ ਬਣਾਉ ਦਿੱਤਾ।

ਵਿਜ਼ਨ ਤੋਂ ਭਾਸ਼ਾ ਤੱਕ: ਸਿੱਕਵੈਂਸ-ਟੂ-ਸਿੱਕਵੈਂਸ ਸੋਚ

ਕਾਨਸੈਪਟ ਤੋਂ ਯੋਜਨਾ ਤੱਕ ਜਾਓ

ਬਿਲ্ড ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਫੀਚਰ, ਡਾਟਾ ਅਤੇ ਪ੍ਰਾਂਪਟਾਂ ਦਾ ਨਕਸ਼ਾ ਬਣਾਉਣ ਲਈ planning mode ਵਰਤੋ।

ਰੋਡਮੈਪ ਬਣਾਓ

ਇੱਕ ਵੱਡਾ ਬਦਲਾਅ ਇਮੇਜ ਪਹਿਚਾਣ ਤੋਂ ਆਧੁਨਿਕ ਭਾਸ਼ਾਈ AI ਤੱਕ ਦਾ ਇਹ ਸੀ ਕਿ ਭਾਸ਼ਾ ਨੂੰ ਕੁਦਰਤੀ ਤੌਰ ਤੇ ਇਕ "ਲੜੀ" ਸਮੱਸਿਆ ਸਮਝਿਆ ਗਿਆ। ਇੱਕ ਵਾਕ ਇੱਕ ਇਕਲ ਇੰਪੁੱਟ ਵਾਂਗ ਨਹੀਂ ਹੁੰਦਾ; ਇਹ ਟੋਕਨਾਂ ਦੀ ਲੜੀ ਹੈ ਜਿੱਥੇ ਅਰਥ ਕ੍ਰਮ, ਸੰਦਰਭ ਅਤੇ ਪਹਿਲਾਂ ਆਏ ਹਿੱਸਿਆਂ 'ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ।

“ਲੜੀ” ਕਿਉਂ ਖੇਡ ਬਦਲਦੀ ਹੈ

ਪਹਿਲਾਂ ਭਾਸ਼ਾ ਕੰਮਾਂ ਲਈ ਅਕਸਰ ਹੱਥ-ਬਣਾਏ ਫੀਚਰ ਜਾਂ ਕਠੋਰ ਨਿਯਮ ਵਰਤੇ ਜਾਂਦੇ ਸਨ। ਸਿੱਕਵੈਂਸ ਮਾਡਲਿੰਗ ਨੇ ਟਾਸਕ ਨੂੰ ਇਸ ਤਰੀਕੇ ਨਾਲ ਮੁੜ-ਦਰਸਾਇਆ: ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਨੂੰ ਸਮੇਂ-ਪਾਰ ਕੀਤਾ-ਗਿਆ ਅੰਤਰ-ਸੰਬੰਧ ਸਿਖਾਉਣ ਦਿਓ—ਕਿਵੇਂ ਸ਼ਬਦ ਪਹਿਲੇ ਸ਼ਬਦਾਂ ਨਾਲ ਜੁੜਦੇ ਹਨ, ਅਤੇ ਵਾਕ ਦੇ ਸ਼ੁਰੂ ਵਿੱਚ ਕੋਈ ਫਰੇਜ਼ ਆਖਿਰ ਵਿੱਚ ਅਰਥ ਨੂੰ ਬਦਲ ਸਕਦਾ ਹੈ।

ਇੱਥੇ Ilya Sutskever ਉਸ ਅਹੰਕਾਰਪੂਰਣ ਵਿਚਾਰ ਨਾਲ ਗਹਿਰਾਈ ਨਾਲ ਸੰਬੰਧਿਤ ਹਨ: ਸ਼੍ਰੇਣੀ-ਤੋਂ-ਸ਼੍ਰੇਣੀ (seq2seq) ਸਿੱਖਣ ਖਾਸ ਤੌਰ 'ਤੇ ਮਸ਼ੀਨ ਅਨੁਵਾਦ ਵਰਗੇ ਕੰਮਾਂ ਲਈ।

encoder–decoder ਵਿਚਾਰ, ਸਧਾਰਨ ਬੋਲੀਆਂ ਵਿੱਚ

Seq2seq ਮਾਡਲ ਕੰਮ ਨੂੰ ਦੋ ਸਹਿਯੋਗੀ ਭਾਗਾਂ ਵਿੱਚ ਵੰਡਦੇ ਹਨ:

Encoder: ਇਨਪੁੱਟ ਲੜੀ (ਉਦਾਹਰਣ ਲਈ, ਇੱਕ ਅੰਗਰੇਜ਼ੀ ਵਾਕ) ਨੂੰ ਪੜ੍ਹਦਾ ਹੈ ਅਤੇ ਉਸਦਾ ਅਰਥ ਇਕ ਆੰਦਰੂਨੀ ਪ੍ਰਤੀਨਿਧੀ ਵਿੱਚ ਸੰਕੁਚਿਤ ਕਰਦਾ ਹੈ।
Decoder: ਉਸ ਪ੍ਰਤੀਨਿਧੀ ਨੂੰ ਵਰਤ ਕੇ ਆਉਟਪੁਟ ਲੜੀ (ਉਦਾਹਰਣ ਲਈ, ਫਰਾਂਸੀਸੀ ਵਾਕ) ਇਕ ਟੋਕਨ-ਇੱਕ ਸਮੇਂ ਬਣਾਉਂਦਾ ਹੈ।

ਧਾਰਨਾਤਮਕ ਤੌਰ 'ਤੇ, ਇਹ ਸੁਣਨ-ਤੋਂ ਲੈ ਕੇ ਅੰਤਾਂਕ-ਤਕ ਦਾ ਪ੍ਰਕਿਰਿਆ ਵਾਂਗ ਹੈ: ਇੱਕ ਵਾਕ ਨੂੰ ਸੋਚੋ, ਇੱਕ ਮਨੋਵੈਜ্ঞানਿਕ ਸੰਖੇਪ ਬਣਾਓ, ਫਿਰ ਉਸ ਸੰਖੇਪ ਦੇ ਆਧਾਰ 'ਤੇ ਅਨੁਵਾਦ ਬੋਲੋ।

ਅਨੁਵਾਦ ਲਈ ਅਤੇ ਉਸ ਤੋਂ ਆਗੇ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਸੀ

ਇਹ ਦ੍ਰਿਸ਼ਟਕੋਣ ਜੇਕਰ ਅਨੁਵਾਦ ਨੂੰ "ਤਿਆਰ ਕਰਨਾ" ਮੰਨਦਾ ਹੈ ਨਾ ਕਿ ਸਿਰਫ ਵਰਗੀਕਰਨ, ਤਾਂ ਮਾਡਲ ਇੱਕਤਰਫਾ ਫਲੂਇਡ ਆਉਟਪੁੱਟ ਬਣਾਉਣਾ ਸਿੱਖਦਾ ਹੈ।

ਹਾਲਾਂਕਿ ਬਾਅਦ ਵਾਲੀਆਂ ਉਪਲਬਧੀਆਂ (ਖ਼ਾਸ ਕਰਕੇ attention ਅਤੇ transformers) ਨੇ ਲੰਬੇ ਸੰਦਰਭ ਨੂੰ ਸੰਭਾਲਣ ਦੇ ਢੰਗ ਵਿੱਚ ਸੁਧਾਰ ਕੀਤਾ, seq2seq ਨੇ ਇੱਕ ਨਵਾਂ ਮਨਸੂਬਾ ਸਧਾਰਨ ਕੀਤਾ: ਐਂਡ-ਟੂ-ਐਂਡ ਇਕਲ ਮਾਡਲ ਨੂੰ ਕਾਫੀ ਟੈਕਸਟ 'ਤੇ ਟ੍ਰੇਨ ਕਰੋ ਅਤੇ ਇਹ ਇਕ ਲੜੀ ਤੋਂ ਦੂਜੀ ਲੜੀ ਦੀ ਮੈਪਿੰਗ ਖੁਦ ਸਿੱਖ ਲਿਆਏਗਾ। ਇਹ ਫਰੇਮਵਰਕ ਅਜਿਹੇ ਕਈ “ਟੈਕਸਟ ਇਨ, ਟੈਕਸਟ ਆਉਟ” ਪ੍ਰਣਾਲੀਆਂ ਲਈ ਰਸਤਾ ਖੋਲ੍ਹਦਾ ਹੈ ਜੋ ਅੱਜ ਕੁਦਰਤੀ ਲੱਗਦੇ ਹਨ।

Google Brain ਦੇ ਸਾਲ: ਸਕੇਲਿੰਗ ਤਰੀਕੇ ਅਤੇ ਖੋਜ ਸੱਭਿਆਚਾਰ

Google Brain ਇਸ ਅਸਲ ਬੇਟ 'ਤੇ ਬਣਿਆ ਸੀ: ਬਹੁਤ ਸਾਰੀਆਂ ਸਭ ਤੋਂ ਰੁਚਿਕਰ ਮਾਡਲ ਸੁਧਾਰ ਉਹਨਾਂ ਦਿੱਖਦੇ ਹਨ ਜਦੋਂ ਤੁਸੀਂ ਟ੍ਰੇਨਿੰਗ ਨੂੰ ਇਕ-ਮਸ਼ੀਨ ਜਾਂ ਛੋਟੀ ਕਲਸਟਰ ਤੋਂ ਕਾਫੀ ਦੂਰ ਧੱਕੋ। Sutskever ਵਰਗੇ ਖੋਜਕਾਰਾਂ ਲਈ, ਉਹ ਵਾਤਾਵਰਣ ਉਹਨਾਂ ਵਿਚਾਰਾਂ ਨੂੰ ਤਵੱਜੋ ਦਿੰਦਿਆਂ ਸਨ ਜੋ ਸਕੇਲ ਕਰਦੇ—ਨਾ ਕਿ ਸਿਰਫ ਉਹ ਜੋ ਛੋਟੇ ਡੈਮੋ ਵਿੱਚ ਵਧੀਆ ਲੱਗਦੇ।

"ਸਕੇਲਿੰਗ ਰਿਸਰਚ" ਦਿਨ-ਪ੍ਰਤੀ-ਦਿਨ ਕਿਵੇਂ ਲੱਗਦੀ ਸੀ

ਇੱਕ ਵੱਡੀ ਲੈਬ ਮਹੱਤਵਪੂਰਨ ਟ੍ਰੇਨਿੰਗ ਦੌੜਾਂ ਨੂੰ ਇੱਕ ਦੁਹਰਾਏ ਯੋਗ ਰੁਟੀਨ ਵਿੱਚ ਬਦਲ ਸਕਦੀ ਹੈ। ਇਸਦਾ ਆਮ ਤੌਰ 'ਤੇ ਮਤਲਬ ਸੀ:

ਡਿਸਟ੍ਰਿਬਿਊਟਡ ਟ੍ਰੇਨਿੰਗ ਡਿਫੌਲਟ ਹੋਣਾ: ਵੱਖ-ਵੱਖ ਡਿਵਾਈਸਾਂ 'ਤੇ ਕੰਮ ਵੰਡਣਾ ਤਾਂ ਜੋ ਪ੍ਰਯੋਗ ਦਿਨਾਂ ਵਿੱਚ ਖਤਮ ਹੋਣ ਨਾ ਕਿ ਹਫ਼ਤਿਆਂ ਵਿੱਚ।
ਵੱਡੇ, ਗੰਦਲੇ ਡੈਟਾਸੈੱਟ: ਡੈਟਾ ਇਕੱਠਾ ਕਰਨਾ, ਸਾਫ਼ ਕਰਨਾ ਅਤੇ ਵਰਜ਼ਨਿੰਗ ਕਰਨੀ ਤਾਂ ਜੋ ਨਤੀਜੇ ਧਾਵਾ-ਤੁਲਨਯੋਗ ਹੋਣ।
ਆਰੰਭਕ ਪ੍ਰਯੋਗਾਂ ਦਾ ਤੁਰੰਤ-ਦੌਰ: ਬਹੁਤ ਸਾਰੇ ਛੋਟੇ-ਛੋਟੇ ਬਦਲਾਅ (optimizers, architectures, regularization, batching) ਅਜਮਾਉਣਾ ਅਤੇ ਧਿਆਨ ਨਾਲ ਨੋਟ ਰੱਖਣਾ ਤਾਂ ਜੋ ਤਰੱਕੀ ਖੋਈ ਨਾ ਜਾਵੇ।

ਜਦੋਂ ਕੰਪਿਊਟ ਕਾਫੀ ਹੈ ਪਰ ਅਸੀਮ ਨਹੀਂ, ਰੁਕਾਵਟ ਬਣ ਜਾਂਦੀ ਹੈ ਇਹ ਫ਼ੈਸਲਾ ਕਰਨਾ ਕਿ ਕਿਹੜੇ ਪ੍ਰਯੋਗ ਇੱਕ ਸਲਾਟ ਦੇ ਯੋਗ ਹਨ, ਉਨ੍ਹਾਂ ਨੂੰ ਕਿਵੇਂ ਨਪਣਾ ਜਾਏ ਅਤੇ ਉਹ ਗਲਤੀਆਂ ਜੋ ਸਿਰਫ ਸਕੇਲ 'ਤੇ ਆਉਂਦੀਆਂ ਹਨ, ਉਹ ਕਿਵੇਂ ਡਿਬੱਗ ਕੀਤੀਆਂ ਜਾਣ।

ਰਿਸਰਚ-ਟੂ-ਪ੍ਰੋਡਕਸ਼ਨ ਅਣਗੌਪਨ (ਗੁਪਤ ਜਾਣਕਾਰੀਆਂ ਦੇ ਬਿਨਾਂ)

ਇੱਕ ਰਿਸਰਚ ਗਰੁੱਪ ਵਿੱਚ ਵੀ, ਮਾਡਲਾਂ ਨੂੰ ਭਰੋਸੇਯੋਗ ਤਰੀਕੇ ਨਾਲ ਟ੍ਰੇਨ ਕਰਨਾ, ਸਹਿ-ਕਰਮੀ ਦੁਆਰਾ ਦੁਹਰਾਏ ਜਾਣ ਯੋਗ ਬਣਾਉਣਾ ਅਤੇ ਸਾਂਝੀ ਇਨਫ੍ਰਾਸਟਰਕਚਰ ਨਾਲ ਮੇਲ ਖਾਣਾ ਲਾਜ਼ਮੀ ਹੁੰਦਾ ਹੈ। ਇਹ ਪ੍ਰਯੋਗਿਕ ਅਨੁਸ਼ਾਸਨ ਲਿਆਉਂਦਾ ਹੈ: ਮੋਨੀਟਰਿੰਗ, ਫੇਲਯਰ ਰਿਕਵਰੀ, ਸਥਿਰ ਮੁਲਿਆਕੰਨ ਸੈੱਟ ਅਤੇ ਲਾਗਤ-ਅਨੁਭਵ। ਇਹ ਵੀ ਦੁਹਰਾਏ ਯੋਗ ਟੂਲਿੰਗ ਨੂੰ ਉਤਸ਼ਾਹਤ ਕਰਦਾ ਹੈ—ਕਿਉਂਕਿ ਹਰ ਪੇਪਰ ਲਈ ਪਾਈਪਲਾਈਨ ਨੂੰ ਦੁਬਾਰਾ ਬਣਾਉਣਾ ਧੀਮਾ ਕਰ ਦੇਂਦਾ ਹੈ।

ਕਿਉਂ ਇਹ LLMs ਲਈ ਇਕ moat ਬਣ ਗਿਆ

ਆਧੁਨਿਕ LLMs ਆਉਣ ਤੋਂ ਕਾਫ਼ੀ ਪਹਿਲਾਂ, ਟ੍ਰੇਨਿੰਗ ਸਿਸਟਮਾਂ ਵਿੱਚ ਕਠਿਨ ਤਜ਼ਰਬਾ—ਡਾਟਾ ਪਾਇਪਲਾਈਨ, ਡਿਸਟ੍ਰਿਬਿਊਟਡ ਆਪਟੀਮਾਈਜ਼ੇਸ਼ਨ, ਐਕਸਪੇਰੀਮੈਂਟ ਪ੍ਰਬੰਧ—ਪੈਦਾ ਹੋ ਰਿਹਾ ਸੀ। ਜਦ LLMs ਆਏ, ਉਹ ਇਨф੍ਰਾਸਟਰਕਚਰ ਸਿਰਫ਼ ਮਦਦਗਾਰ ਨਾ ਰਹੀ; ਇਹ ਇੱਕ ਮੁਕਾਬਲਾਤੀ ਫ਼ਾਇਦਾ ਬਣ ਗਈ ਜੋ ਟੀਮਾਂ ਨੂੰ ਜੋ ਸਕੇਲ ਕਰ ਸਕਦੀਆਂ ਸਨ ਅਤੇ ਜੋ ਸਿਰਫ ਪ੍ਰੋਟੋਟਾਈਪ ਤਿਆਰ ਕਰ ਸਕਦੀਆਂ ਸਨ, ਵਿੱਚ ਵੱਖ ਕਰ ਦਿੱਤਾ।

OpenAI ਅਤੇ ਆਧੁਨਿਕ LLM ਪ੍ਰੋਗਰਾਮਾਂ ਦਾ ਉਭਾਰ

ਆਪਣੇ ਬਿਲਡ ਨੂੰ ਸਾਂਝਾ ਕਰੋ ਤੇ ਸੇਵ ਕਰੋ

Koder.ai 'ਤੇ ਜੋ ਕੁਝ ਤੁਸੀਂ ਬਣਾਉਂਦੇ ਹੋ ਉਸ 'ਤੇ ਮਦਦਗਾਰ ਸਮੱਗਰੀ ਬਣਾਕੇ ਕ੍ਰੈਡਿਟ ਜਿੱਤੋ।

ਕ੍ਰੈਡਿਟ ਪ੍ਰਾਪਤ ਕਰੋ

OpenAI ਇਕ ਅਸਾਧਾਰਨ ਸਾਦਾ, ਉੱਚ-ਸਤਹ ਦਾ ਟੀਕਾ ਨਾਲ ਸਥਾਪਿਤ ਹੋਇਆ: ਕৃত੍ਰਿਮ ਬੁੱਧੀ ਖੋਜ ਨੂੰ ਅੱਗੇ ਵਧਾਓ ਅਤੇ ਇਸਦੇ ਫਾਇਦੇ ਸਮਾਜ ਤੱਕ ਪਹੁੰਚਾਉ—ਨਾ ਕਿ ਸਿਰਫ਼ ਇਕ ਉਤਪਾਦ ਲਾਈਨ ਤੱਕ। ਉਹ ਮਕਸਦ ਮਹਤੱਵਪੂਰਨ ਸੀ ਕਿਉਂਕਿ ਇਸਨੇ ਮਹਿੰਗੇ, ਲੰਬੇ-ਹੋਰਾਈਜ਼ਨ ਅਤੇ ਅਣਿਸ਼ਚਿਤ ਕੰਮਾਂ ਨੂੰ ਪ੍ਰੇਰਿਤ ਕੀਤਾ—ਜੋ LLMs ਨੂੰ ਸਿਰਫ਼ ਇੱਕ ਚਕਚਕਾ ਡੈਮੋ ਤੋਂ ਅੱਗੇ ਲੈ ਜਾਣ ਲਈ ਲੋੜੀਂਦੇ ਸਨ।

Sutskever ਦਾ ਰੋਲ: ਇੱਕ ਇਕਲ “ਜਾਦੂਈ ਆਈਡੀਯਾ” ਨਹੀਂ

Ilya Sutskever ਨੇ OpenAI ਦੇ ਸ਼ੁਰੂ ਵਿੱਚ ਸ਼ਾਮਿਲ ਹੋ ਕੇ ਇੱਕ ਮੁੱਖ ਰਿਸਰਚ ਆਗੂ ਦਾ ਕੰਮ ਕੀਤਾ। ਇਸਨੂੰ ਇੱਕ ਇਕੱਲੇ ਆਵਿਸਕਾਰਕ ਦੀ ਕਥਾ ਬਣਾਉਣਾ ਆਸਾਨ ਹੈ, ਪਰ ਜਿਆਦਾ ਸਹੀ ਤਸਵੀਰ ਇਹ ਹੈ: ਉਹ ਰਿਸਰਚ ਪ੍ਰਾਥਮਿਕਤਾਵਾਂ ਨਿਰਧਾਰਤ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੇ, ਮੁਸ਼ਕਲ ਸਵਾਲ ਪੁੱਛਦੇ ਅਤੇ ਟੀਮਾਂ ਨੂੰ ਵੱਡੇ ਪੈਮਾਨੇ 'ਤੇ ਵਿਚਾਰਾਂ ਦੀ ਪਰਖ ਕਰਨ ਲਈ ਧੱਕਦੇ ਰਹਿੰਦੇ।

ਆਧੁਨਿਕ AI ਲੈਬਾਂ ਵਿੱਚ, ਲੀਡਰਸ਼ਿਪ ਅਕਸਰ ਇਹ ਚੁਣਨਾ ਹੁੰਦਾ ਹੈ ਕਿ ਕਿਹੜੀਆਂ ਸ਼ਰਤਾਂ ਮਹੀਨਿਆਂ ਦੇ ਕੰਪਿਊਟ ਦੇ ਯੋਗ ਹਨ, ਕਿਹੜੇ ਨਤੀਜੇ ਅਸਲੇ ਹਨ ਬਨਾਮ ਯਾਦਿ-ਤ੍ਰੁੱਟੀ, ਅਤੇ ਕਿਹੜੀਆਂ ਤਕਨੀਕੀ ਰੁਕਾਵਟਾਂ ਅਗਲੇ ਦੌਰ ਲਈ ਲਿਆਉਣ ਯੋਗ ਹਨ।

ਪ੍ਰਗਟਾਉਣ ਕਿਵੇਂ ਹੁੰਦੀ ਹੈ: ਧੀਰੇ-ਧੀਰੇ ਫਾਇਦੇ, ਫਿਰ ਕਦਮ-ਬਦਲ

LLM ਵਿਕਾਸ ਅਕਸਰ ਕ੍ਰਮਿਕ ਹੁੰਦਾ ਹੈ: ਡਾਟਾ ਛੰਟਾਈ ਵਿੱਚ ਸੁਧਾਰ, ਜ਼ਿਆਦਾ ਸਥਿਰ ਟ੍ਰੇਨਿੰਗ, ਹੋਸ਼ਿਆਰ ਮੁਲਿਆਕੰਨ, ਅਤੇ ਉਹ ਇੰਜੀਨੀਅਰਿੰਗ ਜੋ ਮਾਡਲਾਂ ਨੂੰ ਲੰਮਾ ਸਮਾਂ ਟ੍ਰੇਨ ਕਰਨ ਯੋਗ ਬਣਾਉਂਦੀ ਹੈ। ਇਹ ਸੁਧਾਰ ਥੋੜੇ ਬੇਮੋਹਰੀ ਲੱਗ ਸਕਦੇ ਹਨ, ਪਰ ਉਹ ਇਕੱਠੇ ਹੋ ਕੇ ਮਹੱਤਵਪੂਰਨ ਨਤੀਜੇ ਲਿਆਉਂਦੇ ਹਨ।

ਕੇਵਲ-ਕਈ ਵਾਰੀ, ਇੱਕ ਤਕਨੀਕ ਜਾਂ ਸਕੇਲ ਛਾਲ ਨਵੀਆਂ ਜ਼ੁਬਾਨਦਾਰੀ ਖੋਲ੍ਹ ਦਿੰਦੀ ਹੈ। ਇਹ ਬਦਲਾਅ "ਇਕ ਅਜੀਬ ਚਾਲ" ਨਹੀਂ ਹੁੰਦੇ; ਇਹ ਸਾਲਾਂ ਦੀ ਬੀਜੇ ਬੁਹਤ ਅਤੇ ਵੱਡੇ ਪ੍ਰਯੋਗਾਂ ਚਲਾਉਣ ਦੀ ਤਿਆਰੀ ਦਾ ਨਤੀਜਾ ਹੁੰਦੇ ਹਨ।

GPT-ਸਟਾਈਲ ਪ੍ਰੀਟ੍ਰੇਨਿੰਗ, ਸਧਾਰਨ ਸ਼ਬਦਾਂ ਵਿੱਚ

ਆਧੁਨਿਕ LLM ਪ੍ਰੋਗਰਾਮਾਂ ਦੇ ਪਿੱਛੇ ਇਕ ਨਿਰਧਾਰਤ ਰੁਪ ਇਹ ਹੈ: GPT-ਸਟਾਈਲ ਪ੍ਰੀਟ੍ਰੇਨਿੰਗ। ਸੋਚ ਸਧਾਰਨ ਹੈ: ਮਾਡਲ ਨੂੰ ਬਹੁਤ ਮਾਤਰਾ ਵਿੱਚ ਟੈਕਸਟ ਦਿਓ ਅਤੇ ਉਸਨੂੰ ਅਗਲਾ ਟੋਕਨ ਭਵਿੱਖਵਾਣੀ ਕਰਨਾ ਸਿਖਾਓ। ਇਸ ਸਧਾਰਨ ਟਾਸਕ ਨੂੰ ਦੋਹਰਾਉਂਦੇ ਹੋਏ, ਮਾਡਲ ਵਿਆਕਰਨ, ਤੱਥ, ਅੰਦਾਜ਼ ਅਤੇ ਹੋਰ ਬਹੁਤ ਸਾਰੀਆਂ ਪੈਟਰਨ ਬੇਹੱਦ ਅੰਦਰੂਨੀ ਤੌਰ 'ਤੇ ਸਿੱਖ ਲੈਂਦਾ ਹੈ।

ਪ੍ਰੀਟ੍ਰੇਨਿੰਗ ਤੋਂ ਬਾਅਦ, ਉਹੀ ਮਾਡਲ prompting ਜਾਂ ਵਧੇਰੇ ਟ੍ਰੇਨਿੰਗ ਰਾਹੀਂ ਸੰਖੇਪ, Q&A ਜਾਂ ਡਰਾਫਟਿੰਗ ਵਰਗੇ ਟਾਸਕਾਂ ਲਈ ਅਨੁਕੂਲ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਇਹ "ਸਰਵ-ਪਹਿਲਾਂ, ਵਿਸ਼ੇਸ਼-ਬਾਦ" ਰੈਸਪੀ ਨੇ ਭਾਸ਼ਾ ਮਾਡਲਿੰਗ ਨੂੰ ਕਈ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਇੱਕ ਆਪਣੇ ਆਪ ਵਿੱਚ ਮੌਜੂਦ ਨੀਂਹ ਬਣਾ ਦਿੱਤਾ।

ਸਕੇਲ 'ਤੇ ਟ੍ਰੇਨਿੰਗ: ਡਾਟਾ, ਕੰਪਿਊਟ ਅਤੇ ਮੁਸ਼ਕਲ ਹਿੱਸੇ

ਵੱਡੇ ਮਾਡਲ ਟ੍ਰੇਨ ਕਰਨਾ ਸਿਰਫ ਹੋਰ GPUs ਕਿਰाए 'ਤੇ ਲੈਣਾ ਨਹੀਂ ਹੈ। ਜਿਵੇਂ-ਜਿਵੇਂ ਪੈਰਾਮੀਟਰਾਂ ਦੀ ਗਿਣਤੀ ਵਧਦੀ ਹੈ, "ਇੰਜੀਨੀਅਰਿੰਗ ਮਾਰਜਿਨ" ਘਟਦਾ ਹੈ: ਡਾਟਾ, ਆਪਟੀਮਾਈਜ਼ੇਸ਼ਨ ਜਾਂ ਮੁਲਿਆਕੰਨ ਵਿੱਚ ਛੋਟੀ ਸਮੱਸਿਆ ਮਹਿੰਗੀਆਂ ਅਸਫਲਤਾਂ ਵਿੱਚ ਬਦਲ ਸਕਦੀ ਹੈ।

ਉਹ ਮੁੱਖ ਅੰਗ ਜਿਹੜੇ ਅਸਲ ਵਿੱਚ ਸਕੇਲ ਕਰਦੇ ਹਨ

ਡਾਟਾ ਗੁਣਵੱਤਾ ਪਹਿਲਾ ਹਥੌੜਾ ਹੈ ਜੋ ਟੀਮਾਂ ਕੰਟਰੋਲ ਕਰ ਸਕਦੀਆਂ ਹਨ। ਵੱਡੇ ਮਾਡਲ ਜੋ ਕੁਝ ਸਿੱਖਦੇ ਹਨ, ਉਹ ਤੁਹਾਡੇ ਦਿੱਤੇ ਚੰਗੇ-ਬੁਰੇ ਦੋਹਾਂ ਸਿੱਖਦੇ ਹਨ। ਪ੍ਰਯੋਗੀ ਕਦਮ ਜੋ ਮੈਟਰ:

ਨਜ਼ਦੀਕੀ-ਡੁਪਲੀਕੇਟਸ ਸਮੇਤ aggressਿਵ ਡੀਡੁਪਲੀਕੇਸ਼ਨ ਕਰੋ, ਨਹੀਂ ਤਾਂ ਤੁਸੀਂ ਬੈਂਚਮਾਰਕ ਸਕੋਰ ਫੂਲ ਅਤੇ ਫਿਰ ਵੀ ਖਰਾਬ ਜਨਰਲਾਈਜ਼ੇਸ਼ਨ ਵਾਲਾ ਮਾਡਲ ਜਾਰੀ ਕਰੋਗੇ।
ਜਿਹੜੇ ਸਰੋਤ ਖ਼ਤਰਨਾਕ, ਘੱਟ-ਸਿਗਨਲ ਜਾਂ ਸਪੈਮੀ ਹਨ, ਉਹਨਾਂ ਨੂੰ ਫਿਲਟਰ ਕਰੋ; ਉੱਚ-ਗੁਣਵੱਤਾ ਡੋਮੇਨ ਜੋ ਤੁਸੀਂ ਮਾਡਲ ਨੂੰ ਨਕਲ ਕਰਵਾਉਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਉਹ ਜੋੜੋ।
ਡੈਟਾਸੈੱਟ ਵਰਜ਼ਨਿੰਗ ਨੂੰ ਕੋਡ ਵਾਂਗ ਟ੍ਰੈਕ ਕਰੋ। ਜੇ ਇੱਕ ਰਨ ਵਿੱਚ ਸੁਧਾਰ ਆਉਂਦਾ ਹੈ, ਤਾਂ ਤੁਹਾਨੂੰ ਪਤਾ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਕਿਹੜੀ ਡਾਟਾ ਬਦਲਾਵ ਨੇ ਅਚਨਚੇਤ ਬਦਲਾਅ ਲਿਆ।

ਆਪਟੀਮਾਈਜ਼ੇਸ਼ਨ ਸਥਿਰਤਾ ਦੂਜਾ ਹਥੌੜਾ ਹੈ। ਸਕੇਲ 'ਤੇ, ਟ੍ਰੇਨਿੰਗ ਅਜਿਹੀਆਂ ਤਰੀਕਿਆਂ ਨਾਲ ਅਸਫਲ ਹੋ ਸਕਦੀ ਹੈ ਜੋ ਬੇਤਰਤੀਬੀ ਦਿਸ ਸਕਦੀਆਂ ਹਨ ਜੇ ਤਕਨੀਕੀ ਨਿਗਰਾਨੀ ਨਹੀਂ ਹੋਵੇ। ਆਮ ਅਭਿਆਸਾਂ ਵਿੱਚ ਧਿਆਨ ਦੇਣ ਜੋਗੇ ਹਨ: ਸਾਵਧਾਨ ਲਰਨਿੰਗ-ਰੇਟ ਸਕੈਜੂਲ, ਗਰੇਡੀਐਂਟ ਕਲਿੱਪਿੰਗ, ਮਿਕਸਡ ਪ੍ਰਿਸੀਜ਼ਨ ਨਾਲ ਲਾਸ ਸਕੇਲਿੰਗ, ਅਤੇ ਨਿਯਮਤ ਚੈਕਪੌਇਂਟਿੰਗ। ਇੰਨ੍ਹਾਂ ਤੋਂ ਇਲਾਵਾ: ਲਾਸ ਸਪਾਈਕਸ, NaNs ਅਤੇ ਟੋਕਨ ਵੰਡ ਵਿੱਚ ਅਚਾਨਕ ਬਦਲਾਅ ਲਈ ਮੋਨੀਟਰਿੰਗ ਕਰਨਾ ਬਹੁਤ ਜ਼ਰੂਰੀ ਹੈ।

ਇਵੈਲੂਏਸ਼ਨ ਤੀਜਾ ਅੰਗ ਹੈ—ਅਤੇ ਇਹ ਲਗਾਤਾਰ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਇੱਕ "ਅੰਤਿਮ ਬੈਂਚਮਾਰਕ" ਦੇਖ ਕੇ ਬਾਅਦ 'ਚ ਪਤਾ ਲੱਗਣਾ ਬਹੁਤ ਦੇਰ ਹੋਵੇਗੀ। ਹਰ ਕੁਝ ਹਜ਼ਾਰ ਸਟੈਪਾਂ 'ਤੇ ਇੱਕ ਛੋਟੀ ਤੇਜ਼ ਇਵੈਲ ਸੂਟ ਵਰਤੋ ਅਤੇ ਰੋਜ਼ਾਨਾ ਵੱਡੀ ਸੂਟ ਚਲਾਓ, ਜਿਸ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋ ਸਕਦਾ ਹੈ:

ਟਾਸਕ ਦੀ ਸਹੀਤਾ ਅਤੇ ਕੈਲੀਬ੍ਰੇਸ਼ਨ
ਹਾਲੂਸੀਨੇਸ਼ਨ-ਮੁਖੀ ਜਾਂਚਾਂ (ਜਾਣੇ-ਮੰਨੇ ਪ੍ਰਸ਼ਨਾਂ ਨਾਲ ਸੱਚ ਜਵਾਬ ਦੀ ਪਹੁੰਚ)
ਉਹ ਯੋਗਤਾਵਾਂ ਜਿਨ੍ਹਾਂ ਦੀ ਤੁਹਾਨੂੰ ਪਰਵਾਹ ਹੈ ਉਨ੍ਹਾਂ ਲਈ ਰੀਗ੍ਰੈਸ਼ਨ ਟੈਸਟ (ਅੰਦਾਜ਼, ਇਨਕਾਰ ਕਰਨ ਦੀ ਵਰਤੋਂ, ਟੂਲ ਉਪਯੋਗ)

ਆਮ ਫੇਲ੍ਹ-ਮੋਡਸ (ਤੇ ਉਨ੍ਹਾਂ ਦੇ ਨਿਪਟਾਰੇ)

ਓਵਰਫਿਟਿੰਗ ਅਤੇ ਮੈਮੋਰੀਜੇਸ਼ਨ: ਅਕਸਰ ਡੁਪਲੀਕੇਟ ਜਾਂ ਤੰਗ ਡੋਮੇਨਾਂ ਵੱਲੋਂ ਹੁੰਦੀ ਹੈ। ਸੁਧਾਰ ਲਈ ਡਾਟਾ ਹਾਈਜੀਨ ਅਤੇ ਮਜ਼ਬੂਤ ਹੋਲਡ-ਆਊਟ ਸੈਟ ਵਰਤੋ।
ਹਾਲੂਸੀਨੇਸ਼ਨ: ਕਦੇ-ਕਦੇ ਲਾਸ ਸੂਚਕਾਂ ਵਿਚ ਸੁਧਾਰ ਹੋਣ ਦੇ ਬਾਵਜੂਦ ਵੱਧ ਸਕਦੀ ਹੈ। ਤੱਥੀਕਤਾ ਮੈਟਰਿਕਸ ਟਰੈਕ ਕਰੋ ਅਤੇ ਉਤਪਾਦ ਵਿੱਚ ਰੀਟ੍ਰੀਵਲ ਜਾਂ ਸੀਮਿਤ ਜੈਨਰੇਸ਼ਨ 'ਤੇ ਵਿਚਾਰ ਕਰੋ।
ਭੂਤਲ-ਵਰਤਾਰਾ (ਬ੍ਰਿਟਲ ਬਿਹੈਵਿਅਰ): ਮਾਡਲ ਜਿਹੜਾ ਬੈਂਚਮਾਰਕ 'ਤੇ ਚੰਗਾ ਕਰਦਾ ਹੈ ਪਰ ਵੱਖ-ਵੱਖ ਪ੍ਰਾਂਪਟਾਂ ਤੇ ਫੇਲ ਹੋ ਜਾਂਦਾ ਹੈ। ਇਸ ਲਈ ਵਿਆਪਕ ਇਵੈਲੂਏਸ਼ਨ, ਵਿਰੋਧੀ ਟੈਸਟਿੰਗ, ਅਤੇ ਯਥਾਰਥਪੂਰਨ ਯੂਜ਼ਰ ਪ੍ਰਾਂਪਟਾਂ ਦੀ ਲੋੜ ਹੈ।

ਅਸਲ ਪ੍ਰોજੈਕਟਾਂ ਲਈ, ਸਭ ਤੋਂ ਨਿਆੰਤਰਯੋਗ ਜਿੱਤ ਇੱਕ ਅਨੁਸ਼ਾਸਿਤ ਡਾਟਾ ਪਾਇਪਲਾਈਨ, ਕਠੋਰ ਮੋਨੀਟਰਿੰਗ, ਅਤੇ ਉਹ ਇਵੈਲੂਏਸ਼ਨ ਹਨ ਜੋ ਮਾਡਲ ਦੇ ਵਰਤੇ ਜਾਣ ਸੰਦਭ ਨਾਲ ਮੇਲ ਖਾਂਦੇ ਹਨ—ਸਿਰਫ਼ ਲੀਡਰਬੋਰਡ ਵਾਂਗ ਨਹੀਂ।

ਸੁਰੱਖਿਆ ਅਤੇ ਅਲਾਇਨਮੈਂਟ: ਕਿਉਂ ਇਹ ਕੇਂਦਰੀ ਹੋ ਗਿਆ

ਆਪਣੇ ਕੋਡ 'ਤੇ ਕਾਬੂ ਰੱਖੋ

ਪੂਰਾ ਸੋਰਸ ਕੋਡ ਐਕਸਪੋਰਟ ਕਰ ਕੇ ਇੱਕ ਐਪ ਜਿੱਤੋ ਜੋ ਤੁਹਾਡੀ ਮਾਲਕियत ਹੋਵੇ।

ਕੋਡ ਨਿਰਯਾਤ ਕਰੋ

ਜਿਵੇਂ-जਿਵੇਂ ਭਾਸ਼ਾਈ ਮਾਡਲ ਸਿਰਫ਼ autocomplete ਤੋਂ ਅੱਗੇ ਵਧ ਕੇ—ਕੋਡ ਲਿਖਣਾ, ਸਲਾਹ ਦੇਣਾ, ਕਈ ਕਦਮੀ ਹਿਦਾਇਤਾਂ ਲੈਣਾ—ਲੋਕਾਂ ਨੇ ਸਮਝਿਆ ਕਿ ਸਖਤ ਯੋਗਤਾ ਅਤੇ ਭਰੋਸੇਯੋਗਤਾ ਵੱਖ-ਵੱਖ ਚੀਜ਼ਾਂ ਹਨ। ਏਥੇ "AI ਸੇਫਟੀ" ਅਤੇ "ਅਲਾਇਨਮੈਂਟ" ਆਗੂ ਲੈਬਾਂ ਅਤੇ ਖੋਜਕਾਰਾਂ ਲਈ ਕੇਂਦਰੀ ਵਿਸ਼ੇ ਬਣ ਗਏ, ਜਿਸ ਵਿੱਚ Ilya Sutskever ਵੀ ਸ਼ਾਮਿਲ ਹਨ।

ਸੁਰੱਖਿਆ ਅਤੇ ਅਲਾਇਨਮੈਂਟ ਦਾ ਸਧਾਰਨ ਅਰਥ

ਸੁਰੱਖਿਆ ਦਾ ਮਤਲਬ ਨੁਕਸਾਨਦਾਇਕ ਵਰਤਾਰਿਆਂ ਨੂੰ ਘਟਾਉਣਾ ਹੈ: ਮਾਡਲ ਗੈਰਕਾਨੂੰਨੀ ਕਾਰਵਾਈਆਂ ਦੀ ਹਦਾਇਤ ਨਾ ਦੇਵੇ, ਖਤਰਨਾਕ ਨਿਰਦੇਸ਼ ਨਾ ਜਨਰੇਟ ਕਰੇ, ਜਾਂ ਪਾਤਰਤਾ ਨੂੰ ਵਧਾਉਂਦਾ ਜਬਰ ਨਾ ਕਰੇ।

ਅਲਾਇਨਮੈਂਟ ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਸਿਸਟਮ ਦਾ ਵਰਤਾਰਾ ਸੰਦਰਭ ਵਿੱਚ ਲੋਕਾਂ ਦੀ ਪਹਿਲ ਅਤੇ ਮੁੱਲਾਂ ਨਾਲ ਮਿਲਦਾ-ਜੁਲਦਾ ਹੋਵੇ। ਇੱਕ ਮਦਦਗਾਰ ਸਹਾਇਕ ਤੁਹਾਡੇ ਲਕਸ਼ ਨੂੰ ਪਾਲੇ, ਸੀਮਾਵਾਂ ਦਾ ਆਦਰ ਕਰੇ, ਅਨਿਸ਼ਚਿਤਤਾ ਨੂੰ ਸਵੀਕਾਰ ਕਰੇ ਅਤੇ ਨੁਕਸਾਨਦਾਇਕ "ਰਚਨਾਤਮਕ" ਛਲਾਂ ਤੋਂ ਬਚੇ।

ਕਿਉਂ ਹੋਰ ਯੋਗ ਮਾਡਲਾਂ ਨੇ ਮਿਯਾਦ ਉਚੀ ਕੀਤੀ

ਜਿਵੇਂ-ਜਿਵੇਂ ਮਾਡਲ ਹੁਨਰਵਾਨ ਹੋਏ, ਘਟਨਾ ਖਤਰੇ ਵੀ ਵਧੇ। ਇੱਕ ਕਮਜ਼ੋਰ ਮਾਡਲ ਘੁੰਮਾਫਿਰਮ ਕੀਤਾ ਨonsense ਪੈਦਾ ਕਰ ਸਕਦਾ; ਪਰ ਇੱਕ ਤਾਕਤਵਰ ਮਾਡਲ ਪ੍ਰਾਜ਼ੇਕੀ, ਕਾਰਜਯੋਗ ਅਤੇ ਬਹੁਤ ਨਿੱਜीक ਨਤੀਜੇ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ। ਇਸ ਨਾਲ ਹੇਠਾਂ ਦੀਆਂ ਮੁਸ਼ਕਿਲਾਂ ਪੈਦਾ ਹੁੰਦੀਆਂ ਹਨ:

ਗਲਤੀਆਂ ਪਛਾਣਣਾ ਔਖਾ ਹੋ ਜਾਂਦਾ ਹੈ ਕਿਉਂਕਿ ਆਉਟਪੁਟ ਆਤਮਵਿਸ਼ਵਾਸੀ ਲੱਗਦਾ ਹੈ।
ਗਲਤ ਉਪਯੋਗ ਅਸਾਨ ਹੋ ਜਾਂਦਾ ਹੈ ਕਿਉਂਕਿ ਮਾਡਲ ਕਦਮ-ਦਰ-ਕਦਮ ਯੋਜਨਾਵਾਂ ਬਣਾ ਸਕਦਾ ਹੈ।
ਛੋਟੇ ਪ੍ਰਾਂਪਟ-ਫੇਰ ਹੱਥੋਂ-ਹੱਥ ਵੱਡੇ ਵਰਤਾਰਾ ਬਦਲ ਦਿੰਦੇ ਹਨ, ਜੋ ਭਰੋਸੇਯੋਗਤਾ ਨੂੰ ਜਟਿਲ ਬਣਾਉਂਦਾ ਹੈ।

ਯੋਗਤਾ ਵਿੱਚ ਹੋਏ ਫਾਇਦੇ ਨਾਲ ਬਹਿਤਰੀਨ ਗਾਰਡਰੇਲਜ਼, ਸਾਫ਼ ਮੁਲਿਆਕੰਨ ਅਤੇ ਮਜ਼ਬੂਤ ਓਪਰੇਸ਼ਨਲ ਅਨੁਸ਼ਾਸਨ ਦੀ ਲੋੜ ਵੱਧਦੀ ਹੈ।

ਅਭਿਆਸ ਵਿੱਚ ਸੇਫਟੀ ਕੰਮ ਕਿਵੇਂ ਦਿੱਖਦਾ ਹੈ

ਸੁਰੱਖਿਆ ਇਕ ਸਵਿੱਚ ਨਹੀਂ—ਇਹ ਤਰੀਕਿਆਂ ਅਤੇ ਜਾਂਚ-ਪੜਤਾਲਾਂ ਦਾ ਸਮੂਹ ਹੈ, ਜਿਵੇਂ:

ਇਵੈਲੂਏਸ਼ਨ: ਨੁਕਸਾਨਦਾਇਕ ਸਮੱਗਰੀ ਦਰਾਂ, ਹਾਲੂਸੀਨੇਸ਼ਨਜ਼, ਪੱਖਪਾਤ ਅਤੇ ਔਖੇ ਪ੍ਰਾਂਪਟਾਂ 'ਤੇ ਮਾਡਲ ਦੇ ਵਰਤਾਰੇ ਨੂੰ ਮਾਪਣਾ।
ਰੇੱਡ-ਟੀਮਿੰਗ: ਨੁਕਸਾਨਦਾਇਕ ਪ੍ਰਸ਼ਨਾਂ ਨਾਲ ਪ੍ਰਣਾਲੀ 'ਤੇ ਰਵਾਇਤੀ ਤੌਰ 'ਤੇ ਜाँच ਕਰਨਾ ਤਾਂ ਜੋ ਯੂਜ਼ਰਾਂ ਤੋਂ ਪਹਿਲਾਂ ਫੇਲ-ਮੋਡ ਮਿਲ ਸਕਣ।
ਨੀਤੀ-ਸੀਮਾਵਾਂ: ਉਹ ਹੱਦਾਂ ਨਿਰਧਾਰਿਤ ਕਰਨਾ ਜੋ ਸਹਾਇਕ ਨੂੰ ਇਨਕਾਰ ਕਰਨਾ ਚਾਹੀਦੇ ਹਨ ਜਾਂ ਸੰਭਾਲ ਨਾਲ ਨਿਭਾਉਣਾ ਚਾਹੀਦਾ ਹੈ, ਫਿਰ ਉਹਨਾਂ ਹੱਦਾਂ ਦੇ ਖਿਲਾਫ ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਟੈਸਟਿੰਗ ਕਰਨਾ।

ਅਟੱਲ ਤਣਾਅ-ਤੋਲ

ਅਲਾਇਨਮੈਂਟ ਜੋਖਮ ਪ੍ਰਬੰਧਨ ਹੈ, ਨਰਮਤਾ ਨਹੀਂ। ਕਸੇ ਹੋਰ ਪਾਬੰਦੀਆਂ ਨੁਕਸਾਨ ਘਟਾ ਸਕਦੀਆਂ ਹਨ ਪਰ ਉਪਯੋਗਿਤਾ ਅਤੇ ਯੂਜ਼ਰ ਫ੍ਰੀਡਮ ਨੂੰ ਘਟਾ ਸਕਦੀਆਂ ਹਨ। ਢਿੱਲੀਆਂ ਪਲਿਸੀਆਂ ਜ਼ਿਆਦਾ ਖੁੱਲ੍ਹੀਆਂ ਲੱਗਦੀਆਂ ਹਨ, ਪਰ ਉਨ੍ਹਾਂ ਨਾਲ ਗਲਤ ਉਪਯੋਗ ਜਾਂ ਅਸੁਰੱਖਿਅਤ ਸਲਾਹ ਦਾ ਖਤਰਾ ਵੱਧ ਜਾਂਦਾ ਹੈ। ਚੁਣੌਤੀ ਇੱਕ ਵਰਤਣਯੋਗ ਸੰਤੁਲਨ ਖੋਜਣ ਅਤੇ ਮਾਡਲ ਬੇਹੱਤਰੀ ਨਾਲ ਅਪਡੇਟ ਕਰਨ ਦੀ ਹੈ।

Sutskever ਨਾਲ ਅਕਸਰ ਜੋੜੇ ਜਾਣ ਵਾਲੇ ਮੁੱਖ ਵਿਚਾਰ

ਇੱਕ ਵੱਡੇ ਆਦਮੀ ਨੂੰ ਇੱਕ ਨਾਂਹ ਨਾਲ ਜੋੜਨਾ ਆਸਾਨ ਹੈ, ਪਰ ਆਧੁਨਿਕ AI ਤਰੱਕੀ ਆਮ ਤੌਰ 'ਤੇ ਕਈ ਲੈਬਾਂ ਦੇ ਦੁਹਰਾਏ ਕੰਮ ਦਾ ਨਤੀਜਾ ਹੁੰਦੀ ਹੈ। ਫਿਰ ਵੀ, ਕੁਝ ਥੀਮਾਂ Sutskever ਦੇ ਰਿਸਰਚ ਯੁੱਗ ਨਾਲ ਅਕਸਰ ਵਿਚਾਰਨਯੋਗ ਹਨ—ਅਤੇ ਉਹ LLMs ਦੇ ਵਿਕਾਸ ਨੂੰ ਸਮਝਣ ਲਈ ਔਜ਼ਾਰ ਦੇਂਦੀਆਂ ਹਨ।

ਸੀਕਵੈਂਸ-ਟੂ-ਸੀਕਵੈਂਸ: ਇਕ ਚੀਜ਼ ਨੂੰ ਦੂਜੀ ਵਿੱਚ ਬਦਲਣਾ

Seq2seq ਮਾਡਲ "encoder, ਫਿਰ decoder" ਪੈਟਰਨ ਨੂੰ ਲੋਕਪ੍ਰਿਯ ਬਣਾਉਂਦੇ ਹਨ: ਇੱਕ ਇਨਪੁੱਟ ਲੜੀ (ਜਿਵੇਂ ਇੱਕ ਵਾਕ) ਨੂੰ ਅੰਦਰੂਨੀ ਪ੍ਰਤੀਨਿਧੀ ਵਿੱਚ ਬਦਲੋ, ਫਿਰ ਇੱਕ ਆਉਟਪੁੱਟ ਲੜੀ ਜੈਨਰੇਟ ਕਰੋ। ਇਹ ਸੋਚ ਅਨੁਵਾਦ, ਸੰਖੇਪ ਅਤੇ ਬਾਅਦ ਵਿੱਚ ਟੈਕਸਟ ਜਨਰੇਸ਼ਨ ਵਰਗੇ ਟਾਸਕਾਂ ਲਈ ਸਹਾਇਕ ਰਹੀ, ਵੀਦ ਦੀਆਂ ਆਰਕੀਟੈਕਚਰਾਂ RNNs/LSTMs ਤੋਂ attention ਅਤੇ transformers ਵੱਲ ਬਦਲੀ।

ਪ੍ਰਤੀਨਿਧਿਤਾ ਸਿੱਖਣਾ: ਮਾਡਲਾਂ ਨੂੰ ਫੀਚਰ ਖੋਜਣ ਦਿਓ

ਡੀਪ ਲਰਨਿੰਗ ਦੀ ਖੂਬਸੂਰਤੀ ਇਹ ਸੀ ਕਿ ਸਿਸਟਮ ਡਾਟਾ ਤੋਂ ਖੁਦ ਸਿੱਖੇ ਜੁੜੀਆਂ ਫੀਚਰਾਂ ਨੂੰ ਖੋਜ ਸਕਦੇ ਹਨ, ਬਜਾਏ ਹੱਥ-ਨਿਰਮਿਤ ਨਿਯਮਾਂ ਦੇ। ਇਹ ਧਾਰਨਾ—ਮਜ਼ਬੂਤ ਆਂਤਰਿਕ ਪ੍ਰਤੀਨਿਧੀਆਂ ਸਿੱਖੋ, ਫਿਰ ਉਨ੍ਹਾਂ ਨੂੰ ਬਹੁਤ ਸਾਰੇ ਟਾਸਕਾਂ 'ਚ ਦੁਬਾਰਾ ਵਰਤੋ—ਅੱਜ ਵੀ ਪ੍ਰੀਟ੍ਰੇਨਿੰਗ + ਫਾਈਨ-ਟਿਊਨਿੰਗ, ਐਮਬੈਡਿੰਗਸ ਅਤੇ ਟ੍ਰਾਂਸਫਰ ਲਰਨਿੰਗ ਵਿੱਚ ਦਿਖਾਈ ਦਿੰਦੀ ਹੈ।

ਸਕੇਲਿੰਗ: ਹੋਰ ਡਾਟਾ ਅਤੇ ਕੰਪਿਊਟ, ਨਾਲ ਹੀ ਬਿਹਤਰ ਟ੍ਰੇਨਿੰਗ ਤਰਕੀਬਾਂ

2010 ਦੇ ਦਹਾਕੇ ਵਿੱਚ ਇੱਕ ਵੱਡਾ ਥ੍ਰੇਡ ਇਹ ਸੀ ਕਿ ਵੱਡੇ ਮਾਡਲ, ਵੱਧ ਡਾਟਾ ਅਤੇ ਬਾਰੀਕੀ ਨਾਲ ਸੋਚਿਆ ਟ੍ਰੇਨਿੰਗ ਇਕਠੇ ਹੋਣ ਤੇ ਲਗਾਤਾਰ ਸੁਧਾਰ ਦਿੰਦੇ ਹਨ। "ਸਕੇਲਿੰਗ" ਸਿਰਫ ਆਕਾਰ ਨਹੀਂ; ਇਸਦਾ ਮਤਲਬ ਟ੍ਰੇਨਿੰਗ ਸਥਿਰਤਾ, ਬੈਚਿੰਗ, ਪੈਰਲੇਲਿਜ਼ਮ ਅਤੇ ਇਵੈਲੂਏਸ਼ਨ ਅਨੁਸ਼ਾਸਨ ਵੀ ਹੈ।

ਕਿਵੇਂ ਪੇਪਰ ਉਤਪਾਦਾਂ ਵਿੱਚ ਬਦਲੇ ਜਾਂਦੇ ਹਨ (ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਉਲਲੇਖ ਕਰਨਾ)

ਖੋਜਕ ਪੁਸਤਕ ਉਤਪਾਦਾਂ ਨੂੰ ਬੈਂਚਮਾਰਕ, ਖੁੱਲ੍ਹੇ ਤਰੀਕੇ ਅਤੇ ਸਾਂਝੇ ਬੇਸਲਾਈਨਾਂ ਰਾਹੀਂ ਪ੍ਰਭਾਵਿਤ ਕਰਦੇ ਹਨ: ਟੀਮਾਂ ਮੁਲਿਆਕੰਨ ਸੈਟ-ਅਪ ਦੀ ਮ<|endoftext|>

ਅਕਸਰ ਪੁੱਛੇ ਜਾਣ ਵਾਲੇ ਸਵਾਲ

Why does Ilya Sutskever matter in the story of large language models?

ਉਹ ਇਕੱਲਾ ਆਵਿਸਕਾਰਕ ਨਹੀਂ ਸੀ, ਪਰ ਉਸਦਾ ਕੰਮ ਇੱਕ ਅਹੰਕਾਰਪੂਰਣ ਨੁਸਖੇ ਨੂੰ ਮਨਜ਼ੂਰ ਕਰਨ ਵਿੱਚ ਮਦਦਗਾਰ ਰਿਹਾ: ਸਕੇਲ + ਸਰੁਪਤਰੀ ਤਰੀਕਿਆਂ ਨਾਲ ਟ੍ਰੇਨਿੰਗ। ਉਸਦੇ ਯੋਗਦਾਨ ਐਲਗੋਰਿਦਮਿਕ ਅਤੇ ਢਾਂਚਾਗਤ ਮੋੜਾਂ ਵਿੱਚ ਦਿਖਾਈ ਦਿੰਦੇ ਹਨ—ਜਿਵੇਂ ਕਿ AlexNet (ਗਹਿਰੇ ਨੈੱਟਵਰਕ ਸਕੇਲ ਤੇ ਕੰਮ ਕਰ ਸਕਦੇ ਹਨ), seq2seq (ਇੰਡ-ਟੂ-ਇੰਡ ਟੈਕਸਟ ਜੈਨਰੇਸ਼ਨ ਨੂੰ ਨਾਰਮਲ ਬਣਾਉਣਾ), ਅਤੇ ਉਸਦੀ ਰਿਸਰਚ ਲੀਡਰਸ਼ਿਪ ਜਿਸ ਨੇ ਵੱਡੇ ਟ੍ਰੇਨਿੰਗ ਦੌਰ ਕਰਨ ਨੂੰ ਦੁਹਰਾਏ ਯੋਗ ਅਭਿਆਸਾਂ ਵਿੱਚ ਬਦਲ ਦਿੱਤਾ।

What is a large language model (LLM) in plain terms?

ਇੱਕ ਵੱਡਾ ਭਾਸ਼ਾਈ ਮਾਡਲ ਇੱਕ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਹੁੰਦਾ ਹੈ ਜੋ ਬਹੁਤ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਟੈਕਸਟ 'ਤੇ ਟ੍ਰੇਨ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਤਾਂ ਜੋ ਅਗਲਾ ਟੋਕਨ ਭਵਿੱਖਵਾਣੀ ਕੀਤਾ ਜਾਵੇ। ਇਸ ਸਧਾਰਨ ਲਕਸ਼ ਦੇ ਨਾਲ ਮਾਡਲ ਵਿਆਕਰਨ, ਅੰਦਾਜ਼, ਤੱਥਾਂ ਅਤੇ ਕੁਝ ਸਮੱਸਿਆ-ਸੁਝਾਅ ਹੁਨਰ ਸਿੱਖ ਲੈਂਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਸੰਖੇਪ ਲਿਖਣਾ, ਅਨੁਵਾਦ, ਡਰਾਫਟਿੰਗ ਅਤੇ Q&A ਵਰਗੇ ਕੰਮ ਹੋ ਸਕਦੇ ਹਨ।

What held neural networks back before the deep learning boom?

~2010 ਤੋਂ ਪਹਿਲਾਂ deep learning ਅਕਸਰ ਹੱਥ-ਨਿਰਮਿਤ ਫੀਚਰਾਂ ਨੂੰ ਹਾਰ ਜਾਂ ਦਿੰਦੀ ਸੀ ਕਿਉਂਕਿ ਤਿੰਨ ਮੁੱਖ ਰੁਕਾਵਟਾਂ ਸਨ:

ਡਾਟਾ: ਵੱਡੇ ਲੇਬਲਡ ਡੈਟਾਸੈੱਟ ਘੱਟ ਮਿਲਦੇ ਸਨ
ਕੰਪਿਊਟ: CPUs 'ਤੇ ਡੀਪ ਟ੍ਰੇਨਿੰਗ ਬਹੁਤ ਧੀਮੀ ਰਹਿੰਦੀ ਸੀ
ਆਪਟੀਮਾਈਜ਼ੇਸ਼ਨ ਸਥਿਰਤਾ: ਗਹਿਰੇ ਨੈੱਟਵਰਕਸ ਨੂੰ ਭਰੋਸੇਯੋਗ ਤਰੀਕੇ ਨਾਲ ਟ੍ਰੇਨ ਕਰਨਾ ਮੁਸ਼ਕਿਲ ਸੀ

ਜਦ ਇਹ ਪਾਬੰਦੀਆਂ ਘਟੀਆਂ ਅਤੇ ਟ੍ਰੇਨਿੰਗ ਪ੍ਰਥਾਵਾਂ ਪੱਕੀਆਂ ਹੋਈਆਂ, ਤਾਂ ਅਧੁਨਿਕ LLMs ਸੰਭਵ ਹੋਏ।

What did AlexNet prove, and why does it matter for LLMs?

AlexNet ਇਹ ਦਿਖਾਉਂਦਾ ਸੀ ਕਿ ਵੱਡੇ ਨੈੱਟਵਰਕ + GPUs + ਚੰਗੇ ਟ੍ਰੇਨਿੰਗ ਵੇਰਵਿਆਂ ਨਾਲ ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਵੱਡਾ ਛਾਲ ਆ ਸਕਦਾ ਹੈ। ਇਹ ਸਿਰਫ ImageNet ਦੀ ਜਿੱਤ ਨਹੀਂ ਸੀ—ਇਸਨੇ ਇਹ ਦਿਖਾਇਆ ਕਿ “ਸਕੇਲਿੰਗ ਕੰਮ ਕਰਦੀ ਹੈ” ਅਤੇ ਹੋਰ ਖੇਤਰ ਵੀ ਇਸ ਤਰੀਕੇ ਨੂੰ ਅਪਣਾ ਸਕਦੇ ਹਨ।

How did sequence-to-sequence (seq2seq) influence modern language AI?

ਭਾਸ਼ਾ ਕੁਦਰਤੀ ਤੌਰ 'ਤੇ ਇੱਕ ਲੜੀ-ਸਬੰਧੀ ਸਮੱਸਿਆ ਹੈ: ਅਰਥ ਕ੍ਰਮ ਅਤੇ ਪਿਛਲੇ ਸੰਦਰਭ 'ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ। Seq2seq ਨੇ ਅਨੁਵਾਦ ਜਿਹੇ ਕੰਮਾਂ ਨੂੰ ਜਨਰੇਸ਼ਨ ਵਜੋਂ ਮੁੜ-ਪੇਸ਼ ਕੀਤਾ: encoder–decoder ਡਿਜ਼ਾਈਨ ਨਾਲ ਇਕ ਇਨਪੁਟ ਲੜੀ ਨੂੰ ਪੜ੍ਹ ਕੇ ਇੱਕ ਅੰਦਰੂਨੀ ਪ੍ਰਤੀਨਿਧੀ ਬਣਾਈ ਜਾਂਦੀ ਹੈ, ਫਿਰ decoder Token-ਦਰ-Token ਆਉਟਪੁਟ ਬਣਾਉਂਦਾ। ਇਹ ਸੋਚ ਅੰਤ-ਤੱਕ ਟ੍ਰੇਨਿੰਗ ਨੂੰ ਸਧਾਰਨ ਬਣਾਉਂਦੀ ਹੈ ਅਤੇ ਆਧੁਨਿਕ LLM ਵਰਕਫਲੋਜ਼ ਲਈ ਰਾਹ ਖੋਲ੍ਹਦੀ ਹੈ।

What did big labs like Google Brain change about scaling research?

ਵੱਡੇ ਪੈਮਾਨੇ 'ਤੇ, ਇੱਕ ਲੈਬ ਦਾ ਫਾਇਦਾ ਅਕਸਰ ਓਪਰੇਸ਼ਨਲ ਹੁੰਦਾ ਹੈ:

ਵੰਡਿਆ ਗਿਆ ਟ੍ਰੇਨਿੰਗ ਤੇ ਸਾਂਝੀ ਇਨਫ੍ਰਾਸਟਰਕਚਰ
ਦੋਹਰਾਯੋਗ ਪਾਇਪਲਾਈਨਾਂ ਡਾਟਾ ਅਤੇ ਇਵੈਲ ਲਈ
ਐਕਸਪੇਰੀਮੈਂਟ ਅਨੁਸ਼ਾਸਨ (ਮੋਨੀਟਰਨਗ, ਲੌਗਿੰਗ, ਦੁਹਰਾਯੋਗਤਾ)

ਇਹ ਇਸ ਲਈ ਜਰੂਰੀ ਹੈ ਕਿਉਂਕਿ ਬਹੁਤ ਵੱਡੇ ਮਾਡਲਾਂ ਅਤੇ ਡੈਟਾਸੈੱਟਾਂ 'ਤੇ ਕਈ ਫੇਲ੍ਹਯਾ ਕੇਸ ਸਿਰਫ ਉਸ ਸਮੇਂ ਨਜ਼ਰ ਆਉਂਦੇ ਹਨ—ਅਤੇ ਜਿਹੜੀਆਂ ਟੀਮਾਂ ਉਹਨਾਂ ਨੂੰ ਡਿਬੱਗ ਕਰ ਸਕਦੀਆਂ ਹਨ, ਉਹ ਅੱਗੇ ਰਹਿੰਦੀ ਹਨ।

What is GPT-style pretraining, and why is it so effective?

GPT-ਸ਼ੈਲੀ ਪ੍ਰੀਟ੍ਰੇਨਿੰਗ ਵਿੱਚ ਇਹ ਧਾਰਨਾ ਹੈ: ਮਾਡਲ ਨੂੰ ਬਹੁਤ ਵੱਡੀ ਟੈਕਸਟ ਕੋਰਪਸ 'ਤੇ ਅਗਲਾ ਟੋਕਨ ਭਵਿੱਖਵਾਣੀ ਲਈ ਟ੍ਰੇਨ ਕਰੋ। ਇਸ ਆਮ ਟ੍ਰੇਨਿੰਗ ਨਾਲ ਮਾਡਲ ਬਹੁਤ ਸਾਰੀਆਂ ਗੁਣਵੱਤਾਵਾਂ ਅੰਦਰੂਨੀ ਤੌਰ 'ਤੇ ਸਿੱਖ ਲੈਂਦਾ ਹੈ। ਪ੍ਰੀਟ੍ਰੇਨਿੰਗ ਤੋਂ ਬਾਅਦ, ਮਾਡਲ ਨੂੰ prompting, ਫਾਈਨ-ਟਿਊਨਿੰਗ ਜਾਂ instruction training ਰਾਹੀਂ ਵਿਸ਼ੇਸ਼ ਕੰਮਾਂ ਲਈ ਅਨੁਕੂਲਿਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ—ਇਸ ਲਈ ਵੱਖ-ਵੱਖ ਟਾਸਕਾਂ ਲਈ ਵੱਖ-ਵੱਖ ਮਾਡਲ ਬਣਾਉਣ ਦੀ ਲੋੜ ਘੱਟ ਹੋ ਜਾਂਦੀ ਹੈ।

What are the biggest “hard parts” of training models at scale?

ਤਿੰਨ ਵਿਸ਼ੇਸ਼ ਲਿਵਰ ਜ਼ਿਆਦਾ ਅਹੰਕਾਰ ਰੱਖਦੇ ਹਨ:

ਡਾਟਾ ਗੁਣਵੱਤਾ: ਡੀਡੁਪਲੀਕੇਸ਼ਨ, ਫਿਲਟਰਿੰਗ, ਡੈਟਾਸੈੱਟ ਵਰਜ਼ਨਿੰਗ
ਆਪਟੀਮਾਈਜ਼ੇਸ਼ਨ ਸਥਿਰਤਾ: ਲਰਨਿੰਗ-ਰੇਟ ਸਕੈਜੂਲ, ਗਰੇਡੀਐਂਟ ਕਲਿੱਪਿੰਗ, ਮਿਕਸਡ ਪ੍ਰਿਸੀਜ਼ਨ, ਚੈਕਪੌਇਂਟਿੰਗ
ਲਗਾਤਾਰ ਇਵੈਲੂਐਸ਼ਨ: ਛੋਟੇ ਤੇਜ਼ ਇਵੈਲ ਅਤੇ ਵਿਸ਼ਾਲ ਸੂਟ ਦੀ ਨਿਯਮਤ ਜਾਂਚ

ਇਹਨਾਂ ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਮਹਿੰਗੀਆਂ ਗਲਤੀਆਂ—ਜਿਵੇਂ ਸਿਖਲਾਈ ਦੀ ਅਸਫਲਤਾ, ਓਵਰਫਿਟਿੰਗ ਜਾਂ ਰੀਗ੍ਰੈਸ਼ਨ—ਕੰਨਟਰੋਲ ਕੀਤੀਆਂ ਜਾ ਸਕਦੀਆਂ ਹਨ।

Why did safety and alignment become central as LLMs improved?

ਜਦੋਂ ਮਾਡਲ ਕਿਸੇ ਕੰਮ 'ਚ ਨਿਪੁੰਨ ਹੋ ਜਾਂਦੇ ਹਨ—ਕੋਡ ਲਿਖਣਾ, ਸਲਾਹ ਦੇਣਾ, ਕਈ ਕਦਮੀ ਹਿਦਾਇਤਾਂ ਲੈਣਾ—ਤਾਂ ਲੋਕਾਂ ਨੇ ਸਮਝਿਆ ਕਿ ਸਿਰਫ ਯੋਗਤਾ ਕਾਫੀ ਨਹੀਂ ਹੈ; ਭਰੋਸੇਯੋਗਤਾ ਵੀ ਲਾਜ਼ਮੀ ਹੈ।

ਸੁਰੱਖਿਆ (Safety): ਨੁਕਸਾਨਦੇਹ ਵਰਤਾਰਿਆਂ ਨੂੰ ਘਟਾਉਣਾ—ਉਹ ਹਦਾਇਤਾਂ ਜੋ ਗੈਰਕਾਨੂੰਨੀ ਜਾਂ ਖਤਰਨਾਕ ਰਿਸ਼ਤੇ ਬਣਾਉਂਦੀਆਂ ਹਨ।
ਅਲਾਇਨਮੈਂਟ (Alignment): ਸਿਸਟਮ ਦਾ ਵਰਤਾਰਾ ਉਸ ਗੱਲ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੋਵੇ ਜੋ ਲੋਕ ਚਾਹੁੰਦੇ ਹਨ—ਸੀਮਾਵਾਂ ਦਾ ਆਦਰ, ਅਨਿਸ਼ਚਿਤਤਾ ਦੀ ਸਵੀਕਾਰਤਾ, ਤੇ ਨੁਕਸਾਨਦਾਇਕ “ਇਮੈਜੀਨੇਸ਼ਨ” ਤੋਂ ਬਚਣਾ।

ਪ੍ਰਯੋਗ ਵਿੱਚ, ਇਹ ਇਵੈਲੂਏਸ਼ਨ, ਰੈੱਡ-ਟੀਮਿੰਗ, ਅਤੇ ਨੀਤੀ-ਚਲਿਤ ਟ੍ਰੇਨਿੰਗ/ਟੈਸਟਿੰਗ ਵਰਗੀਆਂ ਕੈਚਾਂਦੀ ਤਕਨੀਕਾਂ ਨਾਲ ਲਾਗੂ ਹੁੰਦਾ ਹੈ।

What should builders take away when adopting LLMs for a product?

ਸਿੰਪਲ ਪਾਠ: ਉਪਲੇਖ ਇਨਸਾਈਟ ਇਹ ਹੈ ਕਿ ਸਧਾਰਨ ਆਈਡੀਆਜ਼ ਨੂੰ ਵੱਡੇ ਪੈਮਾਨੇ ਤੇ ਬੜੀ ਨਿਭਰਤਾ ਨਾਲ ਲਾਗੂ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਉਤਪਾਦ ਟੀਮਾਂ ਲਈ ਸਲਾਹ ਇਹ ਹੈ ਕਿ ਅਧਿਕ ਅਨੁਸੰਦਾਨ ਕਰਨ ਦੀ ਥਾਂ ਐਕਸਪਰਟਿਮੈਂਟਸ ਘੱਟ ਕਰੋ: ਛੋਟੇ ਪ੍ਰਯੋਗ ਚਲਾਓ, ਸਾਫ ਮੈਟ੍ਰਿਕਸ ਚੁਣੋ, ਤੇ ਤੇਜ਼ੀ ਨਾਲ ਇਟਰੇਟ ਕਰੋ।

ਮੁੱਖ ਨੁਕਤੇ:

ਸ਼ੁਰੂ ਕਰਨ ਲਈ ਆਮ ਤੌਰ 'ਤੇ ਪਹਿਲਾਂ ਖ਼ਰੀਦੋ (buy) — ਇੱਕ ਮਜ਼ਬੂਤ ਫਾਉਂਡੇਸ਼ਨ ਮਾਡਲ ਵਰਤੋ ਅਤੇ ਪ੍ਰੋਡਕਸ਼ਨ ਵਿੱਚ ਮੁੱਲ ਸਾਬਤ ਕਰੋ।
Prompting ਪਹਿਲਾਂ ਵਰਤੋਂ ਜਦੋਂ ਟਾਸਕ ਸਪਸ਼ਟ ਹੋਵੇ।
ਫਾਈਨ-ਟਿਊਨਿੰਗ ਨੂੰ ਉਹਨਾਂ ਕੇਸਾਂ ਲਈ ਰੱਖੋ ਜਿੱਥੇ ਵੱਖਰੇ ਇਜਾਦੀ ਹਾਲਾਤਾਂ 'ਤੇ ਲਗਾਤਾਰ ਵਰਤਾਰਾ ਲਾਜ਼ਮੀ ਹੋਵੇ।
RAG (retrieval) ਵਰਤੋਂ ਜਦੋਂ ਜਵਾਬ ਤੁਹਾਡੇ ਦਸਤਾਵੇਜ਼ਾਂ 'ਤੇ ਅਧਾਰਿਤ ਹੋਣੇ ਚਾਹੀਦੇ ਹੋਣ।