ਪੜ੍ਹੋ ਕਿ Apple ਨੇ Siri ਨਾਲ ਪਹਿਲਾਂ ਕਿਵੇਂ ਲੀਡ ਕੀਤਾ ਪਰ ChatGPT ਅਤੇ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਨੇ ਕਿਵੇਂ AI ਸਹਾਇਕਾਂ ਦੀ ਪਰਿਭਾਸ਼ਾ ਬਦਲੀ ਅਤੇ ਇਹ ਬਦਲਾਵ Apple ਦੀ ਰਣਨੀਤੀ ਲਈ ਕੀ ਮਤਲਬ ਰੱਖਦਾ ਹੈ।

Siri ਅਤੇ ChatGPT ਨੂੰ ਅਕਸਰ ਦੋ ਵੱਖ-ਵੱਖ ਸਹਾਇਕਾਂ ਵਜੋਂ ਤੁਲਨਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਵੱਧ ਦਿਲਚਸਪ ਗੱਲ ਇਹ ਹੈ ਕਿ ਇੱਕ ਕੰਪਨੀ ਨੇ ਸ਼ੁਰੂ ਵਿਚ ਇਸ ਸ਼੍ਰੇਣੀ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕੀਤਾ, ਫਿਰ momentum ਘਟ ਗਿਆ ਜਦੋਂ ਦੂਜੇ ਤਕਨੀਕੀ ਲਹਿਰ ਨੇ ਉਮੀਦਾਂ ਨੂੰ ਬਦਲ ਦਿੱਤਾ।
ਜਦੋਂ Apple ਨੇ 2011 ਵਿੱਚ iPhone 4S ਨਾਲ Siri ਲਾਂਚ ਕੀਤੀ, ਇਹ ਕੁਮਪਿਊਟਿੰਗ ਦਾ ਭਵਿੱਖ ਲੱਗਿਆ: ਆਪਣੇ ਫੋਨ ਨਾਲ ਗੱਲ-ਬਾਤ ਕਰੋ, ਕੰਮ ਮੁਕੰਮਲ ਕਰੋ, ਕੀਬੋਰਡ ਦੀ ਲੋੜ ਨਹੀਂ। Apple ਕੋਲ mainstream ਵੌਇਸ ਅਸਿਸਟੈਂਸ ਵਿੱਚ ਪਹਿਲਾਂ ਆਉਣ ਦਾ ਫਾਇਦਾ ਸੀ, ਜਿਸ ਸਮੇਂ "AI" ਹਰ ਉਤਪਾਦ ਰੋਡਮੈਪ ਦਾ ਕੇਂਦਰ ਨਹੀਂ ਬਣਿਆ ਸੀ। ਕੁਝ ਸਮੇਂ ਲਈ Siri ਨੇ ਲੋਕਾਂ ਨੂੰ ਇਹ ਸੋਚਣ 'ਤੇ ਮਜਬੂਰ ਕੀਤਾ ਕਿ ਸਹਾਇਕ ਕੀ ਕਰ ਸਕਦਾ ਹੈ।
ਇਕ ਦਹਾਕੇ ਬਾਅਦ, ChatGPT ਨੇ 2022 ਦੇ ਅਖੀਰ ਵਿੱਚ ਧਮਾਕਾ ਕੀਤਾ ਅਤੇ ਕਈ ਯੂਜ਼ਰਾਂ ਨੂੰ ਮਹਿਸੂਸ ਕਰਵਾਇਆ ਕਿ ਉਹ ਇਕ ਭਿੰਨ ਕਿਸਮ ਦੇ ਸਹਾਇਕ ਦਾ ਅਨੁਭਵ ਕਰ ਰਹੇ ਹਨ। ਇਹ ਲਿਖ ਸਕਦਾ ਸੀ, ਸਮਝਾ ਸਕਦਾ ਸੀ, ਅਨੁਵਾਦ ਕਰ ਸਕਦਾ ਸੀ, ਡੀਬੱਗ ਕਰ ਸਕਦਾ ਸੀ ਅਤੇ ਸੰਦੇਸ਼ਕ ਸੰਦਰਭ ਲਈ ਅਡਾਪਟ ਕਰ ਸਕਦਾ ਸੀ—ਜਿਸ ਤਰ੍ਹਾਂ ਸਕ੍ਰਿਪਟ ਕੀਤੀਆਂ ਵੌਇਸ ਸਿਸਟਮ ਕਦੇ ਨਹੀਂ ਕਰ ਸਕੇ। ਅਚਾਨਕ, ਯੂਜ਼ਰ ਉਮੀਦਾਂ "ਟਾਈਮਰ ਸੀਟ ਕਰੋ ਅਤੇ ਮੇਰੀ ਬੇਨਤੀ ਨੂੰ ਗਲਤ ਸੁਣਨਾ" ਤੋਂ ਬਦਲ ਕੇ "ਮੋਟੇ-ਸਵਾਲਾਂ 'ਤੇ ਮਿਡਲ-ਵਿੱਚ ਤਰਕ ਕਰੋ ਅਤੇ ਮੰਗ 'ਤੇ ਸਮੱਗਰੀ ਤਿਆਰ ਕਰੋ" ਹੋ ਗਈਆਂ।
ਇਹ ਲੇਖ ਫੀਚਰ ਚੈਕਲਿਸਟ ਬਾਰੇ ਨਹੀਂ ਹੈ। ਇਹ ਰੁਝਾਨ ਬਾਰੇ ਹੈ: Siri ਦੀ ਡਿਜ਼ਾਇਨ, ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਉਤਪਾਦਿਕ ਸੀਮਾਵਾਂ ਨੇ ਉਸਨੂੰ ਸੰਕੁਚਿਤ ਤੇ ਭਰੋਸੇਯੋਗ ਬਣਾਇਆ, ਜਦਕਿ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲ (LLMs) ਨੇ ChatGPT ਨੂੰ ਖੁੱਲ੍ਹਾ-ਅੰਤ ਅਤੇ ਗੱਲ-ਬਾਤੀ ਕਰਨਯੋਗ ਬਣਾਇਆ।
ਅਸੀਂ ਦੇਖਾਂਗੇ:
ਉਤਪਾਦ ਅਤੇ AI ਟੀਮਾਂ ਲਈ, Siri vs ChatGPT ਇਹ ਸਿਖਾਉਂਦਾ ਹੈ ਕਿ ਕਿਵੇਂ ਸਮਾਂ, ਪਲੇਟਫਾਰਮ ਫ਼ੈਸਲੇ ਅਤੇ ਤਕਨੀਕੀ ਦਾਅਵੇ ਕਿਸੇ ਲਾਭ ਨੂੰ ਬਢ਼ਾ ਸਕਦੇ ਹਨ—ਜਾਂ ਆਹਿਸਤੇ-ਆਹਿਸਤੇ ਉਸਨੂੰ ਘਟਾ ਸਕਦੇ ਹਨ।
ਜਦੋਂ Apple ਨੇ 2011 ਵਿੱਚ iPhone 4S ਨਾਲ Siri ਦਾ ਪਰਚਾ ਕੀਤਾ, ਇਹ ਇੱਕ ਮੀਨਸਟਰੀਮ ਡਿਵਾਈਸ 'ਤੇ ਸਾਇੰਸ ਫਿਕਸ਼ਨ ਵਰਗੀ ਮਹਿਸੂਸ ਹੁੰਦੀ ਸੀ। Siri ਪਹਿਲਾਂ SRI International ਤੋਂ ਨਿਕਲ ਕੇ ਇੱਕ ਆਜ਼ਾਦ startup ਵਜੋਂ ਸ਼ੁਰੂ ਹੋਈ ਸੀ; Apple ਨੇ 2010 ਵਿੱਚ ਇਸ ਨੂੰ ਖਰੀਦਿਆ ਅਤੇ ਤੇਜ਼ੀ ਨਾਲ ਇਸ ਨੂੰ ਸਿਰਫ਼ ਇੱਕ ਐਪ ਨਹੀਂ, ਬਲਕਿ ਇੱਕ ਹੈੱਡਲਾਈਨ ਫੀਚਰ ਬਣਾਇਆ।
Apple ਨੇ Siri ਨੂੰ ਇੱਕ ਗੱਲਬਾਤੀ, ਵੌਇਸ-ਚਾਲਿਤ ਸਹਾਇਕ ਵਜੋਂ ਮਾਰਕੀਟ ਕੀਤਾ ਜੋ ਰੋਜ਼ਾਨਾ ਕੰਮ ਸੰਭਾਲ ਸਕਦਾ: reminders ਲਗਾਉਣਾ, messages ਭੇਜਣਾ, ਮੌਸਮ ਵੇਖਣਾ, ਰੈਸਟੋਰੈਂਟ ਲੱਭਣਾ ਅਤੇ ਹੋਰ। ਪੇਚ-ਪੱਕਾ ਪੇਸ਼ਕਸ਼ ਸੀ: ਐਪਾਂ 'ਚ ਟੈਪ ਕਰਨ ਦੀ ਥਾਂ, ਤੁਸੀਂ ਸਿਰਫ਼ ਆਪਣੇ iPhone ਨਾਲ ਗੱਲ ਕਰ ਸਕਦੇ ਸੀ।
ਲਾਂਚ ਮੁਹਿੰਮ ਵਿਅੰਗਤ ਪ੍ਰਸੰਗ ਤੇ ਜ਼ਿਆਦਾ ਧਿਆਨ ਦਿੰਦੀ ਸੀ। Siri ਦੇ witty ਜਵਾਬ, ਜੋਕਸ ਅਤੇ easter eggs ਇਸ ਤਰ੍ਹਾਂ ਬਣਾਏ ਗਏ ਕਿ ਸਹਾਇਕ ਜਿਉਂਦਾ ਅਤੇ ਮਿਲਣਯੋਗ ਮਹਿਸੂਸ ਹੋਵੇ। ਟੈਕ ਰਿਵਿਊਅਰਾਂ ਅਤੇ ਮੁੱਖ ਧਾਰਾ ਮੀਡੀਆ ਨੇ ਲੋਕਾਂ ਦੀ “ਆਪਣੇ ਫੋਨ ਨਾਲ ਗੱਲ” ਕਰਨ ਦੀ ਰਿਪੋਰਟ ਨੂੰ ਇੱਕ ਸੱਭਿਆਚਾਰਕ ਲਹਿਰ ਵਜੋਂ ਕਵਰ ਕੀਤਾ। ਕੁਝ ਸਮੇਂ ਲਈ Siri ਉਪਭੋਗਤਾ AI ਦਾ ਸਭ ਤੋਂ ਦਿੱਸਣਯੋਗ ਪ੍ਰਤੀਕ ਸੀ।
ਦੋਸਤਾਨਾ ਆਵਾਜ਼ ਦੇ ਪਿੱਛੇ, Siri ਦੀ ਆਰਕੀਟੈਕਚਰ ਇੱਕ intent-based ਸਿਸਟਮ ਸੀ ਜੋ predefined domains ਨਾਲ ਜੁੜੀ ਸੀ:
create_reminder ਜਾਂ send_message) ਨਾਲ ਮੈਪ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੀ ਸੀ।Siri ਆਮ ਤੌਰ 'ਤੇ ਜਰੂਰੀ ਤੌਰ 'ਤੇ “ਸਮਝ” ਨਹੀਂ ਰਹੀ; ਇਹ ਇੱਕ ਵੱਡੇ ਨਿਰਧਾਰਤ ਸਕ੍ਰਿਪਟਡ ਸਮਰੱਥਾਵਾਂ ਨੂੰ orchestration ਕਰ ਰਹੀ ਸੀ।
ਲਾਂਚ ਵੇਲੇ, ਇਹ ਮੁਕਾਬਲੇ ਵਿੱਚ ਕਈ ਸਾਲ ਅੱਗੇ ਸੀ। Google Voice Actions ਅਤੇ ਹੋਰ ਕੋਸ਼ਿਸ਼ਾਂ ਉਸ ਸਮੇਂ Siri ਦੇ ਮੁਕਾਬਲੇ ਵਿੱਚ ਤੰਗ ਅਤੇ ਯੂਟਿਲਿਟੇਰੀ ਲੱਗਦੀਆਂ। Siri ਨੇ Apple ਨੂੰ ਇਹ ਵਾਸਤਵ ਵਿੱਚ ਪਹਿਲਾਂ ਆਉਣ ਦਾ ਫਾਇਦਾ ਦਿੱਤਾ: ਇਸਨੇ ਲੋਕਾਂ ਦੀ ਮਨੋਵਿਗਿਆਨ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕੀਤਾ ਕਿ ਸਮਾਰਟਫ਼ੋਨ 'ਤੇ AI ਸਹਾਇਕ ਕਿਵੇਂ ਹੋ ਸਕਦਾ ਹੈ—ਕਾਫੀ ਪਹਿਲਾਂ ਕਿ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲ ਜਾਂ ChatGPT ਮੁਝੇ ਦਰਸ਼ਨ ਹੋਏ।
Siri ਨੇ ਰੋਜ਼ਾਨਾ ਕੰਮਾਂ ਦੀ ਇੱਕ ਨਿੱਘੀ ਸੈੱਟ ਨੂੰ ਨਿਖਾਰ ਕੇ ਲੋਕਾਂ ਦੀ ਰੁਟੀਨ ਵਿੱਚ ਆਪਣੀ ਜਗ੍ਹਾ ਬਣਾਈ। “Hey Siri, set a 10-minute timer,” “Call mom,” ਜਾਂ “Text Alex I’m running late” ਆਮ ਤੌਰ ਤੇ ਪਹਿਲੀ ਕੋਸ਼ਿਸ਼ ਵਿੱਚ ਹੀ ਚੱਲ ਜਾਂਦੇ ਸਨ। ਡਰਾਈਵਿੰਗ ਜਾਂ ਰਸੋਈਦੇ ਵਿੱਚ ਹੱਥ-ਮੁਕਤ ਕੰਟਰੋਲ calls, messages, reminders ਅਤੇ alarms ਲਈ ਜਾਦੂਈ ਲੱਗਦਾ ਸੀ।
Music ਕੰਟਰੋਲ ਇੱਕ ਹੋਰ ਮਜ਼ਬੂਤ ਖੇਤਰ ਸੀ। “Play some jazz,” “Skip,” ਜਾਂ “What song is this?” iPhone ਨੂੰ Apple Music ਅਤੇ ਆਡੀਓ ਅਨੁਭਵ ਲਈ ਵੌਇਸ-ਚਾਲਿਤ ਰਿਮੋਟ ਵਰਗਾ ਮਹਿਸੂਸ ਕਰਵਾਉਂਦਾ। ਸਧਾਰਨ ਪੁੱਛਗਿੱਛ—ਮੌਸਮ, ਖੇਡ ਸਕੋਰ, ਮੂਢ ਤੱਥ—ਸਹੀ ਹੋਣ 'ਤੇ Siri ਛੋਟੇ, single-turn ਇੰਟਰੈਕਸ਼ਨਾਂ ਵਿੱਚ ਤੇਜ਼ utility ਦਿੱਤਾ।
ਸੁੰਘਰੇ ਹਿਸੇ ਨਾਲ, Siri intents, slots, ਅਤੇ domains 'ਤੇ ਨਿਰਭਰ ਸੀ। ਹਰ domain (ਜਿਵੇਂ messaging, alarms, ਜਾਂ music) ਇੱਕ ਛੋਟੇ intents ਸੈੱਟ ਦਾ ਸਮਰਥਨ ਕਰਦਾ—“send message,” “create timer,” “play track”—ਜਿਸ ਵਿੱਚ contact names, durations, ਜਾਂ song titles ਜਿਹੇ slots ਹੁੰਦੇ ਸਨ।
ਜਦੋਂ ਯੂਜ਼ਰ ਉਮੀਦ ਕੀਤੀ ਗਈ phrasing ਦੇ ਨੇੜੇ ਰਹੇ, ਇਹ ਡਿਜ਼ਾਇਨ ਚੰਗੀ ਤਰ੍ਹਾਂ ਕੰਮ ਕਰਦਾ ਸੀ: “Remind me at 3 p.m. to call the dentist” ਇੱਕ reminder intent ਵਿੱਚ ਸਮੇਂ ਅਤੇ ਟੈਕਸਟ ਸਲਾਟਾਂ ਵਿੱਚ ਸੁਤੰਤਰ ਰੂਪ ਨਾਲ ਮੈਪ ਹੋ ਜਾਂਦੀ। ਪਰ ਜਦੋਂ ਲੋਕ ਖੁੱਲ੍ਹ ਕੇ ਬੋਲਦੇ—ਸਾਈਡ ਟਿੱਪਣੀਆਂ ਜੋੜਦੇ ਜਾਂ ਅੱਨਯੁਕਤ ਕ੍ਰਮ ਵਰਤਦੇ—Siri ਅਕਸਰ ਗਲਤ ਹੋ ਜਾਂਦੀ ਜਾਂ ਵੈੱਬ ਖੋਜ 'ਤੇ fallback ਕਰ ਲੈਂਦੀ।
ਕਿਉਂਕਿ ਹਰ ਨਵੇਂ ਵ੍ਹਿਵਹਾਰ ਲਈ ਬਾਰੀਕੀ ਨਾਲ modeled intent ਅਤੇ domain ਦੀ ਲੋੜ ਹੁੰਦੀ ਸੀ, Siri ਦੀ ਸਮਰੱਥਾ ਹੌਲੀ ਵਧੀ। ਨਵੇਂ ਐਕਸ਼ਨਾਂ, ਐਪਾਂ, ਅਤੇ ਭਾਸ਼ਾਵਾਂ ਲਈ ਸਮਰੱਥਾ ਯੂਜ਼ਰ ਉਮੀਦਾਂ ਤੋਂ ਪਿੱਛੇ ਰਹਿ ਗਈ। ਬਹੁਤ ਸਾਰੇ ਲੋਕਾਂ ਨੂੰ ਮਹਿਸੂਸ ਹੋਇਆ ਕਿ ਸਾਲ ਦਰ ਸਾਲ Siri ਨਵੀਆਂ skills ਜਾਂ ਵੱਧ “ਸਮਾਰਟ” ਨਹੀਂ ਹੋ ਰਹੀ।
Follow-up ਸਵਾਲ ਥੋੜ੍ਹੇ ਹੀ ਹੁੰਦੇ—ਲਗਭਗ ਕੋਈ ਪਹਿਲਾ context ਯਾਦ ਨਹੀਂ ਰਹਿੰਦਾ। ਤੁਸੀਂ ਇੱਕ ਟਾਈਮਰ ਲਈ ਪੁੱਛ ਸਕਦੇ ਸੀ, ਪਰ ਕੁਦਰਤੀ ਗੱਲਬਾਤ ਨਾਲ ਕਈ ਟਾਈਮਰ ਮੈਨੇਜ ਕਰਨਾ ਨਾਜੁਕ ਸੀ। ਇਹ ਨਾਜ਼ੁਕਤਾ—ਨਾਲ ਹੀ ਇਹ ਅਹਸਾਸ ਕਿ Siri ਘੱਟ ਵਿਕਸਤ ਹੋ ਰਹੀ—ਉਸ ਵੱਖ-ਵੱਖ ਵੱਲ ਮੋੜਿਆ ਜਦੋਂ ਇੱਕ ਜ਼ਿਆਦਾ ਲਚਕੀਲਾ, ਗੱਲ-ਬਾਤੀ ਸਿਸਟਮ ਜਿਵੇਂ ChatGPT ਬਾਅਦ ਵਿੱਚ ਆਇਆ।
Siri ਇੱਕ intent-based ਮਾਡਲ 'ਤੇ ਬਣਿਆ ਸੀ: ਇੱਕ trigger phrase ਪਛਾਣੋ, ਬੇਨਤੀ ਨੂੰ ਇੱਕ ਜਾਨੇ-ਪਹਚਾਣੇ intent (set alarm, send message, play song) ਵਿੱਚ ਵਰਗੀਕਰਣ ਕਰੋ, ਫਿਰ ਕਿਸੇ ਨਿਰਧਾਰਤ ਸੇਵਾ ਨੂੰ ਕਾਲ ਕਰੋ। ਜੇ ਤੁਹਾਡੀ ਬੇਨਤੀ ਕਿਸੇ predefined pattern ਜਾਂ domain ਨਾਲ ਮੇਲ ਨਹੀਂ ਖਾਂਦੀ, Siri ਕੋਲ ਅੱਗੇ ਜਾਣ ਲਈ ਕੋਈ ਰਾਹ ਨਹੀਂ ਸੀ। ਇਹ ਫੇਲ ਹੋ ਜਾਂਦਾ ਜਾਂ fallback ਵੈੱਬ ਖੋਜ 'ਤੇ ਹੋ ਜਾਂਦਾ।
ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲ (LLMs) ਨੇ ਇਸ ਮਾਡਲ ਨੂੰ ਉਲਟ ਦਿੱਤਾ। ਉਹ ਇੱਕ ਨਿਰ਼ਧਾਰਿਤ intents ਸੈੱਟ ਨੂੰ ਮੈਪ ਕਰਨ ਦੀ ਬਜਾਏ, ਕਿਸੇ ਅਨੁਕ੍ਰਮ ਵਿੱਚ ਅਗਲਾ ਸ਼ਬਦ ਅਨੁਮਾਨ ਕਰਨ ਲਈ ਟ੍ਰੇਨ ਕੀਤੇ ਜਾਂਦੇ ਹਨ, ਵੱਡੇ ਟੈਕਸਟ ਕੋਰਪਸ 'ਤੇ। ਇਹ ਸਧਾਰਨ ਲਕਸ਼
GPT-3 (2020) ਪਹਿਲਾ LLM ਸੀ ਜਿਸ ਨੇ ਗੁಣਤਮਕ ਤੌਰ 'ਤੇ ਵੱਖਰਾ ਮਹਿਸੂਸ ਕਰਵਾਇਆ: ਇੱਕ ਮਾਡਲ ਕੋਡ ਲਿਖ ਸਕਦਾ, ਮਾਰਕੇਟਿੰਗ ਕਾਪੀ ਡ੍ਰਾਫਟ ਕਰ ਸਕਦਾ, ਲੀਗਲ ਟੈਕਸਟ ਸਾਰ ਕਰ ਸਕਦਾ ਅਤੇ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਦੇ ਸਕਦਾ, ਬਿਨਾਂ ਟਾਸਕ-ਸਪੈਸ਼ਲਾਈਜ਼ਡ ਟ੍ਰੇਨਿੰਗ ਦੇ। ਪਰ ਇਹ ਅਜੇ ਵੀ ਇੱਕ "ਰਾਅ" ਮਾਡਲ ਸੀ—ਸ਼ਕਤਿਸ਼ਾਲੀ, ਪਰ ਸਟੀਅਰ ਕਰਨਾ ਔਖਾ।
Instruction tuning ਅਤੇ reinforcement learning from human feedback (RLHF) ਨੇ ਇਹ ਬਦਲ ਦਿੱਤਾ। ਖੋਜਕਾਰੀਆਂ ਨੇ ਮਾਡਲਾਂ ਨੂੰ ਉਦਾਹਰਣਾਂ 'ਤੇ ਫਾਈਨ-ਟਿਊਨ ਕੀਤਾ—ਜਿਵੇਂ “Write an email to…” ਜਾਂ “Explain quantum computing simply”—ਉਨ੍ਹਾਂ ਨੂੰ ਵਰਤੋਂਕਾਰ ਹਦਾਇਤਾਂ ਅਤੇ ਸੁਰੱਖਿਆ ਨਾਰਮਾਂ ਦੇ ਨਾਲ align ਕੀਤਾ। ਇਸ ਨਾਲ LLMs ਪ੍ਰਕ੍ਰਿਤਿਕ ਭਾਸ਼ਾ ਹਦਾਇਤਾਂ ਨੂੰ ਬੇਹਤਰ ਤਰੀਕੇ ਨਾਲ ਫਾਲੋ ਕਰਨ ਲੱਗੇ।
ਇੱਕ instruction-tuned ਮਾਡਲ ਨੂੰ ਇੱਕ ਸਥਾਈ ਚੈਟ ਇੰਟਰਫੇਸ ਵਿੱਚ ਲਪੇਟਣਾ—ਜੋ OpenAI ਨੇ 2022 ਦੇ ਅਖੀਰ ਵਿੱਚ ChatGPT ਨਾਲ ਕੀਤਾ—ਯੋਗਤਾ ਨੂੰ ਸਮਝਣਯੋਗ ਅਤੇ ਪਹੁੰਚਯੋਗ ਬਣਾ ਗਿਆ। ਯੂਜ਼ਰ:
Multimodal ਮਾਡਲਾਂ ਨਾਲ, ਇੱਕੋ ਸਿਸਟਮ ਹੁਣ ਟੈਕਸਟ, ਕੋਡ ਅਤੇ ਇਮੇਜਾਂ ਨੂੰ fluidly ਸੰਭਾਲ ਸਕਦਾ ਹੈ।
Siri ਦੇ ਸੰਕੁਚਿਤ, intent-ਬਾਊਂਡ ਸਕਿਲਜ਼ ਨਾਲ ਤੁਲਨਾ ਕੀਤੀ ਜਾਵੇ ਤਾਂ ChatGPT ਇੱਕ ਜਨਰਲ-ਪਰਪਜ਼ ਡਾਇਲਾਗ ਪਾਰਟਨਰ ਵਾਂਗ ਵਰਤਦਾ ਹੈ। ਇਹ ਵਿਸ਼ਿਆਂ 'ਤੇ ਤਰਕ ਕਰ ਸਕਦਾ, ਡ੍ਰਾਫਟ ਅਤੇ ਡੀਬੱਗ ਕਰ ਸਕਦਾ, ਬ੍ਰੇਨਸਟਾਰਮ ਕਰ ਸਕਦਾ ਅਤੇ ਸਮਝਾ ਸਕਦਾ—Apple-ਸਟਾਈਲ domain ਬਾਊਂਡਰੀਆਂ ਦੇ ਬਿਨਾਂ। ਇਹ ਬਦਲਾਅ—command slots ਤੋਂ open-ended conversation ਤੱਕ—ਉਹ ਗੱਲ ਹੈ ਜਿਸ ਨੇ Siri ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਪੁਰਾਣਾ ਦਿਖਾ ਦਿੱਤਾ।
Apple ਦੀ AI ਕਹਾਣੀ ਸਿਰਫ਼ ਅਲਗੋਰਿਦਮਾਂ ਬਾਰੇ ਨਹੀਂ; ਇਹ ਉਤਪਾਦ ਦਰਸ਼ਨ ਬਾਰੇ ਹੈ। ਉਹੀ ਚੋਣਾਂ ਜਿਨ੍ਹਾਂ ਨੇ iPhone ਨੂੰ ਭਰੋਸੇਯੋਗ ਅਤੇ ਮੁਨਾਫ਼ਾ-ਦਾਇਕ ਬਣਾਇਆ, Siri ਨੂੰ ਉਸੇ ਸਮੇਂ ਜਮਿਆ ਹੋਇਆ ਮਹਿਸੂਸ ਕਰਵਾਉਂਦੀਆਂ ਸਨ ਜਦ ChatGPT ਤੇਜ਼ੀ ਨਾਲ ਅੱਗੇ ਵਧਿਆ।
Apple ਨੇ Siri ਨੂੰ ਇੱਕ ਕੱਢੀ ਪ੍ਰਾਈਵੇਸੀ ਮਾਡਲ ਅਧੀਨ ਬਣਾਇਆ: ਡੇਟਾ ਕਲੈਕਸ਼ਨ ਘੱਟੋ-ਘੱਟ, persistent identifiers ਤੋ ਦੂਰ ਰਹਿਣਾ, ਅਤੇ ਜਿੰਨਾ ਹੋ ਸਕੇ ਉਤਨਾ on-device ਰੱਖਣਾ। ਇਹ ਯੂਜ਼ਰ ਅਤੇ ਨਿਯਮਕਾਂ ਲਈ ਤਸੱਲੀਕਾਰਕ ਸੀ, ਪਰ ਇਸਦੇ ਨੁਕਸਾਨ ਸੀ:
ਜਦੋਂ OpenAI ਅਤੇ ਹੋਰ ਵੱਡੇ ਡੇਟਾਸੈਟ ਅਤੇ ਸਰਵਰ ਲੌਗਾਂ 'ਤੇ LLMs ਟਰੇਨ ਕਰ ਰਹੇ ਸਨ, Apple ਨੇ ਵੌਇਸ ਡੇਟਾ ਨੂੰ ਜਲਦੀ ਬਰਖਾਸਤ ਜਾਂ ਭਾਰੀ ਤੌਰ 'ਤੇ anonymize ਕੀਤਾ। ਇਸ ਨਾਲ Siri ਦੀ ਗਲਤ, ਅਸਲੀ-ਦਿਨ ਬੇਨਤੀਆਂ ਨੂੰ ਸਮਝਣ ਦੀ ਸਮਰੱਥਾ LLMs ਦੀ ਤੁਲਨਾ ਵਿੱਚ ਕੰਝੀ ਰਹਿ ਗਈ।
Apple ਨੇ on-device ਪ੍ਰੋਸੈਸਿੰਗ ਲਈ ਜ਼ੋਰ ਦਿੱਤਾ। iPhones 'ਤੇ ਮਾਡਲ ਚਲਾਉਣ ਨਾਲ latency ਘਟਦੀ ਅਤੇ ਪ੍ਰਾਈਵੇਸੀ ਵਧਦੀ, ਪਰ ਇਹ ਸਾਲਾਂ ਤਕ ਮਾਡਲ ਆਕਾਰ ਅਤੇ ਜਟਿਲਤਾ ਨੂੰ ਸੀਮਤ ਰੱਖਦਾ।
Siri ਦੀਆਂ ਆਰਕੀਟੈਕਚਰਾਂ ਛੋਟੇ, ਵਿਸ਼ੇਸ਼ ਮਾਡਲਾਂ ਲਈ optimized ਸਨ ਜੋ ਕੁੱਝ Memory ਅਤੇ Energy budgets ਵਿੱਚ ਫ਼ਿੱਟ ਹੋ ਸਕਦੀਆਂ। ChatGPT ਅਤੇ ਇਸਦੇ ਬਾਂਦ੍ਹੀਦਾਰ ਵੱਡੇ ਮਾਡਲ ਕਲਾਉਡ ਉੱਤੇ ਵੱਡੇ GPU ਕਲੱਸਟਰਾਂ ਦੇ ਨਾਲ ਸਕੇਲ ਕੀਤੇ ਜਾਂਦੇ।
ਨਤੀਜਾ ਇਹ ਰਹੀ ਕਿ ਭਾਸ਼ਾਈ modeling ਦੇ ਹਰ ਬੜੇ ਕਦਮ—ਵੱਡੇ context windows, ਗੁੰਝਲਦਾਰ reasoning, emergent capabilities—ਪਹਿਲਾਂ ਕਲਾਉਡ-ਅਧਾਰਿਤ ਸਹਾਇਕਾਂ ਵਿੱਚ ਆਏ, Siri ਵਿੱਚ ਨਹੀਂ।
Apple ਦਾ ਕਾਰੋਬਾਰ ਹਾਰਡਵੇਅਰ margin ਅਤੇ ਘਣੇ ਇੰਟੀਗ੍ਰੇਟਿਡ ਸਰਵਿਸਾਂ 'ਤੇ ਗਿਰਦਾ ਹੈ। Siri ਨੂੰ ਇੱਕ ਐਸੇ ਫੀਚਰ ਵਜੋਂ ਰੱਖਿਆ ਗਿਆ ਜੋ iPhone, Apple Watch, ਅਤੇ CarPlay ਨੂੰ ਆਕਰਸ਼ਕ ਬਣਾਉਂਦਾ—ਇੱਕ standalone AI ਉਤਪਾਦ ਨਹੀਂ।
ਇਸ ਨੇ ਨਿਵੇਸ਼ ਨਿਰਣਿਆਂ ਨੂੰ ਰੂਪ ਦਿੱਤਾ:
ਨਤੀਜਾ: Siri ਵਿੱਚ ਸੁਧਾਰ ਆਇਆ, ਪਰ ਜ਼ਿਆਦਾਤਰ ਢੰਗ ਨਾਲ ਉਹ ਡਿਵਾਈਸ ਯੂਜ਼ ਕੇਸਾਂ (timers, messages, HomeKit) ਨੂੰ ਸਮਰਥਨ ਦਿੰਦਾ ਰਿਹਾ, ਨਾ ਕਿ ਵਿਸ਼ਾਲ, exploratory ਸਮੱਸਿਆ-ਹੱਲ।
ਸਭਿਆਚਾਰਕ ਤੌਰ 'ਤੇ, Apple ਅਜਿਹੇ ਕਿਸੇ ਵੀ ਅਧੂਰੇ ਲੱਗਣ ਵਾਲੇ ਚੀਜ਼ ਲਈ ਸੰਭਾਲਵਾਲਾ ਰਹਿੰਦਾ ਹੈ। public “beta” ਫੀਚਰ ਅਤੇ glitchy, ਪ੍ਰਯੋਗਤਮਕ ਇੰਟਰਫੇਸ ਇਸਦੇ ਬ੍ਰਾਂਡ ਨਾਲ ਠੀਕ ਨਹੀਂ ਬੈਠਦੇ।
ਬੜੇ ਭਾਸ਼ਾ ਮਾਡਲ, ਖਾਸ ਕਰਕੇ ਸ਼ੁਰੂਆਤੀ ਪੜਾਅ 'ਚ, ਗੁਲੂਕ, ਅਣਪਛਾਤੇ ਉੱਤਰ ਅਤੇ ਸੁਰੱਖਿਆ ਟਰੇਡ-ਆਫ਼ ਲਿਆਉਂਦੇ ਹਨ। OpenAI ਅਤੇ ਹੋਰ ਕੰਪਨੀਆਂ ਨੇ ਇਨ੍ਹਾਂ ਨੂੰ ਖੁੱਲ੍ਹੇ ਤੌਰ 'ਤੇ ship ਕੀਤਾ, research ਵਜੋਂ ਆਖਰ-ਕਾਰ iteration ਕੀਤਾ। Apple ਨੇ ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਇੱਕ ਅਣਪੂਰਨ Siri ਪ੍ਰਯੋਗ ਕਰਨ ਤੋਂ ਗੁਜ਼ਰਨਾ ਠੋਕਰ ਦਿੱਤੀ।
ਇਸ ਸੰਕੋਚ ਨੇ feedback ਲੂਪ ਨੂੰ ਘਟਾ ਦਿੱਤਾ। ਯੂਜ਼ਰ Siri ਵਿੱਚ ਰੈਡੀਕਲ ਨਵੇਂ ਵੈਹਾਰ ਨਹੀਂ ਵੇਖਣਗੇ, ਅਤੇ Apple ਨੂੰ ਉਹੀ usage data ਦਾ ਬਹੁਤ ਵੱਡਾ ਬੋਢ਼ ਨਹੀਂ ਮਿਲਿਆ ਜਿਸ ਨਾਲ ChatGPT ਤੇਜ਼ੀ ਨਾਲ ਸੁਧਰਿਆ।
ਪ੍ਰਾਈਵੇਸੀ-ਅਧਿਕਤ ਡੇਟਾ ਅਭਿਆਸ, on-device ਧਿਆਨ, hardware-first ਆਰਥਿਕਤਾ ਅਤੇ ਸੰਸਕਾਰਕ ਸਾਵਧਾਨੀ—ਇਨ੍ਹਾਂ ਵਿੱਚੋਂ ਹਰ ਇੱਕ ਆਪਣੇ ਆਪ ਵਿੱਚ ਸਮਝਦਾਰ ਸੀ। ਪਰ ਇਕੱਠੇ ਹੋਣ 'ਤੇ ਇਹ ਮਤਲਬ ਰਹਿਆ ਕਿ Siri ਨਿੱਘੇ, ਨਿਯੰਤਰਿਤ ਕਦਮਾਂ 'ਚ ਵਿਕਸਿਤ ਹੋਈ ਜਦ ਕਿ ChatGPT ਛੱਲੇ-ਛੱਲੇ ਉੱਠਿਆ।
ਕਸਟਮਰ Apple ਦੇ ਇਰਾਦਿਆਂ ਨਾਲ ਤੁਲਨਾ ਨਹੀਂ ਕਰਦੇ—ਉਹ ਤਜ਼ਰਬਾ ਦੇਖਦੇ ਹਨ: Siri ਅਜੇ ਵੀ ਕੁਝ ਸਧਾਰਨ, multi-step ਬੇਨਤੀਆਂ 'ਤੇ ਫੇਲ ਹੁੰਦੀ, ਜਦ ਕਿ ChatGPT complex questions, ਕੋਡ ਸਹਾਇਤਾ, ਬ੍ਰੇਨਸਟਾਰਮ ਅਤੇ ਹੋਰ ਜਾਣਕਾਰੀ ਦੇਣ ਵਿੱਚ ਬਹੁਤ ਬਿਹਤਰ ਸੀ।
ਜਦ Apple ਨੇ Apple Intelligence ਅਤੇ ChatGPT ਨੂੰ ਇੰਟੀਗ੍ਰੇਟ ਕਰਨ ਲਈ ਸਾਂਝ ਕੀਤੀ, ਤਾਂ ਯੂਜ਼ਰ ਧਾਰਣਾ ਵਿੱਚ ਮੋਹਰੀ ਜ਼ਾਹਿਰ ਹੋ ਗਈ: Siri ਉਹ ਸਹਾਇਕ ਬਣ ਗਿਆ ਜਿਸ ਤੋਂ ਤੁਸੀਂ ਗਲਤ ਸਮਝਣ ਦੀ ਉਮੀਦ ਰੱਖਦੇ ਹੋ; ChatGPT ਉਹ ਜਿਸ ਤੋਂ ਤੁਸੀਂ ਹੈਰਾਨ ਰਹਿਣ ਦੀ ਉਮੀਦ ਰੱਖਦੇ ਹੋ।
Siri ਸਿਰਫ਼ ਰੌਣਕ ਵਿਚ ਪਿੱਛੇ ਨਹੀਂ ਸੀ; ਇਹ ਉਸ ਤਰੀਕੇ ਨਾਲ ਸੰਕੁਚਿਤ ਸੀ ਜਿਸ ਨਾਲ Apple ਨੇ ਉਹਨਾਂ ਨੂੰ ਡਿਵੈਲਪਰਾਂ ਲਈ ਉਪਲਬਧ ਕਰਵਾਇਆ।
SiriKit ਨੇ ਇਕ-ਮੁੱਦੇ ਦੀਆਂ "domains" ਅਤੇ intents ਦੀ ਸੂਚੀ 'ਚ ਤੀਸਰੇ-ਪੱਖੀ ਐਪਾਂ ਨੂੰ ਹੀ ਸ਼ਾਮਲ ਕੀਤਾ: messaging, VoIP calls, ride booking, payments, workouts, ਆਦਿ।
ਜੇ ਤੁਸੀਂ ਇੱਕ note-taking ਐਪ, travel planner ਜਾਂ CRM ਬਣਾਉਂਦੇ, ਤਾਂ ਅਕਸਰ ਤੁਹਾਡੇ ਲਈ ਕੋਈ domain ਨਹੀਂ ਸੀ।_supported domains ਦੇ ਵੀਚਕਾਰ, ਉਨ੍ਹਾਂ ਨੂੰ Apple-ਦਿੱਤੇ intents (INSendMessageIntent, INStartWorkoutIntent) ਨਾਲ ਮੇਪ ਕਰਨਾ ਪੈਂਦਾ ਸੀ। ਕੁਝ ਹੋਰ ਕ੍ਰੀਏਟਿਵ ਵੀਚਾਰ Siri ਦੀ ਪਹੁੰਚ ਤੋਂ ਬਾਹਰ ਰਹਿ ਜਾਂਦੇ।
Invocation ਵੀ ਕਾਫੀ ਰਿੱਗਿਡ ਸੀ—ਯੂਜ਼ਰਾਂ ਨੂੰ patterns ਯਾਦ ਰੱਖਣੇ ਪੈਂਦੇ:
“Hey Siri, send a message with WhatsApp to John saying I’ll be late.”
ਜੇ ਉਨ੍ਹਾਂ ਨੇ ਇਹ ਵੱਖਰੇ ਤਰੀਕੇ ਨਾਲ ਕਿਹਾ, Siri ਅਕਸਰ Apple ਦੀ ਆਪਣੀ apps 'ਤੇ fallback ਜਾਂ ਫੇਲ ਹੋ ਜਾਂਦੀ। SiriKit extensions ਦੀ ਇੱਕ ਸਖ਼ਤ review, ਸੀਮਤ UI ਨਿਯੰਤਰਣ ਅਤੇ sandboxing experimentation ਦੀ ਹਿੰਮਤ ਘਟਾਉਂਦੇ।
ਨਤੀਜਾ: ਘੱਟ ਸਾਥੀ, ਪਤਲੇ ਇੰਟਿਗ੍ਰੇਸ਼ਨ ਅਤੇ ਇਹ ਭਾਵ ਕਿ “Siri skills” ਸਮੇਂ ਵਿੱਚ ਜਮ ਗਏ।
OpenAI ਨੇ ਵਧੀਏ ਉਲਟ ਮਾਰਗ ਲਿਆ। ਇੱਕ ਲੰਮੀ Domains ਦੀ ਸੂਚੀ ਦੇ ਬਦਲੇ, ਇਸਨੇ ਇੱਕ ਜਨਰਲ ਟੈਕਸਟ ਇੰਟਰਫੇਸ ਖੋਲ੍ਹ ਦਿੱਤਾ ਅਤੇ function calling, embeddings, fine-tuning ਵਰਗੇ ਟੂਲ ਦਿੱਤੇ।
ਡਿਵੈਲਪਰ ਇੱਕੋ API ਨਾਲ:
ਕੋਈ ਵੱਖਰਾ ਪ੍ਰੋਗਰਾਮ ਜਾਂ domain whitelist ਨਹੀਂ—ਸਿਰਫ ਨੀਤੀਆਂ ਅਤੇ ਕੀਮਤ।
ਕਿਉਂਕਿ experimentation ਸਸਤਾ ਅਤੇ ਲਚਕੀਲਾ ਸੀ, ਹਜ਼ਾਰਾਂ ਐਪਾਂ ਨੇ ਅਜਿਹੇ ਨਵੇਂ ਖਿਆਲਾਂ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ। ਬਹੁਤ ਸਾਰੇ ਫੇਲ ਹੋਏ, ਪਰ ecosystem ਜਲਦੀ ਵਿਕਸਤ ਹੋ ਗਿਆ ਜੋ ਕੰਮ ਕਰਦਾ।
ਜਿਵੇਂ ChatGPT-ਚਾਲਿਤ ਔਜ਼ਾਰ ਹਫਤੇ-ਹਫਤੇ ਸੁਧਰਦੇ ਗਏ, Siri ਇੰਟਿਗ੍ਰੇਸ਼ਨ ਬਹੁਤ ਘੱਟ ਬਦਲੇ। ਯੂਜ਼ਰਾਂ ਨੇ ਇਹ ਨੋਟ ਕੀਤਾ। Siri static ਅਤੇ brittle ਮਹਿਸੂਸ ਹੋਇਆ, ਜਦਕਿ LLM ਆਧਾਰਿਤ ਉਤਪਾਦ ਲਗਾਤਾਰ ਨਵੇਂ ਯੂਜ਼ਕੇਸ ਨਾਲ ਲੋਕਾਂ ਨੂੰ ਹੈਰਾਨ ਕਰ ਰਹੇ ਸਨ।
Ecosystem ਡਿਜ਼ਾਇਨ—ਸਿਰਫ ਮਾਡਲ ਦੀ ਕੁਆਲਿਟੀ ਨਹੀਂ—Siri vs ChatGPT ਦਾ ਫ਼ਰਕ ਇੰਨਾ ਵੱਡਾ ਕਰਦਾ ਹੈ।
ਬਹੁਤ ਸਾਰਿਆਂ ਲਈ “Hey Siri” ਇੱਕ ਮੀਲ-ਪੱਥਰ ਹੋ ਗਿਆ ਜਿਸਦਾ ਮਤਲਬ ਸੀ ਹਲਕੀ ਨਿਰਾਸ਼ਾ। ਰੋਜ਼ਾਨਾ ਦੇ ਲਮ੍ਹੇ ਇਕੱਠੇ ਹੋਏ:
ਸਮੇਂ ਨਾਲ, ਯੂਜ਼ਰਾਂ ਨੇ ਆਪਣੀ ਬੋਲਣੀ ਢੰਗ ਨੂੰ ਛੋਟੇ ਤੇ ਫਾਰਮੂਲੇਟਿਕ ਕਮਾਡਜ਼ ਤੱਕ ਸੀਮਤ ਕਰ ਦਿੱਤਾ। ਖੁੱਲ੍ਹੇ-ਅੰਤ ਸਵਾਲ ਘੱਟ ਪੁਛੇ ਜਾਣ ਲੱਗੇ ਕਿਉਂਕਿ ਉੱਤਰ ਸਤਹੀ ਜਾਂ ਵੈੱਬ ਖੋਜ-ਹਵਾਲੇ ਹੁੰਦੇ। ਜਦੋਂ ਵੌਇਸ ਫੇਲ ਹੁੰਦੀ, ਲੋਕ ਟਾਈਪ ਕਰਨ ਵੱਲ ਮੁੜ ਆ ਗਏ।
ਸੱਭਿਆਚਾਰਕ ਤੌਰ 'ਤੇ Siri ਇੱਕ punchline ਬਣ ਗਿਆ—late-night jokes, YouTube compilations ਅਤੇ memes Siri ਦੀ ਗਲਤੀਆਂ 'ਤੇ ਧਰਮਕਥਾ ਬਣਾ ਲੈਂਦੇ।
ChatGPT ਨੇ ਉਹ ਭਾਵਨਾ ਬਦਲ ਦਿੱਤੀ। ਗਲਤ ਸੁਣਨ ਦੀ ਥਾਂ, ਯੂਜ਼ਰਾਂ ਨੇ ਵਿਸਥਾਰਪੂਰਨ, ਗੱਲ-ਬਾਤੀ ਉੱਤਰ ਵੇਖੇ:
ਇੰਟਰੈਕਸ਼ਨ ਮਾਡਲ ਛੋਟੀਆਂ ਟ੍ਰਾਂਜ਼ੈਕਸ਼ਨਲ ਕਮਾਂਡਾਂ—“set a timer,” “what’s the weather,” “text Alex I’m late”— ਤੋਂ ਲੰਬੇ, ਡੀਪ ਸਹਾਇਕ ਤੱਕ ਵਧ ਗਿਆ: “Help me design a study plan,” “Rewrite this contract in plain English,” “Walk me through this bug.”
ਜਦੋਂ ਲੋਕਾਂ ਨੂੰ ਲੱਗਾ ਕਿ ਸਹਾਇਕ ਸੰਦਰਭ ਯਾਦ ਰੱਖ ਸਕਦਾ, ਡਰਾਫਟ ਸੁਧਾਰ ਸਕਦਾ ਅਤੇ ਕਈ ਕਦਮਾਂ 'ਤੇ reasoning ਕਰ ਸਕਦਾ ਹੈ, ਉਮੀਦਾਂ ਕਈ ਪੱਧਰ ਉੱਪਰ ਚਲੀ ਗਈਆਂ। Siri ਦੇ ਥੋੜ੍ਹੇ-ਥੋੜ੍ਹੇ ਸੁਧਾਰ—ਥੋੜ੍ਹੀ ਬਿਹਤਰ dictation, ਥੋੜ੍ਹਾ ਤੇਜ਼ ਜਵਾਬ—ਨਵੇਂ ਮਾਪਦੰਡ ਦੇ ਅੱਗੇ ਛੋਟੇ ਅਤੇ ਲੁਕਾਊ ਮਹਿਸੂਸ ਹੋਣ ਲੱਗੇ।
ChatGPT ਨੇ ਸਹਾਇਕਾਂ ਲਈ ਮਿਆਰ ਨੂੰ ਬਦਲ ਦਿੱਤਾ: "ਵੌਇਸ ਰਿਮੋਟ" ਤੋਂ "ਸੋਚ-ਸੰਬੰਧੀ ਸਾਥੀ"। ਸਿਰਫ਼ ਟਾਇਮਰ ਲੱਗਾਉਣ ਜਾਂ ਸੈਟਿੰਗ ਬਦਲਣ ਦੀ ਥਾਂ, ਯੂਜ਼ਰਾਂ ਕੋਲ ਹੁਣ ਇਕ ਐਸਾ ਸਹਾਇਕ ਹੈ ਜੋ ਮੁਕੰਮਲ ਕੰਮ-ਉਤਪਾਦ ਤਿਆਰ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦਾ ਹੈ।
ChatGPT ਨੇ ਸਧਾਰਨ ਬਣਾਇਆ ਕਿ ਇੱਕ ਸਹਾਇਕ ਇਹਨਾਂ ਕੰਮਾਂ ਲਈ ਸਹਾਇਕ ਹੋਵੇ:
ਮੁੱਖ ਬਦਲਾਅ ਇਹ ਨਹੀਂ ਕਿ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਆਉਂਦੇ—ਬਲਕਿ ਇਹ ਹੈ ਕਿ ਸਹਾਇਕ ਤਿਆਰ ਉਤਪਾਦ ਉਤਪੰਨ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ। ਲੋਕ ਦਸਤਾਵੇਜ਼, spreadsheets ਅਤੇ ਕੋਡ ਟੁਕੜੇ ਪੇਸਟ ਕਰਕੇ ਇੱਕ ਸੋਚ-ਸਹਾਇਕ ਉਮੀਦ ਕਰਦੇ ਹਨ।
LLMs ਨੇ ਇੱਕ ਸਥਿਰਤਾ ਦੀ ਭਾਵਨਾ ਦਿਤੀ। ChatGPT:
ਟੂਲ ਅਤੇ plugins ਨਾਲ, ਇਹ ਵਰਕਫਲੋਜ਼ ਤੱਕ ਵਧਦਾ: apps ਤੋਂ ਡਾਟਾ ਖਿੱਚਣਾ, ਉਸਦੀ ਤਬਦੀਲ ਕਰਕੇ ਨਤੀਜੇ ਨੂੰ ਈਮੇਲ, ਰਿਪੋਰਟ ਜਾਂ ਕੋਡ ਚੇਨਜ ਵਿੱਚ ਬਦਲ ਦينا। ਇਹੀ ਹੈ ਜੋ ਵਰਤੋਂਕਾਰ ਹੁਣ “ਸਹਾਇਕ” ਨਾਲ ਮੰਗਦੇ ਹਨ—ਇੱਕ ਇਹੋ ਜੈਸੀ ਚੀਜ਼ ਜੋ ਮਨ ਦਾ ਕੰਮ ਕਰ ਸਕੇ।
ਇਸ ਸੰਦਰਭ ਵਿੱਚ Siri ਦੀ ਮੁੱਖ ਤਾਕਤ—ਤੇਜ਼ ਅਤੇ ਭਰੋਸੇਯੋਗ ਡਿਵਾਈਸ ਕੰਟਰੋਲ—ਛੋਟੀ ਲੱਗਣ ਲੱਗੀ। ਇੱਥੇ Siri ਬਹੁਤ ਚੰਗਾ ਹੈ: alarms, messages, calls, media, ਅਤੇ smart home control।
ਪਰ ਜਦੋਂ ਉਮੀਦ ਇੱਕ ਐਸੇ ਸਹਾਇਕ ਦੀ ਹੋਵੇ ਜੋ reasoning ਕਰ ਸਕੇ, ਸੰਦਰਭ ਰੱਖ ਸਕੇ, ਅਤੇ ਕਈ ਕਦਮਾਂ 'ਤੇ ਕੰਮ ਕਰ ਸਕੇ, ਤਾਂ ਇੱਕ ਸਿਸਟਮ ਜੋ ਮੁੱਖ ਤੌਰ 'ਤੇ ਸਵਿੱਚਾਂ ਨੂੰ ਪਲਟਦਾ ਹੈ ਉਦਾਸੀਨ ਰਹਿ ਜਾਂਦਾ ਹੈ।
ਕਈ ਸਾਲਾਂ ਦੀਆਂ ਧੀਮੀ Siri ਅੱਪਡੇਟਾਂ ਬਾਅਦ, Apple ਦੀਆਂ 2024 ਘੋਸ਼ਣਾਵਾਂ ਨੇ ਅਖ਼ਿਰਕਾਰ ਇਸਦੀ AI ਰਣਨੀਤੀ ਨੂੰ ਇੱਕ ਨਾਂ ਅਤੇ ਢਾਂਚਾ ਦਿੱਤਾ: Apple Intelligence।
(ਅਗਲੇ ਸੈਕਸ਼ਨਾਂ ਵਿੱਚ ਪਹਿਲਾਂ ਵਰਣਿਤ ਬਦਲਾਅ ਦੇ ਵਰਣਨ ਦੇ ਨਾਲ-ਨਾਲ ਇਹ ਕਿ Apple ਕਿਵੇਂ Siri ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਿਹਾ ਹੈ—ਜੋ ਓਹਲੇ ਹੀ ਉਪਰ ਦਰਸਾਏ ਗਏ ਹਨ—ਇਹ ਆਪ ਵਿੱਚ ਉਹੀ ਜਾਣਕਾਰੀ ਦੋਹਰਾਉਂਦੇ ਹਨ ਜੋ ਪੂਰਵ ਵਿੱਚ ਉਪਲਬਧ ਹੈ)।
Siri ਨੂੰ ਇੱਕ ਫਿਕਸਡ ਸੈੱਟ ਦੇ ਟਾਸਕਾਂ ਲਈ ਵੌਇਸ ਇੰਟਰਫੇਸ ਬਣਾਇਆ ਗਿਆ ਸੀ, ਜਦਕਿ ChatGPT ਨੂੰ ਇੱਕ ਜਨਰਲ-ਪਰਪਜ਼ ਲੈੰਗਵੇਜ ਮਾਡਲ ਦੇ ਤੌਰ ‘ਤੇ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ ਜੋ ਵੱਖ-ਵੱਖ ਡੋਮੇਨ ਵਿੱਚ ਤਕਨੀਕੀ ਅਤੇ ਰਚਨਾਤਮਕ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ।
ਮੁੱਖ ਤਫ਼ਾਵਤ:
ਆਰਕੀਟੈਕਚਰ
ਕਾਬਲਿਅਤਾਂ
ਅਨਟਰੇਕਸ਼ਨ ਅੰਦਾਜ਼
ਧਾਰਣਾ
Siri ਪਿੱਛੇ ਰਹਿ ਗਿਆ ਨਾ ਕਿ ਇਸ ਲਈ ਕਿ Apple ਕੋਲ AI ਟੈਲੈਂਟ ਨਹੀਂ ਸੀ, ਪਰ ਕਿਉਂਕਿ ਕੁਝ रणਨੀਤਕ ਤੇ ਉਤਪਾਦੀ ਫੈਸਲਿਆਂ ਨੇ ਦਿਖਾਵਟੀ ਤਰੱਕੀ ਨੂੰ ਰੋਕਿਆ।
ਮੁੱਖ ਕਾਰਨ:
Siri ਦਾ ਅਸਲ ਸਿਸਟਮ:
set_alarm, send_message, ਜਾਂ play_song।Apple ਦੇ ਫੈਸਲੇ ਇਕੱਲੇ ਢੰਗ ਨਾਲ ਸਮਝਦਾਰ ਸਨ, ਪਰ ਇੱਕਠੇ ਹੋਣ 'ਤੇ Siri ਦੀ ਵਿਕਾਸ ਰਫ਼ਤਾਰ ਨੂੰ ਰੋਕਿਆ।
ਮੁੱਖ ਉਤਪਾਦੀ ਫੈਸਲੇ:
Siri ਸਿਰਫ਼ ਖ਼ੁਰਾਕੀ ਮਨੁੱਖੀ ਬੁੱਝ ਨਾਲ ਨਹੀਂ ਪਿੱਛੇ ਰਹਿ ਗਿਆ—ਉਸਦੇ developer-facing ਚੋਣਾਂ ਨੇ ਵੀ ਬੰਦਿਆ ਕੀਤਾ।
SiriKit ਸਿਰਫ਼ ਕੁਝ ਪੂਰਵੇ-ਨਿਰਧਾਰਤ domains ਅਤੇ intents ਦਿੰਦਾ ਸੀ: messaging, VoIP, ride booking, payments, workouts, ਆਦਿ।
ਨੋਟ‑ਟੇਕਿੰਗ ਐਪ ਜਾਂ travel planner ਵਰਗੀਆਂ ਬਹੁਤ ਸਾਰੀਆਂ ਐਪਾਂ ਲਈ ਅਕਸਰ ਕੋਈ domain ਨਹੀਂ ਸੀ। ਭੀਤਰਲੇ supported domains ਵਿੱਚ ਵੀ ਵਰਕ-ਮੈਪਿੰਗ Apple-ਨਿਰਧਾਰਤ intents (ਜਿਵੇਂ INSendMessageIntent ਜਾਂ INStartWorkoutIntent) 'ਚ ਹੀ ਹੋ ਸਕਦੀ ਸੀ।
ਲੰਬੇ ਸਮੇਂ ਵਿੱਚ ਯੂਜ਼ਰਾਂ ਦੀ ਧਾਰਣਾ ਬਦਲ ਗਈ: “Hey Siri” ਤੋਂ ਨਿਰਾਸ਼ਾ ਤੱਕ, ChatGPT ਤੋਂ ਉਤਸ਼ਾਹ ਤੱਕ।
ਕਈ ਲੋਕਾਂ ਲਈ “Hey Siri” ਇੱਕ ਹਲਕੀ ਨਿਰਾਸ਼ਾ ਦੀ ਵਿਆਖਿਆ ਬਣ ਗਿਆ। ਰੋਜ਼ਮਰਾ ਵੱਖ-ਵੱਖ ਮਿਸਲਾਂ:
ਲੋਕਾਂ ਨੇ ਅਖੀਰਕਾਰ ਗਲਤ-ਨੁਮਾਇਸ਼ ਭਾਸ਼ਾ ਅਪਣਾਈ—ਛੋਟੇ, ਫ਼ਾਰਮੂਲੇਟਿਕ ਕਮਾਂਡਾਂ। ਬੋਲ ਕੇ ਖੁੱਲੇ-ਅੰਤ ਵਾਲੇ ਸਵਾਲਾਂ ਪੁੱਛਨਾ ਘੱਟ ਹੋ ਗਿਆ ਕਿਉਂਕਿ ਉੱਤਰ ਸਤਹੀ ਹੁੰਦੇ। ਜਦੋਂ ਵੌਇਸ ਫੇਲ ਹੁੰਦੀ, ਲੋਕ ਟਾਈਪ ਕਰਨ ਵੱਲ ਮੁੜ ਗਏ।
ChatGPT ਨੇ ਸਹਾਇਕਾਂ ਦੀ ਪਰਿਭਾਸ਼ਾ ਬਦਲ ਦਿੱਤੀ: ਇੱਕ "ਵੌਇਸ ਰਿਮੋਟ" ਤੋਂ "ਸੋਚਣ ਵਾਲੇ ਸਾਥੀ" ਤੱਕ। ਇੱਕੋ ਹੀ ਪਲੇਟਫਾਰਮ ਵਿੱਚ ਲਿਖਣ, ਕੰਮ ਕਰਨ ਅਤੇ ਸੋਚਣ ਦੀ ਸਮਰੱਥਾ ਆ ਗਈ।
ChatGPT ਨੇ ਸਧਾਰਨ ਬਣਾਇਆ ਕਿ ਇਕ ਸਹਾਇਕ ਇਹ ਕਰ ਸਕੇ:
ਕੀਮਤੀ ਬਦਲਾਅ ਇਹ ਸੀ ਕਿ ਸਹਾਇਕ ਉੱਤਰ ਦੇਣ ਹੀ ਨਹੀਂ, ਬਲਕਿ ਤਿਆਰ ਉਤਪਾਦਾਂ ਨੂੰ ਪੈਦਾ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦਾ। ਲੋਕਾਂ ਨੇ ਡਾਕਯੂਮੈਂਟ ਜਾਂ ਕੋਡ ਪੇਸਟ ਕਰਕੇ ਸੋਚ-ਵਿਚਾਰ ਕਰਨਾ ਆਮ ਕਰ ਲਿਆ।
2024 ਦੀਆਂ ਘੋਸ਼ਣਾਵਾਂ ਨਾਲ Apple ਨੇ ਆਪਣੀ AI ਰਣਨੀਤੀ ਲਈ ਇੱਕ ਨਾਂ ਦਿੱਤਾ: Apple Intelligence।
Apple ਨੇ Apple Intelligence ਨੂੰ ਇੱਕ ਸਿਸਟਮ ਫੀਚਰ ਵਜੋਂ ਪੇਸ਼ ਕੀਤਾ:
Apple ਨੇ ਨਵੇਂ ਹਾਰਡਵੇਅਰ (A17 Pro ਅਤੇ M-ਸਿਰੀਜ਼ ਚਿਪ) ਤੇ ਕੁਝ ਫੀਚਰ ਸੀਮਤ ਰੱਖੇ—ਇਹ ਸੰਕੇਤ ਕਰਦਾ ਹੈ ਕਿ ਸਚਮੁਚੀ AI ਫੀਚਰਾਂ ਲਈ ਮਹੱਤਵਪੂਰਨ on-device ਕੰਪਿਊਟ ਦੀ ਲੋੜ ਹੈ।
ਜਦੋਂ ਲੋਕ ਕਹਿੰਦੇ ਹਨ ਕਿ Apple ਨੇ Siri ਨਾਲ AI ਜੰਗ ਹਾਰ ਲਈ, ਉਹ ਆਮ ਤੌਰ 'ਤੇ ਹਾਰਿਆ ਨਹੀਂ ਬਲਕਿ ਇੱਕ ਖਾਸ ਕਿਸਮ ਦੀ ਆਗੂਈ ਗਵਾਂ ਚੁੱਕੇ ਹਨ: ਕਿਹੜਾ ਸਹਾਇਕ ਕੀ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ।
Apple ਨੇ ਤਿੰਨ ਮਹੱਤਵਪੂਰਨ ਕਿਸਮ ਦੀਅਾਂ ਆਗੂਈਆਂ ਗੁਆਈਆਂ:
Siri ਦੀ ਕਹਾਣੀ ਤਿਆਰੀਆਂ ਲਈ ਸਿੱਖਣਯੋਗ ਹੈ—ਅਤਿ-ਪਹਿਲੀ ਕਦਰ ਹੋਣ ਦੇ ਬਾਵਜੂਦ, ਜੇ ਤੁਰੰਤ ਅਤੇ ਦਿਖਾਈ ਦੇਣ ਵਾਲੀ ਤਰੱਕੀ ਨਾ ਹੋਵੇ ਤਾਂ ਇਹ ਫਿਰ ਛਿੱਕੜ ਸਕਦੀ ਹੈ।
ਮੁੱਖ ਸਬਕ:
ਹਾਂ—Apple ਕੋਲ ਅਜੇ ਵੀ ਮੁਕਾਬਲਾ ਕਰਨ ਲਈ ਪ੍ਰਬਲ ਅਸੈਟ ਹਨ, ਪਰ ਉਹ narrative lead ਗੁਆ ਚੁੱਕਾ ਹੈ ਕਿ ਇਕ ਸਹਾਇਕ ਕਿਸ ਤਰ੍ਹਾਂ ਦਾ ਹੁੰਦਾ ਹੈ।
Apple ਕੋਲ ਜੋ ਹੈ:
ਜੋ ਗੁਆ:
ਇਨ੍ਹਾਂ ਕਾਰਨਾਂ ਕਰਕੇ ChatGPT ਅਤੇ ਸਮਾਨ মਾਡਲ ਹਫਤਿਆਂ-ਹਫਤਿਆਂ ਦਿਸ਼ਾ-ਸਪȘਟ ਤਰੱਕੀ ਦਿਖਾ ਰਹੇ ਸਨ, ਜਿਸ ਨਾਲ ਯੂਜ਼ਰਾਂ ਦੀਆਂ ਉਮੀਦਾਂ ਬਦਲ ਗਈਆਂ।
ChatGPT ਵਰਗੇ LLMs:
ਅਮਲ ਵਿੱਚ, ਇਹ LLMs ਨੂੰ ਜ਼ਿਆਦਾ ਲਚਕੀਲਾ ਬਣਾਉਂਦਾ ਹੈ: ਇਹ ਗੰਦੇ, multi-part ਸਵਾਲਾਂ ਨੂੰ ਪ੍ਰਭਾਵਤ ਢੰਗ ਨਾਲ ਸਹਿਯੋਗ ਕਰ ਸਕਦੇ ਹਨ, ਜਿਨ੍ਹਾਂ ਲਈ Siri ਕੋਲ explicit intents ਨਹੀਂ ਸਨ।
ਕੜੀ ਪ੍ਰਾਈਵੇਸੀ ਮਾਡਲ
On-device processing ਭੁੱਲ
Hardware-first ਧਨ-ਨਿਵੇਸ਼
ਅਨੁਭਵਕਾਰੀ ਸਾਵਧਾਨੀ
ਇਨ੍ਹਾਂ ਸਭ ਨੇ Siri ਨੂੰ ਛੋਟੇ, ਨਿਯੰਤਰਿਤ ਕਦਮਾਂ 'ਚ ਸੁਧਾਰ ਦਿਤੇ, ਜਦਕਿ LLM-ਅਧਾਰਿਤ ਸਹਾਇਕ ਤੇਜ਼ੀ ਨਾਲ ਤਰੱਕੀ ਕਰ ਰਹੇ ਸਨ।
Invocation ਵੀ ਰਿੱਗਿਡ ਸੀ—ਯੂਜ਼ਰਾਂ ਨੂੰ patterns ਯਾਦ ਰੱਖਣੇ ਪੈਂਦੇ: “Hey Siri, send a message with WhatsApp to John saying I’ll be late.”
ਇਸ ਦਾ ਨਤੀਜਾ: ਘੱਟ ਭਾਗੀਦਾਰ, ਪਤਲੇ ਇੰਟਿਗ੍ਰੇਸ਼ਨ ਅਤੇ ਇੱਕ ਐਹਸਾਸ ਕਿ “Siri skills” ਜ਼ਮੀਂ 'ਤੇ ਜਹਿਰ ਹੋ ਰਹੇ ਹਨ।
OpenAI ਨੇ ਵਰਤੋਂਕਾਰਾਂ ਨੂੰ ਇੱਕ ਜਨਰਲ ਟੈਕਸਟ ਇੰਟਰਫੇਸ ਦਿੱਤਾ ਅਤੇ ਬਾਅਦ ਵਿੱਚ function calling, embeddings ਅਤੇ fine-tuning ਵਰਗੇ ਟੂਲ।
ਵਿਕਾਸਕਾਰ ਇੱਕੋ API ਨਾਲ:
ਖਜ਼ਾਨਾ-ਖਰਚ ਅਤੇ ਨੀਤੀਆਂ ਸਗੋਂ, experimentation ਸਸਤਾ ਅਤੇ ਲਚਕੀਲਾ ਹੋਇਆ, ਜਿਸ ਨਾਲ ਹਜ਼ਾਰਾਂ ਐਪਾਂ ਨੇ ਨਵੇਂ ਹਲਾਂ ਕੋਸ਼ਿਸ਼ ਕੀਤੇ।
ਜਿਵੇਂ ChatGPT-ਚਾਲਿਤ ਟੂਲ ਹਫਤੇ-ਹਫਤੇ ਸੁਧਰਦੇ ਗਏ, Siri ਇੰਟਿਗ੍ਰੇਸ਼ਨਾਂ 'ਚ ਬਹੁਤ ਘੱਟ ਬਦਲਾਅ ਆਏ। ਯੂਜ਼ਰਾਂ ਨੂੰ ਇਹ ਨਜ਼ਰ ਆਇਆ—Siri static ਅਤੇ brittle ਲੱਗਣ ਲੱਗਾ, ਜਦਕਿ LLM ਉਤਪਾਦ ਨਵੇਂ ਕਾਬਲਿਅਤਾਂ ਨਾਲ ਲੋਕਾਂ ਨੂੰ ਹੈਰਾਨ ਕਰ ਰਹੇ ਸਨ।
ਇਹ ਵੇਖਾਉਂਦਾ ਹੈ ਕਿ ecosystem ਡਿਜ਼ਾਇਨ—ਸਿਰਫ਼ ਮਾਡਲ ਕੁਆਲਿਟੀ ਨਹੀਂ—Siri ਅਤੇ ChatGPT ਦੇ ਵਿਚਕਾਰ ਵੱਡਾ ਫਰਕ ਬਣਾਉਂਦਾ ਹੈ।
ਸੱਭਿਆਚਾਰਕ ਤੌਰ 'ਤੇ Siri ਮਜ਼ਾਕ ਬਣ ਗਿਆ—ਏਕੋ-ਕਲਿੱਪ, ਯੂਟਿਊਬ ਕੰਪਾਈਲੇਸ਼ਨ ਅਤੇ memes Siri ਦੇ ਗਲਤ ਸਮਝਣ ਨੂੰ ਲੈ ਕੇ ਘੁੰਮੇ।
ChatGPT ਨੇ ਇਹ ਭਾਵਨਾ ਬਦਲ ਦਿੱਤੀ—ਲੋਕਾਂ ਨੇ ਵਿਸਥਾਰਪੂਰਨ, ਗੱਲ-ਬਾਤੀ ਉੱਤਰ ਵੇਖੇ:
ਇੰਟਰੈਕਸ਼ਨ ਮਾਡਲ ਛੋਟੇ ਟ੍ਰਾਂਜ਼ੈਕਸ਼ਨਲ ਕਮਾਂਡਾਂ ਤੋਂ ਉੱਪਰ ਚਲ ਗਿਆ—ਹੋਇਆ ਇਹ ਕਿ ਵਰਤੋਂਕਾਰਾਂ ਨੇ ਇੱਕ ਸਹਾਇਕ ਨੂੰ ਪ੍ਰਤੀ-ਸਮੱਸਿਆ ਹੱਲ ਕਰਨ ਵਾਲਾ ਸਮਝਣਾ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤਾ।
ਜਦੋਂ ਲੋਕਾਂ ਨੇ ਵੇਖਿਆ ਕਿ ਇੱਕ ਸਹਾਇਕ ਸੰਦੇਸ਼ ਯਾਦ ਰੱਖ ਸਕਦਾ, ਡਰਾਫਟ ਸੁਧਾਰ ਸਕਦਾ, ਅਤੇ ਕਦਮ-ਬ-ਕਦਮ ਕਾਰਵਾਈ ਕਰ ਸਕਦਾ ਹੈ, ਤਾਂ AI ਦੀ ਉਮੀਦਾਂ ਕਈ ਪੱਧਰਾਂ ਤੇ ਉੱਪਰ ਚਲੀ ਗਈਆਂ। ਇਸ ਨਵੇਂ ਮਾਪਦੰਡ ਦੇ ਅੱਗੇ Siri ਦੇ ਥੋੜ੍ਹੇ-ਥੋੜ੍ਹੇ ਸੁਧਾਰ ਧੁੰਦਲੇ ਲੱਗਣ ਲੱਗੇ।
LLMs ਨੇ ਸਤਤਤਾ ਅਤੇ ਸੰਦਰਭ ਦਾ ਭਰੋਸਾ ਦਿੱਤਾ। ChatGPT:
ਟੂਲ ਅਤੇ ਪਲੱਗਇਨ ਨਾਲ ਇਹ ਵਰਕਫਲੋਜ਼ ਤਕ ਵਧਦਾ: ਡਾਟਾ ਖਿੱਚਣਾ, ਤਬਦੀਲ ਕਰਨਾ, ਅਤੇ ਨਤੀਜੇ ਈਮੇਲ ਜਾਂ ਰਿਪੋਰਟਾਂ ਵਜੋਂ ਤਿਆਰ ਕਰਨਾ। ਇਹੀ ਉਹ ਗੱਲ ਹੈ ਜਿਸ ਨੂੰ ਵਰਤੋਂਕਾਰ ਹੁਣ “ਸਹਾਇਕ” ਕਹਿਣਾ ਚਾਹੁੰਦੇ ਹਨ।
ਇਸ ਪਿਛੋਕੜ ਵਿੱਚ Siri ਦੀ ਮੁੱਖ ਤਾਕਤ—ਭਰੋਸੇਯੋਗ ਡਿਵਾਈਸ ਕੰਟਰੋਲ ਅਤੇ ਛੋਟੀਆਂ, ਹੱਥ-ਮੁਕਾਬਲੇ ਕਮਾਂਡਾਂ—ਹੌਲੀ ਲੱਗਣ ਲੱਗੀ। ਇਹ ਡਿਵਾਈਸ-ਅਧਾਰਿਤ ਕੰਮਾਂ ਵਿੱਚ ਬਢੀਆ ਹੈ: alarms, messages, calls, media, ਅਤੇ smart home control।
ਪਰ ਜਦੋਂ ਉਮੀਦਾਂ ਇੱਕ ਐਸੇ ਸਹਾਇਕ ਦੀ ਹੋਣ ਲੱਗੀਆਂ ਜੋ reasoning ਅਤੇ context ਰੱਖ ਸਕੇ, ਤਾਂ ਇੱਕ ਸਿਸਟਮ ਜੋ ਮੁੱਖ ਰੂਪ ਵਿੱਚ ਸਵਿੱਚ ਚਲਾਉਂਦਾ ਹੈ, "ਸਮਾਰਟ" ਦੀ ਪਰਿਭਾਸ਼ਾ ਤੋਂ ਬਾਹਰ ਰਹਿ ਗਿਆ।
Apple ਆਪਣੀ ਪ੍ਰਾਈਵੇਸੀ ਕਹਾਣੀ ਦੋਹਰਾਉਂਦਾ:
ਇਸ ਨਾਲ Apple LLM-ਪੈਮਾਨੇ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਬਸਾਉਣ ਦੇ ਬਾਵਜੂਦ ਆਪਣੀ ਪ੍ਰਾਈਵੇਸੀ ਬ੍ਰਾਂਡ ਨੂੰ ਨਹੀਂ ਛੱਡਦਾ।
Apple Intelligence ਦੇ ਅੰਦਰ Siri ਨੂੰ ਆਖ਼ਿਰਕਾਰ ਇੱਕ ਭਾਰੀ ਅੱਪਗ੍ਰੇਡ ਮਿਲ ਰਹੀ ਹੈ:
ਇਹ ਤਬਦੀਲੀਆਂ Siri ਨੂੰ LLM-ਅਧਾਰਿਤ ਅਨੁਭਵਾਂ ਵੱਲ ਲਿਜਾਣ ਦਾ ਉਦੇਸ਼ ਰੱਖਦੀਆਂ ਹਨ।
LLM-ਸ਼ਿਫਟ ਦੀ ਸਭ ਤੋਂ ਦਿਖਾਈ ਦੇਣ ਵਾਲੀ ਮੰਨਤਾ Apple ਦੀ OpenAI ਨਾਲ ਸਿੱਧੀ ਭਾਗੀਦਾਰੀ ਹੈ। ਜਦੋਂ Siri ਜਾਂ Apple Intelligence ਗਣੇ ਸੁਲਝੇ ਹੋਏ ਜਾਂ ਰਚਨਾਤਮਕ ਪ੍ਰਸ਼ਨ ਨੂੰ ਬਹੁਤ ਖੁੱਲਾ-ਅੰਤ ਸਮਝੇ, ਉਪਭੋਗਤਾ:
ਵਧੇਰੇ ਵਰਤੋਂ (ਜਿਵੇਂ ChatGPT Plus ਜਾਂ Teams ਫੀਚਰ) ਲਈ ਵਰਤੋਂਕਾਰ ਆਪਣਾ OpenAI ਖਾਤਾ ਲਿੰਕ ਕਰ ਸਕਦੇ ਹਨ, ਅਤੇ ਡੇਟਾ OpenAI ਦੀਆਂ ਨੀਤੀਆਂ ਦੇ ਅਧੀਨ ਹੋਵੇਗੀ।
ਇਹ ਕਦਮ ਸਪਸ਼ਟ ਕਰਦੇ ਹਨ:
Apple ਨੇ ਸਹਾਇਕ ਦੌੜ ਖੱਤਮ ਨਹੀਂ ਕੀਤੀ, ਪਰ ChatGPT ਨੂੰ ਸਿੱਧਾ ਅਨੁਭਵ ਵਿੱਚ ਵੱਢ ਕੇ ਇਸ ਗੱਲ ਨੂੰ ਮੰਨਿਆ ਹੈ ਕਿ LLMs ਨੇ ਉਪਭੋਗਤਾ ਉਡੀਕਾਂ ਨੂੰ ਬਹੁਤ ਬਦਲ ਦਿੱਤਾ ਹੈ।
Apple ਨੇ ਡਿਵਾਈਸ, ਨਫ਼ਾ ਜਾਂ OS ਕਾਬੂ ਨਹੀਂ ਹਾਰਿਆ। ਉਨ੍ਹਾਂ ਨੇ ਇਹ ਜਗ੍ਹਾ ਹਾਰ ਦਿੱਤੀ ਕਿ ਕੌਣ ਇਹ ਪਰਿਭਾਸ਼ਾ ਕਰਦਾ ਹੈ ਕਿ ਇੱਕ general-purpose assistant ਕਿਹੜਾ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ।
ਜਿਵੇਂ ChatGPT ਅਤੇ ਸਮਾਨ ਟੂਲ "ਕਠੋਰ" ਸਵਾਲਾਂ ਦਾ ਡੈਫੌਲਟ ਟਿਕਾਣਾ ਬਣਦੇ ਹਨ, ਇਕ ਵੰਡ ਉਭਰਦੀ ਹੈ:
ਇਹ ਵੰਡ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਜੇ ਵਰਤੋਂਕਾਰ ਕਿਸੇ ਵੀ ਗੰਭੀਰ ਕੰਮ ਲਈ ਤੀਸਰੇ-ਪੱਖੀ AI ਨੂੰ ਡਿਫੌਲਟ ਮੰਨ ਲੈਂਦੇ ਹਨ, ਤਾਂ ਸਿਸਟਮ ਸਹਾਇਕ ਨਵੀਂ ਬਿਹਤਰ ਵਰਤੋਂ ਰਵੱਈਆਂ ਦਾ ਕੇਂਦਰ ਨਹੀਂ ਰਹਿੰਦਾ।
ਸਮੇਂ ਨਾਲ ਇਹ ਨਿਊਨਤਾ ਘਟਾ ਸਕਦੀ ਹੈ:
Apple ਦਾ 2024 ਦਾ ਕਦਮ—Siri ਨੂੰ ਕੁਝ ਪ੍ਰਸ਼ਨਾਂ ChatGPT ਵੱਲ ਹਵਾਲਾ ਕਰਨ ਦੇਣਾ—ਇੱਕ ਠੀਕ ਸੁਧਾਰ ਹੈ ਅਤੇ ਇਕ ਹਾਰ ਦਾ ਇਜ਼ਹਾਰ ਵੀ: ਇਹ ਮੰਨਦਾ ਹੈ ਕਿ ਸਭ ਤੋਂ ਬਲਸ਼ਾਲੀ general-purpose reasoning ਇੰਜਣ Apple ਦਾ ਨਹੀਂ ਹੈ।
ਇਸਦਾ ਇਹ ਮਤਲਬ ਨਹੀਂ ਕਿ Apple ਖੇਡ ਤੋਂ ਬਾਹਰ ਹੈ। ਉਹ ਕੋਲ ਕਈ ਮਹੱਤਵਪੂਰਨ ਰਣਨੀਤਿਕ ਸੰਪਤੀ ਹਨ:
ਇਸ ਲਈ Apple ਭਾਗੀਦਾਰੀ ਵਿੱਚ ਵਾਪਸ ਆ ਸਕਦਾ ਹੈ—ਪਰ ਉਸਨੇ ਜੋ ਧਾਰਣਾ ਹਾਰਿਆ ਹੈ, ਉਹ ਵਾਪਸ ਲੈਣ ਲਈ ਹੋਰ ਕੰਮ ਕਰਨਾ ਪਏਗਾ।
ਇੱਕ ਪਹਿਲਾ ਫਾਇਦਾ ਦਿਖਾਈ ਦੇਣ ਵਾਲੇ, ਬਹੁਤੇ ছোট ਸੁਧਾਰਾਂ ਦੇ ਬਿਨਾਂ ਘੱਟ ਹੋ ਜਾਦਾ ਹੈ।
ਕਾਬੂ ਰੱਖਣਾ ਅਤੇ ਇੱਕ ecosystem ਨੂੰ ਯੋਗ ਬਣਾਉਣਾ—ਇੱਕ ਸੰਤੁਲਨ ਲਾਜ਼ਮੀ ਹੈ।
ਪ੍ਰਾਈਵੇਸੀ ਨੂੰ ਸਿੱਖਣ ਦੀਆਂ ਤਕਨੀਕਾਂ ਨਾਲ ਜੋੜਨਾ—on-device ਲਰਨਿੰਗ, federated learning, differential privacy, ਅਤੇ ਸਪਸ਼ਟ opt-ins।
ਇੰਟਰਫੇਸ ਬਦਲਾਅ ਉਹ ਸਿਰਫ UI ਟਵੀਕ ਨਹੀਂ; ਇਹ ਪਰਿਭਾਸ਼ਾ ਕਰਨ ਦੀ ਸੰਭਾਵਨਾ ਹੈ ਕਿ ਉਤਪਾਦ ਕਿਹੜੇ ਕੰਮ ਕਰੇਗਾ।
ਤੇਜ਼ iteration ਲਈ ਪਲਾਟਫਾਰਮ ਅਤੇ ਸੰਰਚਨਾ ਪਹਿਲਾਂ ਤਿਆਰ ਕਰੋ—weekly/biweekly ਅਪਡੇਟ ਸੂਚੀਤ ਕਰਨ ਵਾਲੇ ਮਾਡਲ-ਚਲਾਊ ਉਤਪਾਦਾਂ ਦੇ ਮੁਕਾਬਲੇ ਵਿੱਚ ਦੇਰ ਹੋਣ ਦਿੰਦਾ ਹੈ।
ਅਗਲੇ ਕੁਝ ਸਾਲ ਇਹ ਨਿਰਧਾਰਿਤ ਕਰਨਗੇ ਕਿ Apple Siri ਨੂੰ ਦੁਬਾਰਾ ਪਰਿਭਾਸ਼ਿਤ ਕਰ ਸਕਦਾ ਹੈ ਜਾਂ Siri ਇੱਕ ਸਹੂਲਤ ਭਰਿਆ ਵੌਇਸ ਰਿਮੋਟ ਹੀ ਰਹਿ ਜਾਵੇਗਾ।