जानिए कैसे Apple का शुरुआती बढ़त वाला Siri उस समय पिछड़ गया जब ChatGPT और बड़े भाषा मॉडल असिस्टेंट की परिभाषा बदल लाए—और यह बदलाव Apple की रणनीति के लिए क्या मायने रखता है।

Siri और ChatGPT को अक्सर जैसे‑तैसे दो अलग असिस्टेंट के रूप में तुलनात्मक रूप से देखा जाता है। पर अधिक रोचक कहानी यह है कि एक कंपनी ने श्रेणी को परिभाषित किया, फिर जब दूसरी तकनीकी लहर आई और उम्मीदों को फिर से परिभाषित किया तो उस पहले कंपनी ने गति खो दी।
जब Apple ने 2011 में iPhone 4S पर Siri लॉन्च किया, तो वह कंप्यूटिंग का भविष्य जैसा दिखा: फोन से बात करो, काम पूरे हो जाएँ, कीबोर्ड की ज़रूरत नहीं। Apple के पास मेनस्ट्रीम वॉइस असिस्टेंस में एक स्पष्ट फर्स्ट‑मूवर फायदा था, तब भी जब “AI” हर उत्पाद रोडमैप का केंद्र नहीं बना था। कुछ समय के लिए, Siri ने ये तय किया कि लोग असिस्टेंट से क्या उम्मीद कर सकते हैं।
एक दशक बाद, 2022 के अंत में ChatGPT फूट पड़ा और कई उपयोगकर्ताओं को लगा जैसे वे एक अलग प्रकार के असिस्टेंट का अनुभव कर रहे हैं। यह लिख सकता था, समझा सकता था, अनुवाद कर सकता था, डीबग कर सकता था, और संदर्भ के अनुसार अनुकूलन कर सकता था—ऐसा कुछ जो स्क्रिप्टेड वॉइस सिस्टम कभी नहीं कर पाए। एक रात में उपयोगकर्ता अपेक्षाएँ बदल कर "टाइमर सेट करो और मेरी बात गलत सुनो" से "जटिल विषयों पर मुझसे तर्क करो और मांग पर सामग्री बनाओ" तक पहुँच गईं।
यह लेख फीचर‑चेकलिस्ट के बारे में नहीं है। यह प्रगति‑पथ के बारे में है: कैसे Siri की डिजाइन, आर्किटेक्चर, और उत्पाद संबंधी बाधाएँ उसे संकीर्ण और भंगुर रखती रहीं, जबकि बड़े भाषा मॉडल (LLMs) ने ChatGPT को खुला‑अंत और वार्तालापी बना दिया।
हम देखेंगे:
प्रोडक्ट और AI टीमों के लिए, Siri बनाम ChatGPT इस बात का केस‑स्टडी है कि समय, प्लेटफ़ॉर्म निर्णय, और तकनीकी शर्तें कैसे फायदा बढ़ा सकती हैं—या उसे धीरे‑धीरे मिटा भी सकती हैं।
जब Apple ने 2011 में iPhone 4S के साथ Siri का अनावरण किया, तो यह एक मेनस्ट्रीम डिवाइस पर विज्ञान‑कथा जैसा लगा। Siri की शुरुआत SRI International से स्पिन‑आउट हुई एक स्वतंत्र स्टार्ट‑अप के रूप में हुई थी; Apple ने 2010 में उसे खरीदा और जल्दी से इसे एक हेडलाइन फीचर बना दिया, सिर्फ एक और ऐप नहीं।
Apple ने Siri को एक संवादात्मक, वॉइस‑ड्रिवन असिस्टेंट के रूप में प्रचारित किया जो रोजमर्रा के कार्य संभाल सके: रिमाइंडर सेट करना, संदेश भेजना, मौसम देखना, रेस्टोरेंट ढूँढना, और बहुत कुछ। पेशकश सरल और प्रभावशाली थी: ऐप्स के बीच टैप करने के बजाय आप अपने iPhone से बस बात कर सकते थे।
लॉन्च अभियान ने व्यक्तित्व पर भारी निर्भरता दिखाई। Siri के चुटकुले, विटी प्रतिक्रियाएँ और ईस्टर‑एग्स थे ताकि असिस्टेंट जीवंत और पहुँच‑योग्य लगे। टेक समीक्षक और मेनस्ट्रीम मीडिया ने लोगों को “अपने फोन से बात करते हुए” कवर किया—यह एक सांस्कृतिक क्षण था। कुछ समय तक, Siri उपभोक्ता AI का सबसे दिखने वाला प्रतीक था।
मित्रवत आवाज के पीछे, Siri की आर्किटेक्चर एक intent‑आधारित सिस्टम थी जो पूर्व‑निर्धारित डोमेनों से जुड़ी थी:
create_reminder या send_message) में मैप करने की कोशिश करती थी।Siri सामान्य अर्थ में "सोच" नहीं रहा था; यह स्क्रिप्टेड क्षमताओं के बड़े सेट का समन्वय कर रहा था।
लॉन्च पर, यह प्रतिस्पर्धियों की तुलना में वर्षों आगे था। Google Voice Actions और अन्य प्रयास उस तुलना में संकीर्ण और यूटिलिटेरियन महसूस होते थे। Siri ने Apple को एक वास्तविक फर्स्ट‑मूवर लाभ दिया: उसने यह परिभाषित किया कि स्मार्टफ़ोन पर एक उपभोक्ता‑स्तरीय AI असिस्टेंट क्या कर सकता है, तब भी जब बड़े भाषा मॉडल और ChatGPT बाद में आए।
Siri ने रोजमर्रा के संकुचित सेट पर पकड़ बनाकर लोगों की दिनचर्या में जगह बनाई। "हे Siri, 10 मिनट का टाइमर सेट करो," "माँ को कॉल करो," या "Alex को टेक्स्ट करो मैं देर में आ रहा हूँ" आमतौर पर पहली कोशिश में काम कर जाते थे। ड्राइविंग या खाना बनाते समय हैंड‑फ्री नियंत्रण जादुई सा लगता था।
म्यूज़िक नियंत्रण भी एक मजबूत क्षेत्र था। "Play some jazz," "Skip," या "What song is this?" ने iPhone को Apple Music और व्यापक ऑडियो अनुभव के लिए वॉइस‑ड्रिवन रिमोट जैसा बना दिया। सरल क्वेरीज—मौसम, स्पोर्ट्स स्कोर, बेसिक फैक्ट्स—के साथ Siri ने छोटे, एक‑टर्न इंटरैक्शनों में त्वरित उपयोगिता दी।
अंदरूनी कामकाज में, Siri intents, slots, और डोमेन्स पर निर्भर था। हर डोमेन (जैसे मैसेजिंग, अलार्म, या म्यूजिक) कुछ सीमित intents—"send message," "create timer," "play track"—समर्थन करता था, जिनमें स्लॉट्स होते थे जैसे संपर्क नाम, अवधि, या गाने के टाइटल।
यह डिजाइन तब अच्छा काम करता था जब उपयोगकर्ता अपेक्षित वाक्य‑रचना के करीब रहते: "Remind me at 3 p.m. to call the dentist" एक रिमाइंडर intent में समय और टेक्स्ट स्लॉट्स के साथ नीटली मैप हो जाता था। लेकिन जब लोग अधिक स्वतंत्र रूप से बोले—साइड टिप्पणियाँ जोड़ते या असामान्य क्रम में बोलते—तो Siri अक्सर मिसफ़ायर कर जाता या वेब सर्च पर चला जाता।
क्योंकि हर नए व्यवहार के लिए सावधानीपूर्वक modeled intent और डोमेन की ज़रूरत थी, Siri की क्षमताएँ धीरे‑धीरे बढ़ीं। नए एक्शन, ऐप्स और भाषाओं के लिए सपोर्ट उपयोगकर्ता अपेक्षाओं से पिछड़ता गया। कई लोगों ने नोट किया कि साल दर साल Siri नई स्किल्स या स्पष्ट रूप से बढ़ी "स्मार्टनेस" नहीं दिखा रहा था।
फॉलो‑अप प्रश्न सतही थे—लगभग कोई संदर्भ मेमोरी नहीं। आप एक टाइमर पूछ सकते थे, लेकिन प्राकृतिक बातचीत में कई टाइमर्स को प्रबंधित करना नाजुक था। वह भंगुरता—और यह भावना कि Siri अधिक विकसित नहीं हो रहा—ने उपयोगकर्ताओं को तैयार कर दिया कि जब कोई अधिक लचीला, बातचीत‑केंद्रित सिस्टम जैसे ChatGPT आता है तो वे प्रभावित हो जाएँ।
Siri को intent‑आधारित मॉडल पर बनाया गया था: ट्रिगर वाक्य पहचानो, अनुरोध को ज्ञात intents में वर्गीकृत करो (अलार्म सेट करना, संदेश भेजना, गीत बजाना), फिर एक विशिष्ट सेवा को कॉल करो। यदि आपकी रिक्वेस्ट किसी पूर्वनिर्धारित पैटर्न या डोमेन से मेल नहीं खाती, तो Siri के पास आगे बढ़ने का कोई रास्ता नहीं था—यह विफल हो जाता या वेब सर्च पर लौट जाता।
बड़े भाषा मॉडल ने उस मॉडल को पलट दिया। वे फिक्स्ड इंटेंट्स की बजाय सीक्वेंस में अगला शब्द भविष्यवाणी करते हैं, विशाल टेक्स्ट कॉर्पस पर प्रशिक्षित। यह सरल ऑब्जेक्टिव ग्रामर, तथ्य, शैलियाँ, और तर्क के पैटर्न को एक सामान्य सिस्टम में एन्कोड कर देता है। असिस्टेंट को हर नए टास्क के लिए कस्टम रूल या API की जरूरत नहीं रहती; यह डोमेन के पार इम्प्रोवाइज़ कर सकता है।
GPT‑3 (2020) पहला LLM था जिसने गुणात्मक रूप से अलग महसूस कराया: एक ही मॉडल कोड लिख सकता था, मार्केटिंग कॉपी तैयार कर सकता था, कानूनी टेक्स्ट का सारांश बना सकता था, और बिना टास्क‑विशिष्ट ट्रेनिंग के प्रश्नों का उत्तर दे सकता था। फिर भी यह एक "कच्चा" मॉडल था—शक्तिशाली पर नियंत्रित करना कठिन।
इंस्ट्रक्शन‑ट्यूनिंग और मानव फीडबैक से रिइंफोर्समेंट (RLHF) ने उस पर बदलाव किया। शोधकर्ताओं ने मॉडल्स को उदाहरणों पर फाइन‑ट्यून किया जैसे "Write an email to…" या "Explain quantum computing simply," जिससे उन्हें उपयोगकर्ता निर्देशों और सुरक्षा मानदंडों के साथ संरेखित किया गया। इससे LLMs प्राकृतिक भाषा अनुरोधों का पालन करने में बेहतर बने।
इंस्ट्रक्शन‑ट्यून किए मॉडल को एक पर्सिस्टेंट चैट इंटरफ़ेस में लपेटना—जो OpenAI ने ChatGPT के साथ किया—इस क्षमता को समझने योग्य और पहुँच‑योग्य बनाता है। उपयोगकर्ता अब कर सकते थे:
मल्टीमॉडल मॉडल्स के साथ, वही सिस्टम अब टेक्स्ट, कोड, और इमेज़ संभाल सकता है—और इनके बीच अनुवाद कर सकता है।
Siri की संकीर्ण, intent‑बाउंड क्षमताओं की तुलना में, ChatGPT सामान्य‑उद्देश्य वार्तालापी साथी जैसा व्यवहार करता है। यह विषयों के पार तर्क कर सकता है, ड्राफ्ट और डीबग कर सकता है, ब्रेनस्टॉर्म और समझा सकता है—बिना Apple‑स्टाइल डोमेन सीमाओं के। यह बदलाव—कमांड स्लॉट से खुली बातचीत तक—ने Siri को अचानक पुराना दिखा दिया।
Apple की AI कहानी केवल एल्गोरिद्म की नहीं है; यह उत्पाद दर्शन के बारे में है। वही चुनाव जो iPhone को भरोसेमंद और लाभकारी बनाते हैं, उन्होंने Siri को जमाए रहने जैसा महसूस कराया, जबकि ChatGPT आगे बढ़ा।
Apple ने Siri को कड़े प्राइवेसी मॉडल के तहत बनाया: डेटा संग्रह को न्यूनतम रखें, स्थायी पहचानकर्ताओं से बचें, और संभव हो तो ऑन‑डिवाइस रखें। इससे उपयोगकर्ताओं और रेगुलेटरों का विश्वास बढ़ा, पर इसका मतलब था:
जबकि OpenAI और अन्य ने विशाल डेटासेट और सर्वर लॉग्स पर LLMs प्रशिक्षित किए, Apple ने वॉइस डेटा को जल्दी से हटाने या भारी रूप से अनोनिमाइज़ करने का रुख अपनाया। इसके मुकाबले Siri की समझ गंदे, वास्तविक‑विश्व अनुरोधों के लिए संकीर्ण और भंगुर बनी रही।
Apple ने ऑन‑डिवाइस प्रोसेसिंग के लिए भी आक्रामक रूप से धक्का दिया। iPhone पर मॉडल चलाने से लेटेंसी कम और प्राइवेसी बेहतर हुई, पर वर्षों तक यह मॉडल के आकार और जटिलता को सीमित करता रहा।
Siri की शुरुआती आर्किटेक्चर छोटे, विशेषीकृत मॉडलों के लिए अनुकूलित थीं जो तंग मेमोरी और ऊर्जा बजट में फिट हो सकें। ChatGPT और उसके रिश्तेदार इसके विपरीत थे: क्लाउड में विशाल मॉडल जो और GPUs से स्केल किए जा सकते थे।
इसका नतीजा यह हुआ कि भाषा मॉडलिंग में हर छलांग—बड़े संदर्भ विंडो, समृद्ध तर्क, उभरती क्षमताएँ—पहले क्लाउड असिस्टेंट्स में दिखाई दी, Siri में नहीं।
Apple का कारोबार हार्डवेयर मार्जिन और गहरे एकीकृत सेवाओं के इर्द‑गिर्द घूमता है। Siri को एक फिचर के रूप में रखा गया जिसने iPhone, Apple Watch और CarPlay को अधिक आकर्षक बनाया—न कि एक स्टैंडअलोन AI उत्पाद के रूप में।
इसने निवेश निर्णयों को आकार दिया:
परिणाम: Siri ने सुधार किए, पर ज्यादातर ऐसे तरीके जो डिवाइस उपयोग मामलों का समर्थन करते—टाइमर्स, संदेश, HomeKit—न कि व्यापक, अन्वेषणशील समस्या‑समाधान।
सांस्कृतिक रूप से, Apple अधूरा महसूस होने वाले किसी भी विकल्प के प्रति सतर्क है। सार्वजनिक "बीटा" फीचर्स और ग्लिच‑भरे इंटरफेस उसके ब्रांड के साथ सहज नहीं बैठते।
LLMs, खासकर आरंभिक चरणों में, गंदे थे: हलुцина्शन्स, अप्रत्याशित उत्तर, और सुरक्षा‑काँट्रास्ट। OpenAI और अन्य कंपनियों ने इन्हें सार्वजनिक रूप से जारी किया और सार्वजनिक इटरेशन किया। Apple ने बड़े पैमाने पर अप्रत्याशित Siri प्रयोग करने से परहेज़ किया।
उस सावधानी ने फीडबैक लूप को घटा दिया। उपयोगकर्ताओं ने Siri से कोई क्रांतिकारी व्यवहार नहीं देखा, और Apple को वही उपयोग डेटा नहीं मिला जिसने ChatGPT के तेजी से परिष्करण को चलाया।
प्रत्येक उत्पादिक चुनाव—प्राइवेसी‑मैक्सिमाइज़िंग डेटा प्रथाएँ, ऑन‑डिवाइस प्राथमिकता, हार्डवेयर‑फर्स्ट अर्थशास्त्र, और सांस्कृतिक सावधानी—तर्कसंगत थे। पर साथ में उन्होंने यह मतलब निकाला कि Siri छोटे, नियंत्रित कदमों में विकसित हुआ जबकि ChatGPT छलांगें लगाता गया।
ग्राहक Apple की मंशा की तुलना नहीं कर रहे थे, वे अनुभव की तुलना कर रहे थे: Siri अभी भी सापेक्षत: सरल, बहु‑कदम अनुरोधों पर फेल होता था, जबकि ChatGPT जटिल प्रश्न, कोडिंग मदद, ब्रेनस्टोर्मिंग और अधिक संभालता था।
जब Apple ने Apple Intelligence और ChatGPT को एकीकृत करने की घोषणा की, तब तक उपयोगकर्ता धारणा में गैप स्पष्ट था: Siri वह असिस्टेंट बन गया जिसे आप गलत समझे जाने की उम्मीद रखते थे; ChatGPT वह बन गया जिसे आप चौंकाने की उम्मीद करते थे।
Siri केवल कच्ची बुद्धिमत्ता में पीछे नहीं रहा; इसे इस बात ने भी घेरा कि Apple ने डेवलपर्स के लिए इसे कैसे उजागर किया।
SiriKit ने केवल कुछ पूर्व‑परिभाषित “डोमेन्स” और “intents” में तृतीय‑पक्ष ऐप्स को प्लग‑इन करने दिया: मैसेजिंग, VoIP कॉल, राइड बुकिंग, पेमेंट्स, वर्कआउट्स, और कुछ और।
यदि आपने नोट‑टेकिंग ऐप, ट्रैवल प्लानर, या CRM टूल बनाया, तो अक्सर आपके लिए कोई डोमेन नहीं था। समर्थित डोमेन के अंदर भी, आपको उपयोगकर्ता क्रियाओं को Apple‑परिभाषित intents जैसे INSendMessageIntent या INStartWorkoutIntent में मैप करना पड़ता था। और अधिक रचनात्मक चीज़ें Siri की पहुँच से बाहर रहीं।
इनवोकेशन भी सख्त थी। उपयोगकर्ता को पैटर्न याद रखने पड़ते थे जैसे:
“Hey Siri, send a message with WhatsApp to John saying I’ll be late.”
यदि उन्होंने अलग तरीके से कहा, Siri अक्सर Apple के अपने ऐप्स पर लौटता या पूरी तरह विफल हो जाता। SiriKit एक्सटेंशन्स को कड़ा रिव्यू, सीमित UI नियंत्रण, और सैंडबॉक्सिंग का सामना करना पड़ा जिसने प्रयोग को हतोत्साहित किया।
परिणाम: कम पार्टनर, पतले इंटीग्रेशन, और ऐसा अहसास कि “Siri स्किल्स” समय में जमी हुई हैं।
OpenAI ने विपरीत रास्ता अपनाया। उन्होंने संकुचित डोमेन की एक सूची देने के बजाय सामान्य टेक्स्ट इंटरफ़ेस और बाद में function calling, embeddings, और फाइन‑ट्यूनिंग जैसे उपकरण एक्सपोज़ किए।
डेवलपर्स उसी API का उपयोग करके कर सकते थे:
कोई अलग प्रोग्राम या डोमेन‑वाइटलिस्ट नहीं—सिर्फ उपयोग नीति और मूल्य निर्धारण।
क्योंकि प्रयोग सस्ता और लचीला था, हजारों ऐप्स ने जंगली विचार आजमाए: स्वायत्त एजेंट्स, प्लगइन सिस्टम, वर्कफ़्लो कोपाइलट्स, और बहुत कुछ। कई असफल हुए, पर पारिस्थितिकी तंत्र तेज़ी से उस दिशा में विकसित हुआ जो काम आया।
जैसे‑जैसे ChatGPT‑संचालित टूल्स सप्ताह दर सप्ताह बेहतर हुए, Siri इंटीग्रेशन मुश्किल से बदला। उपयोगकर्ताओं ने नोटिस किया। Siri स्थैतिक और भंगुर महसूस हुआ, जबकि LLM‑आधारित उत्पाद लगातार नई क्षमताओं से लोगों को चौंका रहे थे।
परिणाम: केवल मॉडल गुणवत्ता नहीं—पारिस्थितिकी तंत्र डिजाइन ने भी Siri बनाम ChatGPT के अंतर को इतना तीखा बना दिया।
कई लोगों के लिए, "Hey Siri" छोटे‑मोटे निराशाजनक अनुभव के लिए संक्षेप बन गया। रोज़मर्रा के क्षण जमा हो गए:
समय के साथ, उपयोगकर्ता अनुकूलन करने लगे। वे संकुचित, फॉर्म्युलाईक वाक्यों में बोलना सीख गए। खुला‑अंत प्रश्न पूछना बंद कर दिया क्योंकि उत्तर सतही थे या बस "यहाँ मैंने वेब पर क्या पाया" जैसा था। जब आवाज विफल हुई, लोग अपने फ़ोन पर टाइप करने लग गए—अभी भी Apple के पारिस्थितिकी तंत्र के भीतर, पर असिस्टेंट के प्रति कम अपेक्षाओं के साथ।
सांस्कृतिक रूप से, Siri मजाक बन गया। लेट‑नाईट जोक्स, YouTube कंपाइलेशन्स, और मेम्स ने उसी थीम को दोहराया: Siri अलग‑अलग उच्चारणों को गलत सुनना, कई टाइमर सेट कर देना, या अप्रासंगिक सर्च परिणाम देना। असिस्टेंट जम कर रह गया।
ChatGPT ने वह भावनात्मक ट्रैक पलट दिया। गलत समझे गए कमांड की जगह उपयोगकर्ताओं ने विस्तृत, संवादात्मक उत्तर देखे। यह कर सकता था:
इंटरैक्शन मॉडल त्वरक‑लेनदेन "टाइमर सेट करो," "मौसम क्या है," "Alex को टेक्स्ट करो" से गहरे सहायक तक चला गया: "मुझे अध्ययन योजना डिज़ाइन करने में मदद करो," "इस अनुबंध को साधारण अंग्रेजी में फिर लिखो," "इस बग को कैसे ठीक करूँ, चरण दर चरण बताओ।"
लोगों ने देखा कि एक असिस्टेंट संदर्भ याद रख सकता है, ड्राफ्ट सुधर सकता है, और कई स्टेप्स पार कर सकता है—तो अपेक्षाएँ कई स्तर ऊपर चली गईं। उस नए मानक के सामने Siri के क्रमिक लाभ—थोड़ी बेहतर डिक्टेशन, मामूली तेज़ प्रतिक्रिया—छोटे और लगभग अनदेखे लगने लगे। उपयोगकर्ता धारणा सिर्फ Siri पर खट्टा नहीं हुई; उसने असिस्टेंट की परिभाषा ही बदल दी।
ChatGPT ने असिस्टेंट के मानक को "वॉइस रिमोट" से "सोचने वाले साथी" में बदल दिया। अब उपयोगकर्ता सिर्फ टाइमर सेट करने या सेटिंग्स टॉगल करने के अलावा ऐसे सहायक की उम्मीद करने लगे जो ईमेल ड्राफ्ट करे, कोड डीबग करे, भौतिकी समझाए, मार्केटिंग प्लान बनाए—सब एक ही बातचीत में।
ChatGPT ने सामान्य कर दिया कि एक असिस्टेंट से अपेक्षित हो:
मुख्य बदलाव सिर्फ प्रश्नों का उत्तर देने का नहीं था, बल्कि समाप्त‑उत्पाद बनाने में मदद करने का था। लोग दस्तावेज़, स्प्रेडशीट, और कोड स्निपेट पेस्ट करने लगे और मामूली संपादन के साथ शिप करने लायक आउटपुट की उम्मीद करने लगे।
LLMs ने निरंतरता की भावना दी। केवल एक Q&A के बजाय, ChatGPT कर सकता है:
टूल्स और प्लगइन्स के साथ, यह वर्कफ़्लो तक विस्तारित हो गया: ऐप्स से डेटा खींचना, उसे परिवर्तित करना, और परिणामों को ईमेल, रिपोर्ट, या कोड में बदलना। उपयोगकर्ता आजकल "सहायक" कहकर वही चीज़ समझते हैं: ऐसा कुछ जो इरादे को समझकर कई कदमों तक आयोजन कर सके।
ChatGPT जल्दी ही जिज्ञासा से रोज़मर्रा के इंफ्रास्ट्रक्चर में बदल गया। छात्र इसका उपयोग अवधारणाएँ समझने, भाषाओं का अभ्यास करने, और निबंध की रूपरेखा बनाने के लिए करते हैं। नॉलेज वर्कर्स इसे रिसर्च सिंथेसिस, विचार‑उत्पन्न, और प्राथमिक ड्राफ्ट के लिए उपयोग करते हैं। टीमें इसे सपोर्ट फ्लोज़, कोडिंग पाइपलाइन्स, और आंतरिक नॉलेज टूल्स में शामिल करती हैं।
इस परिप्रेक्ष्य में Siri की मुख्य ताकत—विश्वसनीय डिवाइस नियंत्रण और त्वरित, हैंड्स‑फ्री कमांड—छोटी लगने लगी। यह ऑन‑डिवाइस क्रियाओं में अच्छा है: अलार्म, संदेश, कॉल, मीडिया, और स्मार्ट होम नियंत्रण।
पर जब उपयोगकर्ता यह उम्मीद करने लगते हैं कि असिस्टेंट तर्क कर सके, संदर्भ रख सके, और जटिल कार्य पूरे कर सके, तो एक प्रणाली जो मुख्यतः स्विच फ्लिप करती और सरल तथ्य बताती है, "स्मार्ट" की परिभाषा अब नहीं बनाती। ChatGPT ने उस परिभाषा को सहायक को सहयोगी सोचने वाले साथी की तरफ़ धकेल दिया।
वर्षों के क्रमिक Siri अपडेट के बाद, Apple की 2024 घोषणाओं ने आखिरकार इसकी AI रणनीति के लिए नाम और संरचना दी: Apple Intelligence।
Apple ने Apple Intelligence को एक सिस्टम फीचर के रूप में फ्रेम किया, न कि एक अकेले ऐप के रूप में। यह:
महत्वपूर्ण बात यह है कि Apple ने समर्थन को नए हार्डवेयर (A17 Pro और M‑सीरीज़) तक सीमित किया, यह संकेत देते हुए कि सार्थक AI फीचर्स के लिए वस्तुतः ऑन‑डिवाइस कम्प्यूट बहुत जरूरी है।
Apple ने अपनी प्राइवेसी कहानी को दोगुना किया:
यह Apple को LLM‑स्केल क्षमताओं के बारे में बात करने देता है बिना अपनी प्राइवेसी ब्रांड त्यागे।
Apple Intelligence के भीतर, Siri को आखिरकार एक गंभीर अपग्रेड मिल रहा है:
ये परिवर्तन Siri को LLM‑आधारित असिस्टेंट की अपेक्षाओं के करीब लाने का प्रयास करते हैं।
LLM बदलाव की सबसे उल्लेखनीय स्वीकृति Apple का OpenAI के साथ सीधा साझेदारी है। जब Siri या Apple Intelligence फैसला करे कि कोई क्वेरी बहुत खुले‑अंत या रचनात्मक है, तब उपयोगकर्ता:
और यदि आप और गहरा उपयोग चाहते हैं (जैसे ChatGPT Plus या Teams सुविधाएँ), तो आप अपना OpenAI अकाउंट लिंक कर सकते हैं, और डेटा OpenAI की नीतियों के अधीन होगा।
ये कदम Apple की स्थिति को स्पष्ट करते हैं:
Apple ने असिस्टेंट रेस हार मान ली है यह नहीं कहा जा सकता, पर ChatGPT को सीधे अनुभव में पिरोकर उसने यह स्वीकार कर लिया कि LLMs ने उपयोगकर्ता अपेक्षाओं को कितनी गहराई से बदल दिया है।
जब लोग कहते हैं कि Apple ने Siri बनाम ChatGPT में AI युद्ध हारा, तो वे शायद हार‑जीत को गलत तरीके से समझते हैं। Apple ने हार नहीं मानी हार्डवेयर या व्यापारिक मौलिकताओं में; उसने वह कहानी खो दी जो तय करती है कि असिस्टेंट क्या हो और कौन सीमा निर्धारित करता है।
Apple ने तीन महत्वपूर्ण प्रकार की नेतृत्व खो दीं:
Apple ने डिवाइसेज़, लाभ और OS नियंत्रण नहीं खोया। उसने यह शुरुआती स्थिति खो दी कि दुनिया को पहला मेनस्ट्रीम असिस्टेंट दिखाने वाली कंपनी वही है।
जैसे जैसे ChatGPT और समान टूल्स "कठोर" प्रश्नों के लिए डिफ़ॉल्ट गंतव्य बनते हैं, एक विभाजन उभरता है:
यह विभाजन मायने रखता है। यदि उपयोगकर्ता मानसिक रूप से कोई भी गैर‑तृतीयक कार्य थर्ड‑पार्टी AI पर भेजने लगते हैं, तो सिस्टम असिस्टेंट नया व्यवहार खोजने और आकार देने का केंद्र नहीं रह जाता।
समय के साथ यह कमजोर कर सकता है:
Apple का 2024 का कदम—Siri को कुछ क्वेरी ChatGPT पर भेजने की अनुमति—एक समाधान और स्वीकारोक्ति दोनों है: यह उपयोगकर्ता अनुभव बेहतर करता है, पर यह मानता भी है कि सबसे मजबूत सामान्य‑उद्देश्य तर्क इंजन Apple का नहीं है।
इसका यह मतलब नहीं कि Apple खेल से बाहर है। उसके पास अभी भी AI में कुछ सबसे कीमती रणनीतिक सक्रिय हैं:
तो Apple के पास अभी भी भाग लेने का या फिर से तेज़ दौड़ लगाने का अवसर है। उसने वह धारणा खो दी कि Siri ही असिस्टेंट की परिभाषा करता है। अगली कुछ उत्पाद चक्र तय करेंगे कि क्या Apple अपने बचे हुए फायदों को इस्तेमाल कर वह कहानी फिर से लिख पाएगा, या Siri एक सुविधाजनक वॉयस‑रिमोट बनकर रह जाएगा जबकि अन्य आगे की बुद्धिमत्ता का मालिक बनेंगे।
Siri एक समय जादुई महसूस करता था क्योंकि यह नया था। समय के साथ वह नव‑नवीनता तब बोझ बन गई जब उपयोगकर्ताओं ने प्रगति महसूस करना बंद कर दिया।
फीचर काम हुआ—बेहतर स्पीच रिकॉग्निशन, अधिक ऑन‑डिवाइस प्रोसेसिंग—पर वे अक्सर अदृश्य या अति‑क्रमिक थे। जबकि ChatGPT की प्रगति दृश्य थी: नई क्षमताएँ, नए मॉडल, स्पष्ट वर्शनिंग, और सार्वजनिक रोडमैप।
उत्पाद टीमों के लिये सरल सबक: ऐसे परिवर्तन जारी करें जिन्हें उपयोगकर्ता महसूस कर सकें और पहचान सकें। प्रगति को पठनीय बनाएं—नामकरण, रिलीज नोट्स, और UX परिवर्तनों के माध्यम से—ताकि धारणा वास्तविकता के साथ रहे।
Apple की नियंत्रित पसंद ने Siri को सुसंगत रखा पर संकीर्ण भी। SiriKit ने केवल छोटे डोमेन एक्सपोज किए; डेवलपर्स असामान्य उपयोग‑मामले नहीं बना सके।
ChatGPT ने इसके उलट खुलापन अपनाया: APIs, प्लगइन्स, कस्टम GPTs। इससे पारिस्थितिकी तंत्र ने उन विचारों को तेज़ी से खोज लिया जो किसी एक कंपनी से बाहर ढूँढे जा सकते थे।
AI उत्पाद टीमों को तय करना चाहिए कि किन हिस्सों को कंट्रोल में रखा जाए (सुरक्षा, UX गुणवत्ता, प्राइवेसी), और कहाँ डेवलपर्स को प्रयोग की छूट दी जाए। बहुत अधिक पाबंदी उत्पाद की छत को चुपचाप सीमित कर देती है।
Apple की प्राइवेसी नीति ने निर्धारित किया कि Siri उपयोगकर्ता इंटरैक्शन से कितना सीख सकता है। डेटा की सुरक्षा जरूरी है, पर यदि आपका सिस्टम सुधारने के लिए पर्याप्त नज़र नहीं रखता, तो वह ठहर जाता है।
प्राइवेसी‑प्रिज़र्विंग लर्निंग के लिये डिज़ाइन करें: ऑन‑डिवाइस मॉडल्स, फ़ेडरेटेड लर्निंग, डिफ़रेंशियल प्राइवेसी, और स्पष्ट उपयोगकर्ता ऑप्ट‑इन्स। लक्ष्य न तो "सब कुछ इकट्ठा करो" है और न ही "कुछ भी न इकट्ठा करो"—बल्कि "सुरक्षित और पारदर्शी तरीके से सीखो।"
Siri कमांड्स में बैठा रहा; ChatGPT ने असिस्टेंस को एक चलती‑फिरती लिखित बातचीत के रूप में फिर से परिभाषित किया जो शाखाएँ बना सकती है, सुधार सकती है, और संदर्भ रख सकती है। मल्टीमॉडल इनपुट (टेक्स्ट, वॉइस, इमेज़, कोड) ने इसे एक सामान्य सहयोगी जैसा बना दिया।
टीमों को इंटरफ़ेस बदलाव—चैट, मल्टीमॉडल, एजेंट्स—को सिर्फ UI ट्वीक न मानकर यह समझना चाहिए कि वे उत्पाद को क्या करवा सकते हैं और किन नौकरियों को हल कर सकते हैं।
Siri का अपडेट‑कैलेंडर पारंपरिक सॉफ़्टवेयर जैसा था: बड़े वार्षिक रिलीज़, छोटे पॉइंट अपडेट। LLM‑आधारित उत्पाद साप्ताहिक रूप से विकसित होते हैं।
प्रतिस्पर्धा करने के लिए टीमों को चाहिए:
यदि आपका संगठन, टूलिंग, या रिव्यू प्रक्रियाएँ धीमी चक्रों को मानती हैं, तो आप देरी कर देंगे—भले ही आपकी रिसर्च या हार्डवेयर मजबूत हो।
Siri की कहानी चेतावनी भी है और यह दिखाती है कि अभी भी क्या संभव हो सकता है।
Apple ने पहले मेनस्ट्रीम वॉइस असिस्टेंट भेजने से लेकर यह देखते हुए कि "Siri बनाम ChatGPT" पुराने वॉइस इंटरफेस और आधुनिक LLMs के बीच का गैप बन गया—यह परिवर्तन अचानक नहीं हुआ। यह वर्षों तक के रूढ़िवादी उत्पादिक निर्णयों, कड़े पारिस्थितिकी नियमों, और प्राइवेसी‑संरक्षित ऑन‑डिवाइस प्रोसेसिंग की अनिवार्यता के कारण हुआ—पहले जब मॉडल उन सीमाओं के भीतर चमकने के लिए तैयार नहीं थे।
विरोध केवल बेहतर उत्तर देने का नहीं है।
Siri ने एक संकीर्ण, कमांड‑शैली असिस्टेंट का प्रतिनिधित्व किया जो पूर्व‑निर्धारित intents और इंटीग्रेशन से बंधा हुआ था। ChatGPT और समान उपकरणों ने दिखाया कि सामान्य‑उद्देश्य LLMs डोमेन्स के पार तर्क कर सकते हैं, संदर्भ रख सकते हैं, और आविष्कार कर सकते हैं। Apple ने नियंत्रण, विश्वसनीयता, और हार्डवेयर एकीकरण के लिये ऑप्टिमाइज़ किया; OpenAI और अन्य ने मॉडल क्षमता और डेवलपर खुलापन के लिये ऑप्टिमाइज़ किया। दोनों सेट विकल्प संगत थे—पर उन्होंने बहुत अलग उपयोगकर्ता अनुभव दिए।
Apple Intelligence और OpenAI साझेदारी के साथ, Apple आखिरकार अपनी AI रणनीति को उसी दिशा में संरेखित कर रहा है जहाँ फ़ील्ड चली गई है: समृद्ध जनरेटिव मॉडल, अधिक लचीले असिस्टेंट, और हाइब्रिड ऑन‑डिवाइस/क्लाउड निष्पादन। इससे "Hey Siri" पर दशक भर की उपयोगकर्ता नाखुशी तुरंत मिटेगी यह नहीं कहा जा सकता, पर यह Siri को फिर से परिभाषित करने की गंभीर, दीर्घकालिक कोशिश का संकेत है।
Apple चाहे और भी ज़ोर से गहरे ऑन‑डिवाइस मॉडलों में निवेश करे, अधिक तृतीय‑पक्ष हुक खोले, या सहअस्तित्व वाले कई असिस्टेंट रखे (Siri प्लस ChatGPT और अन्य), अगले कुछ वर्षों में यह तय होगा कि यह पुनर्निर्माण है या केवल एक पैच।
उपयोगकर्ताओं के लिए व्यावहारिक प्रश्न यह नहीं है कि किसने "जीत" की—बल्कि कौन‑सा असिस्टेंट किस काम के लिए फिट है:
अधिकांश लोग अंततः कई AI असिस्टेंट साइड‑बाय‑साइड इस्तेमाल करेंगे। स्मार्ट उपाय यह है कि उन्हें पूरक उपकरण समझें—विरोधी नहीं—और करीबी से देखें कौन‑से लगातार विकास कर रहे हैं जो आपकी दिनचर्या की घर्षण को घटाते हैं।
यदि Siri की यात्रा से कंपनियों और उपयोगकर्ताओं के लिए कोई सबक है, तो वह यह है: शुरुआती बढ़त को अंतिम लाभ मत समझो, और जब लोग बेहतर असिस्टेंट का अनुभव करते हैं तो उम्मीदें कितनी तेज़ी से बदल सकती हैं।
Siri को एक निश्चित कार्यों के लिए वॉइस इंटरफेस के रूप में डिजाइन किया गया था, जबकि ChatGPT एक सामान्य-उद्देश्य भाषा मॉडल है जो कई डोमेन में आविष्कार कर सकता है।
मुख्य अंतर:
आर्किटेक्चर
क्षमताएँ
इंटरैक्शन शैली
धारणा
Siri पीछे नहीं इसलिए छूटा कि Apple के पास AI प्रतिभा नहीं थी, बल्कि इसलिए कि रणनीतिक और उत्पादिक विकल्प ने दृश्यमान प्रगति धीमी कर दी।
मुख्य कारण:
Siri का मूल सिस्टम:
set_alarm, send_message, या play_song जैसे ज्ञात intents में मैप करने की कोशिश करता था।Apple के निर्णय स्वाभाविक थे पर साथ में Siri की प्रगति सीमित कर दी।
मुख्य उत्पाद निर्णय:
Apple Intelligence एक प्रणाली‑व्यापी जनरेटिव AI पहल है जो iPhone, iPad, और Mac पर फैली है।
क्या शामिल है:
Apple का OpenAI/ChatGPT के साथ भागीदारी Siri को उस समय एक वैकल्पिक मार्ग देती है जब Apple के मॉडल पर्याप्त न हों।
मुख्य बिंदु:
वे अलग‑अलग नौकरी के लिए बेहतर हैं; अधिकांश लोग दोनों का उपयोग करेंगे।
Use Siri जब आपको चाहिए:
Use ChatGPT‑शैली के टूल्स जब आपको चाहिए:
डेवलपर्स के लिए, Siri और LLM प्लेटफ़ॉर्म मुख्यतः लचीलापन और सतह‑क्षेत्र में अलग हैं।
Siri / SiriKit:
LLM प्लेटफ़ॉर्म (जैसे OpenAI APIs):
लेख कुछ व्यवहार्य सबक उजागर करता है:
हाँ—Apple के पास अभी भी मजबूत संसाधन हैं, पर उसने उस कहानी को खो दिया जो तय करती है कि सहायक क्या हो सकता है।
Apple के पास अभी भी:
जो उसने खोया:
इसी दौरान ChatGPT और अन्य LLMs ने स्पष्ट और लगातार उन्नति दिखाई, जिससे उपयोगकर्ता अपेक्षाएँ बदल गईं।
इसके विपरीत, ChatGPT जैसे LLMs:
व्यवहार में, यह LLMs को बहुत अधिक लचीला बनाता है: वे गंदे, बहु‑कदम प्रश्नों को भी अपनाकर ऐसे कार्य कर सकते हैं जिनके लिए Siri के पास explicit intents नहीं थे।
कड़ाई से प्राइवेसी मॉडल
ऑन‑डिवाइस प्रोसेसिंग प्राथमिकता
हार्डवेयर‑फर्स्ट फोकस
सावधान शिपिंग संस्कृति
इन सबका संयोजन यह सुनिश्चित कर गया कि Siri धीरे‑धीरे सुधरे जबकि उपयोगकर्ता‑दिखने वाले ब्रेकथ्रू कहीं और हुए।
संक्षेप में, Apple Intelligence Apple की कोशिश है कि LLM‑चालित सहायक की परिभाषा के साथ तालमेल बैठाया जाए—पर अपनी प्राइवेसी और हार्डवेयर रणनीति के भीतर।
प्राइवेसी के लिहाज़ से, Apple इसे एक स्पष्ट, ऑप्ट‑इन मार्ग के रूप में पेश करता है: Siri फ्रंट‑एंड बना रहता है और आप तय करते हैं कब आपका क्वेरी Apple की सीमा से बाहर OpenAI को भेजा जाए।
व्यवहारिक नियम: Siri से अपने डिवाइस को चलवाएँ; ChatGPT से साथ मिलकर सोचें।
यदि आप गहरे डिवाइस‑एक्शन एकीकरण चाहते हैं तो SiriKit ज़रूरी है; अगर आप लचीले, डोमेन‑विशेष सहायक बनाना चाहते हैं तो LLM प्लेटफ़ॉर्म बेहतर है।
संक्षेप में, AI UX में शुरुआती लाभ नाजुक है—इसे बनाए रखने के लिए तेज़, उपयोगकर्ता‑केंद्रित प्रगति ज़रूरी है।
अगले कुछ वर्षों में यह तय होगा कि Apple Siri को फिर से परिभाषित कर सकता है या नहीं।