اكتشف كيف تلاشت ميزة آبل المبكرة مع سيري بينما أعادت ChatGPT ونماذج اللغة الكبيرة تعريف المساعدات الذكية، وماذا يعني هذا التحول لاستراتيجية آبل.

غالبًا ما تُقارن سيري وChatGPT كما لو أنهما مجرد مساعدين مختلفين. القصة الأكثر إثارة للاهتمام هي كيف ساهمت شركة في تعريف الفئة ثم فقدت الزخم بينما وصلت موجة تقنية جديدة وأعادت ضبط التوقعات.
عندما أطلقت آبل سيري على iPhone 4S في 2011 بدا كأنها مستقبل الحوسبة: تحدث إلى هاتفك وأنجز أمورك دون لوحة مفاتيح. كانت آبل تملك ميزة الدخول المبكر في المساعدة الصوتية الاستهلاكية قبل سنوات من أن يصبح مصطلح "الذكاء الاصطناعي" محور خارطة المنتجات. لفترة، شكّلت سيري ما يظن الناس أنه يمكن أن يكون عليه المساعد.
بعد عقد، انفجر ChatGPT في أواخر 2022 وجعل العديد من المستخدمين يشعرون أنهم أمام نوع مختلف من المساعد. استطاع الكتابة، الشرح، الترجمة، تصحيح الأخطاء، والتكيّف مع السياق بطريقة لم تستطع أنظمة الصوت المبرمجة أن تفعلها. بين عشية وضحاها ارتفعت توقعات المستخدمين من "اضبط مؤقتًا وأخطئ أحيانًا" إلى "ناقش معي موضوعات معقدة وأنتج محتوى عند الطلب".
هذا المقال لا يتناول قوائم ميزات فحسب. يتناول المسار: كيف أبقى تصميم سيري وهندسته وقيود المنتج نطاقه ضيقًا وهشًا، بينما مكّنت نماذج اللغة الكبيرة ChatGPT من أن يكون مفتوح النهاية وحواريًا.
سنتناول:
لفرق المنتج والذكاء الاصطناعي، تكشف مقارنة سيري وChatGPT كيف يمكن للتوقيت وقرارات المنصة والمخاطر الفنية أن تعزز الميزة أو تقضي عليها بهدوء.
عندما كشفت آبل عن سيري مع iPhone 4S في 2011 بدا وكأنه لمحة من الخيال العلمي على جهاز شائع. نشأت سيري كشركة ناشئة من SRI International؛ استحوذت عليها آبل في 2010 وحوّلتها بسرعة إلى ميزة بارزة، ليست مجرد تطبيق آخر.
روّجت آبل لسيري كمساعد محادثي يعتمد الصوت يمكنه التعامل مع مهام يومية: ضبط التذكيرات، إرسال الرسائل، التحقق من الطقس، العثور على مطاعم، والمزيد. كانت الفكرة بسيطة وقوية: بدلاً من التنقل عبر التطبيقات، يكفي التحدث إلى الآيفون.
ارتكزت حملة الإطلاق على الشخصية. كان لسيري إجابات طريفة ونكات و"بيض عيد" صممت لجعل المساعد يبدو حيًا ويمكن الاقتراب منه. غطت المراجعات التقنية والإعلام الشعبي الناس "يتحدثون إلى هواتفهم" كحدث ثقافي. لفترة، كانت سيري أكثر رمز مرئي للذكاء الاصطناعي للمستهلك.
خلف الصوت الودود، كانت بنية سيري نظامًا قائمًا على النوايا مربوطًا بمجالات معرفة مُحددة:
create_reminder أو send_message).سيري لم تكن "تفكر" بشكل عام؛ كانت تنسق مجموعة كبيرة من القدرات المبرمجة.
عند الإطلاق، كان هذا متقدمًا على ما شحنه المنافسون بعدة سنوات. شعرت جهود مثل Google Voice Actions ضيقة وأداتية بالمقارنة. منحت سيري آبل ميزة دخول مبكر حقيقية: امتلكت خيال الجمهور بشأن ما يمكن أن يكون عليه مساعد الذكاء الاصطناعي على هاتف ذكي، قبل ظهور نماذج اللغة الكبيرة وChatGPT.
حصلت سيري على مكانة في روتين الناس من خلال إتقان مجموعة ضيقة من المهام اليومية. قول "يا سيري، اضبط مؤقتًا 10 دقائق" أو "اتصل بأمي" أو "أرسل رسالة لألكس بأنني سأتأخر" عادة ما نجح من المحاولة الأولى. التحكم بدون يَد للمكالمات والرسائل والتذكيرات والمنبهات بدا سحريًا، خاصة أثناء القيادة أو الطهي.
كان التحكم بالموسيقى نقطة قوة أخرى. "شغّل بعض الجاز" أو "تخطي" أو "ما اسم هذه الأغنية؟" جعل الآيفون يبدو كجهاز تحكم صوتي لتجربة Apple Music والصوت الأوسع. مع الاستعلامات البسيطة—الطقس، نتائج المباريات، حقائق أساسية—قدمت سيري فائدة سريعة في تفاعلات قصيرة ومحددة الدور.
تحت السطح، اعتمدت سيري على النوايا والحقول والمجالات. كل مجال (كالرسائل أو المنبهات أو الموسيقى) دعم مجموعة صغيرة من النوايا—"إرسال رسالة"، "إنشاء مؤقت"، "تشغيل مقطع"—مع حقول لتفاصيل مثل أسماء جهات الاتصال أو مدد الزمن أو عناوين الأغاني.
كان هذا التصميم يعمل جيدًا إذا التزم المستخدمون بصيغ متوقعة: "ذكّرني الساعة 3 م بالاتصال بطبيب الأسنان" تترجم بسلاسة إلى نية تذكير مع حقول الوقت والنص. لكن عندما تحدث الناس بحرية أكثر—أضافوا تعليقًا جانبيًا أو رتبوا الجمل بترتيب غير اعتيادي—غالبًا ما أخفقت سيري أو رجعت لنتائج الويب.
لأن كل سلوك جديد تطلب نمذجة نية ومجال بعناية، نمت قدرات سيري ببطء. دعم إجراءات وتطبيقات ولغات جديدة تأخر عن توقعات المستخدمين. لاحظ كثيرون أنه عامًا بعد عام، لم تبدُ سيري أنها تكتسب مهارات جديدة أو "ذكاء" ملحوظًا.
الأسئلة المتتابعة كانت سطحية، مع ذاكرة سياقية ضئيلة. يمكنك طلب مؤقت واحد، لكن إدارة عدة مؤقتات عبر محادثة طبيعية كانت هشة. تلك الهشاشة—جنبًا إلى جنب مع الإحساس بأن سيري لا تتطور كثيرًا—هي ما جعل المستخدمين منبهرين عندما ظهر نظام محادثي أكثر مرونة كـ ChatGPT لاحقًا.
بُنيت سيري على نموذج قائم على النوايا: كشف العبارة المحفزة، تصنيف الطلب لنية معروفة (ضبط منبه، إرسال رسالة، تشغيل أغنية)، ثم استدعاء خدمة محددة. إذا لم يطابق طلبك نمطًا أو مجالًا محددًا، لم يكن أمام سيري مكان تذهب إليه؛ إما فشلت أو عادت إلى بحث الويب.
قلبت نماذج اللغة الكبيرة هذا النموذج. بدلًا من الربط بمجموعة ثابتة من النوايا، تتنبأ هذه النماذج بالكلمة التالية في تسلسل، ومدرّبة على كم هائل من النصوص. هذا الهدف البسيط يُشفّر قواعد اللغة والحقائق وأنماط الأسلوب والاستدلال في نظام عام واحد. لم يعد المساعد بحاجة إلى قاعدة أو واجهة برمجة تطبيقات لكل مهمة جديدة؛ يمكنه الارتجال عبر المجالات.
كان GPT-3 (2020) أول نموذج لغة كبير شعر بأنه مختلف نوعيًا: نموذج واحد قد يكتب كودًا، يصيغ نصًا تسويقيًا، يلخص نصًا قانونيًا، ويجيب عن أسئلة دون تدريب خاص بالمهمة. مع ذلك، كان لا يزال "خامًا"—قويًا لكن صعب التوجيه.
غيرت معايرة التعليمات والتعلم المعزز من التغذية الراجعة البشرية (RLHF) ذلك. حيث أعاد الباحثون تدريب النماذج على أمثلة مثل "اكتب بريدًا إلكترونيًا إلى..." أو "اشرح الحوسبة الكمومية ببساطة"، ما جعلها أكثر امتثالًا للتعليمات ومعايير السلامة. هذا جعل نماذج اللغة أفضل بكثير في اتباع طلبات اللغة الطبيعية، لا مجرد إكمال النص.
إحاطة نموذج مُعلّم على التعليمات بواجهة دردشة مستمرة—ما فعلته OpenAI مع ChatGPT في أواخر 2022—جعل الإمكانية مفهومة وسهلة الوصول. أصبح بإمكان المستخدمين:
مع النماذج متعددة الوسائط، يمكن لنفس النظام الآن التعامل مع نصوص، كود، وصور—مترجمًا بينها بسلاسة.
مقارنة بمهارات سيري الضيقة المرتبطة بالنوايا، يتصرف ChatGPT كشريك حوار عام‑الغرض. يستطيع الاستدلال عبر مواضيع، كتابة وتصحيح الأكواد، العصف الذهني والشرح، دون حدود مجالات آبل التقليدية. هذا التحول—من فتحات الأوامر إلى الحوار المفتوح—هو ما جعل سيري تبدو قديمة بسرعة.
قصة آبل في الذكاء الاصطناعي ليست مجرد خوارزميات؛ إنها قصة فلسفة المنتج. نفس الخيارات التي جعلت الآيفون موثوقًا ومربحًا جعلت سيري تشعر بالتجمّد بينما قفز ChatGPT أمامها.
بنت آبل سيري وفق نموذج خصوصية صارم: تقليل جمع البيانات، تجنّب المعرفات الدائمة، والحفاظ على أقصى قدر ممكن على الجهاز. هذا أراح المستخدمين والمنظمين، لكنه أيضًا يعني:
بينما دربت OpenAI وآخرون نماذج لغة على مجموعات بيانات هائلة وسجلات خوادم، تعاملت آبل مع بيانات الصوت كما لو كانت شيئًا يُتخلص منه سريعًا أو يُعمّى بشدة. بقي فهم سيري للطلبات الواقعية الفوضوية ضيقًا وهشًا بالمقارنة.
دافعت آبل أيضًا بقوة عن المعالجة على الجهاز. تشغيل النماذج على الآيفون يعني كمونًا أقل وخصوصية أفضل، لكنه قيد حجم النموذج وتعقيده لسنوات.
صُممت هياكل سيري المبكرة لنماذج صغيرة ومتخصصة تتناسب مع قيود الذاكرة والطاقة. بالمقابل، تم تحسين ChatGPT ونماذج شبيهة له للعمل كسلاسل سحابية ضخمة يمكن توسيعها بعدد أكبر من وحدات المعالجة الرسومية.
نتيجة لذلك، ظهرت كل قفزة في نمذجة اللغة—نوافذ سياق أكبر، قدرة استدلال أغنى، قدرات ناشئة—أولًا في المساعدين السحابيين وليس في سيري.
تدور أعمال آبل حول هوامش الأجهزة والتكامل الوثيق للخدمات. صُوّرت سيري كميزة تجعل iPhone وApple Watch وCarPlay أكثر جذبًا، لا كمنتج ذكاء اصطناعي مستقل.
هذا شكل قرارات الاستثمار:
النتيجة: تحسنت سيري، لكن في أغلب الأحيان بطرق تدعم حالات استخدام الجهاز—المؤقتات، الرسائل، HomeKit—أكثر من حل المشكلات الاستكشافية الواسعة.
ثقافيًا، آبل حذرة مع أي شيء يبدو غير مكتمل. ميزات "النسخة التجريبية" العامة والواجهات التجريبية المعطوبة تشعر بعدم الارتياح مع علامتها التجارية.
كانت نماذج اللغة، خصوصًا في مراحلها الأولى، فوضوية: هلوسات، إجابات غير متوقعة، ومقايضات أمنية. شركات مثل OpenAI طرحتها علنًا ووسمتها كبحث وكررت التطوير أمام الجمهور. آبل، بالمقابل، تجنبت السماح لسيري بالتجريب غير المتناغم على نطاق واسع.
خفض هذا الحذر حلقة التغذية الراجعة. لم ير المستخدمون سلوكيات جذرية جديدة من سيري، ولم تحصل آبل على نفس فيضان بيانات الاستخدام الذي سرّع تحسين ChatGPT.
كل من هذه الخيارات—ممارسات الحفاظ على الخصوصية، تحيّز المعالجة على الجهاز، اقتصاديات العتاد، وثقافة الحذر—منطقية لوحدها. معًا، جعلت سيري تتطور بخطوات صغيرة ومتحكم بها بينما قفز ChatGPT إلى الأمام.
قارن العملاء نوايا آبل بالكيفية: ما زالت سيري تفشل في طلبات متعددة الخطوات البسيطة، بينما تعامل ChatGPT مع أسئلة معقدة، مساعدة في البرمجة، العصف الذهني، والمزيد. بحلول وقت إعلان آبل عن Apple Intelligence وشراكتها لدمج ChatGPT، كان الفارق في تصور المستخدم واضحًا: سيري أصبحت المساعد الذي تتوقع أن يسيء فهمك؛ وChatGPT هو الذي تتوقع أن يفاجئك.
تم تصميم سيري كـ واجهة صوتية لمجموعة محددة من المهام، بينما بُني ChatGPT كنموذج لغة عام يمكنه الارتجال عبر مجالات متعددة.
الاختلافات الرئيسية:
البنية
القدرات
أسلوب التفاعل
الانطباع العام
تأخرت سيري ليس لندرة المواهب في آبل، بل بسبب اختيارات استراتيجية ومنتجية أبطأت التقدم الملموس.
الأسباب الرئيسية:
نظام سيري الأصلي:
set_alarm أو send_message أو play_song.اختيارات آبل كانت مفهومة كل على حدة لكنها مجتمعة قيّدت تطور سيري.
القرارات الرئيسية للمنتج:
Apple Intelligence هو اسم آبل لميزات الذكاء التوليدي المتكاملة نظاميًا على iPhone وiPad وMac.
ما يتضمنه:
تكامل آبل مع OpenAI يوفر لسيري مسارًا لاستخدام ChatGPT عندما ترى آبل أن استعلامًا ما مفتوح النهاية جدًا.
كيف يعمل بشكل عام:
كلاهما ممتاز في مهام مختلفة، ومعظم الناس سيستخدمان الاثنين.
استخدم سيري عندما تحتاج إلى:
استخدم أدوات على غرار ChatGPT عندما تحتاج إلى:
للمطورين، الاختلاف الأساسي بين سيري ومنصات LLM هو المرونة ومساحة التجربة.
سيري / SiriKit:
منصات LLM (مثل OpenAI):
الدروس العملية لفرق المنتج والذكاء الاصطناعي:
نعم—آبل لا تزال تملك أصولًا قوية، لكنها فقدت قيادة السرد حول ما يعنيه مساعد ذكي.
ما تملكه آبل بعد:
ما فقدته:
في المقابل، تحسّن ChatGPT بوضوح وبوتيرة أسرع، ما جعل توقعات المستخدمين تتغير بسرعة.
نماذج اللغة الكبيرة مثل التي تعمل خلف ChatGPT:
عمليًا، هذا يجعل نماذج اللغة أكثر مرونة وقادرة على التعامل مع أسئلة معقدة ومتعددة الأجزاء التي لم تُصنَّف لسيري.
نموذج خصوصية صارم
انحياز للمعالجة على الجهاز
اقتصاديات مركزة على الأجهزة
ثقافة الحذر في الإطلاق
مجموع هذه العوامل جعل سيري تتحسن تدريجيًا بينما بدت الاختراقات الواضحة من نماذج اللغة في مكان آخر.
بالمجمل، Apple Intelligence هي محاولة آبل للحاق بنمط المساعدين المبني على نماذج اللغة مع الحفاظ على موقفها تجاه الخصوصية والتكامل الهارديوري.
من ناحية الخصوصية، تقدّم آبل هذا كطريقة واضحة و"بنقرة موافقة": تظل سيري الواجهة الأمامية، وأنت تقرر متى يُغادر استعلامك نظام آبل إلى OpenAI.
قاعدة عملية: اطلب من سيري تشغيل جهازك؛ واطلب من ChatGPT أن يفكّر معك.
إذا كنت تريد تكاملًا عميقًا مع إجراءات الجهاز فستحتاج SiriKit. إذا أردت مساعدًا مرنًا أو مساعدًا متخصصًا فأنظمة LLM عادةً أفضل.
بإيجاز، الريادة المبكرة هشة—تحتاج تطورًا سريعًا ومرئيًا ومحوريًا حول المستخدم لتظل في المقدمة.
السنوات القادمة—كيف تطور آبل سيري، تفتح بيئتها، وتوظف Apple Intelligence—ستحدد إن كانت ستعيد تعريف تجربة المساعد أم تظل وظيفة صوتية مريحة بينما تملك جهات أخرى مقدمة الذكاء.