जानिए कैसे लैरी पेज के शुरुआती विचार—एआई और ज्ञान के बारे में—ने Google की दीर्घकालिक रणनीति को आकार दिया, खोज की गुणवत्ता से लेकर मूनशॉट्स और AI-फर्स्ट दांव तक।

यह किसी एक बड़े विज्ञप्ति-क्षण या ओवरहाइप वाला लेख नहीं है। यह दीर्घकालिक सोच के बारे में है: कैसे कोई कंपनी किसी दिशा का जल्दी चुनाव कर सकती है, कई तकनीकी परिवर्तनों के माध्यम से निवेश जारी रख सकती है, और धीरे-धीरे एक बड़े विचार को रोज़मर्रा के उत्पादों में बदल सकती है।
जब यह पोस्ट 'लैरी पेज की एआई दृष्टि' कहती है, तो इसका मतलब यह नहीं है कि 'Google ने आज के चैटबॉट्स की भविष्यवाणी कर ली थी।' इसका मतलब कुछ सरल—और अधिक टिकाऊ—है: अनुभव से सीखने वाली प्रणालियाँ बनाना।
इस पोस्ट में, 'एआई दृष्टि' कुछ जुड़ी मान्यताओं को दर्शाती है:
अर्थात्, 'दृष्टि' किसी एक मॉडल के बारे में कम और एक इंजन के बारे में ज्यादा है: संकेत इकट्ठा करें, पैटर्न सीखें, सुधार भेजें, दोहराएँ।
इस विचार को ठोस बनाने के लिए, बाकी पोस्ट एक सरल प्रगति का पता लगाती है:
अंत तक, 'लैरी पेज की एआई दृष्टि' नारा जितनी नहीं, रणनीति उतनी ही महसूस होनी चाहिए: सीखने वाली प्रणालियों में जल्दी निवेश करें, उन्हें खिलाने वाली पाइपलाइन बनाएं, और वर्षों में सम्मिलित प्रगति के लिए धैर्य रखें।
शुरूआती वेब में एक सरल परंतु जटिल परिणाम वाली समस्या थी: अचानक इतनी जानकारी आ गई थी कि किसी व्यक्ति के लिए सब छाँटना असंभव था, और ज्यादातर सर्च टूल्स बस यह अनुमान लगा रहे थे कि क्या महत्व रखता है।
अगर आप कोई क्वेरी टाइप करते, तो कई इंजन स्पष्ट संकेतों पर निर्भर करते थे—किसी पेज पर शब्द कितनी बार आया, क्या यह टाइटल में है, या साइट मालिक ने उसे छुपे टेक्स्ट में कितनी बार डाला। इससे परिणाम आसानी से गेम हो जाते थे और भरोसेमंद नहीं रहते थे। वेब उसी गति से बढ़ रहा था जिस गति से उसे व्यवस्थित करने वाले टूल्स नहीं थे।
लैरी पेज और सर्गेई ब्रिन का मुख्य अंतर्दृष्टि यह था कि वेब के पास पहले से ही एक अंतर्निर्मित वोटिंग सिस्टम है: लिंक।
एक पेज से दूसरे पेज का लिंक किसी पेपर में संदर्भ या एक दोस्त की सिफारिश जैसा है। लेकिन सभी सिफारिशें समान नहीं होतीं। ऐसे पेज से आने वाला लिंक जिसकी स्वयं कई अन्य साइटें मूल्यवान मानती हैं, अज्ञात पेज से मिलने वाले लिंक से अधिक मायने रखता है। PageRank ने इस विचार को गणित में बदला: पेजों को सिर्फ अपनी सामग्री के आधार पर नहीं, बल्कि वेब के बाकी हिस्सों द्वारा दिए गए 'वोट्स' के आधार पर रैंक किया गया।
इससे एक साथ दो जरूरी काम हुए:
सिर्फ एक चालाक रैंकिंग विचार होना पर्याप्त नहीं था। सर्च क्वालिटी एक गतिशील लक्ष्य है: नए पेज आते हैं, स्पैम अनुकूलन होते हैं, और किसी क्वेरी का क्या मतलब है बदल सकता है।
इसलिए सिस्टम को मापने योग्य और अपडेटेबल होना पड़ा। Google लगातार टेस्टिंग पर झुका—बदलाव आजमाना, मापना कि क्या परिणाम सुधरते हैं, और दोहराना। यह पुनरावृत्ति की आदत कंपनी के दीर्घकालिक 'लर्निंग' सिस्टम्स के दृष्टिकोण को आकार देती रही: सर्च को एक बार का इंजीनियरिंग प्रोजेक्ट न मानकर निरंतर मूल्यांकन योग्य चीज़ माना गया।
महान सर्च सिर्फ चालाक एल्गोरिद्म का मामला नहीं है—यह उन संकेतों की मात्रा और गुणवत्ता का मामला है जिनसे वे एल्गोरिद्म सीख सकते हैं।
शुरूआती Google के पास एक अंतर्निहित लाभ था: वेब खुद ही 'वोट्स' से भरा है जो मायने रखते हैं। पेजों के बीच के लिंक (PageRank की नींव) संदर्भ की तरह काम करते हैं, और एंकर टेक्स्ट ("click here" बनाम "best hiking boots") अर्थ जोड़ता है। इसके ऊपर, पन्नों में भाषा के पैटर्न मॉडल को पर्यायवाची, वर्तनी के भिन्न रूप और एक ही प्रश्न पूछने के कई तरीके समझने में मदद करते हैं।
एक बार लोग किसी सर्च इंजन का बड़े पैमाने पर उपयोग करते हैं तो उपयोग से अतिरिक्त संकेत बनते हैं:
यही फ़्लाइव्हील है: बेहतर परिणाम अधिक उपयोग आकर्षित करते हैं; अधिक उपयोग समृद्ध संकेत पैदा करता है; समृद्ध संकेत रैंकिंग और समझ को सुधारते हैं; और वह सुधार और भी अधिक उपयोग खींचता है। समय के साथ, सर्च एक निश्चित नियमों के सेट की तरह कम और एक सीखने वाली प्रणाली की तरह ज्यादा बन जाता है जो लोगों को वास्तव में उपयोगी क्या लगता है, उसके मुताबिक अनुकूलित होती है।
विभिन्न प्रकार का डेटा एक-दूसरे को सुदृढ़ करता है। लिंक संरचना प्राधिकरण को उभार सकती है, जबकि क्लिक व्यवहार वर्तमान प्राथमिकताओं को दर्शाता है, और भाषा डेटा अस्पष्ट क्वेरियों (