झांग यीमिंग और ByteDance: एक वैश्विक ध्यान इंजन बनाना

Q: सोशल ग्राफ और इंटरेस्ट ग्राफ फ़ीड में क्या अंतर है?

एक सोशल-ग्राफ फ़ीड उस पर निर्भर होता है किसे आप फ़ॉलो करते हैं ; एक इंटरेस्ट-ग्राफ फ़ीड उस पर निर्भर होता है आप क्या करते हैं (देखना, स्किप करना, फिर देखना, शेयर करना, सर्च)। इंटरेस्ट-ग्राफ तरीका उन स्थितियों में भी काम कर सकता है जब आप किसी को फ़ॉलो नहीं करते, लेकिन यह जल्दी से अच्छी सिफारिशें देने और फीड से तेजी से सीखने पर बहुत निर्भर करता है।

Q: अनुशंसा सिस्टम आमतौर पर पहले क्या दिखाने का चयन करते हैं?

अधिकांश फीड दो मुख्य काम करते हैं: - कैंडिडेट जनरेशन: विशाल कैटलॉग में से एक शॉर्टलिस्ट खींचना, व्यापक सुरागों के आधार पर (भाषा, स्थान, पिछला व्यवहार, समान उपयोगकर्ता)। - रैंकिंग: उस शॉर्टलिस्ट को इस तरह क्रमबद्ध करना कि वह तय करे कि आप अभी सबसे ज्यादा क्या enjoy करेंगे। कैंडिडेट जनरेशन संभावित मिलानों को ढूँढता है; रैंकिंग अंतिम क्रम तय करती है जहाँ छोटे-छोटे बदलाव भी आपके अगले व्यू को बदल सकते हैं।

Q: TikTok/Douyin जैसे रैंकिंग में सबसे ज्यादा किन संकेतों पर निर्भर किया जाता है?

मजबूत संकेत आमतौर पर व्यवहार से आते हैं, खासकर: - वॉच टाइम और पूरा देखना (और रिवैचस) - तेज़ स्किप्स (स्पष्ट नकारात्मक संकेत) - शेयर/सेंड (अक्सर लाइक्स से मजबूत) - फॉलो (लंबे समय की प्राथमिकता) लाइक्स और कमेंट्स काम आते हैं, पर वॉच व्यवहार अक्सर सबसे भरोसेमंद होता है क्योंकि बड़े पैमाने पर इसे नकली करना कठिन है।

लॉग इन शुरू करें

झांग यीमिंग: ByteDance के पीछे उत्पाद का सिद्धांत

झांग यीमिंग (जन्म 1983) को ByteDance के संस्थापक के रूप में जाना जाता है, लेकिन उनकी कहानी सेलिब्रिटी उद्यमशीलता के बारे में कम और एक विशिष्ट उत्पाद विश्वास के बारे में अधिक है।

नानकाई विश्वविद्यालय में पढ़ाई के बाद (माइक्रोइलेक्ट्रॉनिक्स से सॉफ़्टवेयर की ओर शिफ्ट), उन्होंने ऐसे रोल लिये जो उन्हें सर्च, फीड और उपभोक्ता इंटरनेट के पैमाने से परिचित करते थे: ट्रैवल सर्च स्टार्टअप Kuxun में निर्माण, Microsoft China में एक छोटा स्टिंट, और फिर शुरुआती रियल-एस्टेट प्रोडक्ट 99fang की स्थापना।

वह समस्या जो वे हल करना चाहते थे

झांग का मूल प्रश्न सरल था: आप बिना उपयोगकर्ता से बहुत काम कराये, कैसे सही जानकारी को सही व्यक्ति के साथ जल्दी मैच कराते हैं?

पूर्व इंटरनेट उत्पाद यह मानते थे कि उपयोगकर्ता खोजेंगे या पोर्टल और श्रेणियों का अनुसरण करेंगे। लेकिन जैसे-जैसे कंटेंट बढ़ा, बोतलनैक "कम जानकारी" से बदलकर "बहुत ज्यादा जानकारी" हो गया। उनका उत्पाद सिद्धांत यह था कि सॉफ़्टवेयर फ़िल्टरिंग का ज्यादा काम करे—और इसे लगातार करे—ताकि हर इंटरैक्शन के साथ अनुभव सुधरता जाए।

एक उत्पाद दर्शन जिसने ByteDance को आकार दिया

शुरुआत से, ByteDance ने पर्सनलाइज़ेशन को एक फीचर के रूप में नहीं बल्कि एक प्रथम-श्रेणी के उत्पाद प्रिमिटिव के रूप में माना। यह मानसिकता तीन बार-बार होते चुनावों में दिखती है:

व्यवहार को मापो, इंटेंट को नहीं। आप क्या देखते हैं, क्या स्किप करते हैं, क्या फिर देखते हैं, क्या शेयर करते हैं—ये उन चीज़ों से अधिक भरोसेमंद हैं जो आप कहते हैं कि पसंद हैं।
तेज़ भेजो, और तेज़ सीखो। छोटे प्रयोग, कड़े फ़ीडबैक लूप, और लगातार पुनरावृत्ति “परफेक्ट” लॉन्च की तुलना में बेहतर होते हैं।
पूरे सिस्टम का अनुकूलन करो। एक शानदार फीड के लिए केवल एक एल्गोरिथम ही नहीं चाहिए; इसे कंटेंट सप्लाई, क्रिएटर प्रोत्साहन, और गवर्नेंस की भी ज़रूरत होती है जो साथ चल सके।

इस लेख में क्या उम्मीद करें

यह पौराणिक कथाओं का टूटना नहीं बल्कि तंत्रों का ब्रेकडाउन है: किस तरह अनुशंसा एल्गोरिदम, उत्पाद डिज़ाइन, और "कंटेंट लॉजिस्टिक्स" एक साथ काम करते हैं—और इसका क्रिएटर्स, विज्ञापनदाताओं, और वैश्विक पैमाने पर सुरक्षा के लिए क्या अर्थ है।

ByteDance की उत्पत्ति की कहानी और शुरुआती उत्पाद दांव

ByteDance शॉर्ट वीडियो से शुरू नहीं हुआ। यह एक सरल प्रश्न से शुरू हुआ: जब सामग्री बहुत ज्यादा हो तो लोगों को उपयोगी, रोचक जानकारी कैसे ढूँढने में मदद करें?

झांग यीमिंग के शुरुआती उत्पाद न्यूज़ और जानकारी ऐप्स थे जो सीखने के लिए डिज़ाइन किए गए थे कि हर उपयोगकर्ता क्या चाहता है और फ़ीड को उसी के अनुसार फिर से व्यवस्थित करते थे।

ByteDance ने सबसे पहले क्या बनाया (TikTok से पहले)

ब्रेकआउट शुरुआती उत्पाद Toutiao (एक “हेडलाइंस” ऐप) था। उपयोगकर्ताओं से प्रकाशकों या दोस्तों का अनुसरण करने के बजाय, इसने सामग्री को इन्वेंटरी की तरह और फ़ीड को व्यक्तिगत स्टोरफ़्रंट की तरह माना।

यह फ्रेमिंग महत्वपूर्ण थी क्योंकि इसने कंपनी को मूल मशीनरी जल्दी बनाने के लिए बाध्य किया: कंटेंट को टैग करना, रैंक करना, और वास्तविक समय में संतोष मापना।

मूल दांव: वितरण सामाजिक ग्राफ से नहीं, एल्गोरिथम से

उस समय अधिकांश उपभोक्ता ऐप्स सोशल ग्राफ पर निर्भर थे—आप किसे जानते हैं यह तय करता था कि आप क्या देखते हैं। ByteDance ने इंटरेस्ट-ग्राफ पर दांव लगाया—आप क्या देखते हैं, स्किप करते हैं, पढ़ते हैं, शेयर करते हैं, और सर्च करते हैं यह तय करता है कि आगे आपको क्या दिखेगा।

इस चुनाव ने लॉन्च पर उत्पाद को नेटवर्क इफेक्ट्स पर कम और “पर्याप्त अच्छा” सिफारिशें जल्दी पाने पर ज्यादा निर्भर बना दिया।

उत्पाद संस्कृति में प्रयोग को बेक किया गया

शुरू से ही, ByteDance ने उत्पाद निर्णयों को परिकल्पनाओं की तरह माना। फीचर्स, लेआउट, और रैंकिंग समायोजन लगातार टेस्ट किये गये, और जीतने वाले वेरिएंट तेज़ी से भेजे गये।

यह सिर्फ A/B टेस्टिंग के रूप में टूल नहीं था; यह एक प्रबंधन प्रणाली थी जो सीखने की गति को इनाम देती थी।

शॉर्ट वीडियो की ओर परिवर्तन के मोड़

एक बार अनुशंसा इंजन लेखों के लिए काम करने लगा, धनी फ़ॉर्मैट्स की ओर जाना एक स्वाभाविक अगला कदम था। वीडियो ने स्पष्ट फीडबैक सिग्नल दिए (वॉच टाइम, रिप्ले, कम्पलीशन), तेज़ सामग्री उपभोग और बड़ा अपसाइड—अगर फ़ीड लगातार प्रासंगिक बने—यह सब Douyin और बाद में TikTok के लिए मंच तैयार कर रहा था।

कंटेंट डिस्कवरी की समस्या: कमी से ओवरलोड तक

मीडिया के इतिहास में अधिकांश समय समस्या कमी थी: हर निच के लिए पर्याप्त चैनल, प्रकाशक, या क्रिएटर नहीं थे। वितरण सरल था—टीवी चालू करें, समाचारपत्र पढ़ें, कुछ वेबसाइट पर जाएँ—और "सर्वश्रेष्ठ" सामग्री वही थी जो सीमित द्वारों से होकर गुज़री।

अब बोतलनैक उल्टा हो गया है। इतनी सामग्री है कि कोई भी व्यक्ति उसका मूल्यांकन नहीं कर सकता, यहां तक कि एक श्रेणी में भी नहीं। इसका मतलब है कि "बहुत अधिक सामग्री" अब निर्माण की समस्या कम और वितरण की समस्या ज्यादा है: मूल्य अधिक पोस्ट करने से हटकर सही दर्शक को सही चीज़ जल्दी ढूँढने में हो गया है।

क्यों कालानुक्रमिक फीड काम करना बंद कर देते हैं

कालानुक्रमिक फीड मानते हैं कि आप पहले से जानते हैं किसे फ़ॉलो करना है। वे दोस्तों या छोटे क्रिएटर सेट के साथ बने रहने के लिए अच्छे हैं, पर वे तब संघर्ष करते हैं जब:

आप नए हैं और किसी को भी फ़ॉलो नहीं करते
आपकी रुचियाँ उस फ़ॉलो सूची से तेज़ी से बदलती हैं
क्रिएटर अनियमित रूप से पोस्ट करते हैं (आप रत्न मिस कर देते हैं, और भराव देखते हैं)

फ़ॉलोअर-आधारित डिस्कवरी भी देर-सबेर incumbents को फ़ायदा देती है। एक बार कुछ अकाउंट्स ने जल्दी ध्यान पकड़ लिया, तो सबके लिए वृद्धि कठिन हो जाती है—गुणवत्ता की परवाह किए बिना।

केवल क्लिक नहीं, ध्यान मापना

जब सामग्री प्रचुर हो, प्लेटफ़ॉर्म को ऐसे संकेत चाहिए जो "देखा" और "आनंद लिया" को अलग करें। बिताया गया समय मायने रखता है, लेकिन यह एकमात्र सुराग नहीं है। कम्प्लीशन रेट, रिवैचस, पाज़ेस, शेयर और "नॉट इंटरेस्टेड" जैसे कार्य मदद करते हैं जिज्ञासा को संतोष से अलग करने में।

पर्सनलाइज़ेशन बदल देता है कि “स्केल” का क्या अर्थ है

एक ब्रॉडकास्ट मॉडल में, स्केल का मतलब होता है एक हिट को लाखों तक पुश करना। एक व्यक्तिगत मॉडल में, स्केल का मतलब है हर माइक्रो-ऑडियंस के लिए लाखों छोटे-छोटे हिट्स पहुँचना।

चुनौती पहुंच नहीं है—यह हर व्यक्ति के लिए बार-बार और तेज़ी से प्रासंगिकता है।

अनुशंसा एल्गोरिदम, गैर-तकनीकी पाठकों के लिए समझाया गया

ByteDance के फीड (Douyin/TikTok) जादुई लगते हैं क्योंकि वे तेज़ी से सीखते हैं। पर मूल विचार सीधा है: सिस्टम बार-बार अनुमान लगाता है कि आपको क्या पसंद आयेगा, देखता है कि आपने आगे क्या किया, और अगले अनुमान को अपडेट करता है।

दो कदम: कैंडिडेट जनरेशन बनाम रैंकिंग

फ़ीड को लाखों आइटमों वाली दुकान की तरह सोचें।

कैंडिडेट जनरेशन “शॉर्टलिस्ट” कदम है। बड़ी सूची में से सिस्टम कुछ सौ या हज़ार वीडियो खींचता है जो आपके लिए उपयुक्त हो सकते हैं। यह व्यापक सुरागों का उपयोग करता है: आपकी भाषा, स्थान, डिवाइस, आप जिन अकाउंट्स को फ़ॉलो करते हैं, जिन विषयों के साथ आपने सहभागिता की है, और उन दर्शकों ने क्या पसंद किया जो आपसे मिलते-जुलते हैं।

रैंकिंग "अंतिम क्रम" कदम है। उस शॉर्टलिस्ट में से यह अनुमान लगाता है कि आप अभी किन वीडियो को देखने और आनंद लेने की संभावना रखते हैं, और उन्हें उसी के अनुसार सॉर्ट करता है। यहां छोटे अंतर मायने रखते हैं: दो वीडियो की जगह बदलने से यह बदल सकता है कि आप अगला क्या देखेंगे, और उससे सिस्टम जो सीखता है वह बदल जाता है।

फीड को कौन से संकेत चलाते हैं?

एल्गोरिथम दिमाग नहीं पढ़ता—यह व्यवहार पढ़ता है। सामान्य संकेतों में शामिल हैं:

वॉच टाइम और कम्प्लीशन: क्या आपने वीडियो पूरा देखा? क्या आपने उसे दोबारा चलाया?
स्किप्स: क्या आपने तुरंत स्वाइप कर दिया?
शेयर और सेंड्स: यह दर्शाता है कि आपने इसे आगे भेजने लायक पाया।
लाइक्स, कमेंट्स, सेव्स: उपयोगी हैं, पर अक्सर वॉच व्यवहार जितने मजबूत नहीं।
फॉलोज़: एक लंबी अवधि की प्रतिबद्धता जो भविष्य के कैंडिडेट्स को बदल देती है।

महत्वपूर्ण बात: यह "नकारात्मक" प्राथमिकताओं को भी सीखता है: आप क्या लगातार स्किप करते हैं, म्यूट करते हैं, या नॉट-इंटरेस्टेड मार्क करते हैं।

कोल्ड स्टार्ट: नए यूज़र्स और नए वीडियो

एक नए उपयोगकर्ता के लिए, सिस्टम सुरक्षित, विविध पिक्स से शुरू करता है—आपके क्षेत्र और भाषा की लोकप्रिय सामग्री और श्रेणियों का मिश्रण—ताकि जल्दी प्राथमिकताएँ पता चल सकें।

एक नए वीडियो के लिए, यह अक्सर एक नियंत्रित "ट्रायल" चलाता है: इसे छोटे समूहों को दिखाना जो संभावित रुचि रखते हैं, और अगर इंगेजमेंट मजबूत है तो वितरण बढ़ाना। यही तरीका उन अज्ञात क्रिएटर्स को बिना मौजूदा ऑडियंस के भी ब्रेकथ्रू देने देता है।

क्यों शॉर्ट वीडियो इतनी तेजी से सीखते हैं

शॉर्ट वीडियो मिनटों में बहुत सारे फ़ीडबैक पैदा करते हैं: कई व्यूज़, कई स्वाइप्स, कई कम्प्लीशन्स। यह सिग्नल्स का घना प्रवाह मॉडल को तेज़ी से अपडेट करने में मदद करता है, और "टेस्ट" और "सीख" के बीच लूप को कसता है।

A/B टेस्टिंग के साथ लगातार ट्यूनिंग

ByteDance A/B टेस्ट चला सकता है जहाँ अलग-अलग समूहों को थोड़े अलग रैंकिंग नियम दिखाए जाते हैं (उदाहरण के लिए, शेयर को लाइक से अधिक महत्व देना)। यदि किसी वर्जन से महत्वपूर्ण आउटकम—जैसे संतोष और समय की गुणवत्ता—सुधरती है, तो वह नया डिफ़ॉल्ट बन जाता है, और चक्र जारी रहता है।

अटेंशन फ्लाइवील: कंपाउंडिंग फीडबैक लूप्स

ByteDance का फ़ीड अक्सर "नशे वाला" कहा जाता है, पर असल में जो होता है वह एक कंपाउंडिंग फीडबैक सिस्टम है। हर स्वाइप एक विकल्प और एक माप दोनों है।

जब आप देखते हैं, स्किप करते हैं, लाइक करते हैं, कमेंट करते हैं, फिर देखते हैं या शेयर करते हैं, आप उन संकेतों को जेनरेट कर रहे हैं जो सिस्टम को अगला क्या दिखाना है अनुमान लगाने में मदद करते हैं।

कैसे एक स्वाइप बेहतर सिफारिशों में बदलता है

एक अकेला व्यू अपने आप में ज्यादा सूचनात्मक नहीं है। पर लाखों छोटे-छोटे क्रियाएँ—खासकर दोहराए गए पैटर्न—यह स्पष्ट तस्वीर बनाते हैं कि क्या आपका ध्यान बनाए रखता है। प्लेटफ़ॉर्म उन संकेतों का उपयोग करके:

आपको समान कंटेंट क्लस्टर्स (विषय, फ़ॉर्मैट, क्रिएटर्स) से मिलाता है
सीखता है कौन से वैरिएशन्स काम करते हैं (लंबाई, पेस, ऑडियो, कैप्शन)
जब आपकी रुचियाँ बदलती हैं तो तेज़ी से एडजस्ट करता है (आज रेसिपीज़; कल ट्रैवल)

यह फ्लाइवील है: इंगेजमेंट → बेहतर मैचिंग → ज्यादा इंगेजमेंट। जैसे-जैसे मैचिंग सुधरती है, उपयोगकर्तार्ओं का समय बढ़ता है; अतिरिक्त समय और डेटा देता है; डेटा फिर से मैचिंग को बेहतर बनाता है।

एक्सप्लोरेशन क्यों मायने रखता है (और क्यों मुश्किल है)

यदि सिस्टम केवल "जो काम किया उससे और" ही पीछा करे, तो आपकी फीड जल्दी बोर कर देगी। इसलिए अधिकांश अनुशंसा सिस्टम जानबूझकर एक्सप्लोरेशन शामिल करते हैं—नई, आसन्न या अनिश्चित सामग्री दिखाते हुए।

एक्सप्लोरेशन दिख सकता है जैसे:

परिचित श्रेणी में एक नया क्रिएटर
एक ही विषय के साथ अलग शैली का वीडियो
एक “वाइल्ड कार्ड” जो नई रुचि की जाँच करता है

अच्छी तरह करने पर, यह फ़ीड को ताज़ा रखता है और उपयोगकर्ताओं को उन चीज़ों की खोज में मदद करता है जिनकी वे खोज नहीं जानते थे।

रनअवे ऑप्टिमाइज़ेशन और प्लेटफ़ॉर्म कैसे इसका मुकाबला करते हैं

एक फ्लाइवील गलत दिशा में भी घूम सकता है। यदि ध्यान जीतने का आसान तरीका सनसनीखेज़ता, आक्रोश, या चरम सामग्री है, तो सिस्टम इसे अधिक इनाम दे सकता है। जब पर्सनलाइज़ेशन बहुत संकरी हो जाती है तो फ़िल्टर बबल बन सकते हैं।

प्लेटफ़ॉर्म आमतौर पर संतोष और नवीनता का संतुलन बनाए रखने के लिए विविधता नियम, गुणवत्ता थ्रेशहोल्ड्स और सुरक्षा नीतियों का मिश्रण उपयोग करते हैं (जैसा कि लेख में बाद में कवर है), साथ ही पेसिंग कंट्रोल्स ताकि "उच्च-उत्तेजना" सामग्री हर सेशन में हावी न हो।

कंटेंट लॉजिस्टिक्स: फ़ीड के पीछे छिपा सिस्टम

कंटेंट पाइपलाइनों का प्रोटोटाइप बनाएं

साधारण एडमिन स्क्रीन, कतारें और स्टेटस ट्रैकिंग से कंटेंट लॉजिस्टिक्स मॉडल करें।

शुरू करें

जब लोग ByteDance की बात करते हैं, वे आमतौर पर अनुशंसा एल्गोरिथम की ओर इशारा करते हैं। पर वहाँ एक शांत प्रणाली भी उतनी ही मेहनत करती है: कंटेंट लॉजिस्टिक्स—क्रिएटर के फोन से सही दर्शक की स्क्रीन तक वीडियो को जल्दी, सुरक्षित और बार-बार पहुँचाने की एंड-टू-एंड प्रक्रिया।

“कंटेंट लॉजिस्टिक्स” का वास्तविक अर्थ

इसे ध्यान के लिए एक सप्लाई चैन की तरह सोचें। गोदामों और ट्रकों की जगह, सिस्टम प्रबंधित करता है:

क्रिएटर इनपुट (रिकॉर्डिंग, एडिटिंग, मेटाडेटा)
प्लेटफ़ॉर्म प्रोसेसिंग (अपलोड, एन्कोडिंग, चेक)
वितरण (डिलीवरी स्पीड, स्थिरता)
नियंत्रण (मॉडरेशन, पॉलिसी अनुपालन)

यदि किसी भी चरण में देरी या अनविश्वसनीयता है, तो एल्गोरिथम के पास काम करने के लिए कम चीज़ें होंगी—और क्रिएटर की प्रेरणा खो जाएगी।

क्रिएटर्स के लिए घर्षण कम करना

एक उच्च-प्रदर्शन फीड को लगातार “ताज़ा इन्वेंटरी” की ज़रूरत होती है। ByteDance-शैली के उत्पाद क्रिएटर्स को अधिक बार पोस्ट करने में मदद करते हैं: इन-ऐप टेम्पलेट, इफेक्ट्स, म्यूजिक स्निपेट्स, एडिटिंग शॉर्टकट, और गाइडेड प्रम्प्ट्स।

ये सिर्फ मज़ेदार फीचर्स नहीं हैं। वे फ़ॉर्मैट्स (लंबाई,.aspect ratio, pacing) को मानकीकृत करते हैं और वीडियो को खत्म करना आसान बनाते हैं, जिससे पोस्टिंग फ़्रीक्वेंसी बढ़ती है और प्रदर्शन की तुलना करना सरल होता है।

अपलोड, एन्कोडिंग, और डिलीवरी: स्पीड एक फीचर है

अपलोड के बाद, वीडियो को कई रेज़ॉल्यूशन और फ़ॉर्मैट्स में प्रोसेस करना होता है ताकि वे विभिन्न डिवाइस और नेटवर्क कंडीशन्स पर स्मूद चलें।

तेज़ प्रोसेसिंग मायने रखती है क्योंकि:

क्रिएटर्स प्रदर्शन पर तेज़ फ़ीडबैक की अपेक्षा करते हैं
दर्शक धीमी-लोडिंग वीडियो छोड़ देते हैं
सिस्टम तेज़ी से तब सीखता है जब कंटेंट जल्दी लोगों तक पहुँचता है

विश्वसनीयता भी “सेशन” को बचाती है। अगर प्लेबैक रुक-रुक कर चलता है, उपयोगकर्ता स्क्रॉल करना बंद कर देते हैं, और फ़ीडबैक लूप कमजोर पड़ जाता है।

मॉडरेशन को एक चेकपॉइंट नहीं बल्कि पाइपलाइन के रूप में देखना

पैमाने पर, मॉडरेशन एक एकल निर्णय नहीं है—यह एक वर्कफ़्लो है। अधिकांश प्लेटफ़ॉर्म पर्त-दर-पर्त कदम इस्तेमाल करते हैं: स्वचालित पहचान (स्पैम, नग्नता, हिंसा, कॉपीराइटेड ऑडियो के लिए), रिस्क स्कोरिंग, और एज केस और अपील के लिए लक्षित मानव समीक्षा।

पॉलिसी लागू करना ऑपरेशंस है

नियम तभी काम करते हैं जब उन्हें सुसंगत रूप से लागू किया जाये: स्पष्ट नीतियाँ, रिव्यूअर ट्रेनिंग, ऑडिट ट्रेल्स, एस्केलेशन पाथ्स, और माप (फॉल्स पॉज़िटिव, टर्नअराउंड टाइम, रिपीट ऑफेंडर)।

दूसरे शब्दों में, कार्यान्यन एक परिचालन प्रणाली है—जिसे सामग्री जितनी तेज़ बदलती है उतनी ही तेज़ बदलना चाहिए।

वह उत्पाद डिज़ाइन विकल्प जो अनुशंसाओं को बढ़ाते हैं

ByteDance का लाभ केवल "एल्गोरिथम" नहीं है। यह उस तरीके में भी है जिस तरह उत्पाद उन सही संकेतों को पैदा करने के लिए बनाया गया है—और उन संकेतों को प्रवाहित रखने के लिए।

विचार से पोस्ट तक दूरी घटाने वाले निर्माण उपकरण

एक बढ़िया अनुशंसा सिस्टम को लगातार सप्लाई चाहिए। TikTok/Douyin हमेशा-तैयार कैमरा, सरल ट्रिमिंग, टेम्पलेट्स, फ़िल्टर्स, और बड़ी साउंड लाइब्रेरी के साथ घर्षण घटाते हैं।

दो डिज़ाइन विवरण मायने रखते हैं:

ऑडियो को शुरुआत के रूप में उपयोग करना: पहले एक साउंड चुनना क्रिएटर्स को तुरंत फ़ॉर्मैट, मूड, और ऑडियंस क्लस्टर देता है।
एडिटिंग जो दया महसूस कराती है: तेज़ कट्स और इफेक्ट्स "पर्याप्त अच्छा" कण्टेंट बनाते हैं बिना प्रोफेशनल कौशल के।

अधिक क्रिएटर्स अधिक बार पोस्ट कर रहे हैं, जिसका अर्थ है फ़ीड के पास टेस्ट करने के लिए अधिक विविधता और मैच मिलने के ज्यादा मौके।

फुल-स्क्रीन, साउंड-ऑन: कम विकल्प, अधिक ध्यान

फुल-स्क्रीन प्लेयर प्रतिस्पर्धी UI एलिमेंट्स को हटा देता है और एक स्पष्ट क्रिया को प्रोत्साहित करता है: स्वाइप। डिफ़ॉल्ट रूप से साउंड-ऑन भावनात्मक प्रभाव बढ़ाता है और ट्रेंड्स को पोर्टेबल बनाता है (एक साउंड साझा संदर्भ बन जाता है)।

यह डिज़ाइन डेटा की गुणवत्ता भी सुधारता है। जब हर स्वाइप एक मजबूत हाँ/नहीं संकेत है, तो सिस्टम भीड़-भाड़ वाले इंटरफेस की तुलना में तेज़ी से सीख सकता है जहाँ ध्यान बँटा होता है।

डुएट, स्टिच और रिमिक्स: सहयोग को वितरण के रूप में बदलना

रिमिक्स फ़ॉर्मेट “निर्माण” को “उत्तर देने” में बदल देते हैं। यह मायने रखता है क्योंकि रिप्लाईज़ संदर्भ विरासत में लेते हैं:

एक डुएट/स्टीच नया कंटेंट मौजूद, साबित क्लिप से जोड़ता है।
मूल क्रिएटर को लगातार सर्कुलेशन का फ़ायदा मिलता है।
सिस्टम को स्पष्ट इंटरेस्ट-ग्राफ मिलते हैं (जो लोग X पसंद करते हैं वे अक्सर X के जवाबों के साथ भी सहभागिता करते हैं)।

व्यवहार में, रिमिक्स इनबिल्ट वितरण है—बिना फॉलोअर्स के।

नोटिफिकेशन और सेशन लूप: क्या नोट करना है, क्या बचना है

नोटिफिकेशन्स लूप फिर से खोल सकते हैं (नए कमेंट्स, क्रिएटर पोस्ट्स, लाइव इवेंट)। स्ट्रीक्स और समान मैकेनिक रिटेंशन बढ़ा सकते हैं, पर वे अनिवार्य जाँच को भी बढ़ा सकते हैं।

एक उपयोगी उत्पाद सबक: अर्थपूर्ण प्रॉम्प्ट्स (जवाब, वह फॉलो जो आपने मांगा) को प्राथमिकता दें बजाय दबाव वाले प्रॉम्प्ट्स (स्ट्रीक खोने का डर)।

UI कैसे अनुशंसाओं को आदत में बदलता है

छोटे निर्णय—तुरंत प्लेबैक, न्यूनतम लोडिंग, एक प्राथमिक जेस्चर—अनुशंसित फ़ीड को खोज का डिफ़ॉल्ट तरीका महसूस कराते हैं।

उत्पाद सिर्फ आपको सामग्री नहीं दिखा रहा; यह एक दोहराने योग्य व्यवहार ट्रेन कर रहा है: ऐप खोलो → देखो → स्वाइप करो → फ़ीड ट्यून हो।

वैश्विक जाना: संस्कृति, ऑपरेशन, और अनुपालन का पैमाना बढ़ाना

पहले सिस्टम की योजना बनाएं

Planning Mode का उपयोग करके कोड जनरेट करने से पहले फीचर, मीट्रिक्स और गार्डरिल्स मैप करें।

बिल्ड की योजना बनाएं

ByteDance ने "एक ऐप का अनुवाद" नहीं किया और उसे अंतरराष्ट्रीय कहा। उसने वैश्वीकरण को एक उत्पाद समस्या और एक ऑपरेटिंग-सिस्टम समस्या दोनों के रूप में ट्रीट किया: जो चीज़ें लोग पसंद करते हैं वे काफी स्थानीय होती हैं, पर जो मशीनरी इसे डिलीवर करती है उसे लगातार होना चाहिए।

स्थानीयकरण: सिर्फ भाषा से अधिक

स्थानीयकरण भाषा से शुरू होता है, पर जल्दी ही संदर्भ—मीम्स, म्यूज़िक, ह्यूमर, और वीडियो में "अच्छा" पेसिंग किसे कहा जाता है—पर आता है।

स्थानीय क्रिएटर कम्युनिटीज़ यहाँ मायने रखती हैं: शुरुआती वृद्धि अक्सर कुछ स्थानीय क्रिएटर्स के छोटे समूह पर निर्भर करती है जो टोन सेट करते हैं जिसे अन्य लोग नकल करते हैं।

टीमें आमतौर पर लोकलाइज़ करती हैं:

ऑनबोर्डिंग प्रॉम्प्ट और रुचियाँ (जाते समय एक सामान्य फीड से बचने के लिए)
म्यूज़िक लाइब्रेरी और ट्रेंडिंग साउंड्स
डिस्कवरी सतहें (हैशटैग, चैलेंज, फ़ीचर्ड क्रिएटर्स)

ऑपरेशनल ज़रूरतें: इंसान इन-द-लूप

उपयोग बढ़ने पर, फीड एक लॉजिस्टिक्स ऑपरेशन बन जाता है। क्षेत्रीय टीमें साझेदारियों (लेबल्स, स्पोर्ट्स लीग्स, मीडिया), क्रिएटर प्रोग्राम, और स्थानीय क़ानून के अनुरूप नीति प्रवर्तन संभालती हैं।

मॉडरेशन परतों में स्केल होता है: प्रोक्टिव फ़िल्टर्स, उपयोगकर्ता रिपोर्ट्स, और मानव समीक्षा। लक्ष्य है गति और सुसंगतता—स्पष्ट उल्लंघनों को तेज़ी से हटाना और एज मामलों को स्थानीय विशेषज्ञता के साथ संभालना।

वितरण की वास्तविकताएं: ऐप स्टोर्स और डिवाइस

वैश्विक होना मतलब ऐप स्टोर नियमों और डिवाइस सीमाओं के भीतर रहना। अपडेट समीक्षा प्रक्रियाओं से देरी हो सकते हैं, फ़ीचर क्षेत्रानुसार अलग हो सकते हैं, और लो-एंड फोन वीडियो क्वालिटी, कैशिंग, और डेटा उपयोग पर कठिन चुनाव मजबूर करते हैं।

डिस्ट्रिब्यूशन मार्केटिंग का फुटनोट नहीं है; यह तय करता है कि उत्पाद विश्वसनीय रूप से क्या कर सकता है।

संस्कृति नीति से तेज़ी से बढ़ती है

ट्रेंड्स दिनों में आ सकते और जा सकते हैं, जबकि नीति लेखन और एन्फोर्समेंट ट्रेनिंग हफ्तों ले सकती है। टीमें इस गैप को "अस्थायी नियमों" के साथ पाटती हैं जब नए फ़ॉर्मैट उभरते हैं, त्वरित प्रवर्तन दिशानिर्देश देती हैं, और अस्थिर क्षणों के दौरान कड़ी निगरानी रखती हैं—फिर बाद में जो काम करता उसे स्थायी नीति और टूलिंग में बदल देती हैं।

फीड के पीछे कैसे समर्थन किया जाता है इस पर और जानकारी के लिए, देखें /blog/content-logistics-hidden-system-behind-the-feed.

क्रिएटर्स, विज्ञापनदाताओं, और प्लेटफ़ॉर्म मार्केटप्लेस

ByteDance का फ़ीड अक्सर "एक एल्गोरिथम" कहा जाता है, पर यह एक मार्केटप्लेस की तरह व्यवहार करता है। दर्शक मांग (ध्यान) लाते हैं। क्रिएटर्स इन्वेंटरी (वीडियो) सप्लाई करते हैं। विज्ञापनदाता उस ध्यान को पहुँचाने के लिए पैसा देते हैं—जब यह भरोसेमंद और सुरक्षित तरीके से पहुंचाया जा सके।

सप्लाई साइड के रूप में क्रिएटर्स

क्रिएटर्स केवल कंटेंट अपलोड नहीं करते; वे कच्चा माल बनाते हैं जिसे अनुशंसा सिस्टम टेस्ट कर सकता है, वितरित कर सकता है, और उससे सीख सकता है।

एक लगातार ताज़ा पोस्ट्स का प्रवाह प्लेटफ़ॉर्म को और अधिक "प्रयोग" चलाने देता है: विभिन्न विषय, हुक्स, फ़ॉर्मैट, और ऑडियंस।

बदले में, प्लेटफ़ॉर्म ऐसे प्रोत्साहन प्रदान करते हैं जो व्यवहार को आकार देते हैं:

दिखाई: अपरिचित दर्शकों तक पहुँचने की संभावना, केवल फॉलोअर्स तक सीमित नहीं।
समुदाय: कमेंट्स, डुएट/रिमिक्स, और क्रिएटर-टू-क्रिएटर मानदंड।
राजस्व प्रोग्राम (उच्च-स्तर): टिपिंग, क्रिएटर फंड, सब्सक्रिप्शन, ब्रांड डील—आमतौर पर पात्रता नियमों और अस्थिरता के साथ, गारंटी नहीं।

विज्ञापनदाताओं को क्या चाहिए

ब्रांड्स आमतौर पर वायरल किस्म की किस्मत से कम और दोहराए जाने योग्य परिणामों से अधिक परवाह करते हैं:

टार्गेटिंग जो गोपनीयता सीमाओं का सम्मान करते हुए भी प्रासंगिक ऑडियंस तक पहुँचता है।
मापन (एट्रीब्यूशन, लिफ्ट स्टडीज़, कन्वर्ज़न सिग्नल) जो समझने योग्य और ऑडिटेबल हो।
सुरक्षा: हानिकारक या विवादास्पद सामग्री के साथ सन्निकटता से बचाव, और नीतियों के लागू होने का विश्वास।

निच समुदाय बनाम मास ट्रेंड्स

अनुशंसा निच समुदायों को बिना विशाल फॉलोवर काउंट के फले-फूले की अनुमति देती है। वहीं, यह तेजी से भी ध्यान को केंद्रीकृत कर सकता है जब बहुत से दर्शक समान रूप से प्रतिक्रिया देते हैं।

यह डायनमिक क्रिएटर्स के लिए रणनीतिक तनाव पैदा करती है: निच सामग्री वफादारी बना सकती है; ट्रेंड में भागीदारी पहुँच में बढ़ोतरी कर सकती है।

अनुशंसा क्रिएटर रणनीति को कैसे बदलती है

क्योंकि वितरण प्रदर्शन-आधारित है, क्रिएटर्स उन संकेतों के लिए ऑप्टिमाइज़ करते हैं जिन्हें सिस्टम जल्दी पढ़ सके: मजबूत ओपनिंग्स, स्पष्ट फ़ॉर्मैट, सीरीज़ व्यवहार, और नियमित पोस्टिंग।

यह "रीडेबल" कंटेंट को भी इनाम देता है—स्पष्ट विषय, पहचानने योग्य ऑडियो, और दोहराने योग्य टेम्पलेट—क्योंकि इन्हें सही दर्शकों से जोड़ना बड़े पैमाने पर आसान होता है।

भरोसा, सुरक्षा, और पैमाने पर ध्यान की लागतें

ByteDance की सुपरपावर—इंगेजमेंट के लिए फीड को अनुकूलित करना—एक अंतर्निहित तनाव पैदा करती है। वही संकेत जो सिस्टम को बताते हैं कि "लोग इसको नहीं छोड़ पा रहे" वे स्वतः यह नहीं बताते कि "यह उनके लिए अच्छा है"। छोटे पैमाने पर यह UX मुद्दा दिखता है। TikTok/Douyin के पैमाने पर, यह भरोसे का मुद्दा बन जाता है।

मूल व्यापारिक-ऑफ़: इंगेजमेंट बनाम भलाई

अनुशंसा सिस्टम उन चीज़ों से सीखते हैं जो उपयोगकर्ता करते हैं, न कि वे बाद में क्या चाहते थे कि उन्होंने किया होता। तेज़ रिप्ले, लंबे वॉच टाइम, और देर रात स्क्रॉल करना मापना आसान होते हैं। पछतावा, चिंता, और आवेगी उपयोग मापना कठिन हैं।

यदि फ़ीड केवल मापनीय इंगेजमेंट के लिए ट्यून की जाती है, तो यह संभवतः ऐसी सामग्री को अधिक इनाम दे सकती है जो आक्रोश, भय, या जुनून को ट्रिगर करती है।

बड़े पैमाने पर सामान्य चिंताएँ

कई पूर्वानुमेय जोखिम बाज़ारों में दिखते हैं:

गलत सूचना जो सुधारों से तेज़ी से फैलती है
हानिकारक या आत्म-हानि से जुड़ी सामग्री जो "रैबिट होल्स" में क्लस्टर कर सकती है
अनंत स्क्रॉल और बदलती इनाम संरचना द्वारा उत्पन्न आदी उपयोग के पैटर्न

इनमें से कोई भी कंपनी के अंदर “खराब अभिनेता” को ज़रूरी नहीं मानता; वे सामान्य अनुकूलन से उभर सकते हैं।

पारदर्शिता क्यों सचमुच कठिन है

लोग अक्सर एक सरल स्पष्टीकरण पूछते हैं: "मुझे यह क्यों दिखा?" व्यवहार में, रैंकिंग हजारों फीचर्स (वॉच टाइम, स्किप्स, ताज़ा होना, डिवाइस संदर्भ, क्रिएटर इतिहास) और वास्तविक-समय प्रयोगों का मिश्रण होती है।

भले ही प्लेटफ़ॉर्म एक सूची साझा करे, फिर भी वह किसी विशिष्ट इंप्रेशन के लिए एक मानवीय-रीडेबल कारण में साफ़ तरीके से मैप नहीं करेगा।

डिजाइन के द्वारा सुरक्षा कैसी दिख सकती है

सुरक्षा केवल बाद में मॉडरेशन नहीं है। इसे उत्पाद और संचालन में डिज़ाइन किया जा सकता है: संवेदनशील विषयों पर घर्षण, नाबालिगों के लिए मजबूत नियंत्रण, दोहरावदार एक्सपोज़र कम करने के लिए विविधीकरण, देर रात सिफारिशों पर सीमाएँ, और फ़ीड रीसेट या ट्यून करने के सरल टूल।

ऑपरेशनल रूप से, इसका मतलब है अच्छी तरह प्रशिक्षित रिव्यू टीमें, एस्केलेशन पाथ्स, और मापनीय सुरक्षा KPIs—केवल विकास KPIs नहीं।

गवर्नेंस दीर्घकालिक वृद्धि को आकार देती है

क्या अनुमति है, अपील कैसे काम करती है, और प्रवर्तन कैसे ऑडिट होता है—इन नीतियों का भरोसा सीधे प्रभावित करता है। यदि उपयोगकर्ता और रेगुलेटर मानते हैं कि सिस्टम अपारदर्शी या असंगत है, तो वृद्धि नाज़ुक बन जाती है।

सतत ध्यान केवल लोगों को देखते रहने के बजाय उनके जीवन में दिखने की अनुमति कमाने की बात है।

उत्पाद टीमों के लिए सबक: जिम्मेदार डिस्कवरी सिस्टम बनाना

पूरा सोर्स कंट्रोल रखें

दिन एक से ही अपने कोडबेस का मालिक बनें और इसे कभी भी अपनी इंजीनियरिंग टीम को सौंप दें।

कोड निर्यात करें

ByteDance की सफलता "सिफारिशें + तेज़ शिपिंग" को एक सरल नुस्खा जैसा दिखाती है। हस्तांतरणीय भाग किसी एक मॉडल में नहीं है—यह डिस्कवरी के चारों ओर का ऑपरेटिंग सिस्टम है: कड़े फ़ीडबैक लूप, स्पष्ट मापन, और उन लूप्स को खिलाने वाली सामग्री पाइपलाइन में गंभीर निवेश।

आप क्या नकल कर सकते हैं (बिना ByteDance बने)

तेज़ पुनरावृत्ति तब काम करती है जब इसे मापन योग्य लक्ष्यों और छोटे सीखने के चक्रों के साथ जोड़ा जाता है। हर परिवर्तन को परिकल्पना मानें, छोटे भेजें, और रोज़ाना—not तिमाही—परिणाम पढ़ें।

मेट्रिक्स को उपयोगकर्ता मूल्य पर केंद्रित रखें, सिर्फ़ समय पर नहीं। उदाहरण: "सेशन जो एक फॉलो के साथ समाप्त होते हैं", "कंटेंट सेव/शेयर हुआ", "सर्वे की गई संतुष्टि", या "क्रिएटर रिटेंशन"। ये कच्चे वॉच टाइम से कठिन हैं, पर वे बेहतर व्यापार-ऑफ़्स का मार्गदर्शन करते हैं।

क्या न करें

बिना गार्डरेल के केवल इंगेजमेंट-आधारित ऑप्टिमाइज़ेशन। यदि "ज़्यादा मिनट" स्कोरबोर्ड है, तो आप अंततः कम-गुणवत्ता, ध्रुवीकरण या दोहरावदार सामग्री को इनाम देंगे क्योंकि वे भरोसेमंद रूप से चिपकने वाली होती हैं।

और इस मिथक से भी दूर रहें कि एल्गोरिथ्म संपादकीय निर्णय की आवश्यकता को हटा देता है। डिस्कवरी सिस्टम हमेशा चुनावों को एन्कोड करते हैं: क्या बढ़ावा देना है, क्या सीमित करना है, और एज मामलों को कैसे संभालना है।

एक नैतिक डिस्कवरी इंजन के लिए व्यावहारिक चेकलिस्ट

नारे से शुरू न होकर प्रतिबंधों के साथ शुरू करें:

नुकसान श्रेणियाँ परिभाषित करें (गलत सूचना, उत्पीड़न, आत्म-हानि, धोखाधड़ी) और एस्केलेशन नियम।
रैंकिंग से पहले "गुणवत्ता फ़्लोर्स" जोड़ें (स्पैम फ़िल्टर, डुप्लिकेशन जांच, न्यूनतम मौलिकता संकेत)।
काउंटर-मैट्रिक्स उपयोग करें: हर 1,000 व्यूज़ पर शिकायतें, "नॉट इंटरेस्टेड" दर, पुनरावृत्त एक्सपोज़र, क्रिएटर चर्न।
पारदर्शिता बनाएं: "आप यह क्यों देख रहे हैं" समझाएं और सरल नियंत्रण दें।

जादू नहीं, लॉजिस्टिक्स में सोचें

अनुशंसाएँ कंटेंट लॉजिस्टिक्स पर निर्भर करती हैं: टूलिंग, वर्कफ़्लो, और गुणवत्ता नियंत्रण। आरंभ में निवेश करें:

क्रिएटर टूल्स और स्पष्ट दिशानिर्देश (/features)
मॉडरेशन कतारें, ऑडिट, और रिव्यूअर ट्रेनिंग
प्रयोग डैशबोर्ड और निर्णय लॉग

यदि आप बजट बना रहे हैं, तो पूरे सिस्टम—मॉडलों, मॉडरेशन, और सपोर्ट—की कीमत लगाएँ पहले कि आप स्केल करें (/pricing)।

एक व्यावहारिक नोट टीमों के लिए जो सॉफ़्टवेयर बना रहे हैं: इन कई “सिस्टम” निवेशों (डैशबोर्ड, आंतरिक टूल, वर्कफ़्लो ऐप्स) को जल्दी से प्रोटोटाइप करना सरल है अगर आप बिल्ड–मेज़र–लर्न लूप को छोटा कर सकें। Koder.ai जैसे प्लेटफ़ॉर्म यहां मदद कर सकते हैं—टीमों को चैट इंटरफ़ेस के ज़रिये वेब ऐप्स को vibe-code करने देना, फिर सोर्स कोड एक्सपोर्ट या तैनात करने की सुविधा—यह प्रयोगात्मक डैशबोर्ड, मॉडरेशन कतार प्रोटोटाइप, या क्रिएटर ऑपरेशन्स टूलिंग जल्दी से घुमाने में उपयोगी है।

अधिक उत्पाद चिन्तन के लिए देखें /blog.

निष्कर्ष और आगे पढ़ने के स्रोत

ByteDance का मूल उत्पाद सिद्धांत एक सरल समीकरण में संक्षेपित किया जा सकता है:

अनुशंसा एल्गोरिदम + कंटेंट लॉजिस्टिक्स + उत्पाद डिज़ाइन = एक स्केलेबल अटेंशन इंजन।

एल्गोरिथम लोगों को संभावित-रोचक वीडियो के साथ मिलाता है। लॉजिस्टिक्स सिस्टम सुनिश्चित करता है कि देखने के लिए हमेशा कुछ है (सलाह, समीक्षा, लेबलिंग, वितरण, क्रिएटर टूल्स)। और उत्पाद डिज़ाइन—फुल-स्क्रीन प्लेबैक, तेज़ फ़ीडबैक सिग्नल, कम-घर्षण निर्माण—हर व्यू को डेटा में बदल देता है जो अगले व्यू को बेहतर बनाता है।

अभी भी क्या बहस में है (और बाहर से हम क्या नहीं जान सकते)

कुछ महत्वपूर्ण विवरण अस्पष्ट बने हुए हैं या आंतरिक पहुंच के बिना सत्यापित करना कठिन है:

कारण बनाम सहसंबंध: यह प्रमाणित करना मुश्किल है कि कौन सा डिज़ाइन या मॉडल परिवर्तन किसी मीट्रिक शिफ्ट का कारण बना, क्योंकि कई बदलाव एक साथ चलते हैं।
फीड के पीछे का “रेसिपी”: प्लेटफ़ॉर्म शायद ही कभी सटीक रैंकिंग फैक्टर्स, उनके वेट्स, या वे कैसे क्षेत्र और उपयोगकर्ता सेगमेंट के हिसाब से बदलते हैं, सार्वजनिक करते हैं।
ट्रेड-ऑफ़्स और थ्रेशहोल्ड्स: टीमें वॉच टाइम, संतोष, विविधता, और सुरक्षा का संतुलन कैसे करती हैं यह आंशिक रूप से नीति, आंशिक रूप से संस्कृति, और अक्सर संदर्भगत होता है।

अनुमान लगाने के बजाय, सार्वजनिक दावों (कंपनी, आलोचकों, या टिप्पणिकारों से) को परिकल्पनाओं की तरह लें और प्रकटीकरणों, अनुसंधान, और प्रेक्षणीय उत्पाद व्यवहार में लगातार साक्ष्य ढूँढें।

गहराई से पढ़ने के मार्ग

यदि आप तकनीकी होने के बिना और गहराई में जाना चाहते हैं, इन विषयों पर ध्यान दें:

रैकेमेंडर सिस्टम्स बेसिक्स: रैंकिंग, कोलैबोरेटिव फ़िल्टरिंग, एम्बेडिंग्स, और क्यों “फीडबैक लूप्स” ट्रेंड्स को तेज़ कर सकते हैं।
प्रयोग और मेट्रिक्स: A/B टेस्टिंग, प्रॉक्सी मेट्रिक्स, और अनपेक्षित परिणाम।
कंटेंट मॉडरेशन ऑपरेशंस: मानव समीक्षा वर्कफ़्लो, नीति डिज़ाइन, अपील, और क्षेत्रीय अनुपालन।

किसी भी फीड-आधारित उत्पाद का मूल्यांकन करने के लिए प्रश्न

सिस्टम किसके लिए ऑप्टिमाइज़ करता है: वॉच टाइम, वापसी यात्राएँ, “संतोष”, क्रिएटर रिटेंशन, विज्ञापन प्रदर्शन—या इनका मिश्रण?
कौन सी उपयोगकर्ता क्रियाएँ मजबूत संकेत मानी जाती हैं (रीवॅच, शेयर, फॉलो), और किन्हें नजरअंदाज किया जाता है?
उत्पाद नवीनता कैसे पेश करता है और “एक ही प्रकार की सामग्री” में फंसने से कैसे रोकता है?
सुरक्षा बैकस्टॉप्स क्या हैं (सीमाएँ, घर्षण, रिपोर्टिंग, पारदर्शिता), और वे कितनी तेज़ी से काम करते हैं?
सिस्टम से किसे सबसे ज़्यादा लाभ होता है—उपयोगकर्ता, क्रिएटर्स, विज्ञापनदाता—और लागत कौन उठाता है?

यदि आप इन प्रश्नों को हाथ में रखें, तो आप TikTok, Douyin, और किसी भी भविष्य के फीड-आधारित उत्पाद का अधिक स्पष्ट आँकलन कर सकेंगे।

अक्सर पूछे जाने वाले प्रश्न

झांग यीमिंग का ByteDance के पीछे मूल उत्पाद सिद्धांत क्या था?

झांग यीमिंग का उत्पाद सिद्धांत यह था कि सॉफ़्टवेयर को जानकारी को लगातार आपके लिए फ़िल्टर करना चाहिए, व्यवहार संकेतों का उपयोग करके, ताकि हर इंटरैक्शन के साथ अनुभव बेहतर होता जाए। कंटेंट ओवरलोड की दुनिया में, उत्पाद का काम "मुझे जानकारी ढूंढने में मदद करो" से बदलकर "अभी सबसे प्रासंगिक क्या है, यह तय करो" हो जाता है।

सोशल ग्राफ और इंटरेस्ट ग्राफ फ़ीड में क्या अंतर है?

एक सोशल-ग्राफ फ़ीड उस पर निर्भर होता है किसे आप फ़ॉलो करते हैं; एक इंटरेस्ट-ग्राफ फ़ीड उस पर निर्भर होता है आप क्या करते हैं (देखना, स्किप करना, फिर देखना, शेयर करना, सर्च)। इंटरेस्ट-ग्राफ तरीका उन स्थितियों में भी काम कर सकता है जब आप किसी को फ़ॉलो नहीं करते, लेकिन यह जल्दी से अच्छी सिफारिशें देने और फीड से तेजी से सीखने पर बहुत निर्भर करता है।

अनुशंसा सिस्टम आमतौर पर पहले क्या दिखाने का चयन करते हैं?

अधिकांश फीड दो मुख्य काम करते हैं:

कैंडिडेट जनरेशन: विशाल कैटलॉग में से एक शॉर्टलिस्ट खींचना, व्यापक सुरागों के आधार पर (भाषा, स्थान, पिछला व्यवहार, समान उपयोगकर्ता)।
रैंकिंग: उस शॉर्टलिस्ट को इस तरह क्रमबद्ध करना कि वह तय करे कि आप अभी सबसे ज्यादा क्या enjoy करेंगे।

कैंडिडेट जनरेशन संभावित मिलानों को ढूँढता है; रैंकिंग अंतिम क्रम तय करती है जहाँ छोटे-छोटे बदलाव भी आपके अगले व्यू को बदल सकते हैं।

TikTok/Douyin जैसे रैंकिंग में सबसे ज्यादा किन संकेतों पर निर्भर किया जाता है?

मजबूत संकेत आमतौर पर व्यवहार से आते हैं, खासकर:

वॉच टाइम और पूरा देखना (और रिवैचस)
तेज़ स्किप्स (स्पष्ट नकारात्मक संकेत)
शेयर/सेंड (अक्सर लाइक्स से मजबूत)
फॉलो (लंबे समय की प्राथमिकता)

लाइक्स और कमेंट्स काम आते हैं, पर वॉच व्यवहार अक्सर सबसे भरोसेमंद होता है क्योंकि बड़े पैमाने पर इसे नकली करना कठिन है।

फीड नए उपयोगकर्ताओं और नए वीडियो के लिए कोल्ड स्टार्ट समस्या को कैसे संभालती है?

नए उपयोगकर्ताओं के लिए, प्लेटफ़ॉर्म आपके भाषा/प्रदेश में विविध, “सुरक्षित” लोकप्रिय सामग्री के साथ शुरुआत करते हैं ताकि प्राथमिकताएँ जल्दी पता चल सकें।

नए वीडियो के लिए, अक्सर एक छोटा ट्रायल डिस्ट्रिब्यूशन चलाया जाता है: संभावित रुचि वाले समूहों को दिखाना और अगर इंगेजमेंट अच्छा है तो वितरण बढ़ाना। व्यावहारिक रूप से, इसका मतलब है कि बिना बड़े फॉलोवर बेस के अनजान क्रिएटर्स भी उभर सकते हैं—यदि शुरुआती प्रदर्शन अच्छा हो।

क्यों अनुशंसा सिस्टम जानबूझकर आपको ऐसी सामग्री दिखाते हैं जो आपको पसंद न भी आए?

एक्सप्लोरेशन फीड को एकरस होने से रोकता है—यह जानबूझकर ऐसे कंटेंट का परीक्षण करता है जो नया, आसन्न, या अनिश्चित हो। सामान्य तरीके:

परिचित विषयों में एक नया क्रिएटर मिलाना
उसी विषय के साथ अलग स्टाइल आजमाना (लंबाई, पेसिंग, ऑडियो)
कभी-कभी एक “वाइल्ड कार्ड” देना

बिना एक्सप्लोरेशन के, सिस्टम ओवरफिट कर सकता है और फ़ीड संकुचित या ध्रुवीकृत हो सकती है।

एक अटेंशन फीड में “रनअवे ऑप्टिमाइज़ेशन” का क्या अर्थ है, और इसे कैसे संभाला जाता है?

रनअवे ऑप्टिमाइज़ेशन तब होता है जब ध्यान जीतने का सबसे आसान रास्ता सनसनीखेज या चरम सामग्री हो, इसलिए एल्गोरिथम अनजाने में उसे पुरस्कृत कर देता है। प्लेटफ़ॉर्म इसे संतुलित करने के लिए विविधता नियम, गुणवत्ता थ्रेशहोल्ड्स, और सुरक्षा नीतियाँ लागू करते हैं, साथ ही ऐसे कंटेंट के लिए पेसिंग कंट्रोल्स जो हर सेशन में हावी न हो सकें।

“कंटेंट लॉजिस्टिक्स” क्या है, और यह एल्गोरिथम जितना ही क्यों महत्वपूर्ण है?

कंटेंट लॉजिस्टिक्स वह एंड-टू-एंड पाइपलाइन है जो क्रिएटर के फोन से दर्शक की स्क्रीन तक सामग्री पहुँचाती है:

क्रिएशन इनपुट और मेटाडेटा
अपलोड, एन्कोडिंग, और डिलीवरी प्रदर्शन
मॉडरेशन वर्कफ़्लो और पॉलिसी लागू करना

यदि यह पाइपलाइन धीमी या अविश्वसनीय है, तो अनुशंसा खराब होती है क्योंकि सिस्टम के पास कम (और कम गुणवत्ता) इन्वेंटरी और कमजोर फ़ीडबैक लूप होंगे।

क्रिएटर टूल और रिमिक्स फ़ॉर्मैट अनुशंसा प्रदर्शन को कैसे बढ़ाते हैं?

कम-रुकावट क्रिएशन टूल (टेम्पलेट, इफेक्ट, साउंड लाइब्रेरी, आसान एडिटिंग) पोस्टिंग फ़्रीक्वेंसी बढ़ाते हैं और फॉर्मेट को स्टैन्डर्डाइज़ करते हैं, जो कंटेंट को टेस्ट और तुलना में आसान बनाता है। रिमिक्स मेकानिक्स (डुएट/स्टीच) भी इनबिल्ट डिस्ट्रिब्यूशन की तरह काम करते हैं—क्योंकि वे नए पोस्ट को पहले से प्रमाणित क्लिप से जोड़ देते हैं, जिससे सिस्टम संदर्भ और रुचियाँ तेज़ी से समझ पाता है।

ByteDance की प्रयोगशीलता संस्कृति उत्पाद परिणामों को कैसे प्रभावित करती है—और टीमों को किन मेट्रिक्स का उपयोग करना चाहिए?

A/B टेस्टिंग उत्पाद निर्णयों को मापन योग्य परिकल्पनाओं में बदल देती है। टीमें छोटे बदलाव (UI, रैंकिंग वेट, नोटिफिकेशन) जल्दी भेजती हैं, परिणाम मापती हैं, और विजेताओं को आगे बढ़ाती हैं। जिम्मेदार रखने के लिए, कच्चे वॉच टाइम के अलावा मेट्रिक्स का प्रयोग करें (जैसे: संतोष, सेव/शेयर, “नॉट इंटरेस्टेड” दर, शिकायत दर) ताकि विकास उपयोगकर्ता-कल्याण की कीमत पर न हो।

झांग यीमिंग और ByteDance: एक वैश्विक ध्यान इंजन बनाना | Koder.ai