28 अग॰ 2025·8 मिनट

भारतीय ई‑कॉमर्स सर्च के लिए ऑटोकम्पलीट और टाइपो‑टॉलरेंस

समानार्थी योजना, स्थानीय शब्द, ट्रांसलिटरेशन और एनालिटिक्स के जरिए भारतीय ई‑कॉमर्स सर्च के लिए ऑटोकम्पलीट और टाइपो‑टॉलरेंस सीखें ताकि परिणाम बेहतर हों।

क्यों भारतीय उत्पाद नाम सर्च तोड़ देते हैं

भारतीय ई‑कॉमर्स सर्च एक आसान कारण से फेल होती है: लोग एक ही चीज़ को एक ही तरह नाम नहीं देते। यही उत्पाद अंग्रेज़ी, हिंदी, तमिल या मिश्रित रूप में लिखा जा सकता है, और हर क्षेत्र के अपने रोज़मर्रा के शब्द होते हैं।

एक ग्राहक "atta", "aata", "gehu ka atta" या सिर्फ ब्रांड नाम टाइप कर सकता है। कोई और व्यक्ति "jeera", "zeera" या सिर्फ "cumin" टाइप करता है। अगर आपका कैटलॉग उन सब में से सिर्फ एक फॉर्म रखता है, तो बहुत सामान्य क्वेरी भी शून्य परिणाम दे सकती है।

छोटे स्पेलिंग अंतर उम्मीद से ज़्यादा नुकसान पहुँचाते हैं क्योंकि सर्च इंज़िन अक्सर क्वेरी को सटीक टेक्स्ट की तरह ट्रीट करते हैं। एक गायब स्वर, एक अतिरिक्त स्पेस, या शब्दों का अलग क्रम सही प्रोडक्ट को टॉप रिज़ल्ट्स से बाहर कर सकता है, या बिल्कुल शून्य परिणाम में ले जा सकता है।

भारतीय उत्पाद नाम कई रूपों में बंटने के आम कारण:

कई स्क्रिप्ट और ट्रांसलिटरेशन (हिंदी को अंग्रेज़ी अक्षरों में लिखना, स्थानीय स्पेलिंग)
एक ही आइटम के लिए क्षेत्रीय शब्द (खाना, कपड़े, घरेलू सामान)
ब्रांड-प्रथम बनाम सामान्य-प्रथम नामकरण ("Surf Excel 1kg" बनाम "detergent powder")
संक्षेप और बोली जाने वाली रूपें ("kurti" बनाम "kurta top", "1 ltr" बनाम "1L")
कीबोर्ड टाइपो और ऑटोकरेक्ट ("pista" बनकर "pita", "saree" बनाम "sarri")

ऑटोकम्पलीट और टाइपो‑टॉलरेंस खरीदार के अनुभव को बदल देते हैं। ऑटोकम्पलीट टाइप करने से पहले ही लोगों को उन शब्दों की ओर गाइड करके प्रयास घटाता है जो आपकी साइट समझती है। टाइपो‑टॉलरेंस "लगभग सही" क्वेरी को असफल होने से बचाता है, ताकि गलत स्पेलिंग होने पर भी खरीदार प्रासंगिक आइटम देख सकें।

भारतीय ई‑कॉमर्स सर्च के लिए ऑटोकम्पलीट और टाइपो‑टॉलरेंस का व्यावहारिक लक्ष्य "सर्वोत्तम भाषा समर्थन" नहीं है। यह मापने योग्य है: शून्य-परिणाम क्वेरियों में कमी और तेज़ प्रोडक्ट डिस्कवरी, ताकि ज़्यादा खरीदार उत्पाद सूची तक पहुँचें न कि एक डेड‑एंड तक।

साफ़ भाषा में मुख्य विचार

भारत में अच्छा सर्च ऑल्गोरिद्म्स से ज़्यादा इस बात से जुड़ा है कि लोग असल में कैसे प्रोडक्ट नाम टाइप करते हैं। कई खरीदार अंग्रेज़ी और स्थानीय शब्द मिलाते हैं, एक ही चीज़ को तीन अलग तरीकों से स्पेल कर सकते हैं, और उम्मीद करते हैं कि सर्च फिर भी "समझे"।

ऑटोकम्पलीट वह हिस्सा है जो क्वेरी पूरी होने से पहले मदद करता है। जब कोई "jeer…" टाइप करता है, तो आप "jeera rice", "jeera powder" या "jeera whole" सुझा सकते हैं। अगर यह सही से किया गया हो तो ऑटोकम्पलीट प्रयास घटाता है और खरीदारों को उन शब्दों की ओर नरम‑सहारा देता है जो आपके कैटलॉग में मौजूद हैं।

टाइपो‑टॉलरेंस का मतलब है कि जब यूज़र संभावित गलती करे तब भी मैच मिलना चाहिए, जैसे "zeera" बनाम "jeera" या "shampo" बनाम "shampoo"। लक्ष्य सामान्य गलतियों को सुधारना है बिना अर्थ बदलने के। बहुत ज़्यादा टॉलरेंस अजीब मैच बनाता है (उदाहरण के लिए, छोटा क्वेरी "ram" अचानक असंबंधित प्रोडक्ट से मैच करना)।

समानार्थी सरल हैं: अलग शब्द, वही इरादा। "Atta" और "wheat flour" को एक ही प्रोडक्ट सेट पर लाना चाहिए। भारतीय ई‑कॉमर्स में समानार्थी में अक्सर ब्रांड‑जैसे शब्द, क्षेत्रीय शब्द और श्रेणी‑निकनेम आते हैं।

ट्रांसलिटरेशन तब होती है जब लोग स्थानीय भाषा के शब्द अंग्रेज़ी अक्षरों में टाइप करते हैं। कोई "namkeen", "nimeen" या "namkin" टाइप कर सकता है आदत और कीबोर्ड के अनुसार। ट्रांसलिटरेशन नियम इन वैरिएंट्स से मैच करने में मदद करते हैं, भले ही आपका कैटलॉग सिर्फ एक स्पेलिंग इस्तेमाल करे।

ऑटोकम्पलीट और टाइपो‑टॉलरेंस के बारे में व्यवहारिक तरीका यह सोचें:

ऑटोकम्पलीट यूज़र को एक वैध, लोकप्रिय क्वेरी की ओर गाइड करता है।
टाइपो‑टॉलरेंस तब यूज़र को बचाता है जब वे किसी वैध क्वेरी की गलत स्पेलिंग कर दें।
समानार्थी अलग शब्दों को एक ही शॉपिंग इरादे से जोड़ते हैं।
ट्रांसलिटरेशन अलग स्पेलिंग को एक ही स्थानीय‑भाषा शब्द से जोड़ता है।

इन बातों के साफ़ होने के बाद आप एक छोटा, नियंत्रित मैपिंग सेट बना सकते हैं और वास्तविक सर्च एनालिटिक्स का उपयोग करके इसे बढ़ा सकते हैं, अनुमान लगाकर नहीं।

अपना भारतीय नामकोश बनाएं (एकत्र करने के लिए इनपुट्स)

एक अच्छा सर्च डिक्शनरी आपकी अपनी डेटा से शुरू होती है, अटकलबाज़ी से नहीं। लक्ष्य सरल है: लोग भारत में उत्पादों को कैसे नामित करते हैं—स्थानीय शब्द, स्पेलिंग और शॉर्टहैंड—इन्हें कैप्चर करें ताकि ऑटोकम्पलीट और टाइपो‑टॉलरेंस के पास काम करने के लिए ठोस चीज़ें हों।

सबसे पहले, अपने कैटलॉग को माइन करें। प्रोडक्ट शीर्षक, श्रेणी नाम, एट्रिब्यूट, वेरिएंट लेबल, ब्रांड, पैक साइज और यूनिट अक्सर वे "आधिकारिक" शब्द होते हैं जिन्हें खरीदार पहुँच सकें चाहिए। ग्रोसरी के लिए, इसमें जनरिक और विशिष्ट दोनों शब्द हो सकते हैं जैसे "toor dal", "arhar dal" और "split pigeon peas" अगर आप उन्हें उपयोग करते हैं।

अगला, असली ग्राहक भाषा इकट्ठा करें। सर्च लॉग दिखाते हैं कि लोग भागते समय क्या टाइप करते हैं, जबकि कस्टमर सपोर्ट चैट्स दिखाती हैं कि जब वे आइटम नहीं ढूँढ पाते तो कैसे बताते हैं। कुछ हफ्तों के लॉग भी दोहराए गए पैटर्न दिखा सकते हैं जैसे "aata/atta", "dahi/curd" या "chilli/chili"।

पाँच जगहों से इनपुट बनाएं, फिर उन्हें मर्ज और क्लीन करें:

कैटलॉग टेक्स्ट (टाइटल, एट्रिब्यूट, वेरिएंट, ब्रांड, साइज)
सर्च क्वेरीज (शून्य‑परिणाम क्वेरियों सहित)
कस्टमर सपोर्ट चैट्स और कॉल नोट्स
आपकी टीम पहले से उपयोग करने वाले क्षेत्रीय और स्थानीय शब्द
यूनिट और बंडल शॉर्टहैंड (ml, ltr, pcs, combo, 1+1)

अंत में, जनरिक शब्दों को ब्रांड शब्दों से अलग रखें। "Atta" कई प्रोडक्ट से मेल खाना चाहिए, जबकि किसी ब्रांड नाम को गलती से अनन्य आइटम खींचना नहीं चाहिए। दो लेबल्ड लिस्ट रखें (generic बनाम brand) ताकि बाद की नियमावली इंटेंट को धुंधला न करे और रैंकिंग गड़बड़ न हो।

चरण-दर-चरण: समानार्थी और ट्रांसलिटरेशन योजना बनाएं

छोटे से शुरू करें। 20 से 50 कैटेगरी चुनें जो अधिकांश सर्च और राजस्व ड्राइव करती हों—जैसे staples, beauty, और लोकप्रिय electronics। इससे काम फोकस्ड रहेगा और आप ऑटोकम्पलीट और टाइपो‑टॉलरेंस में जल्दी प्रभाव देख पाएँगे।

फिर एक साझा "नाम तालिका" बनाएं जिसे सभी संपादित कर सकें (merch, content, support)। पहले इसे स्प्रेडशीट में रखें, फिर अपने सर्च इंडेक्स में सिंक करें।

1) एक कैनोनिकल सूची बनाएं

प्रत्येक कैटेगरी के लिए वह एक शब्द चुनें जिसे आप सिस्टम को "मुख्य" नाम मानना चाहेंगे (canonical)। ग्राहक जो पहचानते हैं उसे चुनें, सप्लायर जो कहता है वह नहीं।

ऐसी पंक्तियाँ बनाएँ:

प्राथमिक (canonical) शब्द	समानार्थी (एक ही प्रोडक्ट)	आम गलत स्पेलिंग	ट्रांसलिटरेशन	नोट्स
cumin	jeera	jeera, jeeraa	zeera, zira	Keep “caraway” separate
face wash	cleanser	fash wash	fes wash	Don’t map to “face cream”

यूनिट और पैक पैटर्न को अलग, पुन: उपयोग योग्य टोकन के रूप में जोड़ें: 1kg, 500 g, 2x, combo pack, family pack। ये अक्सर शून्य‑परिणाम कारण बनते हैं क्योंकि यूज़र पूरा वाक्य टाइप करते हैं।

2) "एक ही प्रोडक्ट" के लिए सख्त नियम रखें

एक समानार्थी का मतलब होना चाहिए कि ग्राहक उसी परिणाम से खुश होगा। एक छोटा नियम लिखें जिसे आपकी टीम फॉलो कर सके:

स्वीकृत: क्षेत्रीय नाम वेरिएंट, ब्रांड‑शॉर्टकट, सामान्य स्पेलिंग
स्वीकृत: हिंग्लिश ट्रांसलिटरेशन जहाँ अर्थ समान रहे
न स्वीकार्य: पड़ोसी प्रोडक्ट (cleanser vs toner, cumin vs carom)
न स्वीकार्य: अलग साइज को समानार्थी बनाना (साइज़ एक फ़िल्टर है)
न स्वीकार्य: "healthy" या "premium" को बेस आइटम का समानार्थी बनाना

3) इसे मेंटेन रखना आसान रखें

प्रत्येक कैटेगरी के लिए एक मालिक नियुक्त करें और साधा समीक्षा चक्र (पहले साप्ताहिक) जोड़ें। जब सपोर्ट "नहीं मिला" की शिकायत देखे, वे उसी दिन तालिका में शब्द जोड़ें।

अगर आप कस्टम सर्च स्टैक बना रहे हैं, तो Koder.ai जैसे टूल से आप एडमिन स्क्रीन और सिंकिंग वर्कफ़्लो जल्दी शिप कर सकते हैं, जबकि समानार्थी सूची नॉन‑टेक टीमों के लिए संपादन योग्य रहती है।

भारत के लिए सही लगने वाला ऑटोकम्पलीट डिज़ाइन करें

ऑटोकम्पलीट तेज़, परिचित और क्षमाशील होना चाहिए। भारतीय ई‑कॉमर्स सर्च में सबसे बड़ा लाभ पहले कुछ अक्षरों पर उपयोगी सुझाव दिखाना है। लोग अक्सर जल्दी टाइप करते हैं, अंग्रेज़ी और स्थानीय शब्दों के बीच स्विच करते हैं, और सटीक स्पेलिंग नहीं याद रखते।

प्रिफिक्स के लिए ट्यूनिंग से शुरू करें। पहले 2 से 4 अक्षर पर मजबूत, हाई‑इंटेंट सुझाव दिखने चाहिए। अगर कोई "sha" टाइप करे, तो टॉप स्लॉट दुर्लभ आइटम पर बर्बाद न करें। दिखाएँ कि ज़्यादातर खरीदार क्या मतलब रखते हैं, और जो आप अच्छी तरह बेचते हैं।

सुझावों को केवल शब्द‑आधारित न रखें, बल्कि श्रेणी‑सचेत रखें। यदि यूज़र "shakkar" टाइप करता है, तो सुझाव स्पष्ट रूप से उत्पाद श्रेणी (sugar) और लोकप्रिय उपप्रकार (powdered, organic) की ओर इशारा करें। इससे भ्रम घटेगा और गलत चयन की संभावना कम होगी।

सुझाव छोटे और पठनीय रखें। एक अच्छा पैटर्न है: ब्रांड + उत्पाद (जब यह वाकई सामान्य हो) या उत्पाद + मुख्य एट्रिब्यूट। साइज, लंबा मॉडल नंबर और कई एट्रिब्यूट एक लाइन में डालने से बचें।

यहाँ कुछ व्यावहारिक UI नियम हैं जो आमतौर पर काम करते हैं:

5 से 8 सुझाव तक दिखाएँ, शीर्ष 3 को उच्च रूपांतरण के लिए अनुकूलित रखें।
स्पेसिंग और विराम को सामान्य करें, ताकि "t-shirt", "tshirt" और "t shirt" एक ही सुझाव सेट लाएँ।
उन आइटम और श्रेणियों को प्राथमिकता दें जिन्हें आप अभी पूरा कर सकते हैं (in‑stock और active listings)।
प्रकारों को सावधानी से मिक्स करें: 1–2 श्रेणी सुझाव, फिर प्रोडक्ट, फिर ब्रांड्स।
ऐसे सुझाव न दिखाएँ जो आप बेच नहीं सकते (डेड कैटेगरी, डिस्कॉन्टिन्यूड ब्रांड्स)।

उदाहरण: कोई खरीदार "dett" टाइप करता है। भारत में कई लोग "Dettol" का मतलब रखते हैं (ब्रांड इरादा), पर कुछ "handwash" या "sanitizer" चाहते हैं (प्रोडक्ट इरादा)। आपका ऑटोकम्पलीट "Dettol Handwash", "Dettol Sanitizer" और एक कैटेगरी जैसे "Handwash" दिखा सकता है ताकि दोनों इरादे कवर हों बिना ज़्यादा अनुमान लगाए।

जब आप यह लगातार करते हैं, तो भारत के लिए ऑटोकम्पलीट और टाइपो‑टॉलरेंस चालाक अल्गोरिद्म से कम और खरीदारों को अगला स्पष्ट कदम दिखाने के बारे में ज़्यादा हो जाता है।

बिना गलत मिलान के टाइपो‑टॉलरेंस सेट करें

समानार्थी मैनेजर तैनात करें

समानार्थी और ट्रांसलिटरेशन के लिए एक आंतरिक एडमिन पेज बनाएं जिसे आपकी मर्च टीम संपादित कर सके।

बनाना शुरू करें

टाइपो‑टॉलरेंस तब लोगों को प्रोडक्ट ढूँढने में मदद करता है जब वे गलत टाइप करें। लेकिन अगर आप इसे बहुत ढीला रखेंगे, तो सर्च "क्लोज‑एनफ" आइटम दिखाने लगेगा जो गलत लगते हैं। लक्ष्य सरल है: स्पष्ट गलतियों को पकड़ें, और तब सावधान रहें जब इरादा बदल सकता है।

शूठे एडिट‑डिस्टेंस नियमों से शुरू करें जो शब्द की लंबाई पर आधारित हों। छोटे शब्द आसानी से टूटते हैं, इसलिए उन्हें सख्त रखें। लंबे शब्द थोड़ी अधिक लचीलापन संभाल सकते हैं।

1–4 अक्षर: 0–1 एडिट की अनुमति (उदाहरण: "atta" → "atta", "attta")
5–8 अक्षर: 2 एडिट तक अनुमति
9+ अक्षर: 3 एडिट तक अनुमति
अगर क्वेरी में कई शब्द हैं, तो प्रति शब्द एडिट लागू करें, पर पूरे क्वेरी के लिए कुल एडिट पर कैप रखें

नंबर्स को अलग श्रेणी मानें। "1kg" और "10kg" कभी आपस में इंटर्प्रेटेबल नहीं होने चाहिए, और "500ml" को "1500ml" नहीं बनना चाहिए। एक व्यावहारिक नियम: न्यूमेरिक टोकन के अंदर टाइपो‑टॉलरेंस न लगाएँ, और यूनिट न बदलें। केवल फॉर्मैटिंग सुधारों की अनुमति दें जैसे स्पेस या केस बनाम छोटे‑बड़े अक्षर ("1 kg", "1KG", "1kg")।

ब्रांड नामों और हाई‑इंटेंट टर्म्स को "सुधार" होने से बचाएँ। एक छोटा प्रोटेक्टेड लिस्ट रखें (टॉप ब्रांड्स, प्राइवेट लेबल)। अगर क्वेरी किसी प्रोटेक्टेड टर्म से करीब मेल खाती है, तो उसे रीराइट करने के बजाय सुझाव दिखाने को प्राथमिकता दें।

कीबोर्ड‑नेबर गलतियाँ मोबाइल पर आम हैं, खासकर हिंग्लिश में। पास के की (a‑s, i‑o, n‑m) के लिए अतिरिक्त टॉलरेंस जोड़ें, पर केवल तब जब शब्द का बाकी हिस्सा मजबूत मेल हो।

जब सुधार अस्पष्ट हो, तो उसे सुझाव के रूप में दिखाएँ, न कि चुपचाप बदलें। उदाहरण के लिए, अगर "dove" का मतलब "done" या "dovee" भी बन सकता है, तो "क्या आपका मतलब dove है?" जैसा सुझाव दिखाएँ और मूल परिणाम भी रखें। यह ट्रस्ट बनाए रखता है और बैक‑क्लिक्स घटाता है।

ट्रांसलिटरेशन और स्थानीय भाषा के शब्द (व्यवहारिक नियम)

भारतीय क्वेरीज अक्सर स्क्रिप्ट और आदतों को एक लाइन में मिलाती हैं: "जीरा rice", "jeera चावल", "zeera rice" या "poha nashta"। आपकी सर्च को इन्हें एक ही इरादे के रूप में ट्रीट करना चाहिए, अलग दुनिया के रूप में नहीं। ऑटोकम्पलीट और टाइपो‑टॉलरेंस के लिए लक्ष्य सरल है: एक ही प्रोडक्ट अर्थ के कई लिखने के तरीकों को मैप करें।

छोटे, व्यवहारिक नियमों से शुरू करें और तभी बढ़ाएँ जब आप देखेँ कि वे काम कर रहे हैं।

व्यवहारिक सामान्यीकरण नियम

स्क्रिप्ट मिक्सिंग स्वीकार करें और सबको एक साझा "सर्च फॉर्म" में सामान्यीकृत करें (विश्लेषण के लिए मूल क्वेरी रखें, पर मैचिंग सामान्यीकृत वर्शन पर करें)।
ट्रांसलिटरेशन जोड़े सिर्फ आपके टॉप आइटम्स के लिए पहले जोड़ें (उदाहरण: namkeen, bhujia, poha, jeera)। उन सामान्य स्पेलिंग को शामिल करें जो यूज़र वास्तव में टाइप करते हैं।
लंबे स्वर वैरिएंट्स को जहाँ मायने रखते हों वहां स्पष्ट जोड़े के रूप में संभालें (poha vs pauha, jeera vs zeera), हर स्वर शिफ्ट अनुमान लगाने की बजाय।
साउंड‑स्वैप्स (v‑w, b‑v, j‑z) को सावधानी से और संकीर्ण रूप से प्रयोग करें: केवल जानी‑पहचानी प्रोडक्ट टोकन पर लगाएँ, पूरे क्वेरी पर नहीं, ताकि अजीब मैच न हों।
ब्रांड नाम और SKUs को अधिकतर "जैसा टाइप किया गया" रखें ताकि आप उन्हें गलती से कुछ और में परिवर्तित न कर दें।

पहले किन भाषाओं को सपोर्ट करें

ट्रैफ़िक और शून्य‑परिणाम के आधार पर चुनें, महत्वाकांक्षा पर नहीं। आम क्रम है: पहले अंग्रेज़ी + हिंग्लिश, फिर यदि अर्थपूर्ण हिस्से में क्वेरीज आते हैं तो हिंदी स्क्रिप्ट जोड़ें। बाद में किसी क्षेत्र में मांग दिखे तो अगली भाषा भी जोड़ें, एक कैटेगरी‑प्रति‑बार।

एनालिटिक्स लूप: वास्तविक व्यवहार के आधार पर सर्च सुधारें

अपने डोमेन पर लॉन्च करें

अपने ई‑कॉमर्स ऑप्स वर्कफ़्लो के अनुसार कस्टम डोमेन पर अपने आंतरिक टूल चलाएँ।

डोमेन जोड़ें

सर्च गुणवत्ता एक बार का सेटअप नहीं है। इसे साप्ताहिक आदत की तरह रखें: देखें कि लोग क्या टाइप करते हैं, क्या क्लिक करते हैं, और कहाँ हार मान लेते हैं। इसी तरह ऑटोकम्पलीट और टाइपो‑टॉलरेंस बेहतर होता है बिना अटकलबाज़ी के।

छोटे कोर मेट्रिक्स से शुरू करें और उन्हें हफ्तों में कॉन्सिस्टेंट रखें:

शून्य‑परिणाम दर (कुल और टॉप क्वेरीज के लिए)
रिफाइनमेंट दर (यूज़र सर्च के तुरंत बाद फिर टाइप या फ़िल्टर जोड़ रहे हैं)
सर्च के बाद ऐड‑टू‑कार्ट (या अगर कार्ट नॉइज़ी हो तो सर्च के बाद प्रोडक्ट क्लिक)
ऑटोकम्पलीट उपयोग (सुझाव क्लिक बनाम पूरा मैन्युअल टाइप)
सुधार प्रभाव (टाइपो‑फिक्स्ड क्वेरीज जिनसे क्लिक होते हैं बनाम बाउंस)

सप्ताह में एक बार अपने टॉप नो‑रिज़ल्ट क्वेरीज निकालें और हर एक को वर्गीकृत करें। श्रेणियाँ साधारण रखें ताकि टीमें वास्तव में उनका उपयोग करें: missing synonym (jeera vs zeera), spelling variation, brand/model mismatch, गलत भाषा/स्क्रिप्ट, या कैटलॉग गैप (प्रोडक्ट स्टॉक में नहीं)। लक्ष्य यह अलग करना है कि "सर्च को समानार्थी चाहिए" या "इन्वेंटरी गायब है"।

ऑटोकम्पलीट डेटा अक्सर सबसे तेज़ जीत देता है। अगर यूज़र सुझावों को अक्सर अनदेखा कर के पूरा टाइप कर रहे हैं, तो आपके सुझाव बहुत सामान्य, गलत क्रम या स्थानीय शब्दों के बिना हो सकते हैं। अगर वे सुझाव क्लिक कर के भी फिर रीफ़ाइन करते या बाउंस करते हैं, तो सुझाव सही दिखता है पर कमजोर परिणाम देता है।

टाइपो को सिर्फ अधिक टॉलरेंस से ठीक न समझें — इसकी ऑडिट करें। प्रति सप्ताह 20–50 सुधारित क्वेरीज सैंपल करें और उन्हें चिह्नित करें:

मददगार (इरादे वाले प्रोडक्ट पर फिक्स किया)
हानिरहित (क्लोज‑एनफ, यूज़र फिर भी आइटम ढूँढ पाया)
हानिकारक (किसी अलग प्रोडक्ट या श्रेणी पर फिक्स किया)

इसे एक सरल डैशबोर्ड व्यू में रखें जिसे प्रोडक्ट और मार्केटिंग 2 मिनट में पढ़ सकें: टॉप शून्य‑परिणाम क्वेरीज और उनका कारण, टॉप ऑटोकम्पलीट सुझाव और क्लिक‑रेट, और अगले रिलीज़ के लिए एक छोटी कार्रवाई सूची। अगर आप अंदरूनी टूल जल्दी बनाते हैं (उदाहरण के लिए Koder.ai में), यह डैशबोर्ड और साप्ताहिक एक्सपोर्ट पाइपलाइन अच्छे पहले प्रोजेक्ट हैं।

सामान्य गलतियाँ और जाल जिनसे बचें

भारत में अधिकांश सर्च समस्याएँ "ज़्यादा समानार्थी" से नहीं आतीं। वे कुछ अनुमानित गलतियों से आती हैं जो धीरे‑धीरे लोगों को गलत परिणामों की ओर धकेलती हैं और ट्रस्ट नुक्सान करती हैं।

सबसे बड़ा जाल ओवर‑ब्रॉड समानार्थी इस्तेमाल करना है जो अलग प्रोडक्ट्स को मिला देता है। अगर "cream" और "lotion" आपस में बदल दिए जाएं, तो जो उपयोगकर्ता मोटा फेस क्रीम चाहता है वह हल्की बॉडी लोशन पर जा सकता है और छोड़ सकता है। समानार्थी को टाइट रखें: एक ही इरादे के वेरिएंट को मैप करें, पड़ोसी श्रेणियों को नहीं।

एक और आम मिस है पैक साइज और यूनिट इरादा की अनदेखी। "Oil 1L" और "oil 5L" एक जैसे नहीं हैं, और "atta 5 kg" और "atta 10 kg" भी नहीं। अगर आपके नियम यूनिट्स को नजरअंदाज़ करते हैं, तो जो यूज़र बल्क में रेस्टॉक करना चाहता है उसे छोटे पैक मिल सकते हैं और आपकी रैंकिंग रैंडम लगेगी।

यहाँ उच्च‑प्रभाव वाली गलतियाँ देखने के लिए:

नज़दीकी प्रोडक्ट्स को समानार्थी मानना (cream vs lotion, shampoo vs conditioner)
साइज, काउंट और यूनिट शब्दों की अनदेखी (1L, 5L, 500 ml, 10 pcs)
टाइपो‑टॉलरेंस से ब्रांड नामों का दूसरे ब्रांड में बदल जाना
ऐसे ऑटोकम्पलीट सुझाव दिखाना जो आप स्टॉक नहीं करते या उस पिन कोड पर नहीं डिलीवर कर सकते
नियम सेट करना और भूल जाना, खासकर प्रमो और सीज़नल स्पाइक्स के बाद

ब्रांड नामों के साथ extra सावधानी रखें। अगर कोई "Himalya face wash" टाइप करता है और आपकी टाइपो सेटिंग्स इसे किसी अन्य लोकप्रिय ब्रांड पर "सुधार" कर देती हैं, तो यह bait की तरह लगेगा। सुरक्षित नियम यह है: सामान्य शब्दों पर उदार रहें ("shampu"), पर ब्रांड और मॉडल‑जैसी टोकन्स पर सख्त रहें।

ऑटोकम्पलीट तब भी गलत काम कर सकता है जब यह उपलब्ध न होने वाले आइटम सुझाए। उदाहरण के लिए, "ghee 2L" सुझाना क्योंकि यह बार‑बार पूछा जाता है, जबकि केवल 1L स्टॉक में है, निराशा पैदा करता है। ऐसी चीज़ों को प्राथमिकता दें जिन्हें आप आज पूरा कर सकते हैं।

यदि आप ऑटोकम्पलीट और टाइपो‑टॉलरेंस बना रहे हैं, तो एक समीक्षा आदत जोड़ें: सेल सप्ताह के बाद नई टॉप क्वेरीज, उभरते मिसस्पेलिंग और शून्य‑परिणाम शब्द चेक करें। छोटे‑मोटे सीज़नल बदलाव (शादी का मौसम, मानसून, एग्ज़ाम सीज़न) भी लोगों की टाइपिंग बदल सकते हैं।

अगर आप इन रूल्स को जल्दी टेस्ट करना चाहते हैं, तो Koder.ai आपकी मदद कर सकता है: एक सर्च रूल्स सर्विस और एडमिन पेज प्रोटोटाइप करें, फिर कोड एक्सपोर्ट करें जब आप रेडी हों।

वास्तविक उदाहरण: "jeera rice" और "zeera rice" सर्च ठीक करना

एक खरीदार "zeera rice" टाइप करता है और शून्य परिणाम मिलता है। वे अलग प्रोडक्ट नहीं ढूँढ रहे हैं—उनका मतलब "jeera rice" (cumin rice) था, पर उन्होंने उसे अपनी बोली के अनुसार स्पेल किया।

आप इसे दो छोटे, सुरक्षित बदलावों से ठीक कर सकते हैं: आम स्पेलिंग वेरिएंट के लिए एक समानार्थी और एक संयमी टाइपो नियम। इस क्वेरी के लिए "zeera" को "jeera" का ट्रांसलिटरेशन वेरिएंट मानें, अलग अर्थ न मानें।

यहाँ एक व्यावहारिक मैपिंग है जो आमतौर पर ठीक काम करती है:

क्वेरी समानार्थी: zeera -> jeera
क्वेरी समानार्थी: zira -> jeera
कैटलॉग में प्रोडक्ट नाम वैसे ही रखें (SKUs को न बदलें)

फिर एक टाइपो‑टॉलरेंस नियम जोड़ें जो छोटे शब्दों पर सख्त हो। उदाहरण के लिए, 5+ अक्षर वाले टोकन पर 1 एडिट की अनुमति दें। यह "jeera" बनाम "jeeraa" जैसी गलतियाँ पकड़ने में मदद करेगा, पर बहुत छोटे टोकनों पर गंदे मैच से बचाएगा।

बदलाव के बाद, ऑटोकम्पलीट खरीदार को गाइड करे बजाय ज़्यादा अनुमान लगाने के। जब वे "zee…" टाइप करें तो सुझाव हो सकते हैं:

"jeera rice"
"jeera basmati rice"
"jeera (cumin)"

और जब वे "zeera rice" सबमिट करें, तो रिज़ल्ट्स में आपके "jeera rice" प्रोडक्ट्स पहले दिखने चाहिए, साथ में संबंधित आइटम जैसे cumin और basmati, आपकी रैंकिंग नियमों के अनुसार।

एक हफ़्ते बाद, व्यवहार‑केंद्रित ई‑कॉमर्स सर्च एनालिटिक्स देखें, सिर्फ क्लिक नहीं:

"zeera", "zira" और "jeera" के लिए शून्य‑परिणाम दर
सर्च रीफ़ाइनमेंट दर (क्या लोग क्वेरी फिर से टाइप कर रहे हैं?)
उन क्वेरीज के लिए ऐड‑टू‑कार्ट दर
यह पुष्टि करने के लिए टॉप क्लिक कि समानार्थी असंबंधित आइटम नहीं खींच रहा

अगर परिणाम खराब हों (उदाहरण के लिए, "zira" किसी ब्रांड या दूसरे कैटेगरी से मेल खाने लगे), तो जल्दी रिवर्स करें—सिर्फ़ उस समानार्थी समूह को डिसेबल करें, पूरे सिस्टम को नहीं। वर्ज़नड कॉन्फ़िग रखें ताकि आप मिनटों में रोलबैक कर सकें। यही तुलनात्मक फीडबैक लूप ऑटोकम्पलीट और टाइपो‑टॉलरेंस का मूल है।

शिप करने से पहले त्वरित चेकलिस्ट

विचार से कोड तक जाएँ

एक चैट प्रॉम्प्ट से आपके सर्च कॉन्फ़िग वर्कफ़्लो के लिए React UI और Go API बनाएं।

कोड जनरेट करें

नई समानार्थी, ऑटोकम्पलीट या टाइपो सेटिंग्स पुश करने से पहले एक त्वरित पास करें जो असली क्वेरी डेटा और हैंड‑ऑन टेस्ट को मिलाए। इससे "मददगार" बदलाव शोर‑भरे परिणाम बनाने से बच जाते हैं।

इस छोटी प्री‑शिप चेकलिस्ट का उपयोग करें:

पिछले 7–14 दिनों से अपने टॉप 50 सर्च क्वेरीज खींचें, फिर उन्हें इरादा के हिसाब से ग्रुप करें (ब्रांड, जनरिक प्रोडक्ट, वेरिएंट जैसे साइज या रंग, और समस्या‑से‑हल जैसे "hair fall oil"). अगर क्वेरी का दो अर्थ हो सकते हैं तो दोनों लिखें।
अपने टॉप 50 शून्य‑परिणाम क्वेरीज निकालें और हर एक के लिए फिक्स तय करें: मौजूद कैटेगरी पर मैप करें, समानार्थी जोड़ें (स्थानीय शब्द या स्पेलिंग), गायब प्रोडक्ट जोड़ें, या उसे ब्लॉक करें अगर वह अप्रासंगिक है। उन्हें "बाद में ठीक करेंगे" मत छोड़ें।
अपनी समानार्थी और ट्रांसलिटरेशन सूची को एक ओनर, लास्ट‑अपडेटेड डेट और एक छोटा कारण दें। इससे बेतरतीब एडिट्स रोके जाते हैं।
रियल यूज़र्स की भाषा के साथ अपने टॉप कैटेगरी में ऑटोकम्पलीट टेस्ट करें: अंग्रेज़ी, हिंग्लिश और सामान्य शॉर्टहैंड आज़माएँ। जाँचें कि सुझाव निचले‑निश आधारित आइटम पर जल्दी नहीं कूदते, और लोकप्रिय वेरिएंट (जैसे "1kg", "500g", "pack of 2") शामिल हों।
20 ट्रिकी क्वेरीज के साथ टाइपो‑टॉलरेंस को स्ट्रेस‑टेस्ट करें: ब्रांड मिसस्पेलिंग (ख़ासकर डबल अक्षर), मिश्रित संख्याएँ ("iPhone 15 pro 256"), और दिखने में समान शब्द ("jeera/zeera", "besan/besan flour")। सुनिश्चित करें कि टॉप रिज़ल्ट्स अभी भी सही हैं, सिर्फ "क्लोज़" नहीं।

अगर कोई आइटम फेल करे, तो पहले छोटा बदलाव शिप करें। तंग रोलआउट बड़ी अपडेट से बेहतर है जो सर्च को रैंडम बना दे।

अगले कदम: एक सरल रोलआउट योजना (और तेज़ी से कैसे बनाएं)

पहले उस एक कैटेगरी से शुरू करें जहाँ सर्च का दर्द स्पष्ट हो—जैसे groceries, personal care, या mobile accessories। स्कोप छोटा रखें ताकि एक हफ्ते में कारण और प्रभाव देख सकें। 2–3 सफलता मीट्रिक्स चुनें जिन्हें आप असल में मूव कर सकें, जैसे शून्य‑परिणाम दर, सर्च‑से‑प्रोडक्ट‑क्लिक दर, और सर्च के बाद ऐड‑टू‑कार्ट।

एक सरल रोलआउट जो काम करता है:

Day 1: बेसलाइन—वर्तमान मेट्रिक्स, टॉप क्वेरीज और टॉप शून्य‑परिणाम क्वेरीज कैप्चर करें।
Days 2–3: एक छोटा डिक्शनरी शिप करें—टॉप 50 क्वेरीज के लिए सीमित समानार्थी और हिंग्लिश ट्रांसलिट्रेशन, और टॉप 20 ब्रांड/पैक‑साइज़ पैटर्न जोड़ें।
Day 4: गार्डरेल—जहाँ अर्थ बदलता है वहाँ एक्सक्लूज़न जोड़ें (उदाहरण: "atta" को तब match न करें अगर "ATA" आपके कैटलॉग में कोई ब्रांड या कोड है)।
Days 5–6: मॉनिटर—विन (शून्य परिणाम घटे, क्लिक ज़्यादा) और लॉस (अप्रासंगिक क्लिक, अधिक बैक‑टू‑सर्च) ट्रैक करें।
Day 7: डिसाइड—रखें, ट्वीक करें, या रिवर्ट करें और अगली बैच की योजना बनाएं।

बदलाव reversible रखें। अपनी समानार्थी और टाइपो नियमों को कोड की तरह वर्शन करें, स्नैपशॉट लें और स्पष्ट रोलबैक पाथ रखें। अगर नया नियम अचानक "face wash" को "dishwash liquid" दिखाने लगे, तो मिनटों में रिवर्ट होना चाहिए न कि दिनों में।

ओनरशिप कल्पनाशक्ति से ज़्यादा मायने रखती है। एक व्यक्ति को 30‑मिनट साप्ताहिक समीक्षा चलाने के लिए नियुक्त करें: टॉप नई शून्य‑परिणाम क्वेरीज, टॉप "अच्छी सेव्स" (टाइपो ठीक हुए), और किसी भी लो‑क्वालिटी क्लिक में स्पाइक।

अगर आप तेज़ी से बनाना और इटरेट करना चाहते हैं, तो Koder.ai आपकी मदद कर सकता है: चैट‑ड्रिवन बिल्ड, प्लानिंग मोड में नियम और मीट्रिक्स मैप करें, और एक्सपोर्टेबल सोर्स कोड रखें ताकि आपकी टीम लंबी अवधि में ओनरशिप रख सके। यह स्नैपशॉट और रोलबैक भी सपोर्ट करता है, जो तब आदर्श है जब किसी सर्च ट्वीक को तेज़ी से undo करना पड़े।

नापे गए नतीजों से अपना अगला इटरेशन प्लान करें। उदाहरण के लिए, अगर "zeera rice" कन्वर्ट होना शुरू हो गया पर अब "jeera" किसी असंबंधित "zera" प्रोडक्ट से मैच कर रहा है, तो अगला स्पष्ट कदम है: उस नियम को टाइट करें, पूरे सिस्टम को नहीं बदलें।