동의어, 지역어, 전사 규칙, 분석을 통해 인도 이커머스 검색의 자동완성과 오타 허용을 개선하는 방법을 배우세요.

인도 이커머스 검색이 실패하는 간단한 이유는 사람들마다 같은 것을 똑같이 부르지 않기 때문입니다. 같은 제품을 영어로, 힌디어로, 타밀어로 또는 섞어 입력할 수 있고, 지역마다 일상적으로 쓰는 단어가 다릅니다.
예를 들어 어떤 쇼퍼는 “atta”, “aata”, “gehu ka atta” 또는 브랜드 이름만 입력할 수 있습니다. 또 다른 사람은 “jeera”, “zeera” 또는 단순히 “cumin”을 입력할 수 있습니다. 카탈로그에 그중 하나만 있으면 매우 정상적인 쿼리도 결과가 없을 수 있습니다.
작은 철자 차이가 예상보다 더 큰 피해를 줍니다. 검색 엔진은 종종 쿼리를 정확한 텍스트로 취급하기 때문에 한 글자의 모음 누락, 추가 공백, 단어 순서 차이만으로도 올바른 제품이 상단 결과에서 밀리거나 제로 결과로 사라질 수 있습니다.
인도 제품명이 여러 버전으로 나뉘는 흔한 이유들:
자동완성과 오타 허용은 쇼핑 경험을 바꿉니다. 자동완성은 사용자가 검색을 치기 전부터 매장에 있는 용어로 유도해 입력 노력을 줄입니다. 오타 허용은 철자가 완벽하지 않아도 "거의 맞는" 쿼리가 실패하지 않게 해 관련 상품을 보여줍니다.
인도 이커머스 검색에서 자동완성과 오타 허용의 현실적인 목표는 “완벽한 언어 지원”이 아니라 계량 가능한 결과입니다: 제로 결과 검색 감소, 더 빠른 제품 발견 — 즉 더 많은 쇼퍼가 막다른 길이 아닌 제품 목록으로 이동하도록 하는 것입니다.
인도에서 좋은 검색은 화려한 알고리즘보다 사용자가 실제로 어떻게 제품명을 입력하는지 이해하는 일이 더 중요합니다. 많은 쇼퍼가 영어와 지역어를 섞어 쓰고, 같은 것을 세 가지 방식으로 철자하고도 검색이 이를 이해하길 기대합니다.
자동완성은 쿼리를 끝내기 전에 도와주는 부분입니다. 누군가 "jeer…"를 입력하면 “jeera rice”, “jeera powder”, “jeera whole” 같은 제안을 보여줄 수 있습니다. 잘 설계된 자동완성은 노력을 줄이고 쇼퍼를 카탈로그에 실제로 존재하는 용어로 부드럽게 유도합니다.
오타 허용은 사용자가 “zeera” vs “jeera”나 “shampo” vs “shampoo”처럼 흔한 실수를 해도 매칭되게 합니다. 목표는 의미를 바꾸지 않고 일반적인 오류를 잡는 것입니다. 오타 허용을 과도하게 하면 짧은 쿼리(예: “ram”)가 전혀 관련 없는 항목과 매칭되는 등 이상한 결과가 생길 수 있습니다.
동의어는 간단합니다: 다른 단어지만 같은 의도. “Atta”와 “wheat flour”는 같은 제품군으로 연결되어야 합니다. 인도 이커머스에서는 동의어에 브랜드형 표현(“biscuit” vs “cookies”), 지역어, 카테고리 별칭이 포함되는 경우가 많습니다.
전사는 사람들이 인도어 단어를 영어 글자로 입력할 때를 말합니다. 어떤 사용자는 “namkeen”, “nimeen”, “namkin” 등으로 쓸 수 있습니다. 전사 규칙은 카탈로그에 하나의 표기가 있더라도 이런 변형들을 매칭하도록 도와줍니다.
자동완성과 오타 허용을 생각하는 실용적인 요약은 다음과 같습니다:
이 점들이 명확해지면, 추측으로 규칙을 만들기보다 실제 검색 분석을 통해 작은 제어된 매핑 세트를 만들고 확장할 수 있습니다.
좋은 검색 사전은 추측이 아니라 자체 데이터에서 시작합니다. 목표는 간단합니다: 자동완성과 오타 허용이 작업할 수 있도록 사람들이 인도에서 실제로 제품을 어떻게 부르는지(지역어, 표기, 약어 포함)를 포착하는 것입니다.
먼저 카탈로그를 조사하세요. 제품 제목, 카테고리명, 속성, 옵션 라벨, 브랜드, 팩 크기, 단위에는 사용자가 도달해야 할 "공식" 표기가 들어 있는 경우가 많습니다. 식료품의 경우 “toor dal”, “arhar dal”, “split pigeon peas” 같은 일반명과 상세명이 모두 있을 수 있습니다.
다음으로 실제 고객 언어를 수집하세요. 검색 로그는 사람들이 급히 입력할 때 무엇을 쓰는지 보여주고, 고객 지원 채팅은 항목을 찾지 못할 때 어떻게 설명하는지 드러냅니다. 몇 주 치 로그만으로도 반복되는 패턴(예: “aata/atta”, “dahi/curd”, “chilli/chili”)을 찾아낼 수 있습니다.
다섯 곳에서 입력을 모으고 합치고 정리하세요:
마지막으로 일반 용어와 브랜드 용어를 분리하세요. “Atta”는 여러 제품에 매칭되어야 하지만 브랜드 이름은 의도와 혼동하지 않도록 분리되어야 합니다. 나중에 규칙이 의도와 순위를 흐리지 않도록 일반용과 브랜드용 두 개의 레이블된 목록을 유지하세요.
작게 시작하세요. 대부분의 검색과 매출을 이끄는 20~50개 카테고리를 선택하세요(예: 주식, 뷰티, 인기 전자제품). 이렇게 하면 작업에 집중할 수 있고 자동완성과 오타 허용의 영향을 빠르게 확인할 수 있습니다.
그다음 모든 팀이 편집할 수 있는 하나의 공용 "명명 테이블"을 만드세요(우선 스프레드시트에 보관한 뒤 검색 인덱스로 동기화).
각 카테고리에 대해 시스템이 “주 용어(정식 표기)”로 취급할 한 가지 용어를 선택하세요. 공급업체 표기보다 고객이 인식하는 표현을 사용하세요.
다음과 같은 행을 만드세요:
| Canonical term | Synonyms (same product) | Common misspellings | Transliterations | Notes |
|---|---|---|---|---|
| cumin | jeera | jeera, jeeraa | zeera, zira | Keep “caraway” separate |
| face wash | cleanser | fash wash | fes wash | Don’t map to “face cream” |
단위와 팩 패턴은 별도의 재사용 가능한 토큰(1kg, 500 g, 2x, combo pack, family pack)으로 추가하세요. 사용자가 전체 문구를 입력해 제로 결과가 되는 일이 자주 발생합니다.
동의어는 고객이 같은 결과에 만족할 때만 사용하세요. 팀이 따를 수 있는 간단한 규칙을 작성하세요:
카테고리별로 담당자를 지정하고 간단한 검토 주기(초기에는 주간)를 추가하세요. 지원팀이 “찾을 수 없다”는 불만을 보면 같은 날 테이블에 용어를 추가하도록 하세요.
커스텀 검색 스택으로 빌드하는 경우, Koder.ai 같은 도구가 관리자 화면과 동기화 워크플로를 빠르게 제공해 비기술팀이 동의어 목록을 편집할 수 있게 도와줄 수 있습니다.
자동완성은 빠르고 친숙하며 관대하게 느껴져야 합니다. 인도 이커머스 검색에서 가장 큰 성공은 첫 몇 글자만으로도 유용한 제안을 얻는 것입니다. 사람들은 빠르게 입력하고 영어와 지역어를 왔다 갔다 하며 정확한 철자를 기억하지 못하는 경우가 많습니다.
우선 접두사(prefix) 튜닝부터 시작하세요. 처음 2~4자만으로도 강력한 의도의 제안을 보여줘야 합니다. 누군가가 "sha"를 입력하면 희귀한 항목으로 상단을 채우지 마세요. 대부분의 쇼퍼가 의미하는 것과 재고가 풍부한 항목을 보여주세요.
제안은 단어 수준이 아닌 카테고리 인식이어야 합니다. 사용자가 지역어인 "shakkar"를 입력하면 제안에 분명히 제품 카테고리(설탕)와 인기 하위 유형(파우더, 유기농 등)이 나타나야 혼란을 줄이고 잘못된 선택 가능성을 낮춥니다.
제안은 짧고 읽기 쉽게 유지하세요. 좋은 패턴은 브랜드 + 제품(브랜드가 정말 흔한 경우) 또는 제품 + 주요 속성입니다. 사이즈, 긴 모델 번호, 여러 속성을 한 줄에 넣어 과도하게 길게 만들지 마세요.
일반적으로 잘 작동하는 UI 규칙:
예시: 쇼퍼가 "dett"를 입력하면 인도에서는 많은 사람이 "Dettol"(브랜드 의도)을 의미하지만 어떤 사람은 "handwash"나 "sanitizer"(제품 의도)를 원합니다. 자동완성은 "Dettol Handwash", "Dettol Sanitizer", 그리고 "Handwash" 같은 카테고리를 보여줘서 두 의도를 모두 과도하게 추측하지 않고 커버할 수 있습니다.
이런 식으로 일관되게 운영하면 자동완성과 오타 허용은 영민한 알고리즘보다 쇼퍼에게 다음 명확한 행동을 제시하는 일이 됩니다.
오타 허용은 사용자가 잘못 입력해도 제품을 찾게 도와줍니다. 그러나 너무 느슨하면 검색이 "충분히 가까운" 항목들을 잘못 보여주기 시작합니다. 목표는 명확합니다: 명백한 실수를 잡되, 의도가 바뀔 위험이 있는 경우 신중하게 적용하세요.
단어 길이에 기반한 안전한 편집 거리 규칙으로 시작하세요. 짧은 단어는 쉽게 깨지므로 엄격하게 유지하고, 긴 단어는 더 유연하게 허용합니다.
숫자는 별도의 클래스로 취급하세요. “1kg”와 “10kg”는 서로 바꿀 수 없고, “500ml”가 “1500ml”가 되어서는 안 됩니다. 실용적인 규칙은 숫자 토큰 내부에서는 오타 허용을 적용하지 않고 단위는 변경하지 않는 것입니다. 다만 공백이나 대소문자 형식 차이(“1 kg”, “1KG”, “1kg”) 정도는 허용합니다.
브랜드 이름과 높은 의도의 용어는 “수정”되지 않도록 보호하세요. 상위 브랜드, 프라이빗 라벨, 브랜드처럼 보이는 일반 쿼리를 작은 보호 목록으로 유지하세요. 쿼리가 보호된 용어와 근접하게 매칭되면 무작정 수정하기보다 제안을 우선 보여주십시오.
모바일에서는 키보드 이웃 키 실수가 흔합니다(힌글리시 포함). (a-s, i-o, n-m 등) 인접 키에 대한 추가 관용을 추가하되, 단어의 나머지 부분이 강한 매칭일 때만 적용하세요.
수정이 모호할 때는 결과를 조용히 바꾸지 말고 제안으로 보여주세요. 예를 들어 “dove”가 “done”이나 “dovee”로 바뀔 수 있다면 "Did you mean dove?"처럼 물어보고 원래 결과도 유지하세요. 이렇게 하면 신뢰도를 유지하고 역클릭을 줄일 수 있습니다.
인도 쿼리는 종종 스크립트와 습관을 섞어 씁니다: “जीरा rice”, “jeera चावल”, “zeera rice”, “poha nashta”처럼요. 검색은 이들을 서로 다른 세계로 취급해서는 안 됩니다. 자동완성과 오타 허용의 목표는 많은 표기 방식을 하나의 명확한 제품 의미로 매핑하는 것입니다.
작동하는 것을 본 뒤에만 범위를 확장하세요. 먼저 작고 실용적인 규칙 집합으로 시작하세요.
욕심으로 정하지 말고 트래픽과 제로결과를 기준으로 선택하세요. 일반적으로는 영어 + Hinglish를 먼저 지원하고, 의미 있는 비중의 쿼리가 있으면 힌디 스크립트를 추가합니다. 이후 특정 지역에서 수요가 보이면 로그 기반으로 한 카테고리씩 확장하세요.
검색 품질은 한 번에 끝나는 작업이 아닙니다. 주간 루틴처럼 다루세요: 사람들이 무엇을 입력하고, 무엇을 클릭하며, 어디서 포기하는지 관찰하세요. 그래야 자동완성과 오타 허용이 추측 없이 개선됩니다.
우선 소규모 핵심 지표를 정하고 주간으로 일관되게 관찰하세요:
주 1회 상위 제로결과 쿼리를 추출해 분류하세요. 팀이 실제로 사용할 수 있도록 분류는 단순하게 유지하세요: 동의어 부족(jeera vs zeera), 철자 변형, 브랜드/모델 불일치, 잘못된 언어/스크립트, 카탈로그 공백(재고 없음). 목표는 "동의어가 필요함"과 "재고가 없음"을 구분하는 것입니다.
자동완성 데이터는 종종 가장 빠른 승리 포인트입니다. 사용자가 제안을 무시하고 끝까지 입력하면 제안이 너무 일반적이거나 순서가 잘못되었거나 지역어가 빠진 것일 수 있습니다. 사용자가 제안을 클릭하지만 여전히 정제하거나 이탈하면 제안은 맞아 보이지만 결과가 약한 것입니다.
오타는 관용을 늘리는 것만으로 해결되지 않습니다. 주당 20~50개의 교정된 쿼리를 샘플링해 다음으로 분류하세요:
이 정보를 제품팀과 마케팅이 2분 내에 읽을 수 있는 단순 대시보드로 만드세요: 상위 제로결과 쿼리와 원인, 상위 자동완성 제안과 클릭률, 다음 릴리스에 대한 짧은 작업 목록. 내부 도구를 빠르게 만들 수 있다면(Koder.ai 같은 툴 활용), 이 대시보드와 주간 추출 파이프라인은 좋은 첫 프로젝트입니다.
인도에서의 대부분의 검색 문제는 "더 많은 동의어"가 아니라 몇 가지 예측 가능한 실수에서 비롯됩니다. 이런 실수들은 서서히 사람들을 잘못된 결과로 몰아 신뢰를 떨어뜨립니다.
가장 큰 함정 중 하나는 지나치게 넓은 동의어를 사용하는 것입니다. “cream”과 “lotion”을 서로 바꿀 수 있게 하면, 크림을 원하던 고객이 가벼운 바디 로션을 보게 되어 떠날 수 있습니다. 동의어는 동일한 의도의 변형만 매핑하세요, 인접 카테고리는 아니어야 합니다.
또 다른 흔한 실수는 팩 사이즈와 단위 의도를 무시하는 것입니다. “Oil 1L”과 “oil 5L”은 쇼핑 의도가 다르고, “atta 5 kg”와 “atta 10 kg”도 마찬가지입니다. 규칙이 단위를 무시하면 대량 구매를 하려는 사용자가 소포장만 보게 되어 순위가 무작위처럼 보일 수 있습니다.
주의할 고영향 실수들:
브랜드 이름은 특히 주의하세요. 예를 들어 사용자가 “Himalya face wash”를 입력했을 때 오타 규칙이 이를 인기 있는 다른 브랜드로 고쳐 버리면 미끼 같게 느껴집니다. 일반 단어에는 관대하게, 브랜드와 모델처럼 보이는 토큰에는 더 엄격하게 적용하는 것이 안전합니다.
자동완성도 재고가 없는 항목을 제안하면 역효과가 날 수 있습니다. 예를 들어 자주 검색되는 "ghee 2L"을 제안하지만 실상은 1L만 재고가 있으면 실망을 초래합니다. 오늘 판매 가능한 항목을 우선 제안하세요.
자동완성과 오타 허용을 구축한다면 리뷰 습관을 추가하세요: 세일 주간 이후 상위 신규 쿼리, 늘어난 오타, 제로결과 용어들을 점검하세요. 작은 시즌 변화(결혼 시즌, 몬순, 시험 시즌 등)도 사용자가 입력하는 내용을 바꿀 수 있습니다.
규칙 변경을 빠르게 테스트하고 싶다면 Koder.ai 같은 도구로 검색 규칙 서비스와 관리자 페이지를 프로토타입하고 동의어, 단위, 브랜드 보호 규칙을 관리한 뒤 필요 시 코드를 내보낼 수 있습니다.
쇼퍼가 “zeera rice”를 입력해 제로 결과를 받았습니다. 그들은 다른 제품을 찾는 것이 아니라 발음대로 철자한 "zeera"를 입력한 것입니다. 의도는 “jeera rice”(cumin rice)입니다.
이 문제는 두 가지 작고 안전한 변경으로 해결할 수 있습니다: 흔한 철자 변형에 대한 동의어 추가와 보수적인 오타 규칙 적용입니다. 이 쿼리에서는 “zeera”를 “jeera”의 전사 변형으로 취급하세요.
실용적인 매핑 예시:
그런 다음 짧은 단어에 대해 엄격한 오타 허용 규칙을 추가하세요. 예: 토큰 길이가 5자 이상일 때만 1회 편집을 허용하도록 하면 “jeera” vs “jeeraa” 정도는 잡지만 매우 짧은 토큰에서의 엉뚱한 매칭은 피할 수 있습니다.
변경 후 자동완성은 추측하기보다 쇼퍼를 안내해야 합니다. 그들이 "zee…"를 입력하면 제안으로 다음을 보여주세요:
사용자가 “zeera rice”를 제출하면 결과는 카탈로그의 “jeera rice” 제품을 최상위에 보여주고, 랭킹 규칙에 따라 관련 항목(예: cumin, basmati 등)을 함께 표시해야 합니다.
일주일 후에는 행동 기반 지표에 초점을 맞춘 검색 분석을 확인하세요(단순 클릭이 아닌 실제 행동):
결과가 악화되면(예: “zira”가 다른 브랜드나 카테고리로 매칭되기 시작하면) 해당 동의어 그룹만 비활성화해 빠르게 롤백하세요. 전체 자동완성/오타 시스템을 되돌릴 필요는 없습니다. 버전 관리된 간단한 설정으로 몇 분 내에 되돌릴 수 있어야 합니다. 이런 빠른 피드백 루프가 인도 이커머스 검색의 자동완성과 오타 허용의 핵심입니다.
새 동의어, 자동완성, 오타 설정을 배포하기 전에 실제 쿼리 데이터와 직접 테스트를 섞어 한 번 점검하세요. 이렇게 하면 "도움이 되는" 변경이 잘못된 결과를 만드는 일을 막을 수 있습니다.
배포 전 체크리스트:
문제가 있으면 작은 변경부터 배포하세요. 큰 업데이트가 검색을 무작위로 만들게 하는 것보다 점진적이고 통제된 배포가 낫습니다.
검색 문제가 뚜렷한 한 카테고리(예: 식료품, 퍼스널 케어, 모바일 액세서리)로 시작하세요. 범위를 일주일 이내로 작게 유지해 원인과 결과를 관찰하세요. 움직일 수 있는 2~3개의 성공 지표(제로결과율, 검색→제품 클릭률, 검색 후 장바구니 추가 등)를 선택하세요.
간단하지만 효과적인 배포 계획 예시:
변경은 되돌릴 수 있게 만드세요. 동의어와 오타 규칙을 코드처럼 버전 관리하고 스냅샷을 찍어 롤백 경로를 확보하세요. 새 규칙으로 "face wash"가 갑자기 "dishwash liquid"를 보여주면 몇 분 내에 되돌릴 수 있어야 합니다.
소유권이 규칙보다 중요합니다. 주간 30분 리뷰를 담당할 사람을 지정하세요: 신규 상위 제로결과 쿼리, 잘 고쳐진 오타, 저품질 클릭 급증 등.
더 빨리 빌드하고 반복하고 싶다면 Koder.ai가 검색 레이어를 구현하고 채팅 기반 빌드를 도와주며, 계획 모드로 규칙과 지표를 매핑하고 소스 코드를 내보낼 수 있게 해 장기적으로 팀이 소유할 수 있게 합니다. 또한 스냅샷과 롤백을 지원해 규칙 변경 시 빠른 복구가 가능합니다.
측정된 결과에서 다음 반복을 계획하세요. 예를 들어 “zeera rice”의 전환이 좋아졌지만 “jeera”가 이제 무관한 “zera” 제품과 매칭된다면, 다음 행동은 그 규칙을 조이기(엄격하게 하기)이지 전체를 다시 쓰는 것이 아닙니다.