SEO pour vitrines Hindi-Anglais en Inde : choisissez une structure d'URL claire, ajoutez hreflang correctement et établissez un flux de contenu qui évite les pages fines.

La duplication SEO dans une boutique Hindi + Anglais ressemble généralement à deux pages presque identiques, à l'exception de la langue. Elles présentent les mêmes produits, les mêmes titres et les mêmes balises méta, si bien que Google a du mal à décider laquelle doit être affichée selon l'utilisateur.
Cela arrive souvent lorsqu'une boutique publie des URL traduites sans signaux clairs, ou lorsque les pages anglaises sont clonées et que seuls quelques mots sont changés. Le résultat est un ensemble de pages « différentes » qui n'apportent aucune valeur nouvelle, et qui peuvent être considérées comme du contenu fin ou dupliqué.
La cannibalisation est le problème suivant. Cela signifie que deux pages de votre propre site se font concurrence pour la même recherche, de sorte qu'aucune ne performe aussi bien qu'elle pourrait. Par exemple, si vous avez une page de catégorie en anglais et une en hindi qui tentent toutes deux de se classer pour « men shoes » (parce que la page hindi utilise encore majoritairement du texte anglais), Google peut alterner entre elles ou classer la plus faible.
L'objectif pour le SEO d'une vitrine Hindi-Anglais est simple : une page claire par langue et par intention. Les pages anglaises doivent cibler fortement les requêtes en anglais, et les pages hindi doivent cibler fortement les requêtes en hindi, avec une séparation nette et des relations claires entre elles.
L'Inde complique cela parce que les internautes ne recherchent pas dans une langue unique et propre. Beaucoup de personnes cherchent en anglais, en hindi, ou en requêtes mixtes (Hinglish), par exemple « best pressure cooker 5 litre » ou « saree under 1000 ». Si vos pages hindi sont de simples versions légèrement éditées des pages anglaises, elles peuvent finir par se concurrencer avec vos pages anglaises pour ces requêtes mixtes.
Un moyen rapide de repérer le risque de duplication est de vérifier :
La structure d'URL est la première décision qui prévient (ou crée silencieusement) la duplication. Elle influence la façon dont les moteurs de recherche crawlent, comment vous mesurez la performance, et la difficulté à maintenir l'alignement entre pages anglaises et hindi au fil du temps.
Trois configurations courantes existent :
example.com/en/ et example.com/hi/en.example.com et hi.example.comexample.in et example.com (ou un domaine dédié pour le hindi)Les sous-dossiers sont le meilleur choix par défaut pour la plupart des équipes qui travaillent le SEO d'une vitrine Hindi-Anglais. Tout vit sous un même domaine, donc l'autorité, le crawl et les rapports restent centralisés. Il est aussi plus simple d'appliquer des règles cohérentes pour les balises canonicals, le maillage interne et les templates. Pour une petite équipe, cette configuration réduit généralement les erreurs qui mènent à des pages traduites dupliquées ou fines.
Les sous-domaines peuvent fonctionner, mais ils se comportent en pratique plus comme des sites séparés. On finit souvent avec des vues analytiques scindées, des configurations de tracking doublées, et deux ensembles de contrôles SEO techniques. La maintenance a tendance à diverger : le site anglais reçoit les améliorations en premier, et le hindi reste en retard, ce qui crée des écarts de qualité.
Les domaines séparés ne sont pertinents que lorsque les activités sont vraiment différentes (règles de livraison, tarification, ou exigences légales distinctes). Sinon, ils multiplient l'effort : sitemaps séparés, construction d'autorité séparée, et plus d'occasions d'avoir des pages dépareillées qui se concurrencent.
Une règle compte plus que le choix : choisissez un schéma et appliquez-le partout. Si les catégories sont sous /hi/, les produits, filtres, contenus de blog et pages d'aide doivent suivre la même structure. Les patterns incohérents sont une raison fréquente pour laquelle les sites multilingues publient accidentellement plusieurs URL pour la même intention.
Un pattern d'URL clair montre qu'il s'agit de langues différentes, pas de duplicata. Pour le SEO d'une vitrine Hindi-Anglais, la règle la plus simple est : une langue, une URL, toujours.
Un pattern commun et clair est d'utiliser des dossiers par langue :
/en//hi/Ainsi vos pages deviennent faciles à raisonner :
/en/mens-shoes/ et /hi/purush-joote//en/puma-running-shoe-12345/ et /hi/puma-daudne-joota-12345//en/blog/how-to-measure-feet/ et /hi/blog/pair-kaise-mapen//en/help/returns/ et /hi/help/returns/Localisez les parties que les utilisateurs lisent. Gardez stables les parties dont dépendent les systèmes.
Localisez :
Gardez stables (ne pas traduire) :
12345)Garder un ID à la fin de l'URL est utile si votre slug hindi change plus tard, car l'URL peut toujours pointer vers le même produit.
Évitez d'avoir plusieurs URL qui ressemblent à la « page d'accueil principale ». Choisissez une par défaut et rendez les autres explicites.
Une configuration simple :
/ (choisissez soit l'anglais soit un sélecteur neutre)/en/ et /hi/Si vous utilisez un sélecteur de langue sur /, assurez-vous qu'il ne crée pas de copies indexables comme /?lang=hi et /?lang=en. Celles-ci se multiplient facilement et sont difficiles à contrôler. Faites en sorte que le changement de langue soit lié aux dossiers, de sorte que chaque langue ait une adresse propre et cohérente.
Hreflang est un petit élément de balisage qui indique à Google : « Ces pages sont le même produit ou la même catégorie, simplement rédigées pour des langues ou régions différentes. » Cela n'améliore pas le classement en soi. Hreflang aide surtout Google à afficher la version adaptée à l'utilisateur, afin que votre page hindi ne concurrence pas votre page anglaise.
Pour l'Inde, la configuration la plus courante est langue plus pays :
hi-INen-INSi vous servez aussi de l'anglais pour d'autres pays, vous pouvez utiliser en pour une page anglaise globale, et garder en-IN pour l'anglais spécifique à l'Inde (prix en INR, règles d'expédition, termes locaux). Choisissez l'ensemble le plus restreint qui corresponde vraiment aux différences entre les pages.
Hreflang fonctionne en cluster. Chaque version linguistique doit référencer les autres versions, et se référencer elle-même. Par exemple, la page produit anglaise pointe vers la version hindi, et la page hindi renvoie à l'anglaise. Si une page oublie d'inclure l'autre, le signal s'affaiblit et Google peut traiter les pages comme distinctes.
C'est là que beaucoup de configurations Hindi-Anglais échouent : elles ajoutent hreflang seulement sur les pages anglaises, ou seulement sur certains templates, de sorte que Google voit un set incomplet.
x-default sert de page « de secours » quand vous ne pouvez pas associer un utilisateur à une langue ou une région. C'est utile si vous avez une page de sélection de langue, ou une page neutre qui invite l'utilisateur à choisir Hindi ou English.
Ne pointez pas x-default vers une de vos pages principales sauf si cette page fonctionne vraiment comme valeur par défaut pour tout le monde. Sinon, cela peut embrouiller Google et envoyer des signaux contradictoires sur la version à classer.
Les balises canonical et hreflang ont des rôles différents, et la plupart des sites bilingues ont besoin des deux. Hreflang dit à Google quelle version montrer à quel utilisateur. La canonical dit à Google quelle URL est la version principale quand plusieurs pages sont très similaires.
Pour le SEO d'une vitrine Hindi-Anglais, le plus sûr par défaut est : chaque page linguistique réelle pointe canonical vers elle-même. Votre page produit anglaise canonical vers l'URL anglaise, et votre page produit hindi canonical vers l'URL hindi. Ensuite, elles se référencent mutuellement avec hreflang. Cela garde les deux pages éligibles au classement, sans être traitées comme des duplicatas.
Ne canonicisez pas une langue vers l'autre à moins que vous ne vouliez vraiment qu'elle ne soit pas indexée. Si votre page hindi est juste une traduction automatique incomplète (ou un placeholder temporaire), une canonical vers l'anglais peut servir de filet de sécurité à court terme. Mais cela dit aussi aux moteurs de recherche d'ignorer l'URL hindi pour le classement, alors n'utilisez cette approche que si c'est intentionnel.
Les règles d'indexation comptent surtout pour les pages qui se multiplient vite :
Les URLs avec paramètres et le tri sont une source commune de bloat d'index. Si vous avez des URLs comme ?sort=price ou ?utm_source=, choisissez une version « principale » propre (généralement la catégorie non filtrée) et canonicisez toutes les versions paramétrées dessus. Si certains filtres méritent leur propre landing page (comme « chaussures de course homme »), créez une URL fixe pour ce filtre et traitez-la comme une vraie catégorie avec un contenu unique, pas comme une page paramétrée.
Un bon workflow empêche que les pages hindi et anglaises se concurrencent. L'objectif n'est pas de tout traduire. L'objectif est de publier des pages qui méritent de se classer dans chaque langue et qui sont clairement mappées à la bonne intention.
Commencez par un inventaire de pages et une règle pour « les deux vs une ». Gardez les pages à forte intention dans les deux langues (accueil, catégories principales, best-sellers, expédition, retours, contact). Laissez les filtres long tail, sous-catégories quasi-duplication et pages à faible trafic dans une seule langue jusqu'à preuve qu'elles attirent des recherches.
Rédigez un brief de traduction avant que quiconque ne touche au texte. Indiquez le ton (hindi formel vs conversationnel), un glossaire pour les noms de produits et matériaux, comment afficher les tailles et unités, et les mots exacts à utiliser pour expédition, COD, retours, garantie et offres. Cela évite d'avoir 20 variantes du même terme à travers les templates.
Localisez d'abord les pages commerciales, pas tout le catalogue. Traduisez et adaptez les intros de catégories, guides d'achat, FAQ et sections de confiance. Pour les pages produit, concentrez-vous sur les éléments qui influencent la décision : titre, bénéfices clés, spécifications, instructions d'entretien, et livraison/retours. Si un produit n'a qu'une courte ligne en anglais, le traduire crée une page hindi fine. Dans ce cas, gardez le produit dans une langue et traduisez plutôt la catégorie et les pages de support.
Effectuez une QA structurée qui inclut les éléments SEO. Vérifiez les balises titre et meta descriptions pour le sens (pas la traduction mot à mot). Confirmez un H1 clair, des en-têtes propres et des fil d'Ariane dans la bonne langue. Assurez-vous que les liens internes et les textes d'ancrage correspondent à la langue de destination, afin que la navigation hindi ne pointe pas systématiquement vers des pages anglaises (et inversement).
Publiez par petits lots et surveillez la performance par langue. Déployez 20 à 50 URLs, puis suivez les impressions, clics et requêtes pour chaque langue. Si les pages hindi commencent à se classer pour des requêtes anglaises (ou l'inverse), ajustez les textes et les liens internes pour que chaque page réponde à la bonne intention linguistique. C'est là que le SEO Hindi-Anglais se gagne ou se perd.
Un exemple simple : si votre catégorie anglaise dit « running shoes » et que la version hindi utilise plusieurs variantes à travers les pages, choisissez une formulation hindi principale dans le brief et conservez-la. La cohérence aide les utilisateurs et réduit les risques que deux pages soient perçues comme interchangeables.
Si vous utilisez une plateforme comme Koder.ai, conservez le brief et le glossaire comme référence partagée, puis réutilisez les mêmes sections de template (expédition, retours, tailles) afin que les pages traduites restent complètes et non incomplètes.
Le moyen le plus rapide de créer de la duplication SEO est de publier une version hindi pour chaque produit quand la page contient presque aucune information réelle. Si la page hindi n'est qu'un titre traduit et une ligne, Google peut la considérer comme de faible valeur et continuer à la crawler, ce qui peut tirer vers le bas toute la section (et parfois embrouiller le classement par langue).
Les produits avec peu de texte ont besoin de plus qu'une traduction brute. Ajoutez des détails utiles pour l'achat, même si vous restez concis : contenu de la boîte, notes sur la taille et l'ajustement, matériaux, instructions d'entretien, modalités de garantie, délais de livraison par région, et quelques vraies FAQ. L'objectif n'est pas de rendre le hindi plus long que l'anglais, mais de le rendre complet.
Un bon template vous aide à éviter les pages « presque vides ». Construisez des blocs cohérents à remplir pour chaque SKU et chaque catégorie :
Fixez ensuite une règle minimale de contenu avant qu'une page puisse être indexée. Beaucoup de projets Hindi-Anglais échouent parce qu'ils traduisent tout, puis indexent tout.
Un jeu de règles pratique pourrait être :
Exemple : vous lancez le hindi pour un catalogue mode de 2 000 SKUs. Commencez par indexer seulement vos 200 produits principaux et catégories clefs où vous pouvez remplir correctement le template. Pour le reste, publiez l'interface hindi mais bloquez l'indexation jusqu'à ce que le contenu atteigne le seuil. Si vous utilisez une plateforme comme Koder.ai, vous pouvez intégrer ces contrôles dans les templates et utiliser les snapshots/rollback si un publish massif crée trop de pages fines.
Les recherches Hinglish sont courantes en Inde car les gens mélangent scripts et langues dans une même requête, par exemple « wireless earbuds price » ou « मिक्सर grinder 750w ». Pour le SEO, cela signifie généralement que l'internaute veut le même produit, mais que sa formulation est un mélange d'habitudes, de paramètres clavier et de niveau de confort.
Une règle utile : ne traitez pas le Hinglish comme une troisième version linguistique. Si vous créez des pages séparées juste pour cibler ces requêtes mixtes, vous finirez souvent avec du contenu quasi-duplicate qui se fait concurrence avec la page principale en anglais ou en hindi.
Conservez les noms de marque, numéros de modèle et identifiants techniques de façon cohérente entre les langues. Ces termes sont souvent saisis en anglais même dans des requêtes hindi, et la cohérence aide les utilisateurs et les moteurs de recherche à trouver la bonne page. Par exemple, gardez « Philips HL7756/00 » exactement identique sur les pages anglaises et hindi, même si le texte environnant est traduit.
Des éléments bilingues peuvent aider sans transformer la page en mélange confus. Ajoutez-les uniquement là où les utilisateurs s'y attendent, comme dans les specs, dimensions, SKU ou notes de compatibilité. Un pattern simple : étiquette en hindi + terme d'unité en anglais, ou phrase en hindi avec le nom du modèle inchangé.
Voici ce qui marche généralement le mieux pour capter les recherches à intention mixte sans cannibalisation :
Fixez les attentes : vous n'obtiendrez pas une page qui se classe parfaitement pour tous les mélanges linguistiques. Visez plutôt des pages anglaises propres, des pages hindi propres, et de petites aides bilingues qui permettent aux recherches « entre-deux » d'atterrir sur la bonne version.
Une boutique D2C vend des soins personnels et compte 500 produits. Leur site anglais se classe déjà pour les termes produit et catégorie, ils veulent des pages hindi sans créer de duplicatas ni pousser les pages anglaises hors des résultats. C'est un cas classique : vous voulez plus de portée, pas deux versions en concurrence.
Ils choisissent une structure par dossier claire :
/en/ (exemple : /en/category/face-wash/)/hi/ (exemple : /hi/category/face-wash/)Ils lancent par phases au lieu de tout traduire le premier jour. D'abord, ils traduisent les 20 catégories principales et les 100 produits qui génèrent le plus de trafic et de ventes. Pour les 400 autres produits, ils n'ajoutent pas de pages hindi fines copiées de l'anglais. Ceux-ci restent uniquement en anglais jusqu'à ce que le contenu hindi soit prêt.
La duplication est évitée avec trois règles simples. Chaque page linguistique a une canonical auto-référencée, et les pages anglaises continuent de fonctionner comme avant. Chaque page traduite reçoit des annotations hreflang pointant vers sa paire (en <-> hi). Et les pages hindi ne sont pas créées en ne changeant que le titre et quelques mots — elles réécrivent les parties clés (intro de catégorie, bénéfices produit, usage, FAQ) pour que la page soit vraiment utile en hindi.
Après le lancement, ils surveillent hebdomadairement Search Console et analytics. En semaine 2, ils détectent de la cannibalisation : la page de catégorie hindi commence à apparaître pour des requêtes anglaises, pendant que la page anglaise baisse légèrement. La correction est simple : ils ajustent la page hindi pour utiliser des titres naturels en hindi et des mots-clés hindi (pas des termes anglais), resserrent les liens internes pour que les menus anglais pointent vers des pages anglaises, et vérifient que hreflang est correct. En deux semaines, les résultats se séparent proprement : les pages anglaises gagnent les requêtes anglaises, et les pages hindi progressent sur les requêtes hindi.
La cannibalisation survient quand Google voit deux (ou vingt) pages comme des réponses concurrentes à la même requête. Dans le SEO Hindi-Anglais, cela commence souvent avec de bonnes intentions : on lance le hindi vite, puis les classements oscillent parce que le site a désormais beaucoup de quasi-duplicates.
Un déclencheur fréquent est la traduction automatique publiée sans revue humaine, avec chaque page autorisée à s'indexer. Si la version hindi sonne maladroite ou reprend la structure anglaise sans contexte local, elle peut paraître fine. Google peut la tester sur les mêmes mots-clés, puis alterner entre versions.
Les erreurs hreflang sont une autre cause fréquente. Si votre page hindi pointe vers l'anglais, mais que la page anglaise ne renvoie pas en retour (lien de retour manquant), le signal est faible. Des codes langue ou région erronés, ou un hreflang pointant vers des URL non canoniques, créent aussi de la confusion.
Les balises canonical peuvent aggraver la situation. Si vous canonicalisez l'anglais et le hindi vers la même URL anglaise, vous dites aux moteurs : « ce sont des duplicatas, ne gardez que l'anglais. » Cela peut supprimer le hindi des résultats ou provoquer des conflits d'indexation.
Faites attention aux « même intention, plusieurs pages ». Cela arrive quand des équipes créent plusieurs variantes hindi qui signifient la même chose (par exemple, deux traductions différentes utilisées dans la navigation et la recherche interne). Elles ciblent alors la même requête avec des URLs séparées.
La navigation facettée peut multiplier silencieusement le problème. Lorsque les filtres taille, couleur, marque et prix génèrent des URLs indexables, vous pouvez produire des milliers de pages qui ressemblent à des catégories mais avec peu de valeur unique.
Patterns à auditer en priorité :
Un check rapide : cherchez sur votre propre site un terme de catégorie important dans les deux langues. Si vous trouvez plusieurs URLs qu'un humain qualifierait de « même page », Google le peut probablement aussi.
Avant de mettre des pages hindi en ligne, faites une passe calme sur les bases. La plupart des chutes de positionnement proviennent de petits signaux (URLs, canonicals, hreflang, liens internes) qui se contredisent.
Utilisez ceci comme gate final pour votre déploiement Hindi-Anglais :
Un seul pattern d'URL, partout. Choisissez une règle unique et appliquez-la à l'accueil, aux catégories, produits, pages blog/aide et landing pages. Évitez de mélanger des patterns comme certains pages en sous-dossiers et d'autres en paramètres.
Canonical auto-référencé sur chaque page linguistique. La page anglaise doit canonicaliser vers elle-même, et la page hindi vers elle-même. N'utilisez des cross-canonicals que si vous voulez intentionnellement qu'une seule version soit indexée.
Set hreflang complet et correct. Chaque page anglaise pointe vers son équivalent hindi et vice-versa. Incluez un x-default uniquement si vous avez une vraie page par défaut (par ex. une page de sélection de langue).
Pas d'indexation pour les duplicatas à faible valeur. Filtres, résultats de recherche internes, ordres de tri proches-duplicates et variations fines doivent être bloqués de l'indexation (généralement avec noindex + maillage interne propre), tout en permettant au crawl d'accéder aux pages clefs.
La QA de traduction ne concerne pas que le texte. Vérifiez titres de page, H1/H2, meta descriptions, texte alternatif des images lorsque pertinent, liens internes (ils doivent rester dans la langue cible), et champs de données structurées localisables (comme les noms de produit). Confirmez aussi la monnaie, le libellé d'expédition et les extraits de politique de retour adaptés au marché.
Après le lancement, séparez le reporting. Suivez la performance pour /en/ et /hi/ indépendamment (classements, clics, pages indexées, requêtes principales). Si les pages hindi progressent mais que les pages anglaises reculent, ralentissez le déploiement et corrigez les templates avant de traduire plus.
Choisissez une langue par défaut en premier. Pour l'Inde, beaucoup de boutiques conservent l'anglais comme langue par défaut pour les nouveaux visiteurs, puis proposent un changement de langue clair qui modifie l'URL (et pas seulement le texte de la page). Faites le changement cohérent partout (header, footer, checkout) pour éviter que les utilisateurs ne rebondissent en plein parcours.
Planifiez le déploiement en vagues pour mesurer l'impact et corriger les problèmes avant de tout traduire. Un ordre pratique : catégories générant le plus de revenus d'abord, puis les produits les plus vendus dans ces catégories, puis la longue traîne. Cela garde vos pages hindi concentrées sur les requêtes importantes et réduit le risque de pages fines.
Mettez en place une règle qualité simple avant qu'une page traduite soit autorisée à indexer. L'objectif est que chaque page hindi soit utile par elle-même, et non une copie qui concurrence l'anglais.
Pour les outils, utilisez Google Search Console pour détecter tôt l'indexation et la cannibalisation, ainsi qu'un crawler pour vérifier hreflang et canonicals à grande échelle. Si vous reconstruisez, vous pouvez prototyper vos routes /en/ et /hi/ dans Koder.ai en décrivant la structure en chat, générer rapidement des pages React, et utiliser snapshots/rollback pour itérer en sécurité avant déploiement. Cela rend le travail SEO Hindi-Anglais contrôlé, mesurable et réversible.