
Vous avez lancé votre boutique Shopify, vos produits sont bien présentés, vos photos sont soignées. Et pourtant, le trafic ne...
Agence SEO, GEO & création de sites WordPress à Nantes
Transformez votre présence en performance!
Les études de cas
Client : laboxavin.fr | CMS : Shopify | Secteur : E-commerce vin | Mission : Audit complet & 5 jours d’optimisations techniques
Réalisée par PerfSEO — Consultant SEO, GEO & Création de sites performants à Nantes

Dans l’écosystème ultra-concurrentiel de la vente de vin en ligne, face à des mastodontes du secteur, Laboxavin affichait un trafic organique de 23 200 clics sur 12 mois pour 1,38 million d’impressions.
Un potentiel de trafic très prometteur, pénalisé par une position moyenne de 18,6 : le site apparaissait en fin de deuxième page de Google, peu visible pour la majorité de ses clients potentiels.
Avant d’entrer des dans actions de contenu, d’optimisation sémantique, et de netlinking, il fallait d’abord optimiser la structure technique qui empêchait Google et les moteurs génératifs (ChatGPT, Gemini, Perplexity) de bien comprendre et de faire confiance au site. C’est l’objet de la phase Technique de mon travail avec eux.
Avant d’apparaître dans les résultats de recherche sur Google, une page doit franchir deux étapes distinctes. D’abord le crawl : Googlebot, le robot d’indexation de Google, visite l’URL, lit son contenu, suit ses liens. Ensuite l’indexation : Google décide si cette page mérite d’être ajoutée à sa base de données et d’apparaître sur internet.
Une page non indexée est une page invisible : peu importe la qualité du contenu, la pertinence de ses mots-clés. Elle n’existe tout simplement pas aux yeux de Google et est introuvable sur internet.
Ce que l’audit a mis en évidence dans le cas de Laboxavin, c’est un écart massif entre ce que Google découvrait et ce qu’il choisissait d’indexer : 1 400 pages indexées pour 35 500 URLs supplémentaires découvertes mais non indexées.
C’est une différence énorme, mais ce n’était pas un problème d’indexation. Google faisait correctement son travail en ignorant ces URLs qui étaient en fait sans valeur. Le problème était ailleurs.
Le budget crawl désigne le temps et les ressources alloués par Google & ses robots à l’exploration de votre site. Ce quota n’est pas illimité, et Google le distribue en fonction de la popularité et de la qualité perçue du site.
Mais ces 35 500 URLs alors? Elles étaient des URLs générées automatiquement par Shopify : filtres de recherche, paginations infinies, combinaisons de tags produits, elles n’étaient pas indexées (heureusement!), mais elles étaient quand même crawlées. Google les visitait, les analysait, concluait qu’elles n’avaient pas de valeur, et passait à la suivante. En boucle.
Les conséquences sont multiples.
À cela s’ajoutait un second problème : 6 % des explorations aboutissaient sur des erreurs 404 : des pages supprimées ou déplacées sans redirection. Chaque 404 est une impasse pour Google, un signal négatif supplémentaire sur la fiabilité du domaine. Pour les moteurs génératifs, la situation est encore plus directe : un LLM qui tombe sur une page en erreur 404 en tentant d’extraire une information enregistre le site comme source instable et le cite moins dans ses réponses.
Rendre l’indexation d’un site Shopify saine ne se résume pas à supprimer des pages. C’est une intervention en plusieurs couches à différents niveaux.
La première action a porté sur le robots.txt : le fichier qui dicte à Googlebot et Bingbot les zones autorisées et interdites du site. Les URLs générées automatiquement par Shopify pour les tags produits, les filtres de recherche et les paramètres de navigation ont été explicitement exclues de l’exploration via des règles dédiées pour chaque bot. Le sitemap a été mis à jour en parallèle pour ne référencer que les pages à valeur réelle, donnant à Google une carte propre du périmètre à explorer.
Cette intervention seule réduit mécaniquement le volume d’URLs parasites dans le radar de Googlebot — mais elle ne suffit pas pour les URLs déjà connues et enregistrées dans l’index. Pour celles-là, trois actions complémentaires ont été menées :
Résultat : le taux d’erreurs 404 est passé de 6 % à 0,1 %. Le nombre de pages non indexées a chuté de 35 500 à 12 612, toujours en nettoyage, soit 64 % de pages parasites en moins et 3 fois plus de budget crawl disponible pour les pages qui comptent vraiment.
D’après Google Analytics, 79 % des visiteurs de Laboxavin naviguent sur smartphone. Ce chiffre rend la performance mobile critique. Or, l’audit de vitesse a mis en évidence des opportunités importantes.
Le LCP (Largest Contentful Paint) mesure le temps d’affichage du principal élément visible d’une page : généralement l’image héro ou le titre H1. Pour Google, un LCP supérieur à 2,5 secondes est jugé insuffisant. Le LCP mobile moyen de Laboxavin était de 15 secondes sur Page Speed Insights (mesuré par Google). Six fois le seuil critique. Un certain nombre de visiteurs quittent la page avant que le contenu ne s’affiche, et Google le sait.
À contenu égal, Google classe systématiquement le site le plus rapide en premier.
L’amélioration du LCP a nécessité une intervention sur plusieurs niveaux techniques :
Résultat : un gain de +20 points de score de performance mobile et un LCP ramené à 4s en conditions laboratoire (Page Speed Insights) et à 1,5s en conditions réelles (Core Web Vitals), soit presque 4 fois plus rapide qu’à l’état initial. Un site qui charge vite, c’est un site qui convertit mieux. C’est aussi un site que les moteurs génératifs considèrent comme fiable.
Shopify possède une architecture « plate » : sans intervention, toutes les pages sont au même niveau hiérarchique.
Google ne peut pas déduire qu’un Pic Saint Loup appartient au Languedoc, ni qu’un Chinon fait partie de la Loire. Pour un site dont l’autorité dépend de sa capacité à être perçu comme un expert par région et appellation, c’est un handicap majeur.
L’audit a confirmé que les URLs ne pointaient pas vers les bonnes catégories. Les collections étaient privées de tout poids sémantique et les produits étaient tous séparés, au même niveau.
La technique retenue : l’implémentation d’un fil d’Ariane dynamique enrichi en JSON-LD (Schema.org BreadcrumbList). Ce dispositif remplit deux fonctions simultanées.
Pour l’utilisateur, il clarifie la navigation et améliore l’expérience sur mobile. Pour Google et les moteurs génératifs, il envoie un signal de parenté sémantique explicite :
Chaque lien interne remonte désormais l’autorité des fiches produits vers les pages catégories. Les pages catégories : Beaujolais, Rhône, Languedoc deviennent des hubs d’autorité thématique, bien plus puissants sur les mots-clés à fort volume.
Pour le SEO et le GEO spécifiquement, cette structuration est déterminante : un LLM qui cherche à recommander un « vin du Languedoc en ligne » va parser la structure de données du site. Avec des breadcrumbs (fil d’ariane) JSON-LD, Laboxavin lui dit explicitement : « cette page appartient à cette catégorie, qui appartient à cette région ». C’est le langage que les IA comprennent.
L’audit avait identifié 1 282 pages avec des balises H1 multiples et 30 H1 dépassant 70 caractères. Ce n’est pas qu’une question esthétique : la balise H1 est le signal principal que Google utilise pour comprendre le sujet d’une page. Le fait d’avoir plusieurs H1 donne un signal ambigu et entraîne la perte de poids sémantique de chacun des titres.
La correction a normalisé l’ensemble de la structure : un seul H1 descriptif par page, des H2 et H3 structurés pour répondre aux intentions de recherche, et des balises titles harmonisées dans les fourchettes recommandées (50-60 caractères).
Pour les moteurs génératifs, cette hiérarchie propre permet une extraction précise des informations : Gemini ou ChatGPT peuvent lire la page et comprendre immédiatement ce qu’elle contient, à quelle région appartient le vin, et quelle est sa caractéristique principale.
Voici l’état comparatif avant et après la phase d’optimisations techniques :
Métrique | Avant | Après | Impact Business |
|---|---|---|---|
Erreurs 404 (crawl) | 6,0 % | 0,1 % | Google explore les pages qui ont du sens, pas des impasses |
Pages non indexées | 35 500 | 12 698 | Vos nouvelles pages sont indexées plus vite et ont plus de poids |
LCP Mobile | ~15 secondes | < 3 secondes | Moins d’abandons avant même de voir le produit |
Score Perf. Mobile | 58 / 100 | 78 / 100 | Meilleur classement Google à contenu égal |
Structure sémantique | Plate / désordonnée | Silos + Breadcrumbs | Chaque produit bénéficie du poids de sa région |
Données structurées | Absentes | JSON-LD Product | Cité par ChatGPT, Gemini et Perplexity & Rich Snippets Google |
Un audit SEO technique, c’est rarement ce qui fait briller une présentation client. On ne voit pas les breadcrumbs. Personne ne célèbre un taux de 404 à 0,1 %. Et pourtant, c’est précisément ce travail invisible qui détermine si tout ce qui vient ensuite : le contenu, la sémantique, les optimisations produits va fonctionner ou non.
L’assainissement technique n’est pas une fin en soi. C’est la condition préalable à toute stratégie de visibilité durable en SEO classique comme GEO.
Les moteurs génératifs ne recommandent pas les sites rapides. Ils recommandent les sites fiables, structurés, sans ambiguïté sémantique. Un site avec 6 % d’erreurs 404 et plus de 35 000 pages parasites envoie un signal de désordre que les IA traduisent par : source peu fiable, à ne pas citer.
Avec un index nettoyé, des données structurées JSON-LD en place, un LCP sous les 3 secondes et des silos sémantiques opérationnels, La Box à Vin est désormais une base de données de confiance pour les moteurs de recherche de demain.
Travailler le contenu sur un site qui n’est pas optimisé techniquement, c’est créer ou améliorer des pages que Google ne crawle pas correctement, sur un domaine qu’il perçoit comme désorganisé. Les mots-clés ciblés, les descriptions de collections retravaillées, les articles de blog, tout ce travail sémantique s’appuie sur la confiance que Google accorde au domaine. Et cette confiance se construit d’abord sur des signaux techniques propres.
Avec un index nettoyé, les nouvelles pages créées ou optimisées seront découvertes et crawlées plus rapidement. Googlebot ne perd plus son budget sur 35 500 URLs parasites. Avec le fil d’ariane (breadcrumbs) en place, chaque fiche produit optimisée hérite automatiquement du poids sémantique de sa collection. Avec un LCP sous les 3 secondes, les pages de contenu bénéficient d’un signal Core Web Vitals favorable dès leur première évaluation.
La Phase 2 peut maintenant s’attaquer aux leviers à fort impact commercial : l’optimisation des pages collections sur les appellations et régions à volume, la réécriture des fiches produits à fort potentiel, et la création de contenu autour des niches identifiées. Des requêtes accessibles, à faible difficulté, sur un domaine désormais structuré pour les recevoir.

Vous avez lancé votre boutique Shopify, vos produits sont bien présentés, vos photos sont soignées. Et pourtant, le trafic ne...

Le référencement local à Nantes a radicalement changé. Aujourd'hui, pour attirer des clients en physique, optimiser son Google Business Profile...

Vous avez passé des heures à rédiger un article complet, bien structuré, vraiment utile. Vous l'avez publié. Vous avez attendu....