
Le plan du site est considéré comme un élément important d’un site web, qui sert principalement au référencement naturel et répertorie un grand nombre de sous-pages avec leurs URL. Ainsi, le plan du site est une liste des pages d’un site web qui peuvent être vues ou consultées publiquement par des robots d’exploration ou des utilisateurs. Un document ou une page web peut être utilisé comme plan du site. En règle générale, le document ou les pages HTML contenant les URLs répertoriées sont organisés de manière hiérarchique.
Outre les catégories responsables de la structure d’un site web, le plan de site répertorie également certaines sections relatives aux médias et aux actualités, les éléments communautaires, le contenu du blog etc. Les sitemaps sont souvent présents sur Internet et sont également appelés protocoles sitemap. Ce protocole a été fondé sur l’idée de créer des sites Web adaptés aux robots d’exploration. En 2005, Google a développé la première technologie sitemap.
Les deux versions existante d'un plan de site
Il existe deux versions courantes d’un plan de site. Un plan de site XML (ou sitemap.xml) est un format structuré que le propriétaire du site et le visiteur ne voient pas. Cette version ne communique pratiquement qu’avec les crawlers des moteurs de recherche.


Cela leur permet de voir l’importance d’une seule sous-page, le nombre de visiteurs qui cliquent dessus et la fréquence de sa mise à jour. Le XML est un document qui utilise une structure et un codage particuliers. Ce codage est également considéré comme la norme permettant aux robots d’exploration du Web d’analyser et de trouver les sitemaps. La deuxième version est le plan du site HTML. Ce système est conçu pour aider l’utilisateur à mieux organiser le contenu du site Web. Les sitemaps HTML ne doivent pas nécessairement capturer chaque sous-page.
Il aide également les visiteurs et les robots des moteurs de recherche à trouver le contenu d’un site web et est donc accessible au public, par exemple via un lien sur la page d’accueil (généralement dans le pied de page) ou une entrée dans le menu du site. Les pages HTML, contrairement aux versions XML, indiquent la conception de la page web. Les pages XML, en revanche, sont blanches et n’ont pas de contenu CSS ou de codes HTML. Le XML est également beaucoup plus précis que le codage HTML. Les erreurs ne sont pas tolérées, ce qui signifie que la syntaxe est toujours exacte.

Les origines et le but principal d’un sitemap pour le référencement naturel
En 2005, Google a introduit les sitemaps pour permettre aux développeurs web de publier des listes de liens depuis leurs sites web. L’idée de base est que certains sites Web comportent un grand nombre de pages dynamiques qui n’existent que grâce au contenu des visiteurs, comme les forums. Le fichier sitemap contient les URLs de ces pages afin que les robots d’exploration du web puissent les trouver.
Les principaux moteurs de recherche – Bing, Google, Yahoo et Ask – partagent tous un protocole sitemap, ce qui facilite bien sûr l’adhésion des opérateurs de sites web aux spécifications et aux directives de restriction énumérées ci-dessous. Cependant, les sitemaps ne peuvent pas garantir que tous les liens seront explorés, ni l’indexation. Toutefois, un plan de site reste la meilleure assurance pour indiquer à un moteur de recherche que votre site web existe et qu’il se développe ou propose un nouveau contenu.
Utiliser et intégrer un sitemap à bon escient
Si vous avez de l’expérience dans le codage de documents Web, vous pouvez créer un plan du site à l’aide de simples extraits de code et le télécharger sur le serveur sur lequel se trouve le site Web. Faire appel un consultant SEO peut grandement vous aider. Cela peut également se faire avec des systèmes de gestion de contenu. Cependant, elles sont plutôt destinées aux profanes qui souhaitent mettre en place des plates-formes web sans grandes connaissances.
Ces groupes de personnes ont la possibilité d’utiliser ce que l’on appelle des plug-ins et de les utiliser pour installer un plan du site en un clic de souris. L’avantage de cette méthode est que la conception et le contenu exacts du plan du site peuvent être créés ou sélectionnés sans grand effort de codage supplémentaire.
De tels plug-ins qui peuvent fournir un plan du site peuvent être trouvés pour WordPress ainsi que pour Joomla, Drupal et d’autres systèmes de gestion de contenu. Le plus connu est Yoast SEO sur WordPress. En ce qui concerne le protocole sitemap, il convient également de noter que les plug-ins généralement utilisés dans les systèmes de gestion de contenu ont une limite automatique de 50 000 URLs.
Quelles sont les limites du plan du site ?
Il y a quelques restrictions à connaître lors de l’utilisation d’un plan de site. Par exemple, il n’est pas permis de répertorier dans le plan du site plus de 50 000 URLs qui renvoient à du contenu sur la plate-forme web. Si vous avez plus de contenu, vous devez en rayer une partie ou n’inclure que le plus important dans le plan du site. Une autre restriction concerne la taille du plan du site. Il ne doit pas dépasser 50 Mo.
Cette limite de taille supérieure doit également être respectée lors de l’utilisation de sites web compressés. Toutefois, vous pouvez contourner les restrictions en utilisant simplement plusieurs sitemaps. Le sitemap principal renvoie à tous les autres sitemaps, ce qui vous permet théoriquement d’inclure un total de 2,5 milliards d’URLs dans votre protocole sitemap.

Sitemap et Robot.txt, le duo ultime pour un SEO parfait
Les exploitants de sites web utilisent généralement un fichier Robots.txt. Ce fichier est considéré comme le commandant du crawler. Il spécifie par des commandes les pages et les fichiers qui peuvent être enregistrés et visités par les robots des moteurs de recherche. Cela exerce une grande influence sur l’indexation des pages web. Par exemple, on peut déterminer que les crawlers ne sont pas autorisés à mettre en œuvre certaines images dans les moteurs de recherche d’images de Google.
Vous pouvez également exclure de l’indexation par les moteurs de recherche le contenu précieux mais accessible au public que vous ne voulez pas que le monde entier examine. Étant donné que le sitemap n’a pas de grande valeur ajoutée pour un site web, il est fortement conseillé de l’exclure également de l’indexation des moteurs de recherche. Dans le pire des cas, l’accumulation des liens peuvent même détériorer la réputation dont jouissait auparavant un site web auprès de Google et d’autres moteurs de recherche.
Un bon travail de référencement ne fait que s’améliorer avec le temps. Ce sont seulement les astuces des moteurs de recherche qui doivent continuer à changer lorsque les algorithmes de classement changent.
Jill Whalen