<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Archives de &quot;GoogleBot&quot; - Affluences</title>
	<atom:link href="https://www.affluences.ca/sujets/googlebot/feed/" rel="self" type="application/rss+xml" />
	<link>https://www.affluences.ca/sujets/googlebot/</link>
	<description></description>
	<lastBuildDate>Mon, 10 Mar 2025 18:27:20 +0000</lastBuildDate>
	<language>fr-FR</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.8.5</generator>
	<item>
		<title>Tout ce qu’il faut savoir sur le crawl budget pour le référencement</title>
		<link>https://www.affluences.ca/blogue/quil-faut-savoir-crawl-budget-referencement/</link>
					<comments>https://www.affluences.ca/blogue/quil-faut-savoir-crawl-budget-referencement/#respond</comments>
		
		<dc:creator><![CDATA[Affluences]]></dc:creator>
		<pubDate>Fri, 27 Jan 2017 16:10:58 +0000</pubDate>
				<category><![CDATA[Référencement]]></category>
		<category><![CDATA[GoogleBot]]></category>
		<category><![CDATA[Indexation site]]></category>
		<guid isPermaLink="false">https://www.affluences.ca/?p=5261</guid>

					<description><![CDATA[<p>Le crawl budget a un impact sur le référencement des gros sites. Googlebot Commençons par la base : Googlebot, c’est quoi ? C’est le robot d’exploration de<span class="excerpt-hellip"> […]</span></p>
<p>Cet article <a href="https://www.affluences.ca/blogue/quil-faut-savoir-crawl-budget-referencement/">Tout ce qu’il faut savoir sur le crawl budget pour le référencement</a> est apparu en premier sur <a href="https://www.affluences.ca">Affluences</a>.</p>
]]></description>
										<content:encoded><![CDATA[<img fetchpriority="high" decoding="async" width="525" height="300" src="https://www.affluences.ca/upload/2017/01/crawl-budget-googlebot.jpg" class="attachment-full size-full wp-post-image" alt="crawl-budget-googlebot" style="float:right; margin:0 0 10px 10px;" srcset="https://www.affluences.ca/upload/2017/01/crawl-budget-googlebot.jpg 525w, https://www.affluences.ca/upload/2017/01/crawl-budget-googlebot-300x171.jpg 300w, https://www.affluences.ca/upload/2017/01/crawl-budget-googlebot-256x146.jpg 256w, https://www.affluences.ca/upload/2017/01/crawl-budget-googlebot-50x29.jpg 50w, https://www.affluences.ca/upload/2017/01/crawl-budget-googlebot-131x75.jpg 131w" sizes="(max-width:767px) 480px, 525px" /><h1>Le crawl<em> budget a un impact sur</em> le référencement des gros sites.</h1>
<h2>Googlebot</h2>
<p>Commençons par la base : Googlebot, c’est quoi ?</p>
<p>C’est le <a href="https://www.affluences.ca/blogue/comment-fonctionnent-les-robots-des-moteurs-de-recherche/">robot d’exploration</a> de Google. En anglais, on le nomme <em>spider</em> signifiant araignée puisqu’il se promène sur la toile (le « <em>web</em> ») pour en explorer le contenu.</p>
<p>C’est donc ce robot qui vient analyser le contenu de votre site web et le répertorier dans l’index de Google !</p>
<p>Il fonctionne grâce à des algorithmes complexes qui lui permettent de comprendre le contenu de votre site et suivre les liens de façon efficace. Voyez-le comme un explorateur qui ne s’arrête jamais de chercher des nouveautés sur le web pour en informer Google et mettre à jour les pages de résultats.</p>
<p>Son rôle est donc primordial pour<a href="https://www.affluences.ca/quest-ce-que-le-referencement/"> le référencement.</a> Il est la source première d’information.</p>
<h2>Budget d’exploration ou <em>crawl budget</em></h2>
<p>Le web est immense et grandit exponentiellement de jour en jour. Googlebot doit donc organiser son exploration pour être efficace. C’est pour cette raison qu’existe le budget d’exploration communément appelé <em>crawl budget</em>.  Le budget dépend de la demande d’exploration et la vitesse d’exploration</p>
<p>Toutefois, si votre site a moins de quelques milliers d’URLs, le budget d’exploration n’aura pas d’impact sur votre site et il sera explorer sans problème.</p>
<p>Google doit limiter les ressources allouées à un site par le serveur de Googlebot pour les  gros sites ou les sites comportant des pages auto-générées en fonction de paramètres.</p>
<h3>Vitesse d’exploration</h3>
<p>Le premier élément déterminant le budget d’exploration est la vitesse d’exploration (<em>crawl rate</em>).</p>
<p>Généralement, le robot effectuera plusieurs connections parallèles sur un même site web pour l’explorer. Il aura un temps d’attente entre ces requêtes d’exploration. C’est ce qu’on nomme le <em>fetching rate</em> qu’on pourrait traduire par taux de récupération.</p>
<p>L’objectif est de ne pas surcharger la bande passante de votre serveur. Googlebot ne doit pas affecter l’expérience des visiteurs de votre site web.</p>
<p>Ainsi, le taux peut varier selon :</p>
<ol>
<li>La santé de l’exploration (<em>Crawl health</em>) : Si le site répond très vite (chargement des pages, réponse du serveur, etc.), la limite augmente et le nombre de connections simultanées aussi. Le contraire est vrai aussi.</li>
<li>La limite de vitesse d’exploration déterminée dans la Search Console : Vous pouvez indiquer un maximum vous-mêmes pour votre site web.</li>
</ol>
<h3>Demande d’exploration</h3>
<p>Si Googlebot n’explore pas à pleine capacité sur le site, celui-ci n’augmentera pas nécessairement. Tout dépend de la demande d’exploration déterminée par l’algorithme du Googlebot.</p>
<p>En bref, les pages populaires sont explorées plus souvent. De plus, Google détermine les pages à explorer pour éviter de conserver des pages qui n’existent plus dans son index. Finalement, le déplacement d’un site augmente aussi la demande d’exploration pour réindexer le contenu des nouvelles urls.</p>
<h2>Les éléments-clés pour optimiser le budget d’exploration du Googlebot</h2>
<p>Certains facteurs affectent à la baisse le<em> crawl budget</em> de votre site web. Un budget sera diminué si vous avez plusieurs pages apportant peu de valeur.</p>
<p>Voici des situations à risque :</p>
<ul>
<li>Les <strong>« recherche à facettes » :</strong> Il s’agit des filtres dans un outil de recherche pour trier par prix, couleur, etc. S’il y en a plusieurs, ils peuvent créer des combinaisons infinies.</li>
<li>Le <strong>contenu dupliqué</strong></li>
<li>Les <a href="https://support.google.com/webmasters/answer/181708?hl=fr">erreurs « soft 404 »</a>: Lorsqu’une URL erronée affiche le contenu d’une autre page comme la page d’accueil sans passer par un <a href="https://www.affluences.ca/blogue/quest-ce-quune-erreur-404/">code d’erreur 404,</a> Google n’apprécie pas. Il indexe ce contenu comme une véritable page et cela diminue la qualité de son moteur de recherche.</li>
<li>Les <strong>pages piratées</strong></li>
<li>Les <strong>espaces infinis</strong>: Il s’agit de liens infinis. Par exemple, on peut penser aux liens de calendrier « mois prochain » qui peuvent se poursuivre à l’infini et détourner Googlebot du véritable contenu.  Si vous recevez une erreur de ce genre dans votre Search Console, vous trouverez les directives à ce sujet dans <a href="https://support.google.com/webmasters/answer/76401">l’aide de Google</a>.</li>
<li>Les <strong>proxys</strong></li>
<li>Le <strong>contenu de faible qualité</strong> et le <strong>spam</strong></li>
</ul>
<p>En plus d’éliminer ces situations de votre site, voici ce qu’il faut retenir :</p>
<ul>
<li>Améliorez la vitesse de chargement du site, car elle affecte la vitesse d’exploration et donc le budget.</li>
<li>Portez attention aux <a href="https://support.google.com/webmasters/answer/35120">erreurs d’exploration</a> de la Search Console.</li>
<li>Gardez en tête que tout ce que Googlebot explore compte dans le budget : CSS, urls alternatives, AMP, Javascript. Faites donc attention aux redirections longues.</li>
<li>N’oubliez pas que le <em>crawl-delay</em> dans le robots.txt n’est pas prix en compte par le Googlebot.</li>
<li>Enlevez les paramètres des urls qui n’affectent pas le contenu de la page et utilisez plutôt les cookies et redirections 301.</li>
<li>Indiquez avec <em>disallow</em> les actions que Googlebot ne peut pas effectuer dans le robots.txt comme ajouter au panier par exemple.</li>
<li>Sachez que les liens nofollow pourraient être suivis.</li>
</ul>
[contact-form-7]
<p>Cet article <a href="https://www.affluences.ca/blogue/quil-faut-savoir-crawl-budget-referencement/">Tout ce qu’il faut savoir sur le crawl budget pour le référencement</a> est apparu en premier sur <a href="https://www.affluences.ca">Affluences</a>.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://www.affluences.ca/blogue/quil-faut-savoir-crawl-budget-referencement/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
