En novembre 2011, Google annonçait qu’il privilégierait la publication de contenu frais sur les pages de résultats. Cette mise à jour de son algorithme aurait un impact sur 35 % des résultats, soit plus ou moins un résultat par page.
Effrayant quand on lit que 73 % des sites Internet français, qu’ils soient professionnels, publics ou privés, n’ont pas été mis à jour depuis plus d’un an, selon une enquête menée par la société Email-brokers auprès des 2,6 millions de sites actifs existants.
Cette priorisation de résultats frais concerne :
Beaucoup de critiques ont été émises contre les avis de consommateurs déguisés. Une norme est mise en place par Afnor, l’organisme chargé d’établir des normes afin de définir les pratiques garantissant la fiabilité de la collecte des avis des consommateurs.
La norme devrait permettre de mieux identifier les auteurs des messages en croisant les avis laissés par un même internaute afin de vérifier leur pertinence. Enfin, les commentaires seront encadrés afin d’éviter que les sites marchands ne censurent ceux qui sont négatifs.
A l’heure actuelle, en cas de non-respect des règles en vigueur, un contrevenant s’expose à une sanction pouvant aller jusqu’à 2 ans de prison et de 187 500 euros d’amende. Début 2012, 4 procédures ont été diligentées à l’encontre de sites marchands dans les secteurs de la téléphonie, des produits cosmétiques et des enchères. Trois P.V concernent des sites d’avis ou des forums (bonnes adresses de voyages, locations, loisirs). Enfin, une plate-forme d’e-réputation est également concernée.
Faux-avis de consommateurs : rappel à la loi du gouvernement français fin 2011.
Il prend en compte de nombreux critères, notamment : la date, le freshrank, la disparition de vieux contenus, le microblogging et les réseaux sociaux.
Il se base sur la date de création qui inclut la date et le temps.
Il peut y avoir 2 types de dates prises en comptes (inception scores).
En bref, un document peut être découvert et se voir attribuer une date de création, mais ne jamais apparaître sur les pages de résultats.
La date à laquelle un seuil de nombre de liens vers le document a été atteint (par exemple pour le microblogging, la date de création ne sera assignée que si le Tweet a été retweeté plusieurs fois ou si le Tweet émane d’une personne faisant autorité).
L’âge du document est donc défini sur base de la période située entre la date de création et la date de la requête. Cette période est également utilisée pour le calcul relatif aux liens (par exemple, un document d’un jour avec 10 liens sera pondéré différemment qu’un document de 10 ans avec 100 liens).
Sur base de ces informations, le moteur peut alors utiliser l’historique pour pondérer le document, selon le calcul suivant :
H=L/log(F+2)
Où :
H = score de l’historique ajusté (score de fraîcheur de l’URL ajusté)
L = score du lien (score de pertinence basé sur l’analyse traditionnelle des liens)
F = temps écoulé (période calculée sur base de la date de création)
Source : Document Scoring Based on Document Inception Date (PDF en téléchargement).
Résultat de cette équation : une URL bénéficiera de plus de poids dans la période suivant directement la date de création. Le score diminuera ensuite rapidement sur une courte période, mais la vitesse de cette « dépondération » ralentira ensuite jusqu’à ce que le contenu soit considéré comme non mis à jour.
Il est important de préciser que cette équation n’est applicable qu’à des requêtes qui requièrent un contenu frais.
Le volume de contenu mis à jour intervient également, selon le calcul suivant :
U : f(UF,UA)
Où :
U = score de mise à jour
UF = score de fréquence de mise à jour
UA = score de volume mis à jour (en %)
Ce score de mise à jour a pour conséquence qu’un faible volume de contenu doit être mis à jour plus fréquemment pour avoir la même valeur qu’un grand volume mis à jour moins fréquemment.
Mais d’autres facteurs interviennent dans le score. Du contenu en JavaScript par exemple aura peu de poids, contrairement aux title, textes d’ancrage des liens, qualité du contenu de la page. Le moteur peut également considérer le score de fréquence de mise à jour et le volume de contenu mis à jour et voir si la vitesse augmente ou ralentit.
Le nombre de requête d’une expression ou d’expressions en relation augmente sur une période de temps définie, il est probable que ce soit un signal pour les prendre en considération dans le calcul de fraîcheur.
L’augmentation du nombre de clics (CTR) sur un article pour une période définie peut également être prise en compte par les moteurs pour augmenter le score de cet article et le privilégier sur les pages de résultats.
Le nombre de liens entrants et les liens qui disparaissent, ainsi que la vitesse de ces changements pour définir si un contenu va devenir « frais » peuvent également être pris en compte par les moteurs de recherche. Le poids de ce document peut alors être ajusté.
En deux mots, si un “vieux” contenu continue à gagner de nouveaux liens entrants, il peut rivaliser avec un contenu frais.
Les moteurs de recherche peuvent également donner un score de fraîcheur par le biais des liens : la fraîcheur d’un document est ainsi déterminée par le score de fraîcheur des pages qui font des liens vers celui-ci. Le nombre de liens frais entrent aussi en ligne de compte.
Une autre façon de promouvoir le contenu frais est de mettre en place un système pour supprimer le vieux contenu. Lors de leur crawl, les moteurs repèrent les mises à jour importantes du contenu. Au plus les mises à jour sont fréquentes, au plus le crawl sera important. Les moteurs alignent la fréquence de leur crawl en fonction de celles-ci. Grâce à ce processus, les moteurs disposent de plus de ressources pour favoriser l’indexation de documents frais.
Google utilise les microblogs pour identifier les hot topics partant du principe que les réseaux sociaux sont généralement les premiers à publier l’actualité brûlante.
Il y aurait des crawlers et index différents pour le contenu des sites et celui issu du microblogging.
Sources :
Comment la fraîcheur est-elle calculée ? (en anglais)
Google à propos de la fraîcheur du contenu (en anglais)
Commentaires des lecteurs
Aucun commentaire en ce moment.