Révélations sur le classement des contenus par Google
Un exploit mis en lumière par Mark Williams-Cook dévoile plus de 2 000 critères que Google utilise pour classifier les requêtes et les sites web. Cela inclut notamment le scoring par consensus et les types de requêtes.
Pourquoi ces découvertes sont importantes
Ces révélations nous offrent une compréhension approfondie du fonctionnement de la recherche Google. En début d’année, une fuite massive du Content API Warehouse avait déjà révélé des informations cruciales. Désormais, nous en savons plus sur le scoring, la classification et la qualité des sites.
Le scoring par consensus
Google évalue le nombre de passages dans un contenu qui soutiennent, contredisent ou restent neutres par rapport au consensus général. Cela influence potentiellement le classement pour certaines requêtes, notamment celles visant à démystifier des affirmations (ex. : « La Terre est-elle plate ? »).
Catégorisation des requêtes
Google classe presque toutes les requêtes en huit « classes sémantiques affinées » :
- Fait court
- Booléen (questions oui/non)
- Autre
- Instruction
- Définition
- Raison
- Comparaison
- Conséquence (argent, santé, etc.)
Ces classifications aident Google à ajuster son algorithme pour certains types de requêtes. Depuis 2019, nous savons que Google applique des poids de classement différents pour les requêtes de type YMYL (Your Money Your Life).
Scores de qualité de site
Les résultats de Google sont influencés par les scores de qualité de site. Selon Williams-Cook, ceux-ci sont calculés au niveau du sous-domaine, reposant sur :
- Visibilité de la marque (recherches incluant le nom de la marque)
- Interactions des utilisateurs (clics, même si le site n’est pas en premier)
- Pertinence des textes d’ancrage sur le web
Les sites qui n’atteignent pas un certain seuil (par exemple, 0.4 sur une échelle de 0 à 1) ne peuvent pas bénéficier de fonctionnalités de recherche avancées (snippets en vedette, People Also Ask).
Probabilité de clics
Google n’utilise pas directement le taux de clics dans le classement mais semble tenir compte de la probabilité de clics pour chaque résultat organique. En ajustant le titre de la page, cette probabilité peut changer.
À propos des données
Williams-Cook et son équipe ont analysé 2 To de données et plus de 90 millions de requêtes. Google les a récompensés de 13 337 $ pour avoir découvert la vulnérabilité de l’endpoint.
Vidéo recommandée : Pour les passionnés de SEO, visionnez la conférence « Améliorer votre SEO avec des modèles conceptuels » de Mark Williams-Cook sur YouTube.
Pour approfondir :
- Comment fonctionne le classement de la recherche Google
- Comprendre le classement Google selon Pandu Nayak
- Documents essentiels sur le classement Google dans les procès antitrust