SEO sémantique - Compréhension du secteur Hi-Tech par Google

Étude de cas SEO:
Compréhension du secteur Hi-Tech par Google

Mars 2020

Résumé

Google utilise des algorithmes de traitement du langage naturel (NLP) pour convertir les pages Web en sujets et concepts compréhensibles par les machines. En utilisant cette approche, nous avons examiné comment Google comprend les contenus du secteur Hi-Tech.

InLinks a analysé le contenu des 10 premiers résultats de recherche pour le mot-clé transformation digitale (marché FR) et a comparé les entités nommées* reconnues par l'API NLP de Google avec celles reconnues par Inlinks, afin de découvrir les lacunes de Google dans cette industrie.

Les résultats montrent que 16.4% des entités contenues dans les pages de résultats du secteur Hi-Tech ont été correctement identifiées par Google.

Ce chiffre est à comparer à la moyenne de 22.3% pour l'ensemble des secteurs industriels analysés.

A noter que la même étude réalisée en Anglais (mot-clé: Digital Transformation, marché US), montre un taux de détection légérement meilleur des concepts importants par Google (détection du topic principal dans un résultat de recherche, soit 10%)

Comparaison entre les différents secteurs industriels

Les différents secteurs ont tendance à être analysés avec un degré de précision différent par les moteurs de recherche. Cela découle de deux défis principaux.

  1. plus la demande des consommateurs est importante dans une industrie donnée, plus les moteurs de recherche doivent appliquer une reconnaissance d'entité sophistiquée pour mieux répondre aux demandes des utilisateurs.
  2. plus les contenus publiés dans cette industrie sont sophistiqués, plus les moteurs de recherche peuvent utiliser les sujets et des concepts détectés dans ces contenus pour enrichir leurs résultats.

 

Secteur: Hi-Tech Analyse Google Analyse InLinks
Nb. moyen de mots par page 2034
Nb moyen d'entités par page 7.8 47.5
Benchmark - Nb moyen d'entités par page (tous secteurs) 7.5 34.3
Types d'entités détectées:    
- Personnes 9 1
- Organisations 19 18
- Villes et zone géo. 4 1
- Concepts 29 236
Densité sémantique   6.8

Comment la recherche a été menée

Pour le mot-clé transformation digitale, l'API de recherche de Google a renvoyé les URL des sites suivants:

#1min30, #digitall-conseil, #entreprendre, #frenchweb, #hbrfrance, #inboundvalue, #journalducm, #neoptimal, #visiativ-solutions, #webconversion

Les textes de chaque page sont ensuite envoyés à l'API NLP de Google, afin de déterminer quelles entités sont identifiées par le moteur de recherche. Ces entités sont importantes pour la recherche puisque Google est alors en mesure de les relier à son Knowledge Graph pour alimenter ses services, notamment Google Discover, Google search, Voice Search et Google News. (Bien qu'une identification correcte ne garantisse pas l'inclusion dans ces résultats)

Voici tout d'abord la synthèse des résultats renvoyés par Google

  • 29 concepts, incluant Uber (détecté 4 fois) Internet of things (3) Big data (3)
  • 19 organisations, incluant Dassault Systèmes (2) Amazon (company) (2) Airbnb (2)
  • 9 personnes, incluant French language (2) Elisabeth Kübler-Ross (1) Michel Serres (1)
  • 4 zones géographiques, incluant French language (4) France (1) Anglo-Saxons (1)
  • 1 évènement, incluant World Economic Forum (1)

Erreurs de catégorisation relevées

Une fois encore, on peut s'apercevoir que les entités stockées dans le Knowledge Graph ne semblent pas avoir de type prédéfini (concept, organisation, ...): l'entité French Language est en effet détectée une fois comme zone géographique, et une fois comme personne.

Comparaison: entités les plus importantes détectées par InLinks et Google

  • Business (détecté 9 fois par InLinks) => NON détecté par Google
  • Customer (8) => NON détecté par Google
  • Digital transformation (8) => NON détecté par Google
  • Communication (8) => NON détecté par Google
  • Internet (8) => NON détecté
  • Technology (8) => NON détecté
  • Computer network (7) => NON détecté
  • Wage labour (7) => NON détecté
  • Product (business) (7) => NON détecté
  • Tool (7) => détecté 1x
  • Change management (6) => NON détecté
  • Digitizing (6) => NON détecté
  • Economy (5) => NON détecté
  • Information (5) => NON détecté
  • Process (computing) (5) => NON détecté

On voit ici que la plupart des concepts importants de la thématique ne sont que peu détectés par Google. 

Comment le secteur Hi-Tech peut-il tirer profit de ce rapport ?

Produire de meilleurs contenus

En connaissant à la fois les faiblesses de Google en terme de détection d'entités, ainsi que les types de contenus les mieux compris par le moteur de recherche, les entreprises du secteur peuvent rédiger un contenu plus clair facilitant la compréhension de Google.

Dans le cas présent, la page la mieux comprise par Google est:

https://www.visiativ-solutions.fr/la-transformation-digitale-cest-quoi/

Pour laquelle Google a détecté les entités suivantes: Big data, 3D printing, Cloud computing, Mobiquité, Tool, Product-Lifecycle-Management, SIMULIA, Dassault Systèmes, CATIA, DELMIA, SolidWorks

Faciliter la compréhension des moteurs

Une autre option consiste à énoncer explicitement ces concepts à l'aide de Schema.org, afin que les algorithmes de Google en tiennent compte.

Pour cela, on peut utiliser Schema.org/WebPage et les propriétés "about" et "mentions" pour les concepts importants tels que: Digital transformation, Internet, Computer network, Digitizing, Process (computing).

A noter que ce type de marquage Schema.org peut avoir une incidence importante sur le ranking d'une page. Plusieurs études clients ont montré des améliorations significatives de leur positionnement avant/après la mise en place d'un tel balisage.

Améliorer le maillage interne

L'établissement de liens internes vers les sujets/entités les plus importants permettra également de réduire la cannibalisation du contenu dans la compréhension de Google des pages de votre site. Il est également possible que Google utilise les entités détectées dans tous les contenus d'un site pour améliorer sa détection dans les nouveaux contenus publiés. Ceci a notamment été remarqué sur des articles de presse.

© 2019-2020 - InLinks.net - About us - Terms of Use - Privacy Policy