SEO sémantique - Compréhension du secteur Logiciels par Google

Étude de cas SEO:
Compréhension du secteur Logiciels par Google

Mars 2020

Résumé

Google utilise des algorithmes de traitement du langage naturel (NLP) pour convertir les pages Web en sujets et concepts compréhensibles par les machines (ces sujets et concepts sont appelés des entités nommées). En utilisant cette approche, nous avons examiné comment Google comprend les contenus du secteur Logiciels.

InLinks a analysé le contenu des 10 premiers résultats de recherche pour le mot-clé meilleur crm gratuit (marché FR) et a comparé les entités reconnues par l'API NLP de Google avec celles reconnues par Inlinks, afin de découvrir les comment Google comprend cette industrie par rapport aux autres.

Les résultats montrent que 18.2% des entités contenues dans les pages de résultats du secteur Logiciels ont été correctement identifiées par Google.

Ce chiffre est à comparer à la moyenne de 23.5% (à date) pour l'ensemble des secteurs industriels analysés.

 

Comparaison entre les différents secteurs industriels

Si Google détecte généralement très bien les personnes, sociétés et lieux, la détection de concepts lui pose cependant plus de problème. Ce taux de détection varie également en fonction du secteur industriel concerné. Dans le cas de l'industrie du logiciel

 

Secteur: Logiciels Analyse Google Analyse InLinks
Nb. moyen de mots par page 1283
Nb moyen d'entités par page 7.9 43.4
Benchmark - Nb moyen d'entités par page (tous secteurs) 7.6 32.2
Types d'entités détectées:    
- Personnes 6 1
- Organisations 9 12
- Villes et zone géo. 2 0
- Concepts 29 199
Densité sémantique   6

Comment la recherche a été menée

Pour le mot-clé meilleur crm gratuit, l'API de recherche de Google a renvoyé les URL des sites suivants:

#placedesreseaux, #junto, #leadlist, #ledigitalizeur, #agence-copernic, #appvizer, #bitrix24, #capterra, #codeur, #crm-expert

Les textes de chaque page sont ensuite envoyés à l'API NLP de Google, afin de déterminer quelles entités sont identifiées par le moteur de recherche. Ces entités sont importantes pour la recherche puisque Google est alors en mesure de les relier à son Knowledge Graph pour alimenter ses services, notamment Google Discover, Google search, Voice Search et Google News. (Bien qu'une identification correcte ne garantisse pas l'inclusion dans ces résultats)

Voici tout d'abord la synthèse des résultats renvoyés par Google

  • 29 concepts, incluant Customer relationship management (détecté 6 fois) French language (5) SuiteCRM (4)
  • 9 organisations, incluant HubSpot (4) Salesforce (3) SugarCRM (2)
  • 6 personnes, incluant CiviCRM (2) Brad Pitt (1) 
  • 2 zones géographiques, incluant France (1)

Erreurs de catégorisation relevées

Voici quelques erreurs faites par Google lors de la catégorisation des entités :

  • England catégorisée comme concept au lieu de zone géographique
  • CivicCRM catégorisé comme personne

Comparaison: entités les plus importantes détectées par InLinks et Google

  • Customer relationship management (détecté 10 fois par InLinks) => détecté 6x par Google
  • Software (8) => détecté 1x par Google
  • Small and medium enterprises (8) => NON détecté par Google
  • Marketing (8) => NON détecté par Google
  • Customer (7) => NON détecté
  • Management (7) => NON détecté
  • User (computing) (7) => NON détecté
  • Business (7) => NON détecté
  • Sales (7) => NON détecté
  • Sales lead (6) => NON détecté
  • Lead generation (6) => NON détecté
  • HubSpot (6) => détecté 4x
  • Application programming interface (6) => NON détecté
  • Product lifecycle (6) => NON détecté
  • Tool (5) => NON détecté

Comment le secteur Logiciels peut-il tirer profit de ce rapport ?

Produire de meilleurs contenus

En connaissant à la fois les faiblesses de Google en terme de détection d'entités, ainsi que les types de contenus les mieux compris par le moteur de recherche, les entreprises du secteur peuvent rédiger un contenu plus clair facilitant la compréhension de Google.

Pour rappel, que Google détecte la ou les entités principales de vos contenus est une condition essentielle pour que Google puisse proposer ce contenu à ses utilisateurs en fonction de leurs centres d'intérêts. Cette proposition de contenu par centre d'intérêt se retrouve à la fois dans Google Discover, mais également en partie dans Google Search.

Dans le cas présent, la page la mieux comprise par Google est:

https://www.codeur.com/blog/logiciel-crm-gratuit/

Pour laquelle les entités suivantes ont été détectées: PrestaShop, Android (operating system), SuiteCRM, Joomla, WordPress, Drupal, Facebook, French language, Invoice, Customer relationship management, Salesforce

Il est à noter que, pour cette page, InLinks a détecté une densité sémantique particulièrement élevée par rapport aux autres résultats de la SERP (9.6 entités pour 100 mots, à comparer à une densité moyenne de 6 entités / 100 mots), ce qui 

Faciliter la compréhension des moteurs

Une autre option consiste à énoncer explicitement ces concepts à l'aide de Schema.org, afin que les algorithmes de Google en tiennent compte.

Pour cela, on peut utiliser Schema.org/WebPage et les propriétés "about" et "mentions" pour les concepts importants abordés (au minimum Customer relationship management)

 

 

© 2019-2020 - InLinks.net - About us - Terms of Use - Privacy Policy