Auditer son Knowledge Graph peut résoudre un problème majeur d’audit de contenu

Topic Detail Chart
Entités utilisées par SEMRush

La plupart des audits de contenu sont tellement granulaires dans leur analyse qu’ils passent souvent à côté des points permettant d’élaborer un plan d’action:

  • Sur quoi devriez-vous écrire pour combler les lacunes de vos contenus?
  • Quels sont les sujets qui mériteraient d’être développés ?
  • Quels sont les thèmes abordés par vos concurrents que vous devriez également aborder

etc.

Nous avons donc créé un une méthode permettant d’auditer le Knowledge Graph d’un site à l’aide d’Excel, ce qui permet, selon nous, de pouvoir rapidement auditer le contenu d’un site, identifier ses points forts et ses points faibles afin de répondre précisément aux questions ci-dessous. Il sera intéressant de savoir si la communauté du référencement est d’accord (n’hésitez pas à commenter pour cela).

Un gros problème avec la plupart des audits de contenu est qu’ils opèrent au niveau des mots-clés. Pourquoi regarder combien de fois un mot est utilisé sans tenir compte de ses synonymes ?

Considérons les mots suivants: mercatique, communication commerciale et marketing. Ces trois mots ont exactement la même signification et se rapportent tous à l’entité “Marketing” (ID Wikidata: Q39809). Par ailleurs, “stratégie marketing” (ID Wikidata: Q1363963) correspond à une entité entièrement différente.

Les outils SEO d’analyse de contenu existants ne font pas cette distinction. Nous savons que Google le fait (ou du moins essaie), car Paul Haahr de Google nous le dit. Il a utilisé l’exemple de “New York” comme n’étant ni “New” ni “York” (Google WMC, 2019).

Un second problème est que la plupart des outils d’analyse de contenu fonctionnent au niveau de la page. Nous voulions un outil d’audit qui puisse fonctionner au niveau du site.

Vous voulez la version TL;DR ? Téléchargez le modèle Excel ICI. Il est pré-rempli de données factices. Vous devrez ensuite mettre à jour les champs de données avec les exports de vos propres projets.

(mais vous passerez à côté du “pourquoi” si vous choisissez de ne pas lire d’abord)

Knowledge Graph Audit à l’aide d’entités et d’Excel

Alors que l’onglet “Graph” d’InLInks donne un excellent aperçu visuel du graphique de connaissances d’un site web, vous pouvez maintenant créer des audits élaborés de votre Knowledge Graph, en utilisant notre modèle Excel gratuit et en exportant les données des entités directement dans le classeur Excel. Ces audits vous permettent de trouver des lacunes dans le contenu de votre site en examinant les entités que vous exploitez, peut-être par rapport à votre concurrence, ou en comparant les entités que vous utilisez dans votre texte aux entités que vous utilisez dans les titres de vos pages. L’outil vous permet de plonger au cœur du référencement moderne des entités, sans vous concentrer sur les mots-clés.

Les moteurs de recherche, comme Google, s’appuient de plus en plus sur la sémantique pour trouver le sens d’un texte. Cela signifie une augmentation significative de l’utilisation des synonymes dans l’interprétation des requêtes de recherche et dans l’indexation. Les sites web n’ont plus nécessairement besoin des mêmes mots clés que ceux utilisés par l’internaute pour obtenir un bon classement – ils doivent plutôt porter sur les mêmes CHOSES que celles recherchées par l’utilisateur. Dans les années 2020, l’information qui se cache derrière les mots est souvent plus importante que les mots eux-mêmes. Inlinks utilise les données de la fondation Wikidata comme un dictionnaire de ces idées – ou entités. Elle a élaboré l’un des plus grands graphiques de connaissances indépendants de la planète. Le référencement des entités est l’avenir.

A l’aide du Machine Learning, la technologie s’est mise à apprendre des modèles dans des bribes de texte à une échelle énorme pour essayer d’établir quelles entités sont sémantiquement proches les unes des autres et dans quel contexte. Pour exploiter cela, les SEOs peuvent maintenant analyser les entités qui manquent dans un site web et utiliser cela pour améliorer le graphique des connaissances propres à leur site web afin de mieux refléter ses domaines d’expertise.

Prêt à découvrir comment effectuer un audit d’entités ? C’est parti.

Knowledge Graph vs Knowledge Panel vs Web sémantique

Un Knowledge Graph (graphe de connaissance) n’est pas un Knowledge Panel… bien qu’il y ait des similitudes. Le “Knowledge Panel” est une représentation visuelle des données entourant une entité, telles qu’elles sont affichées dans les SERPs. Un Knowledge Graph est une base de données de tous les sujets sous-jacents (Entités) utilisés dans le texte d’une page, d’un site ou d’un corpus de texte. Il peut s’agir d’un livre ou d’un livre blanc, mais pour les audits de Knowledge Graph, nous examinons le contenu d’un site web.

Un audit de KG est un audit des entités composant le site web.

Cela signifie que, bien qu’il ne soit pas facile de modifier un Knowledge panel dans Google, sauf si vous l’avez demandé, vous POUVEZ modifier le Knowledge graph de votre propre site et, ce faisant, la façon dont Google perçoit votre site, le catégorise dans son index et lui attribue de l’autorité sur un sujet précis.

Il est logique que, plus vous faites preuve d’expertise dans votre secteur d’activité, plus les entités vues dans votre texte s’alignent sur celles que Google voit comme devant être couvertes dans tout contenu utilisé pour répondre à la requête d’un chercheur.

Le web sémantique est quelque chose de différent, mais là encore, il est lié et important. Le web sémantique fait appel au balisage pour aider les machines à comprendre le texte plus facilement. Les entités sont importantes dans cette entreprise, car nous pouvons utiliser schema.org (une forme de balisage sémantique) pour dire à Google que ce contenu concerne CETTE entité et utiliser une URL Wikipédia pour la référencer.

Votre site web est le miroir de votre entreprise

Il y a peu de place pour la créativité dans les systèmes d’IA modernes. Alors qu’il est possible d’entraîner une IA à paraître créative, l’IA de Google – du moins dans ses algorithmes de recherche de base, est constituée d’algorithmes de correspondance de motifs. qui commencent par un traitement du contenu en langage naturel.

Le contenu est ensuite divisé en fragments significatifs constitutifs… des entités si possible… puis recousu lorsque l’utilisateur effectue une recherche basée sur des relations sémantiques – les vecteurs entre les entités et les mots aident Google à voir quels mots sont étroitement liés à un concept et lesquels ne le sont pas. Si vous utilisez une hyperbole ou une métaphore dans votre contenu web, vous risquez de ne pas être bien compris par les moteurs de recherche (et donc mal classé). Mais si vous couvrez les bons concepts, le positionnement de vos contenus n’en sera que meilleur.

Comment créer un audit du graphe de votre site web

1 : Vous devez d’abord créer votre projet dans InLinks. Il est probable que vous l’ayez déjà fait si vous avez un compte InLinks gratuit. Cependant, les utilisateurs gratuits sont limités à 20 pages. Le nombre de pages dont vous aurez besoin por cet audit dépend de la taille du site, mais en général, vous n’avez pas besoin de toutes les variations d’URL de votre contenu – assurez-vous cependant que tout le contenu informatif soit inclus.

2 : Créez également un projet pour le site de votre concurrent principal . Vous ne savez peut-être pas quelles sont les URL qu’il considère comme les plus importantes, mais en utilisant l’onglet “Add pages”, vous obtiendrez la liste des pages les plus génératrices de trafic.

3 : Exportez le Knowledge Grah des deux projets dans des fichiers locaux sur votre ordinateur. Utilisez pour cela la bouton “Download as CSV” dans la page “Graph” de chaque projet.

4 : Si vous ne l’avez pas encore fait, téléchargez le template Excel.

5 : Ce template comporte de nombreuses feuilles. Vous devez coller les données du site principal dans la feuille “Website Data” et le concurrent dans la feuille “Comp. Data”. Voici une vidéo explicative sur ce point (en Anglais):

Comment insérer les exports de Knowledge Graph dans la feuille Excel

C’est tout ce dont vous avez besoin pour créer tous les graphiques et diagrammes pour votre audit. Il est judicieux de créer une sauvegardede la feuille Excel.

Explication sur les données fournies

Les données fournies en exportant votre graphe depuis InLinks sont constituées de 14 colonnes résumant pour chaque entité / thème :

  • le nom de l’entité, correspondant à un identifiant Wikipedia
  • Identifiant numérique de l’entité (interne à InLinks)
  • Type (personne, organisation, lieu, événement, chose, …)
  • Catégorie générale
  • Secteur d’activité
  • un statut indiquant si l’entité a été sélectionnée comme entité cible
  • le volume de recherche (marché US)
  • Fréquence d’apparition de l’entité dans le texte
  • Nb d’occurrences dans les pages analysées
  • Nb de liens internes potentiels vers cette entité
  • Nb de liens internes générés par InLinks
  • un facteur de cannibalisation indiquant combien de fois l’entité a été détectée dans les titres des pages
  • Un statut (Y/N) indiquant si l’entité a été trouvée ou non dans les titres
  • Un facteur de compréhension des moteurs de recherche (SEU)

Rappel important : chaque entité agit comme un groupe ou cluster de mots-clés. Cela signifie que des mots clés synonymes comme “SEO”, “SEOs”, “référencement”, ou “positionnement Web” (entre autres) seront considérés comme se référant à un seul sujet : “Optimisation pour les moteurs de recherche”.

Egalement important : Pour ce graphique comme pour les autres, les résultats varieront en fonction du nombre de pages de contenu prises en compte dans le graphique (et donc analysées par InLinks). Plus le nombre de pages analysées est élevé, meilleurs seront les résultats de l’audit. Dans l’exemple ci-dessous, une centaine de page de chaque site (SEMRush et Moz) a été analysée.

Interprétation des données

Les données sont maintenant transformées en une série de graphiques prêts à être utilisés. L’exemple ci-dessous examine le contenu de SEMRush.com et le compare à celui de Moz.com.

De quoi ce site parle-t-il au niveau macro ?

Le contenu de SEMRush aborde principalement la thématique “Marketing and Advertising”

L’onglet “Main Topics cats” a résumé toutes les entités sous-jacentes en secteurs d’activité (ou verticales). Il n’est pas surprenant de constater que les entités SEMRush pointent massivement vers le marketing, la technologie et les logiciels. C’est logique.

En revanche, si vous auditez un site qui renferme beaucoup d’allitérations et de métaphores, cette première vue se déformera dès le départ. Ce n’est probablement pas quelque chose que la plupart des SEO ont besoin de dire, mais parfois les clients ont besoin de le voir dans un graphique pour voir comment le recours à la métaphore peut nuire à la catégorisation d’un site.

La plupart des autres tableaux ci-dessous ont été réalisés dans la catégorie Marketing et publicité. Cela permet d’éliminer le bruit de fond et de se concentrer sur le contenu le plus important pour le modèle commercial de SEMRush.

De quoi le site parle-t-il en détail ?

Topical Detail: The biggest winner is SEO

L’onglet “Most used Topics” permet d’approfondir l’analyse du contenu. (Notez que notre système utilise des underscore à la place des espaces).

Le graphe ci-dessus permet de voir quels sont les sujets principaux abordés par le site audité, en fonction de leur nombre d’apparition respective dans les contenus (ceci en fonction de chaque catégorie d’entité)

Nous voyons maintenant l’importance que les rédacteursde SEMRush ont placé sur “Search Engine Optimisation (évidemment) et “Google Search”. Il est également utile de voir que certaines entités importantes peuvent être sous-représentées… peut-être qu’une discussion plus approfondie sur le “blogging” ou le “Branding” pourrait être utile. Le graphique suivant permet de pousser plus loin cette analyse.

Quels sont les sujets les moins abordés sur le site ?

Faites en sorte que les thèmes importants soient bien abordés.

Le graphique précédent permet, pour chaque catégorie d’entité, d’examiner quelles entités ne sont mentionnées qu’une ou deux fois dans l’ensemble du contenu (ce seuil peut être modifier directement sur la feuille Excel).Dans le cas de SEMRush, nous ne détectons pas d’entités vraiment importantes, mais il pourrait être envisagé de parler davantage de l’importance des langages de balisage (entité “markup_language”) ou des redirections d’URL (entité “URL_redirection) pour le référencement.

D’autres sites peuvent avoir des trous plus flagrants. Nous avons tous vu ces sociétés de marketing qui ne semblent pas pouvoir appeler un chat un chat!

Les sujets importants apparaissent-ils dans les titres ?

Les entités les plus importantes doivent se retrouver dans les titres

Le tableau “Topics used in page titles” permet de visualiser quelles sont les entités apparaissant dans les titres de page. Comme ces entités de titre sont encore plus importantes que celles apparaissant dans le texte principal, il va être intéressant de faire varier la catégorie d’entité afin de pousser l’analyse un peu plus loin.

Voici par exemple les entités de titre de la catégorie “Générale” (c’est à dire n’appartenant pas à une catégorie précise):

entités vues dans les titres (général)

On s’aperçoit avec ce graphe que SEMRush met l’accent sur les guides (How-to), les données (Data), et les ressources gratuites (Gratis).

Quelles sont les meilleures opportunités de contenu par volume de recherche ?

L’onglet “Content Opp.” de la feuille est assez prometteur. De nouveau affichée sous forme de carte radar, nous avons maintenant une extraction de données assez intelligente. Nous avons introduit le volume de recherche comme donnée supplémentaire, puis calculé le graphique en passant au crible les entités mentionnées dans le contenu existant (toujours dans la catégorie marketing), mais non abordées par une page spécifique, c’est-à-dire que l’entité n’apparaît dans aucun titre de page.

Ce type de graphe permet rapidement de mettre en évidence les thèmes à développer grâce à de nouveaux contenus, ou de mettre en évidence des manques au niveau des titres de page.

Puis-je trouver de meilleures possibilités de contenu en évaluant un concurrent ?

Quels sont les sujets de votre concurrent que vous pourriez aussi développer

L’onglet suivant (Content Opp (2) ) indique les thèmes utilisés par votre concurrent, mais qui n’ont pas été détectés dans votre contenu.

En sélectionnant les principales catégories de sujets qui vous intéressent (ci-dessus, c’est le marketing et la publicité, mais cela pourrait aussi être les logiciels ou la technologie), le graphique vous aide à mettre en évidence les lacunes et à quantifier leur potentiel en utilisant les volumes de recherche.

Dans le graphique ci-dessus sont mis en évidence plusieurs enseignements intéressants. Moz semble souvent parler de l’entité “Googke Webmaster Tools” alors que ce sujet n’est pas abordé spécifiquement par SEMRush (du moins dans les pages analysées. Toujours dans cet exemple, “Google My Business” est un sujet intéressant de développement des contenus.

Rapport sur la cannibalisation

Topic Cannibalisation

La cannibalisation semble être interprétée de différentes manières par les outils existant sur le marché. Nous avons demandé à la communauté SEO quels sont les outils offrant un rapport sur la cannibalisation et nous avons obtenu de nombreuses réponses.

Les résultats de ces rapports semblent varier considérablement. Certains d’entre eux examinent les contenus dupliqués et les rectifient par le biais de balises canoniques. C’est très bien, mais il s’agit de duplicate content. D’autres examinent les titres des pages et suggèrent de supprimer le contenu et de le rediriger. Le problème ici, c’est que vous parlerez d’entités importantes sur plus d’une page ! Par ailleurs, en basant ces rapports sur l’analyse des mots-clés, ces outils font l’impasse sur le traitement des synonymes, alors que nous savons aujourd’hui que Google les prend en compte pour l’indexation de chaque page.

Inlinks résout le problème en mettant en avant les entités (en prenant en compte leurs synonymes) susceptibles de se cannibaliser entre elles.

Potentiel de maillage interne

Find where internal links may reinforce content

Le potentiel de maillage interne est calculé en prenant en compte les entités de titre (voir ci-dessus), et en calculant leur nombre d’apparition dans l’ensemble des pages du site. De cette manière, il est facile de mettre en évidence un besoin de développement du maillage interne vers certaines pages.

C’est le cœur de l’outil InLinks, car il évalue où vous avez parlé des concepts du site et – lorsque le contenu de base existe – injecte des liens dynamiquement dans les contenus existant, pour effectuer ce maillage entre entités.

Comment Google comprend-il les entités du site ?

Quelles sont les entités effectivement détectées par Google

InLinks effectue régulièrement des comparaisons sur la compréhension des entités par Google, en utilisant des exemples différents chaque semaine dans plusieurs pays. À l’été 2020, Google identifie en moyenne 20 % de toutes les entités présentes dans un texte (calcul réalisé à l’aide de l’API Google NLP).

Il ressort de ces analyses que Google est particulièrement bon pour identifier les marques et les noms propres (dont ceux avec des majuscules), mais qu’il est encore faible pour les concepts.

On voit notamment dans ce graphe qu’une entité essentielle comme Search Engine Optimization n’est détectée par Google que dans 18% des cas, alors que le taux de détection de cette même entité atteint 67% pour Moz !

Pour améliorer ce score (et donc la catégorisation des pages par Google, mais aussi l’indexation, voire le positionnement), il peut être intéressant de développer le contexte autour de cette entité et d’en multiplier les synonymes pour améliorer ce taux de détection. Il est également possible d’auditer spécifiquement les pages de Moz pour obtenir un audit détaillé de leur stratégie de contenu.

Télécharger le template Excel

(Vous n’avez pas encore de compte InLinks Inscrivez-vous gratuitement.)

Qu’en pensez-vous ?

Merci d’avoir lu jusqu’au bout ! Cette approche des audits de contenu est-elle différente? A-t-elle l’air raisonnable ? Y a-t-il des graphiques particuliers qui, selon vous, pourraient s’intégrer à votre propre processus d’audit ? Nous aimerions avoir votre avis en commentaire.

Check this out by @Inlinksnet

CTO et co-fondateur d'Inlinks. Expert SEO sémantique, Schema.org et SEO basé sur les entités.
Twitter ID: @semanticmarker

Leave a comment

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *