Comment utiliser l'API en langage naturel de Google pour améliorer votre référencement

Nous utilisons tout le temps les moteurs de recherche, mais nous ne sommes pas toujours les meilleurs pour poser des questions.

Prenez cette requête mal conçue et mal rédigée à titre d'exemple:

Heureusement, Google nous fournit toujours des résultats pertinents. Comment? Traitement du langage naturel (PNL).

La PNL est une forme de technologie d'intelligence artificielle qui vise à donner un sens au langage humain. La PNL aide les ordinateurs à comprendre, interpréter et reproduire les caractéristiques du langage humain.

À l’ère de la technologie, il est important que les ordinateurs puissent nous comprendre. La PNL est une tentative de transformer nos entrées en langage de mauvaise qualité en quelque chose d’utile que les ordinateurs peuvent comprendre.

Cette tâche ne serait pas difficile si nous parlions tous comme des robots, mais ce n’est pas le cas. Nous utilisons un argot, des dialectes différents, une mauvaise grammaire et des signes de ponctuation. Pour un ordinateur, c’est comme être débutant dans une nouvelle langue et s’aventurer dans le centre-ville uniquement pour y rencontrer des phrases que vous n’avez jamais entendues auparavant. Vous ne sauriez pas comment réagir de manière appropriée.

Depuis l'introduction des algorithmes d'apprentissage automatique, les ordinateurs peuvent désormais traiter d'énormes quantités d'informations afin d'identifier des modèles et de mieux comprendre les langages humains. Cela a de nombreux cas d'utilisation pour la technologie, que vous pouvez voir et utiliser quotidiennement:

Comment Google utilise la PNL

Quinze pour cent des requêtes de Google sont nouvelles. En d'autres termes, le moteur de recherche n'a jamais vu la combinaison de mots représentant 15% de toutes les recherches.

Ce n'est pas parce que nous recherchons des sujets que Google n'a jamais vus auparavant. C’est en raison des différentes manières dont nous combinons les mots et posons des questions, à la fois par écrit et par recherche vocale. Google et d’autres moteurs de recherche sont en mesure de répondre aux questions que nous ne sommes pas en mesure de formuler correctement.

«C’est notre travail de déterminer ce que vous recherchez et de faire apparaître des informations utiles sur le Web, quelle que soit la façon dont vous épelez ou combinez les mots dans votre requête.»

– Pandu Nayak de Google

Google cherche constamment à mieux comprendre les requêtes afin de fournir des résultats de recherche pertinents, et le traitement du langage naturel joue un rôle important dans cet effort.

BERT de Google

À moins que vous n'habitiez sur une île isolée, vous avez probablement entendu le bruit à propos du BERT à la fin du mois d'octobre. Je m'en voudrais de ne pas en parler. BERT (Représentations de codeurs bidirectionnels à partir de Transformers) est un modèle de PNL introduit par Google en 2018 et commencé à être déployé en octobre 2019. BERT permet de considérer le contexte complet d'un mot en fonction des mots précédant ou suivant.

En termes simples, BERT aide les moteurs de recherche à mieux comprendre l'intention, notamment pour les recherches plus longues comportant plusieurs prépositions.

Dans un message récent, Google a appelé la requête «Un voyageur brésilien aux États-Unis ayant besoin d'un visa pour 2019». Le mot "à" est crucial ici. Avant BERT, Google aurait renvoyé des résultats concernant les citoyens américains voyageant au Brésil. Après le BERT, Google peut reconnaître cette nuance et obtenir un résultat plus pertinent et utile.

La source

API en langage naturel de Google

Pour les non-développeurs et ceux qui ne connaissent pas l'IA, la PNL peut sembler un concept étranger et lointain. Heureusement pour nous, Google nous donne des informations très utiles grâce à un produit API de cloud offrant un ensemble de modèles NLP avancés. Cette API est disponible via Google Cloud et est utilisée par un certain nombre de sociétés pour diverses applications.

Google propose une démo gratuite abrégée de son API.

Voici comment le vérifier:

Copiez et collez le texte d'un élément de contenu.
Dirigez-vous vers cloud.google.com/natural-language.
Collez-le dans la zone de texte située sous «Essayez la démo».
Découvrez l'analyse.

Qu'est-ce que tout cela a à voir avec le référencement? Commençons par examiner les quatre aspects clés de l’API de langage naturel de Google: l’analyse des entités, des sentiments et de la syntaxe, ainsi que les catégories.

Entités

En termes simples, une entité est une chose. Une entité peut être un lieu, une personne, une organisation, une idée ou un concept. Les entités traitent des relations entre les choses et aident les moteurs de recherche tels que Google à comprendre leurs relations.

Par exemple, les entités suivantes sont:

premier ministre
Canada
Justin Trudeau

Lorsque vous recherchez «premier ministre du canada», vous obtenez le résultat suivant:

Les moteurs de recherche recherchent la cooccurrence afin d'établir les relations entre les entités. Les trois entités énumérées ci-dessus sont suffisamment présentes ensemble sur le Web pour que les moteurs de recherche puissent vous servir en toute confiance un seul résultat à la requête.

En plus de la cooccurrence, Google examine d'autres facteurs, tels que la notabilité et l'autorité du contributeur, afin de mesurer l'importance des relations entre les entités.

Entités et référencement

Parmi ces quatre modèles de PNL, les entités ont les implications les plus importantes sur le référencement. L’API de langage naturel de Google mesure l’importance des entités présentes dans le contenu. La visibilité est une note de l'importance de l'entité dans le contexte de l'ensemble du texte. Plus le score est élevé, plus l'entité est saillante.

Malheureusement, il n’existe aucun moyen sûr d’optimiser le contenu pour la visibilité des entités, pas plus que nous sommes certains que la priorité des entités signifie un classement plus élevé. Cependant, la saillance des entités peut être un guide pour l'optimisation du contenu, en particulier pour satisfaire l'intention de l'utilisateur.

Choisissez le sujet que vous souhaitez classer, copiez et collez les cinq principaux résultats des concurrents dans l'API en langage naturel, puis consultez leurs scores de visibilité des entités.

Cela vous donnera une image claire des entités que Google juge importantes en ce qui concerne le sujet. En approfondissant votre connaissance des articles de Wikipédia (lorsqu'ils sont liés), vous pourrez comprendre quels sujets et quels attributs devraient figurer dans votre article.

Notez que le contenu n’est pas la seule implication des entités dans la recherche. Les entités signifient également beaucoup pour les liens, car elles aident les moteurs de recherche à identifier les connexions pertinentes et non pertinentes. Par exemple, une entreprise cherchant à se positionner en référencement à Atlanta a besoin de liens de qualité à partir de pages sur le référencement et de pages sur Atlanta afin d’établir des relations et une autorité d'actualité. En raison du nombre d'entités, les liens des pages sur les chiots et New York auront probablement moins de poids pour cette marque.

Sentiment

L'analyse des sentiments est un autre sous-champ de la PNL qui tente d'identifier les opinions et les émotions suscitées par une entité dans un texte.

Le sentiment est marqué de -1 (sentiments très négatifs) à 1 (sentiments très positifs). La magnitude est un nombre positif qui mesure le sentiment général d'un texte, qu'il soit positif ou négatif.

Selon la démo fournie par Google, il n’est pas surprenant que le seul texte qui se démarque concerne les téléphones Android, ce que Sundar Pichai a souligné que les utilisateurs adoraient. La magnitude de cette affirmation était de 1 et le score de 0,5.

Sentiment et référencement

En janvier 2018, Danny Sullivan a déclaré:

«Par exemple, les personnes qui recherchent« les reptiles sont-ils de bons animaux de compagnie »devraient-elles obtenir le même extrait que« sont-elles de mauvais animaux de compagnie », car elles recherchent les mêmes informations: comment les reptiles se classent-ils comme animaux de compagnie? Cependant, les extraits décrits que nous servons se contredisent. ”

Bien que Google expérimente toujours ce qu’ils devraient montrer pour cette requête, cela nous indique que le sentiment joue un grand rôle dans le classement. Si vous souhaitez classer pour une requête positive (comme "sont des reptiles bons animaux de compagnie"), vous devriez chercher à écrire un message avec un score de sentiment élevé.

De plus, cela signifie que le sentiment qui règne autour de vos backlinks et mentions de marque envoie probablement des signaux à Google. Bien que vous n’ayez pas beaucoup à faire pour optimiser cela, cela vous permet de vous assurer que votre entreprise offre un service à la clientèle de premier ordre et qu’elle investit un effort et une authenticité propres à sa marque.

Syntaxe

L'analyse de syntaxe décompose tous les mots d'un texte et renvoie son type, son humeur, sa voix, etc.

La syntaxe nous donne un aperçu de la façon dont Google examine nos phrases et catégorise les mots pour les comprendre.

L'analyse de syntaxe fournit beaucoup moins d'implications pour le contenu et le référencement que nos trois autres modèles. Une bonne grammaire et une structure de phrase claire sont la clé pour satisfaire les lecteurs, mais il est peu probable que vous en récoltiez plus que de l’analyse syntaxique.

En fait, si vous utilisez Grammarly ou un autre outil d’écriture pour IA, il est probable que vous utilisiez déjà l’analyse syntaxique pour optimiser votre contenu.

Classification de la catégorie

Les catégories indiquent comment Google classe le texte. Dans leur démo API, vous verrez la catégorie avec un score de confiance.

Notre exemple est court, nous ne voyons donc qu’une catégorie avec un score de confiance plutôt faible. Si vous deviez ajouter quelques paragraphes concernant spécifiquement le téléphone, le score de confiance pour Mobile & Wireless augmenterait probablement de 1.

Catégories et référencement

Il va sans dire que vous voudriez que votre contenu génère un score de confiance élevé pour la catégorie et les sous-catégories dans lesquelles vous souhaitez être classé.

Comme pour les entités, il est peu probable qu’un processus d’optimisation de la classification éprouvé soit appliqué. Cependant, les catégories peuvent aussi servir de guide. Je recommanderais d’analyser l’analyse par entité des pages les plus populaires avant de créer du contenu et d’utiliser la classification par catégorie plutôt comme un contrôle post-écriture.

Par exemple, si vous écrivez un article sur les chiots qui obtient un indice de confiance de 0,99 pour / Autos & Vehicles / Véhicules motorisés (par type) / Motos, il serait intéressant de revenir sur les sujets et sous-sujets que vous avez abordés (ou peut-être tout simplement commencer le chemin sur).

L'avenir du référencement

Bien que la PNL n’offre pas de formules spécifiques éprouvées pour un meilleur classement, c’est probablement l’avenir du référencement. Il est important que les référenceurs aient une compréhension de base des modèles de PNL et de la façon dont Google traite le langage. Gardez un œil sur les futurs modèles que Google ajoute à leur algorithme et n’ayez pas peur de plonger dans les eaux de la machine learning et de l’IA. C’est là que notre industrie se dirige.