Nous utilisons des moteurs de recherche tout le temps, mais nous ne sommes pas toujours les meilleurs pour poser des questions.
Prenez cette requête de recherche à moitié réfléchie et mal écrite comme exemple:
Heureusement, Google nous fournit toujours des résultats pertinents. Comment? Traitement du langage naturel (PNL).
La PNL est une forme de technologie d'intelligence artificielle qui vise à donner un sens au langage humain. La PNL aide les ordinateurs à comprendre, interpréter et reproduire les caractéristiques du langage humain.
À une époque où règne la technologie, il est important que les ordinateurs puissent nous comprendre. La PNL est une tentative de prendre nos entrées de langage de mauvaise qualité et de les transformer en quelque chose que les ordinateurs utiles peuvent comprendre.
Cette tâche ne serait pas difficile si nous parlions tous comme des robots, mais nous ne le faisons pas. Nous utilisons l'argot, avons différents dialectes, utilisons mal la grammaire et omettons la ponctuation. Du point de vue d'un ordinateur, c'est comme être un débutant dans une nouvelle langue et s'aventurer dans le centre-ville uniquement pour rencontrer des phrases que vous n'aviez jamais entendues auparavant. Vous ne sauriez pas comment réagir de manière appropriée.
Depuis l'introduction des algorithmes d'apprentissage automatique, les ordinateurs peuvent désormais traiter d'énormes quantités d'informations afin d'identifier les modèles et de mieux comprendre les langues humaines. Cela a de nombreux cas d'utilisation pour la technologie, dont beaucoup sont vus et utilisés quotidiennement:
Comment Google utilise la PNL
Quinze pour cent des requêtes Google sont flambant neuves. En d'autres termes, le moteur de recherche n'a jamais vu la combinaison de mots qui représente 15% de toutes les recherches.
Ce n'est pas parce que nous recherchons des sujets que Google n'a jamais vus auparavant. Cela est dû aux différentes façons dont nous combinons les mots et posons des questions, à la fois par écrit et par recherche vocale. Google et d'autres moteurs de recherche sont en mesure de répondre correctement aux questions que nous ne parvenons pas à formuler.
"Il nous appartient de déterminer ce que vous recherchez et de faire apparaître des informations utiles sur le Web, quelle que soit la façon dont vous épelez ou combinez les mots dans votre requête."
– Pandu Nayak de Google
Google essaie constamment de mieux comprendre les requêtes afin de servir des résultats de recherche pertinents, et le traitement en langage naturel joue un grand rôle dans cet effort.
BERT de Google
À moins que vous ne viviez sur une île isolée, vous avez probablement entendu le bruit du BERT fin octobre. Je m'en voudrais de ne pas y toucher. BERT (Bidirectional Encoder Representations from Transformers) est un modèle NLP que Google a introduit en 2018 et a commencé à déployer en octobre 2019. BERT a la capacité de considérer le contexte complet d'un mot sur la base des mots qui viennent avant ou après.
En termes simples, BERT aide les moteurs de recherche à mieux comprendre l'intention, notamment pour les recherches plus longues qui contiennent plusieurs prépositions.
Par exemple, Google a appelé la requête «Le voyageur brésilien 2019 aux États-Unis a besoin d'un visa» dans un récent post. Le mot «à» est crucial ici. Avant le BERT, Google aurait renvoyé des résultats concernant des citoyens américains voyageant au Brésil. Après le BERT, Google peut reconnaître cette nuance et retourner un résultat plus pertinent et utile.
La source
API de langage naturel de Google
Pour les non-développeurs et ceux qui ne connaissent pas l'IA, la PNL peut sembler être un concept étranger et distant. Heureusement pour nous, Google nous donne des informations très utiles grâce à un produit Cloud API qui propose un ensemble de modèles avancés de PNL. Cette API est disponible via Google Cloud et est utilisée par un certain nombre de sociétés pour diverses applications.
Google propose une démo gratuite abrégée de son API.
Voici comment le vérifier:
Copiez et collez le texte d'un élément de contenu.
Rendez-vous sur cloud.google.com/natural-language.
Collez-le dans la zone de texte sous «Essayez la démo».
Consultez l'analyse.
Qu'est-ce que tout cela a à voir avec le référencement? Commençons par examiner les quatre aspects clés de l'API de langage naturel de Google: l'entité, l'analyse des sentiments et de la syntaxe et les catégories.
Entités
En termes simples, une entité est une chose. Une entité peut être un lieu, une personne, une organisation, une idée ou un concept. Les entités abordent les relations entre les choses et aident les moteurs de recherche comme Google à comprendre leur relation.
Par exemple, les entités suivantes sont:
premier ministre
Canada
Justin Trudeau
Lorsque vous recherchez «Premier ministre du Canada», vous obtenez le résultat suivant:
Les moteurs de recherche recherchent la co-occurrence afin d'établir les relations entre les entités. Les trois entités énumérées ci-dessus existent assez fréquemment sur le Web pour que les moteurs de recherche puissent vous fournir en toute confiance un seul résultat à la requête.
En plus de la co-occurrence, Google examine d'autres facteurs tels que la notabilité et l'autorité du contributeur pour évaluer l'importance des relations entre les entités.
Entités et référencement
De ces quatre modèles de PNL, les entités ont les implications les plus importantes sur le référencement. L'API de langage naturel de Google mesure la saillance des entités trouvées dans le contenu. La saillance est un score de l'importance de l'entité dans le contexte de l'ensemble du texte. Plus le score est élevé, plus l'entité est saillante.
Malheureusement, il n'existe aucun moyen infaillible d'optimiser le contenu pour la saillance d'entité, et nous ne sommes pas certains que la saillance d'entité signifie des classements plus élevés. Cependant, la saillance de l'entité peut être un guide pour l'optimisation du contenu, en particulier pour satisfaire l'intention de l'utilisateur.
Choisissez le sujet pour lequel vous souhaitez vous classer, copiez et collez les cinq premiers résultats des concurrents dans l'API Natural Language et consultez leurs scores de saillance d'entité.
Cela vous donnera une image claire des entités que Google juge importantes en ce qui concerne le sujet. Approfondir les articles de Wikipédia (lorsqu'ils sont liés) vous aidera à comprendre quels sujets et attributs devraient être couverts dans votre article.
Notez que le contenu n'est pas la seule implication des entités dans la recherche. Les entités signifient également beaucoup pour les liens, car elles aident les moteurs de recherche à identifier les connexions pertinentes et non pertinentes. Par exemple, une entreprise cherchant à se classer pour le référencement à Atlanta a besoin de liens de qualité à partir de pages sur le référencement et de pages sur Atlanta afin d'établir une relation et une autorité d'actualité. En raison des entités, les liens des pages sur les chiots et New York auront probablement moins de poids pour cette marque.
Sentiment
L'analyse des sentiments est un autre sous-domaine de la PNL qui tente d'identifier les opinions et les émotions sur une entité dans un texte.
Le sentiment est marqué de -1 (sentiments très négatifs) à 1 (sentiments très positifs). L'amplitude est un nombre positif qui mesure le sentiment général d'un texte, qu'il soit positif ou négatif.
Sur la base de la démo fournie par Google, il n'est pas surprenant que le seul texte qui se démarque soit en référence aux téléphones Android, ce que Sundar Pichai a noté que les utilisateurs aimaient. La magnitude de cette déclaration était de 1 et le score de 0,5.
Sentiment et SEO
En janvier 2018, en ce qui concerne les extraits en vedette, Danny Sullivan a déclaré:
«Par exemple, les personnes qui recherchent« les reptiles sont de bons animaux de compagnie »devraient obtenir le même extrait que« les reptiles sont de mauvais animaux de compagnie »car ils recherchent les mêmes informations: comment les reptiles se classent-ils comme animaux de compagnie? Cependant, les extraits en vedette que nous servons se contredisent. »
Bien que Google expérimente toujours ce qu'ils devraient montrer pour cette requête, cela nous dit que le sentiment joue un grand rôle dans le classement. Si vous souhaitez vous classer pour une requête positive (comme «les reptiles sont-ils de bons animaux de compagnie»), vous devriez chercher à écrire un article avec un score de sentiment élevé.
De plus, cela signifie que le sentiment trouvé autour de vos backlinks et des mentions de marque envoie également des signaux Google. Bien qu'il n'y ait pas grand-chose que vous puissiez faire pour optimiser cela, cela plaide en faveur de la garantie d'un service client de premier ordre et de l'effort et de l'authenticité de sa marque.
Syntaxe
L'analyse syntaxique décompose tous les mots d'un texte et renvoie son type, son humeur, sa voix, etc.
La syntaxe nous donne un aperçu de la façon dont Google regarde nos phrases et classe les mots pour les comprendre.
L'analyse de la syntaxe fournit beaucoup moins d'implications pour le contenu et le référencement que nos trois autres modèles. Une bonne grammaire et une structure de phrase claire sont essentielles pour satisfaire les lecteurs, mais il est peu probable que vous glaniez beaucoup plus que celui de l'analyse syntaxique.
En fait, si vous utilisez Grammarly ou un autre outil d'aide à l'écriture d'IA, il est probable que vous utilisez déjà l'analyse syntaxique pour optimiser votre contenu.
Classification des catégories
Les catégories révèlent comment Google classe le texte. Dans leur démonstration d'API, vous verrez la catégorie avec un score de confiance.
Notre exemple est court, nous ne voyons donc qu'une seule catégorie avec un score de confiance plutôt faible. Si vous deviez ajouter quelques paragraphes spécifiquement sur le téléphone, vous pourriez voir le score de confiance pour Mobile & Wireless augmenter plus près de 1.
Catégories et référencement
Il va sans dire que vous souhaitez que votre contenu produise un score de confiance élevé pour la catégorie et les sous-catégories dans lesquelles vous souhaitez vous classer.
Comme pour les entités, il est peu probable qu'il existe un processus éprouvé et véritable d'optimisation pour la classification. Cependant, les catégories peuvent également être un excellent guide. Je vous recommande d'analyser l'analyse d'entité des pages de premier rang avant de créer du contenu et d'utiliser la classification des catégories comme une vérification post-écriture.
Par exemple, si vous avez écrit un article sur les chiots qui a obtenu un score de confiance de 0,99 pour / Autos et véhicules / Véhicules à moteur (par type) / Motocyclettes, il vaudrait la peine de revoir les sujets et sous-sujets que vous avez couverts (ou peut-être tout simplement commencer tout le chemin).
L'avenir du référencement
Bien que la PNL n'offre pas de formules éprouvées spécifiques pour un meilleur classement, c'est probablement l'avenir du référencement. Il est important que les référenceurs aient une compréhension de base des modèles de PNL et de la manière dont Google traite le langage. Gardez un œil sur les futurs modèles que Google ajoute à son algorithme, et n’ayez pas peur de vous mettre sur la pointe des pieds dans le machine learning et l’IA. C’est là que va notre industrie.