Est-ce que le référencement est prévisible?

3. Dommages collatéraux non intentionnels au cours des efforts d'optimisation

Une page peut potentiellement être classée pour plusieurs mots clés.

Trouver le juste équilibre entre le bon contenu, les bons mots clés cibles et les bons efforts d'optimisation est un défi.

En tant que praticien en référencement, les scénarios suivants peuvent vous paraître familiers:

Un site Web contiendra plusieurs pages couvrant le même thème d'actualité, avec des backlinks externes et des mots clés cibles répartis sur ces pages, ainsi que des liens de qualité optimale non optimisés pour les mots clés ciblés corrects. Un site subit une reconstruction ou une refonte qui a un impact négatif sur le référencement. les intérêts des différentes divisions s’intéressent aux priorités d’optimisation. Sans un mécanisme permettant d'identifier les efforts d'optimisation qui auront le plus d'impact sur les classements de recherche et les résultats commerciaux, il est difficile d'analyser le cas d'une stratégie d'optimisation plutôt que d'une autre.

4. Le manque de fiabilité des critères de référence du CTR standard

Il existe une grande incertitude quant au nombre de clics publicitaires que chaque URL recevra à différentes positions sur la page de résultats du moteur de recherche (SERP).

En effet, le taux de clics (CTR) généré par une page est une fonction de plusieurs éléments de la présentation SERP, notamment:

La position relative de l'URL sur le SERP pour un mot clé spécifique. Le nombre d'annonces au-dessus des résultats organiques pour le mot clé cible. Les packs affichés (zone de réponse, pack local, pack de marque, etc.). Affichage des vignettes ( images, vidéos, critiques, résultats, etc.) Association de marque de l'utilisateur à la marque.

Calculer le CTR par rang n'est qu'un défi.

L'impact réel du référencement sur les entreprises est également difficile à saisir, en raison de la difficulté à identifier le taux de conversion généré par une page et la valeur imputée de chaque conversion.

Les professionnels de la recherche doivent avoir de solides compétences analytiques pour calculer ces métriques.

5. Incapacité à élaborer une analyse de rentabilisation pour des investissements supplémentaires dans la science des données

Lorsqu'ils prennent des décisions d'investissement, les acteurs de l'entreprise souhaitent comprendre l'impact de leurs initiatives sur les résultats.

Si une initiative peut être quantifiée, il est plus facile d'obtenir le niveau d'investissement nécessaire et de hiérarchiser le travail.

C’est là que le SEO se débat souvent. Les chefs d'entreprise estiment que les efforts de référencement sont itératifs et sans fin, tandis que les praticiens de la recherche ne parviennent pas à corréler leur rang avec leur impact sur le trafic, les conversions, les prospects et les revenus.

Le retour sur investissement de la SEO peut sembler minime au leadership par rapport aux résultats plus prévisibles, mesurables et immédiats produits par d’autres canaux.

Une autre complication est l’investissement et les ressources nécessaires à la mise en place interne de processus de science des données pour pouvoir résoudre le problème de la prévisibilité du référencement.

Les compétences, les personnes, les modèles de notation, la culture: les défis sont de taille.

Rendre le référencement prévisible: le besoin de modèles de notation

Maintenant que nous avons établi le chemin qui mène à la prévisibilité, c’est un défi de taille, revenons à ma question initiale.

Le référencement peut-il être rendu prévisible?

Y a-t-il un intérêt à investir pour que la prévisibilité du référencement devienne une réalité?

La réponse courte: Oui!

Chez iQuanti, notre équipe dédiée à la science des données a abordé la résolution du problème de la prévisibilité du référencement en trois étapes:

Étape 1: Définissez des mesures indiquant le succès du référencement et intégrez des données complètes issues des meilleures sources dans un seul entrepôt.Étape 2: procédez à l'ingénierie inverse des résultats de recherche de Google en développant des modèles de scoring et des algorithmes d'apprentissage automatique pour la pertinence, l'autorité et l'accessibilité.Step 3: Utilisez les sorties de l'algorithme pour permettre des informations spécifiques et exploitables sur les performances de la page / du site et développez des capacités de simulation pour permettre de tester une stratégie (comme ajouter un lien en arrière ou modifier le contenu) avant de passer à la production – rendant ainsi le référencement prévisible.

Étape 1: Identification des variables critiques et intégration des données

Comme mentionné précédemment, l'un des principaux obstacles au succès du référencement est l'incapacité à intégrer toutes les mesures nécessaires en un seul endroit.

Les équipes de référencement utilisent une myriade d'outils et d'extensions de navigateur pour collecter des données de performances, à la fois leurs propres données et des données comparatives / concurrentielles.

Cependant, la plupart des plates-formes de référencement pour entreprises échouent à rendre toutes les variables et métriques de référencement d'un mot clé ou d'une page accessibles en une seule vue.

C'est la première étape et la plus critique. Et même s’il a besoin d’accéder aux divers outils de référencement et aux fonctionnalités d’entreposage de données de base, cette première étape essentielle est comparativement plus facile à concrétiser dans la pratique.

Nous ne sommes pas encore entrés dans la phase de modélisation des données et des ressources, mais avec la bonne équipe d’analyse des données en place, l’intégration des données elle-même pourrait se révéler un premier pas précieux vers la prévisibilité du référencement.

Comment?

Laissez-moi vous expliquer avec un exemple.

Si vous êtes en mesure de rassembler toutes les statistiques de référencement de votre URL www.example.com avec une compréhension de la valeur de chaque métrique, il devient facile de créer un modèle de notation comparatif simple vous permettant de comparer votre URL avec les URL les plus performantes. à la recherche. Voir ci-dessous.

CONSEILS PRO: Pour les données texte (ou le contenu), tenez compte des variables suivantes: Fréquence d'utilisation des mots. Correspondances exactes et partielles des mots clés. Métriques de pertinence à l'aide de TF-IDF, Word2Vec ou GLoVe.

Pour les données de liaison, considérez le:

Pertinence des liens vers la page cible. Distribution des pages / domaines de liens par des liens. Pourcentage de liens à suivre / à ne pas suivre.

Automatisez cela et vous disposez d'un processus d'analyse comparative fiable et continu. Chaque fois que vous implémentez des modifications d'optimisation, vous pouvez réellement voir (et mesurer) le déplacement de l'aiguille sur les SERP.

Le suivi de votre score et de ses composants sur une période donnée peut fournir des informations sur les tactiques déployées par les concurrents (par exemple, s’ils améliorent la pertinence des pages ou renforcent l’autorité), ainsi que sur les contre-mouvements correspondants pour garantir la concurrence constante de votre site à un niveau concurrent. haut niveau.

Étape 2: Création de modèles de notation algorithmique

Les classements de recherche reflètent l’effet collectif de plusieurs variables en même temps.

Pour comprendre l'impact d'une seule variable sur les classements, nous devons nous assurer que tous les autres paramètres sont maintenus constants à mesure que cette variable isolée change.

Ensuite, pour arriver à un «score», il existe deux manières de développer un problème de modélisation:

En tant que problème de classification [good vs. not good]Dans cette approche, vous devez étiqueter toutes les URL classées dans le top 10 (c’est-à-dire celles du premier SERP) comme étant 1 et les autres comme étant 0 et essayer de comprendre / inverser la manière dont différentes variables contribuent au fait que l’URL soit dans la page supérieure. .En tant que problème de classementDans cette approche, le rang est considéré comme la métrique continue et les modèles comprennent l'importance des variables pour se classer plus haut ou plus bas.

Créer un tel environnement où nous pouvons identifier les effets individuels et collectifs de multiples variables nécessite un corpus massif de données.

Bien que les moteurs de recherche prennent en compte des centaines de variables pour classer les pages, elles peuvent généralement être classées en paramètres de contenu (sur page), d'autorité (hors page) et techniques.

Je propose de mettre l'accent sur l'élaboration d'un modèle de notation qui vous aide à attribuer et à mesurer des scores pour ces quatre éléments:

1. Score de pertinence

Ce score doit examiner les éléments de contenu de la page, notamment:

La pertinence du contenu principal de la page par rapport au mot clé de recherche ciblé. Dans quelle mesure les signaux de contenu de la page sont communiqués par des éléments balisés de la page (par exemple, titre, H1, H2, image-alt-txt, méta description, etc.) ).

2. Score d'autorité

Cela devrait capter les signaux de l'autorité, notamment:

Le nombre de liens entrants vers la page. Le niveau de qualité des sites fournissant ces liens. Le contexte dans lequel ces liens sont fournis. Si le contexte est pertinent pour la page cible et la requête.

3. Score d'accessibilité

Cela devrait englober tous les paramètres techniques du site nécessaires à une bonne expérience – crawlabilité de la page, temps de chargement de la page, balises canoniques, paramètres géographiques de la page, etc.

4. Algorithme / Courbe CTR

Le CTR dépend de divers facteurs tels que la demande de mot-clé, le secteur d'activité, si le mot-clé est un nom de marque et la présentation du SERP (c'est-à-dire si le SERP comprend une zone de réponse, des vidéos, des images ou un contenu d'actualités.)

L'objectif ici est de déterminer le taux de clic estimé pour chaque position de classement, en donnant aux professionnels du référencement professionnel une connaissance approfondie de la manière dont chaque mot clé contribue au trafic global de la page.

Cela permet au programme de référencement de contrôler plus facilement les mots-clés les plus importants.

Si vous pouvez comparer ces trois sous-scores et attributs sous-jacents, vous serez en mesure d'identifier clairement les raisons du manque de performances – si la page cible n'est pas suffisamment pertinente ou si le site n'a pas suffisamment d'autorité dans le sujet ou si Dans l’expérience technique, rien n’empêche la page d’être classée.

Il identifiera également les attributs exacts à l'origine de cette lacune afin de fournir des informations exploitables spécifiques aux équipes de contenu.

Étape 3: Stratégie et simulation

Un système idéal irait un peu plus loin pour permettre la création d'un environnement dans lequel les professionnels de la SEO peuvent non seulement découvrir des informations exploitables, mais aussi simuler les modifications proposées en évaluant l'impact avant la mise en œuvre effective des modifications dans l'environnement réel.

La capacité de simuler les changements et d'évaluer l'impact permet de rendre les résultats prévisibles. Les applications potentielles de telles capacités de simulation sont énormes dans un programme de référencement.

1. Prévisibilité dans la planification et la hiérarchisation

Les ressources et les budgets sont toujours limités. Définir où appliquer les efforts d'optimisation pour obtenir le meilleur rendement pour votre argent est un défi.

Un modèle prédictif peut calculer l'écart entre vos pages et les pages les mieux classées pour tous les mots clés de votre marque.

L’ampleur de cet écart, les ressources nécessaires pour le combler et le trafic potentiel pouvant être généré à divers niveaux peuvent vous aider à hiérarchiser vos efforts d’optimisation à court, moyen et long terme.

2. Prévisibilité du classement et du trafic par le biais de la simulation de contenu, d'autorité et d'accessibilité

Un module de simulation de contenu permettra de simuler les modifications de contenu et d’estimer l’amélioration des scores de pertinence, ainsi que les gains potentiels de classement.

Avec ce type d’outil de simulation, les utilisateurs peuvent s’attacher à améliorer les attributs peu performants et à protéger les éléments de page générant le classement et le trafic.

Un environnement de simulation pourrait donner aux utilisateurs la possibilité de tester des tactiques d’optimisation hypothétiques (par exemple, des liens retour mis à jour et des paramètres techniques) et de prévoir l’impact de ces changements.

Les professionnels du référencement pourraient alors faire des choix éclairés sur les modifications à mettre en œuvre pour améliorer les performances tout en protégeant les éléments de page performants existants.

3. Prévisibilité dans l'impact commercial des efforts de référencement

Les professionnels du référencement pourraient utiliser le modèle pour déterminer si leur changement avait un impact sur les résultats.

Quel que soit leur rang ou leur prédiction, les professionnels de la SEO peuvent utiliser la courbe CTR pour déterminer le type de clics que le domaine peut recevoir sur une position donnée.

L'intégration de ces données aux analyses de site Web et aux données de taux de conversion permet d'associer les conversions au classement de la recherche, ce qui permet de prévoir l'impact commercial de vos efforts de référencement en termes de conversions ou de chiffre d'affaires.

Le dernier mot

Il n’existe pas de solution unique pour l’élaboration de modèles de notation SEO. Ma tentative a été de donner une vision de haut niveau de ce qui est possible.

Si vous êtes capable de capturer des données à leur niveau le plus granulaire, vous pouvez les agréger comme vous le souhaitez.

C’est notre expérience chez iQuanti: une fois que vous aurez entrepris ce voyage, vous aurez d’autres questions, trouver de nouvelles solutions et développer de nouvelles façons d’utiliser ces données pour vos propres cas d’utilisation.

Vous pouvez commencer avec des modèles linéaires simples, mais élever rapidement leur précision. Vous pouvez envisager des modèles non linéaires, des ensembles de modèles différents, des modèles pour différentes catégories de mots-clés – volume élevé, queue longue, par catégorie d’industrie, etc.

Même si vous n'êtes pas capable de construire ces algorithmes, je vois toujours de la valeur dans cet exercice.

Si seuls quelques professionnels du référencement sont enthousiasmés par la puissance des données pour permettre la prévisibilité, cela peut changer notre approche de l'optimisation de la recherche.

Vous commencerez à apporter plus de données à vos activités de référencement quotidiennes et commencez à penser au référencement naturel comme à un exercice quantitatif – mesurable, déclarable et prévisible.