5 exemples pratiques de mélange de données pour des idées de référencement plus intelligentes

Parfois, nous sommes confrontés à des questions auxquelles il est difficile de répondre avec les informations provenant d’outils isolés. Une technique efficace que nous pouvons utiliser consiste à combiner les données de différents outils pour découvrir de nouvelles informations précieuses.

Vous pouvez utiliser Google Data Studio pour fusionner des données, mais notez que cette technique est limitée à un seul type de technique de fusion: une jointure externe gauche (décrite ci-dessous). Je couvrirai une liste plus complète de techniques de fusion de données que vous pouvez utiliser en Python (ou en SQL si vous le préférez).

Explorons des applications de référencement pratiques.

Approche générale

Afin de mélanger des tableaux de données distincts (pensez aux feuilles de calcul dans Excel), vous avez besoin d’une ou de plusieurs colonnes qu’ils doivent avoir en commun. Par exemple, nous pourrions associer la colonne ga: landingPagePath d'une table Google Analytics à la colonne de page d'une table de la console de recherche Google.

Lorsque nous combinons les tables de données de cette manière, nous disposons de plusieurs options pour calculer la table résultante.

Les diagrammes de Venn ci-dessus illustrent la théorie des ensembles standard utilisée pour représenter l'appartenance aux éléments de l'ensemble résultant. Discutons de chaque exemple:

Jointure externe complète: les éléments de l'ensemble résultant incluent l'union de tous les éléments des ensembles source. Tous les éléments des deux côtés de la jointure sont inclus, avec des informations jointes s’ils partagent une clé et des blancs sinon.

Jointure interne: les éléments du jeu résultant incluent l'intersection de tous les éléments des jeux source. Seuls les éléments qui partagent une clé des deux côtés sont inclus.

Jointure gauche (extérieure): les éléments de l'ensemble résultant incluent l'intersection de tous les éléments des ensembles source et des éléments uniquement présents dans le premier ensemble. Tous les éléments du côté gauche sont présents, avec des informations de jointes supplémentaires uniquement si une clé est partagée avec le côté droit.

Jointure droite (extérieure): les éléments de l'ensemble résultant incluent l'intersection de tous les éléments des ensembles source et des éléments uniquement présents dans le second ensemble. Tous les éléments du côté droit sont présents, avec des informations de jointes supplémentaires uniquement si une clé est partagée avec le côté gauche.

Je vais passer en revue un exemple de ces jointures ci-dessous, mais ce sujet est plus facile à apprendre. N'hésitez pas à vous entraîner avec ce tutoriel interactif.

Voici quelques cas pratiques de mélange de données de référencement:

Ajout de données de conversion / revenus à la console de recherche Google

La console de recherche Google est mon outil indispensable pour le référencement technique, mais comme moi, vous êtes probablement frustré de ne pas pouvoir générer de données de revenus ou de conversion dans les rapports. Il est relativement facile de résoudre ce problème pour les pages de destination en fusionnant les données de Google Analytics.

Les deux tables de données doivent utiliser la même plage de dates.

Tout d’abord, nous allons configurer un Pandas DataFrame avec des exemples de données Google Analytics et l’appeler df_a.

Table de données Google Analytics contenant ga: landingPagePath, ga: revenue, ga: transactions (filtrées pour le trafic de recherche organique dans Google)

Nous allons ensuite configurer un DataFrame avec quelques exemples de données de la console de recherche et l’appeler df_b.

Table de données de la console de recherche Google contenant la page, les impressions, les clics et la position

Nous allons maintenant utiliser la fonction de fusion des pandas pour combiner les deux, en utilisant tout d'abord une jointure interne (l'intersection des deux ensembles), puis une jointure externe (l'union).

Vous pouvez voir que les jointures externe, gauche et droite contiennent des données manquantes («NaN») lorsqu'aucune clé n'est partagée par l'autre côté.

Vous pouvez désormais diviser les transactions par des clics pour obtenir le taux de conversion par page de destination et le revenu par transaction pour obtenir la valeur moyenne de la commande.

Corrélation de liens et de domaines dans le temps avec l'augmentation du trafic

L'augmentation des backlinks est-elle responsable ou non d'une augmentation du trafic? Vous pouvez exporter les derniers liens depuis la console de recherche Google (qui inclut la dernière fois que Googlebot les a explorés), puis combiner ce tableau de données avec le trafic de recherche organique de Google Analytics au cours de la même période.

Comme dans le premier exemple, les deux tables de données doivent utiliser la même plage de dates.

Voici les données dont vous aurez besoin:

Console de recherche Google: page de liaison, dernière exploration

Google Analytics: ga: date, ga: newUsers

Colonnes communes (pour la fonction de fusion): left_on: Last crawled, right_on: ga: date

Vous pouvez tracer le trafic et les liens au fil du temps. Vous pouvez éventuellement ajouter une colonne de domaine calculée au tableau de données de la console de recherche. Cela vous permettra de tracer des domaines de liaison par trafic.

Corréler les nouvelles visites d'utilisateurs à la longueur du contenu

Quelle est la longueur optimale de vos articles de contenu? Au lieu d'offrir des réponses empiriques, vous pouvez réellement calculer cela par client. Nous combinerons une table de données de votre robot d'exploration favori avec les données de performance de Google Analytics ou de Google Search Console. L'idée est de regrouper les pages en fonction de leur nombre de mots et de vérifier quels groupes obtiennent les visites de recherche les plus organiques.

Les deux tables de données doivent utiliser le même ensemble de pages de destination.

Screaming Frog crawl: Adresse, Nombre de mots

Google Analytics: ga: landingPagePath, ga: newUsers

Colonnes communes: left_on: Address, right_on: ga: landingPagePath

Vous devez créer des groupes de comptage de mots, un groupe par groupes, puis tracer le trafic par bac.

Réduire les pages qui ont perdu (ou gagné) du trafic

Pourquoi le trafic a-t-il chuté (ou augmenté)? C'est une question fréquente et parfois pénible à laquelle répondre. Nous pouvons savoir quelles pages spécifiques ont perdu (ou gagné) du trafic en combinant des tableaux de données de deux périodes distinctes.

Les deux tables de données doivent utiliser le même nombre de jours avant et après la chute (ou l'augmentation).

Première période dans Google Analytics: ga: landingPagePath, ga: newUsers

Deuxième période dans Google Analytics: ga: landingPagePath, ga: newUsers

Colonnes communes: left_on: ga: landingPagePath, right_on: ga: landingPagePath

Nous devons d’abord regrouper les nouveaux utilisateurs par page et soustraire la première période de la seconde. Appelons ce delta de soustraction. Si delta est supérieur à zéro, le trafic gagné par la page est égal à 0% du trafic perdu et, s'il est égal à zéro, il n'a pas changé.

Voici un exemple où nous avons regroupé des pages par type de page (Collections, Produits ou N / A) et calculé le delta avant et après une baisse de trafic.

Recherche de mots clés de recherche payés générant un taux de conversion élevé avec un classement SEO faible

Avez-vous des mots clés à conversion élevée dans Adwords qui se classent mal en recherche naturelle? Vous pouvez le savoir en combinant les données Google Adwords avec Google Search Console.

Les deux tables de données doivent utiliser la même plage de dates.

Google Analytics: ga: adMatchedQuery, ga: transactions (filtrées par les transactions supérieures à zéro)

Console de recherche Google: requête, position, clics (filtrés par mots clés dont la position est supérieure à 10)

Colonnes communes: left_on: ga: adMatchedQuery, right_on: query

Le résultat répertorie les mots clés organiques de classement inférieur avec les colonnes transactions, positions et clics.

Les opinions exprimées dans cet article sont celles de l'auteur invité et pas nécessairement celles du moteur de recherche. Les auteurs du personnel sont listés ici.

A propos de l'auteur

Hamlet Batista est PDG et fondateur de RankSense, une plate-forme de référencement agile pour les détaillants et les fabricants en ligne. Il détient des brevets américains sur des technologies de référencement innovantes, a commencé à faire du référencement SEO en tant que filiale marketing efficace en 2002, et estime que de grands résultats en référencement ne devraient pas prendre moins de 6 mois.