Comment utiliser les versions archivées de sites Web pour résoudre les problèmes de référencement

En 2001, une organisation à but non lucratif nommée Internet Archive a lancé un nouvel outil appelé Wayback Machine sur l'URL: archive.org.

L’Internet Archive avait pour mission de constituer une bibliothèque numérique sur l’histoire d’Internet, de la même manière que les copies papier de journaux sont sauvegardées à perpétuité.

Comme les pages Web changent constamment, les robots de Wayback Machine consultent et cachent fréquemment les pages de l'archive.

Leur objectif était de rendre ce contenu disponible pour les générations futures de chercheurs, d'historiens et d'érudits. Mais ces données sont tout aussi précieuses pour les spécialistes du marketing et les professionnels du référencement.

Chaque fois que je travaille sur un projet impliquant un changement important du trafic, que ce soit pour mon site principal ou pour un concurrent, l'un des premiers endroits où je regarderai les pages en cache avant et après les changements de trafic.

Même si vous n’effectuez pas d’analyse médico-légale sur un site, le simple fait d’avoir accès au journal des modifications d’un site peut être un outil précieux.

Vous pouvez retrouver l'ancien contenu ou même vous rappeler une promotion effectuée l'année précédente.

Dépannage avec la machine Wayback

Un peu comme si vous regardiez un site Web en direct, les pages en cache contiendront toutes les informations disponibles pouvant expliquer un déplacement du trafic.

L'ensemble du site Web, avec tout le code HTML inclus, est contenu dans le cache, ce qui facilite l'identification des modifications structurelles ou techniques évidentes.

En comparant les différences entre une image avant et une image postérieure de mon site ou d'un concurrent, je cherche des problèmes avec:

Méta sur la page. Liens internes. Utilisations de l'image. Et même toute partie dynamique de la page qui aurait pu être ajoutée ou supprimée.

Voici les étapes à suivre pour utiliser la Wayback Machine à des fins de dépannage.

1. Mettez votre URL dans la boîte de recherche de Archive.org

Cela n'a pas besoin d'être une page d'accueil. Ce peut être n'importe quelle URL sur le site.

2. Choisissez une date à laquelle vous pensez que le code a peut-être changé

Notez le code couleur des dates:

Le rouge signifie qu'il y a eu une erreur. Le vert indique qu'une redirection se produit. Le bleu signifie qu'il y avait un bon cache de la page.

Vous devrez peut-être continuer à choisir des dates, puis à approfondir chaque version jusqu'à ce que vous trouviez quelque chose d'intéressant qui mérite d'être approfondi.

Pour les sites plus importants, vous constaterez que les pages d'accueil sont mises en cache plusieurs fois par jour, tandis que d'autres sites le sont plusieurs fois par an.

3. La page en cache de archive.org se chargera dans votre navigateur comme tout site Web, sauf qu’elle aura un en-tête de Archive.org.

Rechercher des changements évidents dans la structure et le contenu qui pourraient avoir entraîné une modification de la visibilité de la recherche.

4. Ouvrez le code source de la page et recherchez:

TitleDescriptionRobotsCanonicalsJavaScript

5. Comparez tout ce qui est différent du site actuel et analysez les relations de causalité ou de corrélation

Aucun détail n'est trop petit pour être étudié. Examinez des liens tels que les liens croisés, les mots utilisés sur les pages et même la preuve qu'un site a peut-être été piraté au cours d'une période donnée.

Vous devriez même regarder le langage spécifique dans tous les appels à l'action, car une modification apportée ici pourrait avoir un impact sur les conversions, même si le trafic est désormais supérieur au temps de la mémoire cache de la Wayback Machine.

Dépannage de fichier robot

La Wayback Machine conserve même des instantanés des fichiers robots.txt. Ainsi, en cas de modification des autorisations d'exploration, les preuves sont facilement disponibles.

Cette fonctionnalité m'a été incroyablement utile lorsque les sites semblent avoir mystérieusement quitté l'index, sans pénalité apparente, sans spam, ni problème actuellement visible avec un fichier robots.txt.

Pour trouver l'historique du fichier des robots, il suffit de déposer l'URL du robot dans le champ de recherche, comme ceci:

Après cela, choisissez une date puis effectuez une analyse diff entre le fichier de robots actuel. Il existe un certain nombre d’outils gratuits en ligne qui permettent de comparer deux jeux de texte différents.

Recherche Backlink

Une autre utilisation moins évidente de la Wayback Machine consiste à identifier comment des concurrents ont pu créer des backlinks par le passé.

À l'aide d'un outil comme Ahrefs, j'ai examiné les liens «perdus» d'un site Web, puis les ai placés dans la Wayback Machine pour voir comment ils se connectaient à un site Web cible.

Un lien naturel ne devrait pas vraiment se «perdre» et c’est un excellent moyen de comprendre pourquoi ces liens ont peut-être disparu.

Utilisations du chapeau gris

Outre ces méthodes extrêmement utiles d’utilisation de la Wayback Machine pour résoudre les problèmes de référencement, il existe également des méthodes plus avancées qui permettent à certains d’utiliser ces données.

Pour ceux qui construisent des réseaux de blogs privés (PBN) à des fins de backlink, le site archivé est un excellent moyen de restaurer le contenu d'un domaine expiré récemment acheté.

Le site restauré est ensuite rempli de liens vers d'autres sites du réseau.

Les affiliés

Une autre façon, encore une fois, du côté obscur des choses, que les gens utilisent ce contenu restauré est de le transformer en un site affilié pour cette catégorie.

Par exemple, si une personne achetait un domaine périmé pour une banque, elle en restaurait le contenu, puis plaçait les CTA sur tout le site pour remplir un formulaire de prêt hypothécaire.

Le client peut penser qu’il entre en contact avec une banque. Cependant, en réalité, leurs coordonnées sont vendues aux enchères à divers courtiers en hypothèques.

Pour ne pas terminer sur une note sombre, il existe un dernier moyen incroyable d’utiliser la Wayback Machine et c’est celui qui a été conçu par les créateurs du site.

C’est l’archive de tout sur le Web, et si quelqu'un recherchait la croissance atmosphérique d’Amazon au cours des deux dernières décennies grâce à la progression de son site Web, c’était ici qu’il trouverait une image de ce à quoi ressemblait la page d’accueil d’Amazon.

En plus des cas d’utilisation louche, la Wayback Machine est l’un des meilleurs outils gratuits que vous puissiez utiliser dans votre arsenal de marketing numérique. Il n’ya tout simplement aucun autre outil qui ait 18 ans d’histoire de presque tous les sites web du monde.

Plus de ressources:

Crédits d'image

Toutes les captures d'écran prises par l'auteur, mai 2019

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *