Principes de base du référencement: la traduction est-elle un problème de contenu en double pour Google?

Bien que les gens aient essayé de détruire le mythe de l’idée d’une pénalité liée à la duplication de contenu, l’utilisation flagrante de contenu copié et collé depuis un autre endroit éloigne toujours votre site Web de son optimisation. Il existe des exceptions aux règles associées aux pénalités et à l'optimisation lorsqu'il s'agit d'utiliser du contenu en double, notamment dans les cas suivants:

Même en connaissant ces exceptions, il peut être difficile de savoir ce qui est «autorisé» et ce qui ne l’est pas.

Une étude 2015 de Raven Tools a révélé qu'environ 29% des pages explorées présentaient un contenu en double. Bien sûr, si vous avez confiance en l’originalité de votre contenu (un outil tel que Grammarly Premium peut vous aider à effectuer une vérification du plagiat), vous n’avez vraiment pas à vous inquiéter.

Toutefois, si vous avez des sites Web multilingues, vous pouvez vous demander si les traductions de contenu de différents sites Web seront signalées. Mettons les choses au clair maintenant, la traduction n’est pas un problème de contenu dupliqué.

Approfondissons la question du contenu en double

Mais c’est la réponse courte. Avoir une meilleure idée du contenu dupliqué, de son impact sur le référencement et de ses causes peut vous aider à optimiser davantage les sites Web avec lesquels vous travaillez.

Avant de nous pencher sur le contenu en double, parlons des sites Web en général. Saviez-vous que le premier site Web a été créé le 6 août 1991 par Tim Berners-Lee? Et la première adresse du site Web était http://info.cern.ch/hypertext/WWW/TheProject.html. Pouvez-vous imaginer taper cette adresse? La plupart des gens ne le feraient pas parce que c'était trop long. Aujourd'hui, vous trouverez des adresses Web non www, telles que http://example.com. Et vous pouvez avoir différentes versions d'une URL, telles que http://www.example.com, pour augmenter les résultats de trafic.

Les domaines ont plus de pouvoir que jamais auparavant. Les paramètres d'URL donnent maintenant à une page le pouvoir d'avoir des vues illimitées. Une URL canonique indique à un moteur de recherche de le traiter comme faisant autorité. Et une balise canonique (également connue sous le nom de rel canonique) indique aux moteurs de recherche qu’une URL spécifique est la copie maîtresse d’une page Web ou de la version préférée d’une page Web via un lien canonique. Cela empêche également le contenu dupliqué ou copié d'apparaître. Et lors de la création d'un domaine, vous souhaitez créer un domaine préféré. Cela indique aux moteurs de recherche quel domaine (www. Vs non-www) analyser, ce qui produit de meilleurs résultats de recherche. La version préférée de votre domaine doit également contenir HTTPS. Cela indique aux visiteurs de votre site Web que c'est sécurisé, surtout si vous avez un magasin ou des informations sensibles. HTTPS vous procure également un symbole de verrou sur les moteurs de recherche, tels que Chrome et Google. De plus, Google aime les sites Web sécurisés, qui peuvent donner un coup de pouce au classement. Les domaines ne sont pas les seuls éléments d’un site Web capables de générer un référencement puissant ou de dupliquer le contenu. Le contenu faisant autorité est un autre élément.

Lorsque les sites Web sont devenus populaires, l'accent a été mis principalement sur la conception et sur un ou deux paragraphes concernant l'entreprise. C'est à ce moment que les problèmes de contenu en double sont devenus monnaie courante. Les gens ne savaient pas quoi écrire et il leur était simplement demandé de mettre le contenu sur plusieurs pages pour permettre de meilleurs résultats de recherche (classement dans les moteurs de recherche). Ainsi, ils ne font que dupliquer le contenu (par exemple, des blocs substantiels de contenu), ce qui a entraîné une pénalité de contenu en double de Google. Cela nuit non seulement au classement d’un site Web, mais également à la marque de la société. Un contenu identique peut apparaître non seulement sur un site Web, mais également sur différentes URL de la même entreprise. Pour éviter la tentation de dupliquer le contenu, il est avantageux d’avoir un contenu unique ou faisant autorité. Il est facile d’écrire ce type de contenu si l’auteur est un expert du sujet (ou de la société). L'expert est la source originale du contenu. Lorsqu'un site Web est publié sur Internet ou qu'une page est mise à jour, un Googlebot parcourt la ou les pages, en indexant les mots-clés, ainsi que les balises alt et les balises méta (méta-robots). Dupliquer le contenu peut facilement apparaître dans ces balises. Lorsqu'un Googlebot voit le fichier robot.txt, le fichier ne sera pas analysé, ce qui peut empêcher la copie en double. Cependant, certains pourraient l'utiliser pour contourner le contenu dupliqué en bloquant la page du bot.

Aujourd'hui, tout le monde peut créer un site Web à l'aide d'un système de gestion de contenu, tel que WordPress et Drupal. Le contenu est devenu le «roi» des sites Web aujourd'hui. Il y a plus de pression pour que ce soit authentique sans duplication. Les visiteurs ne veulent pas voir les pages en double; ils souhaitent voir un contenu personnalisé pour chaque page, tel que les pages À propos de et Blog. La page d'accueil ne dévoile plus tout de la société. il se contente de donner un aperçu du site.

Cependant, les rédacteurs de contenu Web ne doivent pas utiliser les mêmes phrases ou phrases sur leurs pages correspondantes. Cela peut conduire à une duplication. De plus, les visiteurs veulent voir le contenu mis à jour, ce qui les fait revenir sur un site. Chaque utilisateur a un identifiant de session, qui peut être utilisé pour mesurer le trafic. Lors de la création de titres et de descriptions de page, vous ne souhaitez pas copier et coller depuis le site Web. C'est l'occasion d'utiliser de nouveaux mots-clés en tant que contenu SERP, ce qui peut aider à développer le référencement. Un autre élément est un lien interne, qui relie une page Web à une autre. Vous devriez également avoir des liens externes, qui lient une page de votre site Web à un autre site Web. C'est un excellent moyen de rendre votre site Web crédible.

Un meilleur référencement signifie plus de trafic, ce qui peut entraîner plus de conversions et de revenus. Un webmaster de Google peut mesurer le référencement via des outils destinés aux webmasters, tels que la console de recherche Google. Entrez simplement les mots-clés qui seraient utilisés dans la requête de recherche pour votre site Web, produit ou service. Pour plus de conseils en matière de référencement, consultez les articles de Matt Cutts et John Mueller.

Qu'est-ce que le contenu dupliqué?

Le contenu dupliqué est un contenu qui semble exactement identique ou presque identique sur plusieurs sites Web.

Google explique que «le contenu dupliqué fait généralement référence à des blocs substantiels de contenu dans ou entre des domaines qui correspondent complètement à un autre contenu ou qui sont sensiblement similaires». La société ajoute: «Généralement, cela n’est pas trompeur d’origine.»

Comment le contenu en double affecte-t-il votre référencement?

Certains référenceurs affirment que Google ne sera pas directement pénalisé pour avoir dupliqué du contenu par inadvertance, mais cela a un impact sur le classement de votre moteur de recherche, notamment en ce qui concerne le classement sur Google.

S'il existe plusieurs sources de contenu similaire sur Internet, Google peut avoir du mal à identifier le résultat le plus pertinent pour une requête donnée. Ne sachant pas quel contenu propose de se classer plus haut, le moteur de recherche peut ne pas classer les pages ayant le même contenu (bien que ce soit un exemple extrême).

Ne pas apparaître sur la première page d'une recherche peut être préjudiciable à une entreprise. Ne pas apparaître n'importe où est un moyen infaillible de s'effondrer.

Selon Google, vous ne rencontrerez vraiment des problèmes avec le moteur de recherche que si vous vous "engagez dans des pratiques trompeuses". Si cette option est activée, votre site Web risque d'être complètement supprimé des résultats de ce moteur.

Google explique: "Une fois que vous avez apporté vos modifications et que vous êtes assuré que votre site n'enfreint plus nos consignes, soumettez votre site à un réexamen."

Il existe également une distinction entre le contenu dupliqué accidentel et le contenu manifestement plagié. Si vous pensez que quelqu'un d'autre a volé votre contenu, vous pouvez demander à Google de le supprimer de ses résultats de recherche. Sur une note similaire, vous pouvez également demander à Google de désavouer les backlinks spammy via Search Console.

Gestion du contenu traduit

Si vous pensez à l’objectif de Google, qui est de fournir les informations les plus pertinentes pour une requête donnée, il devrait immédiatement être clair que le contenu traduit ne serait pas considéré comme un contenu en double. Une personne recherchant des informations sur l’eau de coco en anglais ne trouvera pas de réponse en espagnol aussi pertinente qu’une réponse en anglais.

Selon l’ancien responsable du spam Web de Google, le contenu dans différentes langues – bien qu’il soit identique dans son contexte – est encore très différent, il n’est donc pas considéré comme un contenu dupliqué. Toutefois, si le contenu d'origine était simplement importé dans Google Translate, puis copié-collé, des indicateurs de spam pourraient en résulter.

Ce type de signalisation est dû à la nature automatisée du processus de traduction de contenu sur des outils tels que Google Translate. Sans être examiné par un humain, un tel contenu peut être de mauvaise qualité en raison de nombreux problèmes grammaticaux. En conservant le contenu de Google Traduction avant la publication (par exemple en embauchant un rédacteur pigiste maîtrisant les langues que vous traduisez), vous pouvez facilement éviter ce problème et assurer une meilleure expérience à ceux qui visitent votre site.

Qu'est-ce qui peut causer des problèmes de contenu en double?

La majorité des cas de contenu en double ne sont pas intentionnels. En fait, il est fort possible que vous ayez déjà des doublons sur votre site Web.

Un problème commun aux personnes qui finissent par créer des doublons est qu’elles s’exécutent activement et conservent les versions http: // et https: // d’un site ayant un contenu identique.

Si les deux sites sont en direct, actifs et visibles pour les moteurs de recherche, ceux-ci verront les pages dupliquées.

De la même manière, si votre site comporte une version «normale» et une version «imprimée» de chaque article, ils peuvent être classés en tant que contenu dupliqué. Dans de tels cas, il est préférable d’empêcher les robots d’analyser ceux qui portent une balise méta noindex. Sinon, Google en choisira un.

Le contenu créé par le balayage Web, généralement décrit comme un processus automatisé d'extraction de données d'un site Web, est susceptible d'être considéré comme un problème de contenu en double. C’est souvent le cas des sites Web de commerce électronique, car nombre d’entre eux vendent plusieurs versions des mêmes produits, où les descriptions de produits sont récupérées ailleurs en ligne (le fournisseur d'origine) et ajoutées aux nouveaux magasins de commerce électronique sans modification préalable. changement.

Les domaines localisés peuvent également être une source de contenu en double. Lorsque ces sites Web géo-ciblés, tels que .co.uk pour le Royaume-Uni ou .ca pour le Canada, appartiennent tous à la même société et sont numérotés dans des lieux anglophones distincts, il est facile de se tromper. le même contenu ne sera pas reconnu comme une duplication (alerte spoiler, ce sera le cas).

Toutefois, si le contenu a été traduit dans une langue différente et conçu pour un site Web géo-ciblé, vous ne devriez pas rencontrer de problèmes.

Réflexions finales: la traduction est-elle un problème de contenu en double pour le référencement?

L'essentiel est que la publication de bonnes traductions du même contenu et des informations ailleurs sur votre site n'aura pas d'impact négatif sur votre référencement. Cependant, vous vous configurez pour être signalé comme courrier indésirable si vous comptez sur des traductions automatisées et que vous ne faites plus rien pour gérer le contenu que vous publiez, même s'il se trouve sur un site Web géo-ciblé.

Cela ne signifie pas que vous n'avez pas à vous soucier du contenu en double. Comme indiqué plus haut, il existe de nombreuses situations dans lesquelles vous pouvez accidentellement publier des contenus en double que vous n'avez peut-être même pas compris en direct sur votre site Web! Bien que ce contenu ne vous blesse pas directement, il éloigne votre site Web de son optimisation totale.

À tout le moins, vous devez vous assurer que vous ne créez pas de contenu en double par paresse ou dans le but de tromper les moteurs de recherche. Cela peut causer de graves dommages à votre entreprise et à votre marque si votre site Web est supprimé des résultats des moteurs de recherche jusqu'à ce que vous ayez prouvé que vous avez remédié à la situation. Cela ne vaut tout simplement pas le risque.

Heureusement, traduire le contenu de manière professionnelle et le publier dans plusieurs langues ne vous mettra pas dans cette situation.

Janeene High est la propriétaire de Results Driven Marketing, une entreprise détenue à 100% par des femmes et basée à Wynnewood, en Pennsylvanie, avec un bureau à Philadelphie, en Pennsylvanie. Janeene et son équipe aident les clients à augmenter le trafic qualifié sur leurs sites Web en utilisant les dernières stratégies de référencement. Si vous ou votre entreprise souhaitez trouver plus de personnes ayant besoin de vos services, contactez RDM ou appelez Janeene au 215-393-8700.

Rubriques connexes:

Cinq tendances du marketing numérique à surveiller en 2019

5 étapes pour élaborer une stratégie gagnante de marketing numérique Pinterest

Comment créer une stratégie de marque forte pour votre entreprise

Résultats axés sur le marketing, LLC. Classé dans le Top 50 des entreprises dirigées par des femmes

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *