Duplicate content
18 February 2008
Des auteurs ont peur que coZop ne les pénalise parce que nous allons republier leurs articles en intégralité. Ils craignent que leurs contenus une fois dupliqués perdent de leur valeur vis-à-vis des moteurs de recherche.
Si personne ne peut avoir de certitude à ce sujet parce que personne ne connaît les détails des algorithmes des moteurs, celui de Google en particulier, mon expérience me prouve que republier des billets ne nuit pas à leur référencement (Rankspirit est du même avis). Par exemple, les billets de mon blog republiés ou non ne sont pas mieux ou moins bien notés sur Google. Autre exemple, les articles de wikipedia sont souvent republiés à tour de bras. Cela n’empêche pas wikipedia d’être presque systématiquement dans les tops résultats.
Lorsqu’un livre est disponible en plusieurs éditions les libraires ne le pénalisent pas. À ma connaissance, Google et les autres moteurs imitent les libraires.
Les auteurs doivent en revanche éviter à tout prix de republier des pages à l’identique sous des URL différents. Les moteurs les voient comme une tentative de spam indexing. C’est dans ce cas qu’on parle de duplicate content. coZop remet en forme les articles, les habille différemment… les commentaires seront différents, nous allons même ajouter des liens contextuels… Les contenus mêmes si proches seront de moins en moins identiques.
Pour éviter toute confusion, nous ajoutons coZop à tous les titres de page. Ainsi nous sommes sûrs que vos articles publiés chez nous n’auront pas le même intitulé pour les moteurs (en plus de ne pas avoir les mêmes URL).
Google pour sa part définit clairement ce qu’il entend par duplicate content. Du moment que coZop pointe vers la source exacte d’un article, la source est favorisée par rapport à sa copie sur coZop. Si pour une requête donnée, un de vos articles doit apparaître dans les résultats, votre article original devrait être sélectionné au détriment de celui sur coZop.
Je dis « devrait » parce qu’on ne peut jamais avoir de certitude. Cet article publié sur mon blog, n’apparaît pas en premier sur Google.
Sa version Agoravox dont j’ai accepté la republication sort en premier (parce qu’Agoravox est un site de plus de poids que mon blog pour Google). Puis, pour la même raison, une version pirate apparaît sur le Forum des Forums. Elles devancent mon texte parce qu’elles n’affichent aucun lien retour explicite vers la source. Mon travail d’auteur n’est donc pas valorisé.
Je trouve ça acceptable pour Agoravox parce que j’ai choisi la règle du jeu mais pas pour les spammeurs. Sur coZop, nous citons les sources, c’est-à-dire nous pointons vers la page où est originellement publiée l’article et non seulement vers la page d’accueil générique de l’auteur (ce qui lui donne du poids mais laisse ses articles en retrait dans les résultats de recherche).
Idéalement une requête Google avec le titre exact d’un article doit amener cet article en tête des résultats. Ainsi les plateformes de republication ne vous volent pas le trafic que vous méritez. En revanche, d’autres combinaisons de mots, non présentes à la source, peuvent mener aux rééditions. Elles vous font alors gagner du lectorat, pour peu que comme coZop elles vous donnent accès à vos statistiques (et que vous en connaissiez l’existence).
En résumé, un auteur ne devrait pas accepter de voir un de ses articles republié sans lien retour vers cet article. L’abscence de ce lien, le refus de citer la source, revient à voler du lectorat. coZop cherche au contraire à l’agrandir.
18 February 2008 @ 7:52 pm
À mon avis, la seule façon de définitivement rassurer sur ce point, c’est de le régler, et la seule façon de le régler, c’est de faire du social reading décentralisé.
Attention, je ne suis pas en train de dire que c’est une urgence, par contre, confirmer la vague promesse qu’on peut trouver sur la FAQ à ce sujet serait certainement le bienvenu.
P.S. : et vivement l’apparition des fonctionnalités «lecteurs»
4 March 2008 @ 11:55 am
Question sans rapport…
Comment se font les éditions de 8h… ?
4 March 2008 @ 10:23 pm
Remarque : petit probleme avec les flux rss de blog Wordpress
Comment qu on fait