Vous êtes ici : Nicolas Augé . com » Référencement SEO » Interview : Papy spinning

Interview : Papy spinning

Mar 5 2013

Après l’interview de Fabrice de FaceGooTwi, j’ai l’honneur d’inviter un certain « Papy Spinning » que beaucoup connaissent au sein de la communauté SEO.

Pour ma part, je le connais grâce à son blog de haut niveau, http://www.webcontentspinning.com, qui traite évidemment du content spinning et des sujets qui lui sont liés mais il est également possible de trouver des articles à propos de Google et des billets d’humeur par exemple.

Quoi qu’il en soit, je vous invite ardemment à le lire car je trouve qu’il expose souvent des visions très pertinentes qui amènent à la réflexion.

Merci « Papy Spinning » d’avoir répondu positivement à ma sollicitation.
 

Pour commencer, bien que tu sois très mystérieux peux-tu nous en dire un peu plus sur ton parcours, sur toi ou sur les raisons de ton anonymat ?

IRL nous avons plusieurs vies, plusieurs facettes, nous changeons et évoluons. J’ai envie de croire que sur le web aussi.

Or l’indexation et le stockage de l’information par les moteurs ne va pas dans ce sens. Sur ce point Eric Schmidt avait conseillé de changer d’identité plutôt que demander une impossible « désindexation ».

Aujourd’hui je fais du SEO, demain je pourrais faire des lasagnes au pingouin. Donc je tiens à garder une marge de manœuvre numérique et le fichage de Google me déplaît. Précision, ce n’est pas de l’anonymat mais du pseudonymat, Papy Spinning étant un avatar numériquement bien réel.

Mon parcours est chaotique. Je ne sais pas très bien le décrire de manière synthétique. Je dirais pêle-mêle pour mes centres d’intérêts passés et présents : philosophie, logique, histoire, anthropologie, linguistique, informatique, internet et web.

Je collectionne les boules à neige également.
 

Quand as-tu été pris de passion pour le spinning et/ou le SEO ?

J’ai découvert le content spinning après le SEO. Mais je connaissais le TAL (Traitement Automatique du Langage) à travers la littérature et la poésie.

Cela remonte donc à quelques années quand je me suis rendu compte que le SEO était un jeu de stratégie grâce auquel on pouvait gagner sa vie.

Je suis un grand amateur de jeu de stratégie, en particulier le jeu d’Échecs. Quand Kasparov a été battu par Deep Blue (IBM) la première fois en 1997, ça a été un choc.

Le SEO face à Google, c’est dans la continuité ; même si cela ne semble pas connexe au premier abord !

Le content spinning m’a intéressé dans le cadre du SEO. Cette branche un peu floue du TAL ne me semblait pas très structurée, sans terminologie claire.

J’ai essayé de construire la mienne pour optimiser son utilisation et arriver à des productions de textes sans similarité excessive, tout en ne dégradant pas l’expérience utilisateur. Et je suis passé à autre chose.
 

Ensuite, j’ai beaucoup entendu parler du « spin polymorphe » : peux-tu nous en dire plus ?

Je vais essayer. Tout d’abord l’expression, sauf erreur, revient à Sylvain Deauré, dont le travail poussé et original en fait une référence en la matière.

Par contre l’approche « polymorphique » du spinning remonte personnellement à 2010/2011 quand je travaillais sur cette question. Le problème en spinning était la « détectabilité ». Les brevets de Google sur le Near-Duplicate (à ne pas confondre avec « duplicate content » c’est une erreur fréquente) semblaient tout aussi puissants en théorie que douteux en pratique.

Nous sommes partis du principe qu’un texte n’est ni plus ni moins qu’une chaine de caractères comme une autre, informatiquement parlant. De fait quel était le type de chaine de caractères qui par définition luttait contre la similarité ? Les virus informatiques.

Et quels virus informatiques offraient le plus de garantie et n’étaient tout simplement pas détectables par les sociétés d’anti-virus ? Les virus polymorphes.

Quelles étaient donc les caractéristiques de ces virus polymorphes ? Un triptyque d’auto-transformations :

  • Substitution ;
  • Permutation ;
  • Bruit (ajout/suppression d’informations inutiles aux fonctions).

Or au départ le spinning ne comportait qu’une propriété, la substitution, ce qui en avouait la faiblesse. En témoigne le recours massif et naïf aux seuls synonymes.

Dès lors que la population de textes est générée à partir de ces trois propriétés, la machine patauge face à un « spin polymorphe ».

Mais attention. Le spin polymorphe perd en efficacité si :

  • il ne respecte pas certains planchers quantitatifs et qualitatifs ;
  • le tirage de textes n’est pas optimisé à bon escient.

Pour ceux qui seraient intéressés par en savoir plus ou voudraient utiliser des outils efficaces, je ne peux que conseiller le travail de Sylvain avec XSPIN, c’est une approche très complète de la question.
 

J’ai vu dernièrement une actualité à propos d’un nouveau moteur de recherche baptisé « Qwant », quel est ton avis sur celui-ci ?

L’actualité a été riche et il semble que l’interview proposée par Laurent Bourrelly a permis de recadrer les choses en dehors des passions et des approximations.

Je trouve intéressant de ne pas partir des mêmes bases que Google en 1998. Le web a changé et Qwant a pris la question à bras le corps.

J’espère que Qwant réussira, je le souhaite vraiment car il y a une carence immense aujourd’hui. Primo parce que Google possède une hégémonie toxique pour le web et il le démontre tous les jours. Deuxio parce que collecte et traitement de données sont totalement maitrisés par des firmes US. Et que sur ce point la France est hors-jeu depuis l’invention du minitel (1980).

Je parle de la France et non des français, pensons par exemple à Louis Monier, co-inventeur d’Altavista (1995). Plus près encore il y a Exalead en 2006 mais il appartient à Dassault Systèmes, ce qui pourrait expliquer sa confidentialité.

Du coup je pense qu’il faut leur faire confiance et leur donner le temps de progresser. Vu la situation nous n’avons qu’à y gagner. Beaucoup se sont mis à hurler contre Qwant suite à un billet à charge. Les mêmes n’en font pas autant quand Google s’enrichit sur leurs dos sans aucune contrepartie. Mais ils ont une communication sans faille…
 

Autre actualité qui risque de perdurer : penses-tu que l’Author Rank sera incontournable en 2013 ?

Sujet délicat, car comme tout ce qui est à la mode, ça se démode aussi.

Il conviendrait je pense de séparer le « produit author rank» de la réalité algorithmique, plus complexe et plus opaque.

Par certains aspects, « l’author rank » est du même acabit que le « seo sémantique », un produit marketé par certaines agences web pour « rafraichir » leurs prestations, théorie de l’obsolescence oblige.

Toujours est-il que Google doit assumer un changement de paradigme du web I (documentaire) au web II (social). Les métriques doivent forcément évoluer.

Depuis 2005 Google a donc déposé plusieurs brevets pour noter non plus uniquement le document mais aussi « l’agent », la source, la première difficulté étant de lier le premier à la seconde.

La personnification et la personnalisation, la prise en compte de l’unicité des individus, tend à les « noter » tout autant que les documents qu’ils produisent.

En ce sens Google + est davantage une évolution de Google qu’un simple réseau social de plus. Il s’agit bien d’une nouvelle métrique de classement. Elle s’étudie comme les autres, empiriquement et avec patience, loin des prophéties auto-réalisatrices du marketing. « More hack, less yack »…

J’ignore si elle est « incontournable » en 2013, mais en tant que métrique, on ne peut faire l’économie de son étude en SEO.
 

Enfin, quel est ton point de vue sur le négatif SEO : vaste fumisterie ou effet de bord de l’algo ?

Un effet de bord qui arrange bien la stratégie de Google alors…

Sur certains aspects c’est une fumisterie, car il n’y a pas moins d’opacité avec le SEO « positif ». En revanche d’après mon expérience, c’est une rude et intransigeante réalité. Et ça peut faire très mal, y compris un défaçage de SERPs.

Que Google laisse la possibilité de carboniser un site ou une page avec ces méthodes est assez grave. Ou bien c’est une défaillance technique, ce dont je doute, ou bien c’est une faiblesse tactique pour que les SEO’s se cannibalisent et par conséquent se discréditent eux-mêmes.

Quant à dire que cela ne concerne que les jeunes sites, ce n’est pas ce que j’ai constaté. On peut très bien viser une page d’un domaine de poids sur une requête top tail particulière et la faire disparaitre.

De fait c’est extrêmement nocif. Et ce d’autant que juridiquement il n’y a guère à ma connaissance que la qualification de « concurrence déloyale » qui demande de prouver la relation de causalité entre l’action négative et la preuve de perte de chiffre d’affaire.

En fonction des secteurs commerciaux, nous sommes obligés de tenir compte de cette réalité et l’inclure dans le process SEO.

Cet article vous a plu ? Partagez-le !