408 Rue Albert Bailly - 59290 Wasquehal, France

Quinze ans, c'est long en SEO

Agence Webmarketing à Lille

Quinze ans, c'est long en SEO

posté par Willcritchlow

J'ai été dans une humeur introspective ces derniers temps.

Plus tôt cette année (15 ans après avoir lancé Distilled en 2005), nous avons créé une nouvelle société appelée SearchPilot pour se concentrer sur nos tests SEO A / B et la technologie méta-CMS (anciennement connue sous le nom de Distilled ODN), et a fusionné la partie conseil et conférences de l'entreprise avec Brainlabs.

Je suis maintenant PDG de SearchPilot (qui appartient principalement aux actionnaires de Distilled), et je suis également partenaire SEO chez Brainlabs, donc… Je suis désolé tout le monde, mais je reste beaucoup dans l'industrie du référencement.

En tant que tel, cela ressemble un peu à la fin d'un chapitre pour moi plutôt qu'à la fin du livre, mais cela m'a quand même fait revenir sur ce qui a changé et ce qui n'a pas été au cours des 15 dernières années. industrie.

Je ne peux pas prétendre faire partie de la première génération d'experts en référencement, mais après avoir créé des sites Web depuis environ 1996 et vu la croissance de Google depuis le début, j'ai l'impression d'être peut-être la deuxième génération, et peut-être que j'ai quelques histoires intéressantes à partager avec ceux qui sont plus récents dans le jeu.

Je me suis creusé la tête pour essayer de me souvenir de ce qui me semblait important à l'époque, et j'ai également examiné les grandes tendances à travers mon temps dans l'industrie, pour rassembler ce que je pense faire une liste de lecture intéressante que la plupart des personnes travaillant sur le Web aujourd'hui ferait bien de savoir.

Les grandes époques de la recherche

J'ai plaisanté au début d'un présentation que j'ai faite en 2018 que les grandes époques de la recherche oscillaient entre les directives des moteurs de recherche et les moteurs de recherche se détournant rapidement de ces directives lorsqu'ils ont vu ce que les webmasters faisaient réellement:

Bien que cette diapositive ait été un peu ironique, je pense qu'il y a quelque chose à penser aux époques comme:

Créer des sites Web: avez-vous un site Web? Souhaitez-vous un site Web? C'est difficile à croire maintenant, mais aux débuts du web, beaucoup de gens avaient besoin d'être persuadés pour mettre leur entreprise en ligne. du Web s'est développé au-delà des répertoires sélectionnés par les utilisateurs, les algorithmes basés sur les liens pour la recherche ont commencé à dominer. graphique Contenu de la longue traîne: Parallèlement à cette époque, la longueur du longue queue ont commencé à être mieux compris par les webmasters et par Google eux-mêmes – et il était dans l'intérêt des deux parties de créer des quantités massives de contenu (souvent obscur) et de le faire indexer au moment où cela était nécessaire. voir la tendance ici?), la qualité moyenne du contenu renvoyé dans les résultats de recherche a chuté de façon spectaculaire, et nous voyons donc les premiers facteurs de classement de l'apprentissage automatique sous la forme de tentatives d'évaluation de la «qualité» (aux côtés de la pertinence et de l'autorité du site Web). On peut dire que tout à partir de ce moment a été une aventure dans l'apprentissage automatique et l'intelligence artificielle, et a également eu lieu au cours de la carrière de la plupart des spécialistes du marketing travaillant dans le référencement aujourd'hui. Alors, même si j'adore écrire sur ce sujet, j'y reviendrai un autre jour.

Histoire du référencement: moments cruciaux

Bien que je sois sûr qu'il y a des histoires intéressantes à raconter sur l'ère pré-Google du référencement, je ne suis pas la bonne personne pour leur raconter (si vous avez une excellente ressource, veuillez la déposer dans les commentaires), alors commençons tôt dans le parcours de Google:

La technologie fondamentale de Google

Même si vous vous lancez dans le référencement en 2020, dans un monde de facteurs de classement appris par machine, je recommanderais quand même de revenir en arrière et de lire les premiers travaux académiques étonnamment accessibles:

L'anatomie d'un moteur de recherche Web hypertextuel à grande échelle par Sergey Brin et Lawrence Page [PDF]Analyse des liens dans la récupération d'informations Web [PDF]Surfeur raisonnable (et le Version mise à jour)

Si vous n'utilisiez pas le Web à l'époque, il est probablement difficile d'imaginer à quel point l'algorithme basé sur le PageRank de Google représentait une amélioration par rapport à «l'état de l'art» à l'époque (et il est difficile de s'en souvenir, même pour ceux d'entre nous qui l'étaient):

IPO de Google

En plus de «choses dont il est difficile de se souvenir clairement», au moment de l'introduction en bourse de Google en 2004, très peu de gens s'attendaient à ce que Google devienne l'une des entreprises les plus rentables de tous les temps. Au début, les fondateurs avaient parlé de leur mépris pour la publicité et avaient expérimenté avec un peu de réticence les publicités basées sur des mots clés. En raison de cette attitude, même au sein de l'entreprise, la plupart des employés ne savaient pas quelle fusée ils construisaient.

De cette époque, je recommanderais de lire la lettre d'introduction en bourse des fondateurs (voir cet excellent article de Danny Sullivan – qui est ironiquement maintenant @SearchLiaison chez Google):

«Nos résultats de recherche sont les meilleurs que nous savons produire. Ils sont impartiaux et objectifs, et nous n'acceptons pas de paiement pour eux ou pour inclusion ou mise à jour plus fréquente. "

"Étant donné que nous ne facturons pas aux marchands pour leur inclusion dans Froogle [désormais Google Shopping], nos utilisateurs peuvent parcourir les catégories de produits ou effectuer des recherches de produits en sachant que les résultats que nous fournissons sont pertinents et impartiaux." – Dépôt S1

En outre, Dans le Plex est un livre agréable publié en 2011 par Steven Levy. Il raconte l'histoire de ce que le PDG de l'époque, Eric Schmidt, appelait (à l'époque de l'introduction en bourse) «la stratégie de dissimulation»:

«Ceux qui connaissaient le secret… ont reçu pour instruction assez ferme de se taire à ce sujet.

"Ce que Google cachait, c'est comment il avait déchiffré le code pour gagner de l'argent sur Internet."

Heureusement pour Google, pour les utilisateurs et même pour les spécialistes du marketing de recherche organique, il s'est avéré que cela n'était pas réellement incompatible avec leurs idéaux purs des jours précédant l'introduction en bourse car, comme le raconte Levy, «lors de tests répétés, les internautes étaient plus satisfaits des pages avec des publicités que celles où elles ont été supprimées ». Phew!

Tout indexer

En avril 2003, Google a acquis une société appelée Applied Semantics et mettre en mouvement un séries d'évènements qui, je pense, pourrait être la partie la plus sous-estimée de l'histoire de Google.

La technologie de la sémantique appliquée a été intégrée à leur propre technologie de publicité contextuelle pour former ce qui est devenu AdSense. Bien que les revenus d'AdSense aient toujours été éclipsés par AdWords (maintenant simplement "Google Ads"), son importance dans l'histoire du référencement est difficile à sous-estimer.

En démocratisant la monétisation du contenu sur le Web et en permettant à chacun d'être payé pour produire du contenu obscur, il a financé la création de quantités absurdes de ce contenu.

La plupart de ce contenu n'aurait jamais été vu sans l'existence d'un moteur de recherche qui excellait dans sa capacité à fournir d'excellents résultats pour les recherches à longue traîne, même si ces recherches étaient incroyablement rares ou n'avaient jamais été vues auparavant.

De cette manière, le moteur de recherche de Google (et l'activité de publicité sur les recherches) a formé un puissant volant avec son activité AdSense, permettant le financement de la création de contenu dont il avait besoin pour se différencier avec l'index le plus grand et le plus complet du Web.

Comme pour tant de chapitres de l'histoire, cependant, cela a également créé un monstre sous la forme de contenu de mauvaise qualité ou même généré automatiquement qui conduirait finalement à des crises de relations publiques et à des efforts massifs pour y remédier.

Si vous êtes intéressé par l'ère de tout index, vous pouvez lire davantage de mes réflexions à ce sujet dans diapositive 47 de De la bouche du cheval.

Spam Web

le premières formes de spam sur Internet se trouvaient diverses formes de messages, qui ont frappé le grand public en tant que spam par courrier électronique. Au début des années 2000, Google a commencé à parler du problème qu'ils appelleraient finalement «spam Web» (la première mention que j'ai vue du spam de lien est dans une présentation d'Amit Singhal de 2005 intitulée Défis liés à l'exécution d'un moteur de recherche Web commercial [PDF]).

Je soupçonne que même les personnes qui débutent dans le référencement aujourd'hui ont peut-être entendu parler de Matt Cutts – le premier responsable du spam Web – car il est encore souvent référencé bien qu'il n'ait pas travaillé chez Google depuis 2014. J'ai apprécié cela Présentation 2015 qui parle de sa trajectoire de carrière chez Google.

Ère de la qualité de la recherche

Au fil du temps, en raison de la nature opposée des webmasters essayant de gagner de l'argent par rapport à Google (et d'autres) essayant de créer le meilleur moteur de recherche possible, le spam Web pur n'était pas le seul problème de qualité auquel Google était confronté. Le jeu du chat et de la souris de la manipulation de repérage – en particulier du contenu sur la page, des liens externes et du texte d'ancrage) – serait une caractéristique déterminante de la prochaine décennie de recherche.

C'est après la présentation de Singhal ci-dessus qu'Eric Schmidt (alors PDG de Google) m'a dit, «Les marques sont la solution, pas le problème… Les marques sont la façon dont vous triez le puisard».

Ceux qui sont plus récents dans le secteur auront probablement expérimenté de première main certaines mises à jour de Google (telles que les récentes «mises à jour principales») et auront probablement entendu parler de quelques mises à jour plus anciennes. Mais «Vince», qui est venu après «Florida» (la première mise à jour majeure confirmée de Google), et déployé peu de temps après les déclarations de Schmidt sur la marque, était particulièrement remarquable pour favoriser les grandes marques. Si vous n'avez pas suivi toute l'histoire, vous pouvez consulter les principales mises à jour passées ici:

Une véritable menace pour la réputation

Comme je l'ai mentionné ci-dessus dans la section AdSense, les webmasters étaient fortement incités à créer des tonnes de contenu, ciblant ainsi la longue traîne de recherche en plein essor. Si vous aviez un domaine suffisamment fort, Google explorerait et indexerait un nombre immense de pages, et pour les requêtes suffisamment obscures, tout contenu correspondant serait potentiellement classé. Cela a déclenché la croissance rapide des soi-disant «fermes de contenu» qui exploitaient les données de mots-clés de partout où elles le pouvaient et produisaient un contenu de correspondance de mots-clés de faible qualité. Dans le même temps, les sites Web réussissaient en autorisant l'indexation de grandes bases de données de contenu, même sous forme de pages très minces, ou en permettant l'indexation d'un grand nombre de pages de contenu généré par les utilisateurs.

Il s'agissait d'une véritable menace pour la réputation de Google, et est sorti de la chambre d'écho de recherche et de référencement. C'était devenu un tel bugbear des communautés comme Hacker News et StackOverflow, que Matt Cutts a soumis une mise à jour personnelle à la communauté Hacker News lorsque Google a lancé une mise à jour visant à corriger un symptôme spécifique – à savoir que les sites Web de racleurs surclassaient régulièrement le contenu original qu'ils copiaient.

Peu de temps après, Google a déployé la mise à jour initialement nommée "mise à jour des agriculteurs». Après son lancement, nous avons appris qu'il avait été rendu possible grâce à une percée d'un ingénieur appelé Panda, d'où le nom de mise à jour «big Panda» en interne chez Google, et depuis lors, la communauté SEO l'a principalement appelée la mise à jour Panda.

Bien que nous ayons émis l'hypothèse que le fonctionnement interne de la mise à jour était l'une des premières utilisations réelles de l'apprentissage automatique au cœur de l'algorithme de recherche organique de Google, les fonctionnalités qu'elle modélisait étaient plus facilement comprises comme des facteurs de qualité centrés sur l'homme, et nous a commencé recommander des changements ciblés SEO à nos clients sur la base des résultats d'enquêtes sur la qualité humaine.

Tout passe d'abord par le mobile

J'ai donné un présentation à SearchLove Londres en 2014 où j'ai parlé de la croissance et de l'ampleur incroyables du mobile et du retard avec lequel nous avons réalisé à quel point Google prenait cela au sérieux. J'ai souligné la surprise que beaucoup ont ressentie en entendant que Google concevait d'abord le mobile:

«Vers la fin de l'année dernière, nous avons lancé des améliorations de conception assez importantes pour la recherche sur les appareils mobiles et tablettes. Aujourd'hui, nous avons apporté plusieurs de ces changements à l'expérience de bureau. » – Jon Wiley (ingénieur en chef pour la recherche Google s'exprimant sur Google, ce qui signifie qu'il n'y a aucun lien vers une référence parfaite pour le devis, mais il est référencé ici ainsi que dans ma présentation).

Cette surprise est survenue malgré le fait qu'au moment où j'ai fait cette présentation en 2014, nous savions que la recherche mobile avait commencé à cannibaliser la recherche sur ordinateur (et nous avions vu la première baisse des volumes de recherche sur ordinateur):

Et cela est arrivé même si les gens commençaient à dire que la première année où Google réalisait la majorité de ses revenus sur mobile était dans moins de deux ans:

En écrivant ceci en 2020, nous avons l'impression d'avoir pleinement intégré l'importance du mobile, mais il est intéressant de se rappeler qu'il a fallu un certain temps pour que cela se concrétise.

L'apprentissage automatique devient la norme

Depuis la mise à jour de Panda, l'apprentissage automatique était de plus en plus mentionné dans les communications officielles de Google sur les mises à jour d'algorithmes, et il était impliqué dans encore plus. Nous savons que, historiquement, il y avait eu une résistance de certains milieux (y compris de Singhal) à l'utilisation de l'apprentissage automatique dans l'algorithme de base en raison de la façon dont il empêchait les ingénieurs humains d'expliquer les résultats. En 2015, Sundar Pichai a pris la relève en tant que PDG, a écarté Singhal (bien que cela puisse avoir été pour autres raisons) et installé des ventilateurs AI / ML dans des rôles clés.

Ça fait un tour complet

Avant la mise à jour de Floride (en fait, jusqu'à ce que Google déploie une mise à jour qu'ils ont appelée Fritz à l'été 2003), les résultats de recherche étaient régulièrement mélangés dans un processus surnommé le Google Dance:

La plupart des choses évoluent de plus en plus en temps réel depuis, mais les récentes «mises à jour principales» semblent avoir ramené ce type de dynamique où les changements se produisent selon le calendrier de Google plutôt que sur la base du calendrier des changements de site Web. J'ai spéculé que cela est dû au fait que les «mises à jour de base» sont en réalité en train de recycler Google sur un modèle d'apprentissage profond massif qui est très personnalisé à la forme du Web à l'époque. Quelle que soit la cause, notre expérience de travail avec un large éventail de clients est conforme à la ligne officielle de Google qui:

Les mises à jour de base générales ont tendance à se produire tous les quelques mois. Le contenu qui a été affecté par l'un d'entre eux pourrait ne pas être récupéré – en supposant que des améliorations aient été apportées – jusqu'à ce que la prochaine mise à jour générale du cœur soit publiée.

Lier les tendances récentes et les découvertes comme celle-ci à une histoire ancienne comme Google Dance n'est qu'une des façons dont la connaissance de l'histoire du référencement est «utile».

Si tout ça t'intéresse

J'espère que ce voyage à travers mes souvenirs a été intéressant. Pour ceux d'entre vous qui ont également travaillé dans l'industrie au cours de ces années, qu'est-ce que j'ai manqué? Quels sont les jalons vraiment importants dont vous vous souvenez? Déposez-les dans les commentaires ci-dessous ou contactez-moi Twitter.

Si vous avez aimé cette promenade dans le passé, vous aimerez peut-être aussi ma présentation De la bouche du cheval, où j'essaie d'utiliser des déclarations officielles et non officielles de Google pour décompresser ce qui se passe réellement dans les coulisses, et essayez de donner quelques conseils pour faire de même:



SearchLove San Diego 2018 | Will Critchlow | De la bouche du cheval: ce que nous pouvons apprendre des propres mots de Google de Distillé

Pour nous aider à mieux vous servir, veuillez envisager de participer à l'enquête Moz Blog Reader Survey 2020, qui vous demande qui vous êtes, quels sont les défis auxquels vous êtes confrontés et ce que vous aimeriez voir davantage sur le blog Moz.

Participer à l'enquête

Inscrivez-vous au Moz Top 10, un mailer bimensuel vous mettant à jour sur les dix meilleurs articles, astuces et liens rad sur le référencement découverts par l'équipe Moz. Considérez-le comme votre condensé exclusif de choses que vous n'avez pas le temps de traquer mais que vous voulez lire!