Présentation
Auteur(s)
-
Béatrice FOENIX-RIOU : Directrice de BFR Consultants, formatrice et rédactrice en chef de BASES et NETSOURCES
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleINTRODUCTION
Nous utilisons quotidiennement les moteurs de recherche web, et pourtant leur fonctionnement est mal connu. Les moteurs classent les résultats selon des algorithmes peu transparents, et ont tendance à mettre en avant des sites souvent commerciaux et pas nécessairement pertinents.
Comment optimiser la qualité des résultats ? Comment mieux comprendre ces algorithmes de classement qui ne cessent d’évoluer ? Cette fiche fait le point sur le fonctionnement des moteurs web, notamment :
-
ce qu’ils interrogent réellement ;
-
ce qu’ils ignorent ;
-
les critères qu’ils utilisent pour classer les résultats.
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Management et ingénierie de l'innovation
(450 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Des modules pratiques
Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
5. À quoi correspond la version « en cache » des pages web ?
La collecte des contenus des pages par les robots ne peut s’effectuer en temps réel, pour des raisons techniques. Les réponses fournies par le moteur peuvent correspondre à des versions des pages datant d’il y a un jour ou deux, ou parfois un peu plus. Cela dépend de la fréquence des visites par le robot sur le site et de la fréquence de mise à jour du site lui-même.
Ce mode de fonctionnement explique pourquoi vous obtenez quelquefois, en cliquant sur certains résultats, l’horripilant message « Error 404, page not found », ou encore pourquoi, en cliquant sur le titre d’un résultat dont l’extrait vous a semblé pertinent, vous affichez une page dans laquelle les mots de la requête ont disparu…
Cela signifie que depuis le passage du robot, la page a été effacée, a changé d’emplacement sur le site, ou encore que son contenu a été mis à jour.
La version « en cache » offerte par certains moteurs comme Google ou Bing prend alors toute sa valeur. On y accède à partir du minuscule triangle vert qui figure à droite de l’URL de chaque page dans la liste des résultats. En cliquant sur « En cache », on a accès à une reproduction de la page telle qu’elle était lors de la dernière visite du robot.
On peut également activer la version « en cache » en saisissant l’opérateur « cache » suivi de l’URL du site concerné. Exemple : cache:https://www.techniques-ingenieur.fr/
Si l’on souhaite remonter plus loin dans le temps, on peut utiliser la « Wayback machine », service d’archivage de pages web indépendant des moteurs web classiques et créé par la fondation Internet Archive. À partir de l’URL d’une page web, on pourra retrouver des versions antérieures de la page (avec néanmoins une part d’aléatoire).
Cet article fait partie de l’offre
Management et ingénierie de l'innovation
(450 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Des modules pratiques
Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
À quoi correspond la version « en cache » des pages web ?
Cet article fait partie de l’offre
Management et ingénierie de l'innovation
(450 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Des modules pratiques
Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive