Contactez-nous
À quoi correspond la version « en cache » des pages web ?
Connaître le fonctionnement des moteurs de recherche web
FIC1075 v1 Fiche pratique

À quoi correspond la version « en cache » des pages web ?
Connaître le fonctionnement des moteurs de recherche web

Auteur(s) : Béatrice FOENIX-RIOU

Date de publication : 10 juil. 2022 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Quels sont les principes de fonctionnement des moteurs de recherche ?

2 - Qu’est-ce que la notion de web invisible ?

3 - Comment les résultats de recherche sont-ils classés par le moteur ?

4 - Comment les résultats d’une recherche sont-ils présentés ?

5 - À quoi correspond la version « en cache » des pages web ?

6 - Notre conseil

  • 6.1 - Comparez les résultats des différents moteurs de recherche

7 - Erreurs à éviter

  • 7.1 - Ne vous limitez pas à la première page de résultats de Google
  • 7.2 - Ne vous limitez pas aux moteurs généralistes

8 - Abréviations et acronymes

Sommaire

Présentation

Auteur(s)

  • Béatrice FOENIX-RIOU : Directrice de BFR Consultants, formatrice et rédactrice en chef de BASES et NETSOURCES

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

Nous utilisons quotidiennement les moteurs de recherche web, et pourtant leur fonctionnement est mal connu. Les moteurs classent les résultats selon des algorithmes peu transparents, et ont tendance à mettre en avant des sites souvent commerciaux et pas nécessairement pertinents.

Comment optimiser la qualité des résultats ? Comment mieux comprendre ces algorithmes de classement qui ne cessent d’évoluer ? Cette fiche fait le point sur le fonctionnement des moteurs web, notamment :

  • ce qu’ils interrogent réellement ;

  • ce qu’ils ignorent ;

  • les critères qu’ils utilisent pour classer les résultats.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-fic1075

Lecture en cours
Présentation

Article inclus dans l'offre

"Management et ingénierie de l'innovation"

(450 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

5. À quoi correspond la version « en cache » des pages web ?

La collecte des contenus des pages par les robots ne peut s’effectuer en temps réel, pour des raisons techniques. Les réponses fournies par le moteur peuvent correspondre à des versions des pages datant d’il y a un jour ou deux, ou parfois un peu plus. Cela dépend de la fréquence des visites par le robot sur le site et de la fréquence de mise à jour du site lui-même.

Ce mode de fonctionnement explique pourquoi vous obtenez quelquefois, en cliquant sur certains résultats, l’horripilant message « Error 404, page not found », ou encore pourquoi, en cliquant sur le titre d’un résultat dont l’extrait vous a semblé pertinent, vous affichez une page dans laquelle les mots de la requête ont disparu…

Cela signifie que depuis le passage du robot, la page a été effacée, a changé d’emplacement sur le site, ou encore que son contenu a été mis à jour.

La version « en cache » offerte par certains moteurs comme Google ou Bing prend alors toute sa valeur. On y accède à partir du minuscule triangle vert qui figure à droite de l’URL de chaque page dans la liste des résultats. En cliquant sur « En cache », on a accès à une reproduction de la page telle qu’elle était lors de la dernière visite du robot.

On peut également activer la version « en cache » en saisissant l’opérateur « cache » suivi de l’URL du site concerné. Exemple : cache:https://www.techniques-ingenieur.fr/

Si l’on souhaite remonter plus loin dans le temps, on peut utiliser la « Wayback machine », service d’archivage de pages web indépendant des moteurs web classiques et créé par la fondation Internet Archive. À partir de l’URL d’une page web, on pourra retrouver des versions antérieures de la page (avec néanmoins une part d’aléatoire).

HAUT DE PAGE
Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
À quoi correspond la version « en cache » des pages web ?

Article inclus dans l'offre

"Management et ingénierie de l'innovation"

(450 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire
    Logo Techniques de l'Ingenieur

    Cet article est réservé aux abonnés.
    Il vous reste 94 % à découvrir.

    Pour explorer cet article Consulter l'extrait gratuit

    Déjà abonné ?


    Article inclus dans l'offre

    "Management et ingénierie de l'innovation"

    (450 articles)

    Une base complète d’articles

    Actualisée et enrichie d’articles validés par nos comités scientifiques.

    Des contenus enrichis

    Quiz, médias, tableaux, formules, vidéos, etc.

    Des modules pratiques

    Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

    Des avantages inclus

    Un ensemble de services exclusifs en complément des ressources.

    Voir l'offre