Contactez-nous
Affichage des résultats
Moteurs de recherche web - Google, Bing et leurs challengers
H7240 v2 Archive

Affichage des résultats
Moteurs de recherche web - Google, Bing et leurs challengers

Auteur(s) : Olivier ANDRIEU

Date de publication : 10 mars 2017

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Définitions et données générales

2 - Système de crawl d'un moteur de recherche

3 - Moteur d'indexation

4 - Système de ranking

5 - Affichage des résultats

6 - Conclusion

7 - Glossaire et acronyme

Sommaire

Présentation

NOTE DE L'ÉDITEUR

03/04/2017

Cet article est la réédition actualisée de l’article H7240 intitulé « Moteurs de recherche web. Google, Bing et leurs challengers » paru en 2011, rédigé par le même auteur, Olivier ANDRIEU.

RÉSUMÉ

Les moteurs de recherche font partie de notre quotidien numérique et sont des carrefours essentiels pour nous permettre de rechercher de l'information sur Internet. Quels ont les principaux moteurs ? Comment fonctionnent-ils ? Cet article décrit les différentes phases de traitement de l'information par des outils comme Google ou Bing : crawl du Web, indexation des pages, analyse et utilisation de critères de pertinence in page /off page permettant de donner des notes aux documents explorés, puis affichage des résultats.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

INTRODUCTION

Les moteurs de recherche rythment la vie numérique des internautes actuels. Carrefours indispensables pour mener à bien toute investigation sur la Toile, ils ont fortement évolué depuis les premiers outils (Excite, Webcrawler, Lycos, Altavista, etc.) jusqu'au leader actuel, Google et son challenger, Bing, que bien peu de concurrents arrivent à talonner pour l'instant. Mais l'avenir sera peut-être différent. En tout état de cause, il est intéressant de se pencher sur le fonctionnement de ces outils et leur évolution au cours des années, car la connaissance de ce que l'on peut trouver « sous le capot des moteurs » peut également nous aider à mieux mener à bien nos recherches sur le Web…

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


VERSIONS

Il existe d'autres versions de cet article :

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v2-h7240

Lecture en cours
Présentation

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(237 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

5. Affichage des résultats

Bien sûr, tous les systèmes précédemment décrits dans cet article sont totalement invisibles aux internautes. Ceux-ci ne voient que le côté visible de l'iceberg :

  • le moteur d'interrogation ou interface frontale (formulaire de recherche) proposé aux utilisateurs. Plusieurs niveaux de requête (interface de recherche simple ou avancée) sont en général offerts, la recherche simple étant celle proposée par défaut ;

  • à chaque question, une requête est générée dans l'index et une page web dynamique (SERP – search engine results page) restitue les résultats, généralement sous forme de listes de 10 résultats par défaut (figure 9).

Tous les moteurs fonctionnent donc ainsi et la plupart des interfaces utilisateurs de rendu de résultats se ressemblent plus ou moins avec, pour certaines, quelques variantes notables.

5.1 Recherche universelle

Petit à petit, les moteurs font évoluer leur interface et intègrent d'autres informations, issues d'autres bases de données, comme la recherche universelle de Google, proposant des images, des articles d'actualité, des informations encyclopédiques dans le « Knowledge Graph » sur la partie droite de l'écran, etc. selon la requête demandée (figure 10).

Chaque moteur fait évoluer la présentation de ses résultats par petites touches, pour ne pas « choquer » ses utilisateurs, habitués à une interface donnée.

Il en est de même des systèmes d'autocomplétion (proposition de requêtes et/ou de résultats au fur et à mesure de la saisie de la requête par l'internaute) Google Suggest (septembre 2008) et Instant Search (septembre 2010) (figure 11).

Pourtant, de nombreux analystes estiment que les moteurs de recherche de demain pourraient proposer des pages de résultats beaucoup plus « osées », incluant 3D, cartographie ou système de type CoverFlow (similaire à ce que l'on trouve sur l'iPhone) pour faire défiler les résultats. À ce niveau, les moteurs n'ont finalement que peu évolué depuis leur création.

De plus, les prochaines années verront certainement l'arrivée de la recherche vocale, notamment sur mobile (le fait de poser une question en la vocalisant au travers de son smartphone...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Affichage des résultats

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(237 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - BRIN (S.), PAGE (L.) -   The anatomy of a large-scale hypertextual web search engine. Computer networks audISDN Systems.  -  Google http://infolab.stanford.edu/∼backrub/google.html (1998)

  • (2) - FORD (D.), GRIMES (C.), TASSONE (E.) -   Keeping a search engine index fresh : risk and optimality in estimating refresh rates for web pages.  -  Google http://www.google.com/research/pubs/archive/34570.pdf.

  • (3) - O'BRIEN (S.), GRIMES (C.) -   Microscale evolution of web pages.  -  In WWW'08 : Proceedings of the 17th International World Wide Web Conference http://www.google.com/research/pubs/archive/34428.pdf (2008).

  • (4) - GURMEET (S.M.), JAIN (A.), SARMA (A.D.) -   Detecting near-duplicates for web crawling.  -  Stanford University, Google Inc. http://research.compaq.com/SRC/mercator/papers/www10.ps.

  • (5) - NAJORK (M.), WIENER (J.L.) -   Breadth-first search crawling yields high-quality pages.  -  Compaq http://research.compaq.com/SRC/mercator/papers/www10.ps.

  • ...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(237 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

Le classement des sommets dans les réseaux

Cet article expose l’un des principaux algorithmes numériques qui, dès l’origine des moteurs de ...

Optimisation d’un site web en vue de son référencement (SEO)

Les moteurs de recherche représentent près de la moitié du trafic sur un site web en général. La bonne ...

Professionnalisation des compétences liées aux TIC - Référentiel des métiers de l'Internet

Les technologies de l'information et de la communication (TIC) accroissent la compétition dans le nouvel ...

Machine virtuelle Java (JVM)

Le succès de Java l'a promu langage de programmation sur internet. Cet article présente une architecture ...