#

Web scraping

Web scraping dans l'actualité

PublicitéDevenez annonceur

Toute l'actualité


Web scraping dans les livres blancs


Web scraping dans les conférences en ligne


Web scraping dans les ressources documentaires

  • Article de bases documentaires
  • |
  • 10 mai 2017
  • |
  • Réf : H7235

Optimisation d'un site web en vue de son référencement

Les moteurs de recherche représentent près de la moitié du trafic sur un site web en général... /2017 Cet article est la réédition actualisée de l’article H7235 intitulé « Optimisation d'un site web en vue... . Les moteurs de recherche génèrent plus d'un tiers des visites sur un site web, ce qui en fait une source... et ses concurrents. Pour cela, il est nécessaire de concevoir un site et des pages web qui soient réactifs...

Les articles de référence permettent d'initier une étude bibliographique, rafraîchir ses connaissances fondamentales, se documenter en début de projet ou valider ses intuitions en cours d'étude.

  • Article de bases documentaires
  • |
  • 10 mars 2017
  • |
  • Réf : H7240

Moteurs de recherche web

comme Google ou Bing : crawl du Web, indexation des pages, analyse et utilisation de critères de pertinence in... « Moteurs de recherche web. Google, Bing et leurs challengers » paru en 2011, rédigé par le même auteur... à bien nos recherches sur le Web… Définitions Un moteur de recherche est un ensemble de logiciels visant à créer... de l'internaute. Ces logiciels parcourent le Web, indexent automatiquement les pages visitées puis les analysent...

Les articles de référence permettent d'initier une étude bibliographique, rafraîchir ses connaissances fondamentales, se documenter en début de projet ou valider ses intuitions en cours d'étude.

  • Article de bases documentaires
  • |
  • 10 mai 2010
  • |
  • Réf : H7502

Web sémantique

Le Web sémantique propose dorénavant un saut qualitatif par rapport au Web actuel. Il permet... de connecter différentes ressources du Web (documents et données, au sens large) par des liens sémantiques... (Resource Description Framework) aide à réaliser aisément cette approche dans le Web distribué... majeur. Ces notions de Web sémantique et d'ontologie sont ainsi étroitement liées. En 1989, Tim...

Les articles de référence permettent d'initier une étude bibliographique, rafraîchir ses connaissances fondamentales, se documenter en début de projet ou valider ses intuitions en cours d'étude.

  • Article de bases documentaires : FICHE PRATIQUE
  • |
  • 21 nov. 2012
  • |
  • Réf : 1074

Surveiller des sites web avec WebSite-Watcher

Les logiciels de surveillance automatisée du web font partie du dispositif de la veille stratégique, qu’il s’agisse de veille technologique, concurrentielle ou du suivi de l’e-réputation. Ils prennent en charge cette tâche répétitive et sans grande valeur ajoutée qui consiste à surveiller les modifications sur tout type de site web, et à alerter l’utilisateur de ces changements.

Il existe dans ce domaine de nombreux outils, gratuits ou payants, et plus ou moins sophistiqués. WebSite-Watcher est l’un des logiciels les plus utilisés par les professionnels de la veille.

Cette fiche présente les principales caractéristiques de WebSite-Watcher, son mode de fonctionnement, ainsi que des conseils et astuces d’utilisation avancée. Nous verrons notamment comment ce logiciel peut répondre aux besoins des veilleurs grâce à ses nombreuses fonctionnalités, adaptées à la complexité et à l’hétérogénéité des contenus web (sites, flux, forums, contenus multimédias, etc.).

Toutes les clefs pour maitriser la veille technologique

  • Article de bases documentaires : FICHE PRATIQUE
  • |
  • 11 juin 2014
  • |
  • Réf : 1075

Connaître le fonctionnement des moteurs de recherche web

Le choix des mots clés est une étape essentielle de la recherche sur Internet. C’est en effet de ce choix que dépendra la pertinence des résultats.

Mais pour les choisir efficacement, il importe de connaître avant tout le fonctionnement des moteurs de recherche, notamment :

  • ce qu’ils interrogent réellement ;
  • ce qu’ils ignorent ;
  • les critères qu’ils utilisent pour classer les résultats.

Toutes les clefs pour maitriser la veille technologique

  • Article de bases documentaires : FICHE PRATIQUE
  • |
  • 11 juin 2014
  • |
  • Réf : 1275

Le scraping, un nouvel outil au service de la veille

Le web est un gigantesque dépôt d’informations et de données destinées à être consultées, éventuellement partagées ou commentées sur un navigateur Web. Ce dépôt est changeant, impermanent, parcellaire. Ce qu’il contient ne répond pas toujours à nos besoins, parfois un peu plus ou un peu moins, et nécessite de temps à autre un coup de neuf. Le grattage Web peut être entendu et connu sous plusieurs termes ou technologies qui pourraient refléter ce que vous cherchez :

  • screen scraping ;
  • collecte de données et collecte de données automatisée ;
  • Data Mining
  • grattage de site Web ;
  • extraction des données ;
  • données Crawling ;
  • site Web Ripper.

Toutes les clefs pour maitriser la veille technologique


INSCRIVEZ-VOUS AUX NEWSLETTERS GRATUITES !