#

Fouille de données

Fouille de données dans actualités

PublicitéDevenez annonceur

Toute l'actualité


Fouille de données dans les livres blancs


Fouille de données dans les conférences en ligne


Fouille de données dans les ressources documentaires

  • Article de bases documentaires
  • |
  • 10 févr. 2017
  • |
  • Réf : H6040

Introduction au Big Data

L’objet de cet article est de cerner ce terme Big Data ou mégadonnées. Dans un premier temps, les mégadonnées sont caractérisées au travers du modèle des 3V étendu au 5V. La problématique des mégadonnées est distinguée de celle de l’informatique décisionnelle. Les enjeux économiques et sociétaux associés aux mégadonnées sont abordés en présentant différents exemples d’usage relevant de différents domaines d’activité. Sont ensuite introduites différentes grandes méthodes et techniques associées au stockage et à l’exploitation/analyse de ces mégadonnées.

  • Article de bases documentaires
  • |
  • 10 nov. 2015
  • |
  • Réf : H7245

Systèmes de recommandation

Cet article a pour objectif de présenter les fondements des systèmes de recommandation. Ces systèmes sont très développés aujourd'hui, mais demeurent au final peu visibles, l'utilisateur ne percevant que le résultat, à savoir une liste de suggestions. Les champs d'application de ces systèmes de recommandation sont divers et variés (suggestion de films, de produits marchands, de services...).Cet article présente les champs d'application les plus représentatifs. Les différentes dimensions (culturelles, légales ainsi qu'algorithmiques) sont également abordées sans oublier le niveau implantation au travers de différents outils tels qu'Excel, PHP ou encore java/Mahout.

  • Article de bases documentaires
  • |
  • 10 nov. 2016
  • |
  • Réf : H7270

Analyse automatique d’opinions

Le Web est devenu une source d’information incontournable grâce à la quantité et à la diversité des contenus textuels porteurs d’opinions générés par les internautes. Ces contenus sont multiples : blogs, commentaires, forums, réseaux sociaux, etc. Devant cette abondance de données, le développement d’outils pour extraire, synthétiser et comparer les opinions exprimées sur un sujet donné devient crucial. Cet article dresse un panorama des principales approches en analyse automatique d’opinions. Trois questions fondamentales sont abordées : comment reconnaître les portions de textes qui renseignent l’utilisateur sur l’opinion qu’il recherche ? Comment évaluer la polarité des opinions qui en ressortent ? Comment présenter le résultat de manière pertinente à l’utilisateur ?

  • Article de bases documentaires : FICHE PRATIQUE
  • |
  • 10 déc. 2014
  • |
  • Réf : 1273

L’analyse sémantique des informations avec le moteur Noopsis

La simple mise à disposition de la connaissance, sans traitement particulier, rend cette dernière floue et inexploitable. Noopsis, outil de collecte développé par une entreprise normande, permet de collecter un grand volume d’information et interprète le sens grâce à son moteur de traitement sémantique. Il permet également de réaliser un premier traitement de l’information collectée avant que celle-ci ne soit analysée par le veilleur.

  • Comment Noopsis fonctionne-t-il ?
  • Quels types d’information peut-on collecter ?
  • À quoi peut servir ce traitement sémantique pour le veilleur ?

Cette fiche répondra à ces questions à travers des exemples.

  • Article de bases documentaires : FICHE PRATIQUE
  • |
  • 27 août 2014
  • |
  • Réf : 1350

Analyse de l’information documentaire structurée

Le recueil des nombreuses informations proposées par les bases de données scientifiques nécessite de s’appuyer sur des outils permettant l’analyse automatique de ces informations. La majorité des bases de données commerciales offrent un format de téléchargement qui structure l’information (même format pour toutes les références).

A partir de celui-ci, on peut combiner l’ensemble des données présentes dans les différents champs documentaires et créer des listes, des réseaux, des matrices. Cette information élaborée permettra de répondre aux questions « qui fait quoi », « où », « comment », « quand », « avec qui » et ainsi de définir de nouvelles orientations scientifiques, d’implémenter les processus d’innovation, de trouver des partenariats, de réaliser le « benchmarking » d’auteurs et d’institutions, etc.

Compte tenu du nombre croissant d’informations accessibles, cette méthode de travail est la seule qui permette d’avoir en un minimum de temps une information pertinente et stratégique sur un sujet donné.

  • Article de bases documentaires : FICHE PRATIQUE
  • |
  • 20 janv. 2015
  • |
  • Réf : 1404

Datavisualisation, outil d’exploitation et d’exploration des données

Les données se multiplient à tel point qu’après le risque lié à l’infobésité, apparaît aujourd’hui à l’opposé l’opportunité du big data. Mais que peut donc bien faire un être humain de « big data » ? Pour donner du sens à cette masse de données informe, il a besoin d’outils de traitement et d’aide à l’analyse des données.

Les méthodes et outils de datavisualisation permettent à l’analyste de traiter des masses de données en appliquant des algorithmes statistiques et en limitant les biais cognitifs. Tout en rationalisant et enrichissant la donnée, les outils logiciels permettent également d’offrir des interfaces d’exploration dynamique des corpus de données chiffrées ou textuelles.


INSCRIVEZ-VOUS AUX NEWSLETTERS GRATUITES !