Présentation
Auteur(s)
-
Véronique MESGUICH : Consultante formatrice en veille stratégique
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleINTRODUCTION
Dès qu’il s’agit des données, les chiffres atteignent rapidement des sommets vertigineux : selon le cabinet IDC, la taille de l’univers numérique devrait atteindre 175 zettabytes de données d’ici 2025.
Le big data se caractérise par la règle des 3V : volume, variété, vitesse, auxquels on peut rajouter 2 autres V : valeur et visualisation. En effet, prise individuellement, une donnée ne vaut rien… C’est l’analyse, à travers la datavisualisation, qui va apporter de la valeur ajoutée en créant de l’intelligence et du savoir.
Les méthodes et outils de datavisualisation permettent ainsi au veilleur-analyste de traiter des masses de données en appliquant des algorithmes statistiques et en limitant les biais cognitifs. Tout en rationalisant et enrichissant les données, les outils logiciels permettent également d’offrir des interfaces d’exploration dynamique des corpus de données chiffrées ou textuelles.
Cette fiche propose une approche orientée « méthodes » de la datavisualisation en présentant les différentes étapes : analyse du besoin, identification des données, préparation, choix des métriques.
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Management et ingénierie de l'innovation
(450 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Des modules pratiques
Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
3. Préparer les données
Il est illusoire de penser que les données trouvées dans les différentes sources seront prêtes à l’emploi.
L’analyste devra appliquer plusieurs traitements successifs :
-
contrôle des aberrations et des extrêmes avec suppression éventuelle ;
-
homogénéisation des données lorsque cela est possible (qu’il s’agisse de données chiffrées à convertir ou de noms à uniformiser par exemple) ; cf. figure « Exemple de traitement d’homogénéisation des noms proposé par Open Refine ». Open Refine est un outil qui permet de retraiter les données, de les uniformiser, ou de les dédoublonner ;
-
structuration des données en exploitant par exemple des solutions de segmentation (Web scrapping) ou d’extraction d’entités nommées ;
-
exploitation des données (traitements statistiques, spatialisation, exploration, analyse).
On constate ainsi que la représentation graphique des données est un simple élément à l’intérieur d’une démarche plus globale, qui vise à rendre les données exploitables de façon graphique.
La phase la plus importante est surtout celle de la structuration des données : elle devra permettre de représenter les relations entre des entités qui figureront sur la carte. Cette étape est essentielle, surtout pour préserver la richesse des données et mener une exploitation efficace sous un angle relationnel.
Prenons un exemple très simple : un e-mail écrit par M. Durand à M. Dupont en destinataire principal et M. Martin en copie. Il va falloir imaginer structurer la donnée recueillie (une base d’e-mails) afin de matérialiser ces échanges. Les modalités de la structuration seront définies à partir d’un questionnement. On se demandera, par exemple, comment scorer la relation. Un destinataire non principal doit-il se voir attribuer la même intensité sur la relation ? Quel est le sens de la relation ? Ensuite, en fonction de chaque e-mail traité et recueilli, il faudra consolider les relations entre les entités (ici les émetteurs et destinataires).
Les relations et liens entre les entités à représenter peuvent bien entendu être beaucoup plus complexes : il peut s’agit de personnes se côtoyant au sein d’une entreprise ou d’un cercle d’influence, de co-déposants autour d’un...
Cet article fait partie de l’offre
Management et ingénierie de l'innovation
(450 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Des modules pratiques
Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Préparer les données
DANS NOS BASES DOCUMENTAIRES
ANNEXES
-
Lima M., Cartographie des réseaux. Eyrolles.
-
Tufte E., Beautiful evidence. Graphics Press.
-
Tufte E., Envisioning information. Graphics Press.
-
Rendgen S. et Wiedemann, Information Graphics. Taschen.
-
DataFLow1 et 2.Gestalten.
-
Yau N., Data visualization. Eyrolles.
Site de référence sur les datavisualisations les plus originales et les plus innovantes, incluant régulièrement des outils logiciels émergents et utiles à la fois pour l’extraction, le traitement et la visualisation des données.
Blog de référence sur la datavisualisation et le traitement des données.
Présentation de nombreux projets de dataviz et retour sur leur réalisation
HAUT DE PAGECet article fait partie de l’offre
Management et ingénierie de l'innovation
(450 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Des modules pratiques
Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive