Présentation

Article

1 - DÉFINIR SON BESOIN

2 - IDENTIFIER LES DONNÉES

3 - PRÉPARER LES DONNÉES

4 - VISUALISER LES DONNÉES

5 - NOTRE CONSEIL

  • 5.1 - Prenez soin de vérifier vos données
  • 5.2 - Prenez le temps de formaliser votre modèle de données entités/relations

6 - ERREURS À ÉVITER

  • 6.1 - Ne travaillez pas avec de la donnée brute
  • 6.2 - Ne commencez pas à travailler sur des données avant de savoir ce que vous y recherchez
  • 6.3 - N’enfermez pas vos données

Fiche pratique | Réf : FIC1404 v1

Visualiser les données
Datavisualisation, outil d’exploitation et d’exploration des données

Auteur(s) : Véronique MESGUICH

Date de publication : 10 oct. 2021 | Read in English

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

Auteur(s)

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

Dès qu’il s’agit des données, les chiffres atteignent rapidement des sommets vertigineux : selon le cabinet IDC, la taille de l’univers numérique devrait atteindre 175 zettabytes de données d’ici 2025.

Le big data se caractérise par la règle des 3V : volume, variété, vitesse, auxquels on peut rajouter 2 autres V : valeur et visualisation. En effet, prise individuellement, une donnée ne vaut rien… C’est l’analyse, à travers la datavisualisation, qui va apporter de la valeur ajoutée en créant de l’intelligence et du savoir.

Les méthodes et outils de datavisualisation permettent ainsi au veilleur-analyste de traiter des masses de données en appliquant des algorithmes statistiques et en limitant les biais cognitifs. Tout en rationalisant et enrichissant les données, les outils logiciels permettent également d’offrir des interfaces d’exploration dynamique des corpus de données chiffrées ou textuelles.

Cette fiche propose une approche orientée « méthodes » de la datavisualisation en présentant les différentes étapes : analyse du besoin, identification des données, préparation, choix des métriques.

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-fic1404


Cet article fait partie de l’offre

Management et ingénierie de l'innovation

(450 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation

4. Visualiser les données

Une fois les données préparées, il faudra passer à la phase visualisation.

Nous ferons ici un focus sur les données relationnelles, car elles semblent les plus intéressantes à traiter d’un point de vue dataviz.

Pour visualiser la donnée, deux choses sont essentielles :

  • disposer de métriques applicables aux entités et aux relations entre les entités ;

  • pouvoir les positionner les unes par rapport aux autres.

4.1 Disposer de métriques applicables aux entités et aux relations entre les entités

Dans une dataviz, chaque indicateur est porteur de sens.

Dans la figure « Exemple du dataset et du modèle de données d’analyse des conversations Twitter », label, followed et followers sont extraits de la base de données Twitter. La métrique « nombre de tweets » est par ailleurs calculée à partir des messages extraits et filtrés sur les mots-clés du périmètre. Des éléments de calcul matriciel (modularité et eigenvector ou vecteur propre) sont calculés par le logiciel et viennent enrichir la donnée brute extraite. Une table complémentaire permet de calculer les interactions entre les tables ; elle est calculée à partir des messages et des interactions matérialisées (retweet et mentions).

Sur la dataviz (cf. figure « Vue d’ensemble d’un réseau d’échanges de tweets »), chaque point représente un compte Twitter, les relations entre les comptes ont un sens (X parle à Y dans le sens des aiguilles d’une montre pour la courbe les reliant), les couleurs représentent les clusters ou communautés calculés, la taille de chaque point traduit sa centralité et l’épaisseur des liens ainsi que le nombre de messages échangés.

La figure « Focus sur les échanges de tweets autour du ministère de la Santé du Paraguay » fait un zoom plus détaillé des clusters (regroupements) générés par la datavisualisation : on distingue un cluster couleur brique autour du ministère de la Santé Paraguay et un cluster orange pour les sites médias et sites d’informations. L’intensité des relations se distingue clairement à travers l’épaisseur des liens. Les liaisons bidirectionnelles autour du compte du ministère de la Santé au Paraguay (MSALUDPY) montrent clairement une stratégie de discussion...

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Management et ingénierie de l'innovation

(450 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Visualiser les données
Sommaire
Sommaire

    1 Bibliographie

    • Lima M., Cartographie des réseaux. Eyrolles.

    • Tufte E., Beautiful evidence. Graphics Press.

    • Tufte E., Envisioning information. Graphics Press.

    • Rendgen S. et Wiedemann, Information Graphics. Taschen.

    • DataFLow1 et 2.Gestalten.

    • Yau N., Data visualization. Eyrolles.

    HAUT DE PAGE

    2 Sites Internet

    Information is beautiful

    Site de référence sur les datavisualisations les plus originales et les plus innovantes, incluant régulièrement des outils logiciels émergents et utiles à la fois pour l’extraction, le traitement et la visualisation des données.

    Flowing Data

    Blog de référence sur la datavisualisation et le traitement des données.

    Visualising data

    Présentation de nombreux projets de dataviz et retour sur leur réalisation

    HAUT DE PAGE

    Cet article est réservé aux abonnés.
    Il vous reste 93% à découvrir.

    Pour explorer cet article
    Téléchargez l'extrait gratuit

    Vous êtes déjà abonné ?Connectez-vous !


    L'expertise technique et scientifique de référence

    La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
    + de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
    De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

    Cet article fait partie de l’offre

    Management et ingénierie de l'innovation

    (450 articles en ce moment)

    Cette offre vous donne accès à :

    Une base complète d’articles

    Actualisée et enrichie d’articles validés par nos comités scientifiques

    Des services

    Un ensemble d'outils exclusifs en complément des ressources

    Des modules pratiques

    Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

    Doc & Quiz

    Des articles interactifs avec des quiz, pour une lecture constructive

    ABONNEZ-VOUS