Contactez-nous
Visualiser les données
Datavisualisation, outil d’exploitation et d’exploration des données
FIC1404 v1 Fiche pratique

Visualiser les données
Datavisualisation, outil d’exploitation et d’exploration des données

Auteur(s) : Véronique MESGUICH

Date de publication : 10 oct. 2021 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Définir son besoin

2 - Identifier les données

3 - Préparer les données

4 - Visualiser les données

5 - Notre conseil

  • 5.1 - Prenez soin de vérifier vos données
  • 5.2 - Prenez le temps de formaliser votre modèle de données entités/relations

6 - Erreurs à éviter

  • 6.1 - Ne travaillez pas avec de la donnée brute
  • 6.2 - Ne commencez pas à travailler sur des données avant de savoir ce que vous y recherchez
  • 6.3 - N’enfermez pas vos données

Sommaire

Présentation

Auteur(s)

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

Dès qu’il s’agit des données, les chiffres atteignent rapidement des sommets vertigineux : selon le cabinet IDC, la taille de l’univers numérique devrait atteindre 175 zettabytes de données d’ici 2025.

Le big data se caractérise par la règle des 3V : volume, variété, vitesse, auxquels on peut rajouter 2 autres V : valeur et visualisation. En effet, prise individuellement, une donnée ne vaut rien… C’est l’analyse, à travers la datavisualisation, qui va apporter de la valeur ajoutée en créant de l’intelligence et du savoir.

Les méthodes et outils de datavisualisation permettent ainsi au veilleur-analyste de traiter des masses de données en appliquant des algorithmes statistiques et en limitant les biais cognitifs. Tout en rationalisant et enrichissant les données, les outils logiciels permettent également d’offrir des interfaces d’exploration dynamique des corpus de données chiffrées ou textuelles.

Cette fiche propose une approche orientée « méthodes » de la datavisualisation en présentant les différentes étapes : analyse du besoin, identification des données, préparation, choix des métriques.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-fic1404

Lecture en cours
Présentation

Article inclus dans l'offre

"Management et ingénierie de l'innovation"

(450 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

4. Visualiser les données

Une fois les données préparées, il faudra passer à la phase visualisation.

Nous ferons ici un focus sur les données relationnelles, car elles semblent les plus intéressantes à traiter d’un point de vue dataviz.

Pour visualiser la donnée, deux choses sont essentielles :

  • disposer de métriques applicables aux entités et aux relations entre les entités ;

  • pouvoir les positionner les unes par rapport aux autres.

4.1 Disposer de métriques applicables aux entités et aux relations entre les entités

Dans une dataviz, chaque indicateur est porteur de sens.

Dans la figure « Exemple du dataset et du modèle de données d’analyse des conversations Twitter », label, followed et followers sont extraits de la base de données Twitter. La métrique « nombre de tweets » est par ailleurs calculée à partir des messages extraits et filtrés sur les mots-clés du périmètre. Des éléments de calcul matriciel (modularité et eigenvector ou vecteur propre) sont calculés par le logiciel et viennent enrichir la donnée brute extraite. Une table complémentaire permet de calculer les interactions entre les tables ; elle est calculée à partir des messages et des interactions matérialisées (retweet et mentions).

Sur la dataviz (cf. figure « Vue d’ensemble d’un réseau d’échanges de tweets »), chaque point représente un compte Twitter, les relations entre les comptes ont un sens (X parle à Y dans le sens des aiguilles d’une montre pour la courbe les reliant), les couleurs représentent les clusters ou communautés calculés, la taille de chaque point traduit sa centralité et l’épaisseur des liens ainsi que le nombre de messages échangés.

La figure « Focus sur les échanges de tweets autour du ministère de la Santé du Paraguay » fait un zoom plus détaillé des clusters (regroupements) générés par la datavisualisation : on distingue un cluster couleur brique autour du ministère de la Santé Paraguay et un cluster orange pour les sites médias et sites d’informations. L’intensité des relations se distingue clairement à travers l’épaisseur des liens. Les liaisons bidirectionnelles autour du compte du ministère de la Santé au Paraguay (MSALUDPY) montrent clairement une stratégie de discussion...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Visualiser les données

Article inclus dans l'offre

"Management et ingénierie de l'innovation"

(450 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

    1 Bibliographie

    • Lima M., Cartographie des réseaux. Eyrolles.

    • Tufte E., Beautiful evidence. Graphics Press.

    • Tufte E., Envisioning information. Graphics Press.

    • Rendgen S. et Wiedemann, Information Graphics. Taschen.

    • DataFLow1 et 2.Gestalten.

    • Yau N., Data visualization. Eyrolles.

    HAUT DE PAGE

    2 Sites Internet

    Information is beautiful

    Site de référence sur les datavisualisations les plus originales et les plus innovantes, incluant régulièrement des outils logiciels émergents et utiles à la fois pour l’extraction, le traitement et la visualisation des données.

    Flowing Data

    Blog de référence sur la datavisualisation et le traitement des données.

    Visualising data

    Présentation de nombreux projets de dataviz et retour sur leur réalisation

    HAUT DE PAGE
    Logo Techniques de l'Ingenieur

    Cet article est réservé aux abonnés.
    Il vous reste 95 % à découvrir.

    Pour explorer cet article Consulter l'extrait gratuit

    Déjà abonné ?


    Article inclus dans l'offre

    "Management et ingénierie de l'innovation"

    (450 articles)

    Une base complète d’articles

    Actualisée et enrichie d’articles validés par nos comités scientifiques.

    Des contenus enrichis

    Quiz, médias, tableaux, formules, vidéos, etc.

    Des modules pratiques

    Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

    Des avantages inclus

    Un ensemble de services exclusifs en complément des ressources.

    Voir l'offre