Contactez-nous
Big data dans la santé en 5 lettres
Le domaine de la santé face aux enjeux du big data
MED4050 v1 Article de référence

Big data dans la santé en 5 lettres
Le domaine de la santé face aux enjeux du big data

Auteur(s) : Pierre-Antoine GOURRAUD

Relu et validé le 03 juin 2025 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Contexte des données biomédicales

2 - Big data dans la santé en 5 lettres

  • 2.1 - V de Variété et de Variabilité des données dans la santé
  • 2.2 - N des Nombres auxquels le big data dans la santé nous confronte
  • 2.3 - C de Catégories utilisées, créées et disparaissant dans les données biomédicales
  • 2.4 - Données de santé marquées par des incertitudes mesurées : P de Probabilité
  • 2.5 - T de Temps long des données de santé

3 - Rupture dans l’accès à des données pour de multiples usages

Sommaire

Présentation

RÉSUMÉ

Dans cet article, il est question de la rupture quantitative dans l’accès aux données en examinant les spécificités du domaine biomédical. Les spécificités des données dans le domaine de la santé sont interrogées à l’aide d’un moyen mnémotechnique de 5 lettres : V, N, C, P, T. « V » de Variabilité, « N » des grands et des petits Nombres, « C » des Catégories diagnostiques changeantes, « P » pour la nature Probabiliste des évènements en santé et le « T » pour leur inscription dans des Temps longs. Ces caractéristiques des données de santé sont autant de défis pour le futur d’une médecine devient plus « 4P » : une médecine prédictive, personnalisée, préventive et participative.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Pierre-Antoine GOURRAUD : Professeur des universités Praticien Hospitalier - Nantes Université, CHU, INSERM,Centre de Recherche en Transplantation et Immunologie, UMR 1064, ATIP-Avenir , Nantes, France - CHU de Nantes, INSERM, CIC 1413, Pôle Hospitalo-Universitaire 11 : Santé Publique, Clinique des données, Nantes, France

INTRODUCTION

L’arrivée du « big data » dans la santé, coïncide avec l’émergence d’une médecine dite « de précision » , c’est-à-dire une médecine où l’objectif est de mieux prendre en compte les patients à la fois dans leur globalité de leur pathologie et dans leur particularité individuelle. La HAS (Haute Autorité de Santé) parle de la règle des 5B  autrement dit « administrer le Bon médicament, à la Bonne dose, sur la Bonne voie, au Bon moment, au Bon patient ». La double facilité d’accéder à des données objectives et de lancer un calcul à la volée caractéristique du « big data » est un des moteurs de cette médecine de précision. Elle est de plus en plus envisageable de par la digitalisation des données de santé qui deviennent de plus en plus présentes dans le soin et le traitement des patients. Néanmoins, si le domaine médical, comme d’autres avant lui, est appelé à se transformer grâce à des calculs à la demande réalisés sur des données devenues plus accessibles car digitalisées, il convient de s’interroger sur le substrat même d’une révolution du big data réelle ou supposée. En effet c’est d’abord la nature des données auxquelles on a nouvellement accès de manière massive (big data) qui contient les usages, les espoirs et les limites de l’émergence de la nouvelle médecine à l’ère du big data. Cet article met en avant cinq caractéristiques des données de santé pour comprendre les enjeux du big data en santé et rendre concrètement possibles de multiples applications dans ce domaine.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


2. Big data dans la santé en 5 lettres

2.1 V de Variété et de Variabilité des données dans la santé

Une des spécificités les plus importantes du big data en santé est le V. Ce V est même double :

  1. les données de santé sont marquées par leur extrême diversité : c’est le « V » de Variété des données de santé ;

  2. elles sont aussi marquées par leur nature changeante, c’est le « V » de Variabilité des données de santé.

Cette grande variété et la variabilité des phénomènes sont observées en santé lors d’un évènement de santé ou lors de son suivi. Une consultation ou un séjour dans un établissement de santé génère un grand nombre de données différentes produites et agrégées telles que données cliniques, prescriptions, consommation médicamenteuse, examens complémentaires, interprétation clinique, imagerie, informations biologiques, génétiques… Par nature, les données de santé sont d’une grande diversité technique. Elles proviennent de l’imagerie (IRM), des analyses biologiques (NFS), de l’examen clinique conduit par un praticien, de l’immunologie, ainsi que des déterminants sociaux et démographiques associés à la santé (exposition à des polluants ou à des facteurs de risque), qui, eux aussi, conditionnent l’évolution des problèmes de santé. La variété des données de santé est particulièrement grande, notamment si l’on compare à l’application du big data dans d’autres domaines qui connaissent de la même manière une massification des données collectées relativement homogènes.

Dans le « V » variabilité, les phénomènes de santé eux-mêmes variables sont entre des sujets différents (inter-variabilité) mais aussi chez un même sujet (intra-variabilité) au cours du temps. La variabilité est au cœur de la pensée du vivant. Penser le vivant, c’est penser la diversité du vivant.

Cette variabilité est illustrée par n’importe quelle variable biologique prise seule ou en en combinaison, par l’exemple du taux de fer dans le sang. Le fer est un paramètre biologique extrêmement important dans de nombreuses fonctions de l’organisme notamment dans la production d’hématies....

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Big data dans la santé en 5 lettres

Article inclus dans l'offre

"Smart city - Ville intelligente et durable"

(90 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - COLLINS (F.) -   Building the Precision Medicine Initiative National Research Cohort – The Time is Now.  -  National Institute of Health (2015). https://www.nih.gov/about-nih/who-we-are/nih-director/statements/building-precision-medicine-initiative-national-research-cohort-time-now

  • (2) - Haute autorité de santé -   Outils de sécurisation et d’auto-évaluation de l’administration des médicaments  -  (2013). http://www.has-sante.fr/upload/docs/application/pdf/2011-11/guide outil securisation autoevaluation medicaments complet 2011-11-17 10-49-21 885.pdf?bcsi scan B00125306A6CF17E=0&bcsi scan filename=guide outil securisation autoevalusation medicaments complet 2011-11-17 10-49-21 885.pdf

  • (3) - CAMBON-THOMSEN (A.), DUCOURNAU (P.), GOURRAUD (P.A.), PONTILLE (D.) -   Biobanks for genomics and genomics for biobanks.  -  Comp Funct Genomics, 4(6) ; 628-634. doi:10.1002/cfg.333 (2003).

  • (4) - RODEN (D.M.), TYNDALE (R.F) -   Genomic Medicine, Precision Medicine, Personalized Medicine: What’s in a Name?  -  PMC – US National Library of Medicine. National Institute of Health (2013). https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3965175/

  • ...

NORMES

  • Classification Statistique Internationale des Maladies et des Problèmes de Santé Connexes par l’Organisation Mondiale de la Santé (OMS) : https://icd.who.int/browse10/2008/fr - CIM10 -

  • Exemple de normes en informatique médicale ; il s’agit de spécifications techniques pour les échanges informatisés de données cliniques, mais aussi administratives et financière entre établissements de soins (systèmes d’information hospitaliers – SIH). Ces spécifications sont en partie intégrées dans les normes américaines (ANSI) et internationales (ISO) https://www.hl7.org/implement/standards/ - HL7 -

  • Le modèle de données commun (Common Data Model CDM) de l’Observational Medical Outcomes Partnership (OMOP) permet de saisir les informations (par exemple, les rencontres, les patients, les prestataires, les diagnostics, les médicaments, les mesures et les procédures) de la même manière dans différentes institutions. L'objectif d’un CDM est de normaliser le format et le contenu des données d’observation afin que des applications, des outils et des méthodes normalisées puissent être appliqués à différents ensembles de données. https://www.ohdsi.org/data-standardization/the-common-data-model/ - OMOP -

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Smart city - Ville intelligente et durable"

(90 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

RDISK : une architecture reconfigurable pour l'exploration des banques génomiques

L'architecture RDISK est un système prototype composé d'un cluster de 48 nœuds spécialisés comprenant ...

Stratégies et organisations numériques et collaboratives des entreprises

Cet article vise à dresser un bilan provisoire des avancées de la digitalisation des métiers de la ...

Qualité des données

Cet article présente la problématique et les défis liés à l’évaluation et l’amélioration de la qualité ...

Séquençage à haut débit - Outils et enjeux pour la santé humaine

Le séquençage à haut débit est l’une des révolutions biotechnologiques depuis 2010. En 2019, le génome ...