Qu’il s’agisse de faciliter et d’éclairer la prise de décision ou d’alimenter des intelligences artificielles, le big data offre un potentiel considérable pour les professionnels de la santé. Si beaucoup de chercheurs s’y intéressent de près, c’est bien parce que le big data et l’IA peuvent révolutionner les pratiques.
Mais les données de santé représentent également des données sensibles dans la majorité des cas, liées à un nombre important de contraintes réglementaires. Comment utiliser cette donnée de la manière la plus efficace possible ? Quels sont les enjeux de ce big data spécifiques au domaine de la santé ?
Les différentes typologies de data dans la santé
Les données de gestion
Dans les établissements de santé, on est amené à traiter des données dites « de gestion », qu’on trouve par ailleurs dans toutes sortes d’entreprises. Il s’agit entre autres de données de facturation, de comptabilité ou plus généralement de données qui relèvent de la gestion administrative.
Ces données, plus ou moins volumineuses en fonction notamment de la taille de la structure, peuvent être sensibles ou non selon les cas. En effet, les données de gestion peuvent parfois être confidentielles et nécessiter des précautions spécifiques. Malgré tout, en règle générale, les contraintes ne sont pas aussi importantes que dans la gestion des données de santé.
Les données de santé
Les données de santé, par définition sensibles, concernent comme leur nom l’indique la santé des patients. Elles peuvent être anonymisées ou pas, et concerner toutes sortes d’informations (des résultats d’examens, du suivi de maladies chroniques, etc.).
Bien évidemment, des réglementations très strictes viennent encadrer le traitement de ces données. En toute logique, si elles doivent être exploitées pour faire fonctionner une intelligence artificielle, il faut s’assurer qu’elles ne risquent pas d’être compromises et garantir leur confidentialité sur toute la chaîne de valeur.
D’après la CNIL, on peut parler de donnée de santé dès lors qu’une data répond à l’un de ces trois critères :
- Des informations relatives à une personne physique, collectées dans l’optique qu’elle bénéficie de soins de santé ou qu’elle accède à une prestation de services.
- Des informations liées à un test / un examen sur une quelconque partie du corps (données génétiques et échantillons biologiques inclus).
- Des informations qui concernent une maladie, un handicap, un risque de maladie, des antécédents médicaux, un traitement clinique ou l’état physiologique / biomédical d’une personne.
La gestion des données de santé : de vraies contraintes, mais aussi des opportunités
Les obligations des professionnels en matière de traitement des données de santé
Les professionnels de santé sont soumis à des obligations très strictes dès lors qu’ils doivent traiter des données de santé.
Le RGPD (règlement général pour la protection des données personnelles) interdit le traitement des données de santé, sauf dans certains cas particuliers. Dans tous les cas, le traitement de ces données, même s’il est autorisé exceptionnellement, doit faire l’objet d’une documentation complète en interne.
La CNIL exige également que l’établissement formalise les rôles des différents acteurs, renseigne le registre des activités de traitement, informe et respecte strictement le droit des personnes et garantisse la sécurité des données. Elle précise enfin qu’une analyse d’impact peut être faite si nécessaire.
L’usage de la donnée de santé pour mieux soigner, un vrai potentiel
S’il existe beaucoup de contraintes pour protéger les données de santé, celles-ci ne doivent pas freiner l’innovation dans le domaine. Car dès lors que les règles sont respectées, les données deviennent une véritable mine d’or pour améliorer la prévention, faciliter le diagnostic, ou encore administrer des soins / traitements de manière optimale.
Le big data et l’IA au service des soignants et de la qualité de leurs soins
À partir du moment où les établissements peuvent s’appuyer sur des modèles d’IA alimentés avec le big data dans les règles de l’art, ils se donnent toutes les chances de travailler plus rapidement, plus efficacement et d’innover au service des patients.
L’IA va par exemple permettre d’analyser de nombreuses données médicales, de les faire coïncider avec des tests génétiques ou encore de s’appuyer sur différents dispositifs de surveillance pour identifier des tendances, mais aussi des facteurs de risques.
Toujours grâce à l’usage d’un socle de données savamment maîtrisé, l’IA va permettre, sur la base d’algorithmes capables d’apprendre en autonomie (machine learning), d’interpréter la data et de faciliter le travail côté soignants.
On voit naître des dispositifs d’aide au diagnostic, des solutions qui vont prédire les risques ou l’exposition à certaines maladies pour améliorer la prévention, ou encore des aides concrètes pour optimiser les traitements existants. D’une manière générale, l’IA peut devenir un puissant moteur pour apporter de la performance dans le soin, aiguiller et optimiser la prise de décision, et laisser aux professionnels plus de temps pour les tâches complexes qui nécessitent davantage leur expertise.
Big data et IA dans la santé : quelques cas d’usage
Un suivi de la croissance des enfants plus précis et plus fin
En 2018, la Direction Générale de la Santé (DGS) a publié un nouveau carnet de santé avec des courbes de croissance réactualisées, rapporte l’INSERM.
Cette réactualisation des courbes de croissance repose sur la base de 1,5 million et demi de mesures réalisées sur un panel de 230 000 enfants français. Une approche big data qui s’est accompagnée d’une modélisation mathématique avancée, dans l’optique d’aboutir sur les données les plus fiables possible.
Jusqu’à cette date, on s’appuyait encore sur des informations des années 1970 pour surveiller la croissance des enfants. L’IA et le big data ont permis d’actualiser efficacement les bases de référence, en sachant que les tailles et les poids moyens des enfants ont évolué au fil des décennies.
Le suivi et la prédiction des épidémies
En France, le réseau Sentinelles créé en 1984 a été au cœur de l’actualité pendant l’épidémie de Covid-19. Ce réseau s’appuie lui aussi sur le big data, puisque près de 1 500 médecins (généralistes et pédiatres) alimentent cette plateforme en rapportant les cas de diarrhée aiguë, maladie de Lyme, oreillons, syndromes grippaux, urétrite masculine, varicelle et zona qu’ils rencontrent. Grâce à Sentinelles, on parvient à mieux suivre les pics épidémiques sur notre territoire, et à adapter les mesures préventives en fonction du contexte.
Dans le monde, d’autres dispositifs similaires sont alimentés par du big data. C’est le cas de la solution HealthMap, fruit d’une étroite collaboration entre épidémiologistes et informaticiens américains. Cette plateforme mise à jour en continu est elle aussi fondée sur de nombreuses sources de données. Elle permet aux professionnels de la santé du monde entier de suivre l’évolution d’une quantité importante de maladies différentes.
GLEAM, dans la même optique, est un simulateur utilisé pour prédire la manière dont une épidémie peut se disséminer dans le monde, sur la base des flux aériens entre les continents et les pays.
Une application d’aide au diagnostic pour le CHU de Nantes
Le CHU de Nantes et Sigma travaillent ensemble sur le projet KTDinnov. Financé par des subventions publiques, ce projet vise à prévenir la perte de greffons rénaux en révolutionnant le suivi post-transplantation.
Pour faciliter la prise de décision pour les soignants, les équipes travaillent sur la conception d’une application d’aide au diagnostic. Celle-ci vise aussi à encourager les patients à adopter une démarche active dans leur traitement, au-delà de son objectif principal d’optimisation du suivi post-transplantation.
Dans le domaine de la santé, on peut exploiter le big data dans de nombreux objectifs, avec chaque fois des défis importants en termes de confidentialité et de conformité réglementaire. En parallèle, rappelons aussi que ces innovations imposent des exigences particulièrement élevées en termes de stockage. En effet, un serveur capable de traiter du big data et d’héberger des intelligences artificielles pour la santé nécessite énormément d’énergie et de ressources pour fonctionner.
D’autres défis peuvent également se matérialiser, comme la nécessité de standardiser certaines données pour les traiter plus efficacement. Afin de répondre à tous ces défis et de tirer pleinement profit des innovations possibles, l’enjeu d’un accompagnement par des experts de la data et de l’intelligence artificielle reste incontournable.
À la une
Parcourez notre blog pour découvrir toutes nos actualités sur les thématiques data et intelligence artificielle.