Faut-il (vraiment) faire du machine learning sur les données de santé ?

Travaillant dans le secteur de la santé, nous nous sommes demandé s’il est devenu trop courant d’entendre : « On pourrait faire du machine learning sur les données de santé… ». La proposition semble prometteuse, avec un côté moderne, voire incontournable (et c’est sans parler d’IA génératives qui attirent beaucoup d’attention, on parle ici du machine learning « traditionnel »). Et pourtant… trop souvent, ces projets sont lancés sans réel besoin défini, ni question précise à résoudre. Comme si le simple fait d’utiliser un modèle complexe était en soi un gage de valeur ajoutée.

Nous avons appris au fil des projets que le machine learning n’a de sens que s’il est ancré dans un besoin de terrain, dans un besoin bien formulé. Le risque est que le résultat soit déceptif pour tout le monde, et que personne ne s’empare des résultats.

C’est ce que nous souhaitons partager dans cet article. Nous allons donc poser une question simple :

À quoi ça sert vraiment de faire du machine learning en santé ?

Nous verrons pourquoi l’engouement est réel (et souvent justifié), mais aussi pourquoi il faut rester lucide. Et surtout, comment construire des projets qui visent rigueur scientifique et finalité concrète.

🔎 Petit rappel : qu’est-ce qu’un un modèle de machine learning ?
Un modèle de machine learning (= apprentissage automatique), c’est un programme qui apprend à repérer des régularités dans des données passées pour prédire, classer ou segmenter de nouveaux cas. C’est utile… si ces régularités existent vraiment, et si elles aident à prendre des décisions.

Mais attention, le modèle ne comprend pas ce qu’il fait ! Il ne fait que repérer des régularités mathématiques dans les données. S’il a été mal alimenté, ou si les données sont biaisées, les résultats seront trompeurs.

Trois exemples :
– Prédire un événement (classification ou régression) : va-t-il y avoir un risque de chute ?
– Regrouper automatiquement des cas similaires (clustering) : y a-t-il des profils types de parcours post-opératoire ?
– Détecter des comportements inhabituels (anomaly detection) : ce signal de capteur sort-il de l’ordinaire ?

Décryptage – Le boom du machine learning en santé (2010–2025)

Pour commencer, jetons un petit regard en arrière pour voir ce que nous dit l’évolution du machine learning en santé du point de vue des publications. Le constat est clair : l’intérêt scientifique pour le machine learning, tous sujets confondus en santé, connaît une croissance spectaculaire, confirmée par plusieurs revues de littérature récentes.

Quelques chiffres clés :

  • Une simple recherche sur le site PubMed (https://pubmed.ncbi.nlm.nih.gov/), “Machine Learning + Healthcare” OR “Artificial intelligence + Healthcare”, donne 35 105 réponses (au 1er août 2025).
  • Une étude publiée dans Frontiers in Medicine a analysé 22  950 articles publiés entre 1993 et 2023. Elle montre une accélération très rapide après 2010, avec un pic marqué à partir de 2019 (Y. Xie et al. « Evolution of artificial intelligence in healthcare: a 30-year bibliometric study », Front. Med., vol. 11, janv. 2025, doi: 10.3389/fmed.2024.1505692)
  • Une autre étude recense toutes les publications contenant les mots-clés “machine learning” et “healthcare” dans Scopus de 2000 à 2024.  Le volume passe de quelques dizaines à plus de 3 000 articles par an (A. Dalky et al., « Global Research Trends, Hotspots, Impacts, and Emergence of Artificial Intelligence and Machine Learning in Health and Medicine: A 25-Year Bibliometric Analysis », Healthcare, vol. 13, nᵒ 8, Art. nᵒ 8, janv. 2025, doi: 10.3390/healthcare13080892).

Interprétation de cette explosion

Nous proposons de résumer ces chiffres en 3 phases :

  • La phase exploratoire (jusqu’en 2012) : le machine learning est une curiosité technique.
  • La phase d’adoption (2015–2019) : multiplication par 10 à 20 des publications annuelles.
  • La phase d’emballement (post-2020) : plusieurs milliers d’articles par an, dans toutes les spécialités médicales (et pas que l’imagerie !).

Mais ce volume impressionnant pose question. Une grande partie de ces publications sont des démonstrations techniques ou méthodologiques. Elles ne débouchent pas toujours sur des usages cliniques ou organisationnels.

Pourquoi cela pose problème ?
> Parce que modéliser n’a de sens que si cela aide à décider, à orienter, à prioriser.
> Parce qu’un bon modèle ne vaut que s’il est compréhensible, interprétable et utilisé.

Quand le machine learning est utile : retours d’expérience

Il serait injuste de critiquer le machine learning sans reconnaître ses apports concrets — à condition qu’il soit bien utilisé. Dans plusieurs projets, nous avons vu des approches de classification, de clustering ou de régression produire des résultats réellement utiles pour l’action. D’autant que la barrière à l’entrée pour utiliser ces méthodes est devenue très basse. Ça n’est plus l’apanage des seuls experts techniques. Voici 4 retours d’expériences qui d’usages réussis.

REX 1. Prévention ciblée dans les territoires
Dans un programme régional de prévention des maladies cardiovasculaires, les critères de ciblage classiques (âge, antécédents médicaux) laissaient de côté certains profils à risque. Un modèle de classification basé sur des données médico-sociales et de consommation de soins a permis d’identifier des patients à haut risque non repérés par les outils traditionnels. Grâce à cela, les interventions de prévention (appels infirmiers, entretiens de motivation, courrier d’information) sont mieux ciblées, tout en restant équitables. Ici, le modèle ne remplace pas l’expertise humaine : il l’oriente.

Généré par IA par l’auteur

REX 2. Optimisation du suivi post-opératoire
Dans un centre hospitalier, un projet a analysé les parcours de patients opérés pour des chirurgies digestives. En combinant des données cliniques avec du process mining, l’équipe a utilisé un algorithme de clustering pour identifier des groupes de patients avec des trajectoires post-opératoires atypiques. L’un des groupes présentait un taux de réhospitalisation élevé, lié à un défaut de contact infirmier à J+3. Ce signal, révélé par le modèle, a conduit à une refonte du protocole de suivi. Une fois de plus, l’algorithme n’était qu’un révélateur : la vraie décision s’est prise ensuite.

Généré par IA par l’auteur

REX 3. Dispositifs médicaux : détection précoce d’usure ou d’incidents
Un fabricant de dispositifs médicaux connectés a déployé un algorithme de détection d’anomalies sur les signaux captés par ses capteurs. L’objectif : détecter des signes précoces de défaillance (matérielle ou physiologique) avant que l’événement ne survienne. Une fois le système en place, plusieurs cas ont été évités. L’impact réel ? Moins d’hospitalisations évitables, un SAV plus réactif, et surtout une vigilance renforcée dans l’usage du dispositif.

Généré par IA par l’auteur

REX 4. Essais cliniques : sélection plus fine des participants
Dans un projet de recherche clinique sur une thérapie innovante, les chercheurs soupçonnaient que certains sous-groupes de patients réagissaient différemment au traitement. En amont du protocole, une analyse exploratoire via clustering non supervisé a permis d’identifier des profils différenciés, basés sur des marqueurs biologiques et des scores fonctionnels. Ces profils ont ensuite été utilisés pour affiner les critères d’inclusion, dans le cadre d’une sous-étude. Résultat : une meilleure puissance statistique, une interprétation enrichie des résultats, et une hypothèse plus ciblée pour une future phase III.

Généré par IA par l’auteur

Une constante : ce n’est pas l’algorithme qui agit, c’est l’écosystème autour

Ces exemples ne font pas appel à la plus haute complexité technique qui soit. Parfois, il s’agissait simplement d’un arbre de décision, d’un random forest ou d’un clustering hiérarchique. Ce qui fait la différence, c’est que :

  • les modèles ont été construits en partant d’un besoin métier concret,
  • les résultats ont été intégrés dans un processus de décision ou d’organisation,
  • et surtout, les utilisateurs finaux ont été impliqués dès le début.

Quel point de vue adopter sur le sujet ?

Pour nous, faire du machine learning, ce n’est pas une posture technologique. Ce doit être une démarche rigoureuse, construite avec des experts du domaine concerné.

Les questions clés à se poser avant de lancer un projet :

  • Quelle décision le modèle est-il censé éclairer ?
  • Quels indicateurs seraient vraiment utiles à produire ?
  • Qui est le public cible du modèle ? Est-il formé pour l’utiliser ?
  • A-t-on besoin d’un modèle statistique complexe, ou d’un tableau croisé bien construit ?

Trois erreurs fréquentes à éviter

❌Faire du machine learning pour faire “moderne”
Une IA qui prédit tout, sans qu’on sache à quoi ça sert… n’a aucun impact. Le besoin doit précéder l’outil.

❌Choisir la méthode avant de définir le problème
Ce n’est pas parce qu’un modèle XGBoost ou un réseau de neurones marche ailleurs qu’il est adapté ici. (“ »Quand on n’a qu’un marteau, tout finit par ressembler à un clou. » A. Maslow)

❌Oublier l’appropriation
Un modèle performant mais incompris ne sera jamais utilisé. La pédagogie et la transparence sont des leviers clés. #Explicabilité-de-l’IA

En conclusion

Après plus d’une décennie de travail sur des sujets de data science en santé, je reste convaincu du potentiel du machine learning — mais pas au mythe de la boîte noire magique. Nous croyons à la co-construction, à l’utilité terrain, et à une science des données au service des décisions.

“Un bon projet IA ne commence pas par un algorithme, il commence par une bonne question.”

Retrouvez nos autres articles de blog
👉 La simulation de flux au service des soignants
👉Modéliser un parcours de soin, c’est plus que dessiner un diagramme de flux
👉Améliorer l’organisation des hôpitaux… avec des modèles mathématiques