Big Data en santé du discours aux applications pratiques - Les acteurs du Big data en santé Alexandre Vainchtock

La page est créée Michel Michel
 
CONTINUER À LIRE
Big Data en santé du discours aux applications pratiques - Les acteurs du Big data en santé Alexandre Vainchtock
Big Data en santé
du discours aux applications pratiques
       Les acteurs du Big data en santé
            Alexandre Vainchtock

                                          1
Big Data en santé du discours aux applications pratiques - Les acteurs du Big data en santé Alexandre Vainchtock
Potentiel
d’utilisation des
données du SNDS

                Médico-économie                                    Epidémiologie et pharmacovigilance
                Réalisation d’études portant sur l’évaluation du   Réalisation d’études portant sur l’épidémiologie d’une
                fardeau économique d’une pathologie, d’une prise   pathologie ou les événements indésirables d’un
                en charge thérapeutique, sur la consommation de    produit de santé.
                soins et leurs coûts (ville, hôpital, indemnités
                journalières)

                                                                                                                   jeudi 29 mars 2018   2
Big Data en santé du discours aux applications pratiques - Les acteurs du Big data en santé Alexandre Vainchtock
Potentiel
 d’utilisation des
 données du SNDS
                                                          Parcours et offre de soins                            Innovations méthodologiques
                                                          Parcours de soins :                                   Réalisation d’études portant sur de nouvelles
                                                          Réalisation d’études portant sur l’analyse des        méthodologies appliquées au champ de la santé.
                                                          parcours thérapeutiques des patients, centrés sur
                                                          le recours aux différents acteurs de santé sur une    Application de nouvelles disciplines analytiques
                                                          période donnée.                                       avec le machine learning, le process mining.

                                                          Offre de soins :
                                                          Réalisation d’études portant sur l’analyse de
                                                          l’offre de soins, centrées sur les professionnels
                                                          de santé, les établissements de santé, les services
                                                          d’urgence, les laboratoires de biologie médicale
                                                          et les officines

Snds [internet] [cited 2018 fev 23]. Available from: https://www.snds.gouv.fr/SNDS/Qu-est-ce-que-le-SNDS
                                                                                                                                                              jeudi 29 mars 2018   3
Big Data en santé du discours aux applications pratiques - Les acteurs du Big data en santé Alexandre Vainchtock
1

Applications au sein de la médico-économie
 Du burden of disease à la modélisation d’impact budgétaire

                                                              jeudi 29 mars 2018   4
Analyse des TVP-
                   Analyse des événements TVP-EP auprès des
EP                 patients hospitalisés pour cancer du sein et de
patients           la prostate
atteints de
cancer du sein            POPULATION
et de la                  Patients traités pour un cancer du sein et de la
prostate                  prostate en 2010

                          FOLLOW-UP
                          Suivi prospectif de 2 années calendaires

                          DATA
                          Nombre d’hospitalisations pour TVP-EP

                              NOMBRE DE RÉCIDIVES SUR 2 ANS

                             202        CANCER
                                        DU SEIN        144       CANCER DE
                                                                 LA PROSTATE

                                                                               jeudi 29 mars 2018   5
Coût des
                Analyse des événements TVP-EP auprès des
TVP-EP          patients hospitalisés pour cancer du sein et de
patients        la prostate
atteints de
cancer du              POPULATION
sein et de la          Patients traités pour un cancer du sein et de la
prostate               prostate en 2010

                       FOLLOW-UP
                       Suivi prospectif de 2 années calendaires

                       DATA
                       Nombre d’hospitalisations pour TVP-EP

                         COÛT TOTAL DES TVP-EP SUR 2 ANS
                            1,98 M€                     1,43 M€
                           CANCER DU SEIN           CANCER DE LA PROSTATE

                                                                            jeudi 29 mars 2018   6
2

 De l’épidémiologie à la pharmacovigilance
Auprès d’une population en conditions réelles de prise en charge

                                                                   jeudi 29 mars 2018   7
Cohorte de                     Accès aux chimiothérapies innovantes des
patients atteints              patients atteints de cancers du poumon au stade
                               métastatique (au sein des hôpitaux publics)
d’un KC du
poumon                                POPULATION SOURCE
                                      Patients incidents du cancer du poumon en France
                                      en 2011
Cohorte de patients atteints
d’un KC du poumon                     COHORTE ANALYSEE
                                      Patients métastatiques traités par chimiothérapie
                                      au sein des hôpitaux publics

                                      FOLLOW-UP
                                      Suivi de 2 années calendaires ou jusqu’à décès

                                      INDICATEURS SOCIO-DÉMOGRAPHIQUES
                                      Indice de défaveur social et ruralité

                                                          RÉSULTATS
                                              Inégalités d’accès aux traitements
                                          suivant les régions et les caractéristiques
                                             socio-démographiques des patients

                                                                                        jeudi 29 mars 2018   8
Risques ischémiques                       OBJECTIF :
et hémorragiques                          Quantifier en « vie réelle » les risques ischémiques et hémorragiques et
                                          les différences entre les stents actifs et les stents nus/non actifs
liés aux gammes
d’endoprothèses                           MÉTHODE :

(stents) coronaires                       Sujets ayant eu une implantation de stent en 2014 âgés de plus de 18
                                          ans et affiliés au régime général
en France                                 Le risque de survenue à 1 an a été comparé entre gammes en utilisant
                                          un modèle de Cox ajusté sur les caractéristiques à l’inclusion

                                          SYNTHESE :
                                          Pas de différence de caractéristiques sociodémographiques, médicales
Etude à partir des données du             entre les gammes
SNIIRAM                                   Après ajustement sur les caractéristiques à l’inclusion et prise en compte
                                          de l’effet centre, les risques n’étaient pas différents entre les gammes
*Rapport d’étude Janvier 2018 HAS/ ANSM

                                                                                                                       jeudi 29 mars 2018   9
3

Analyse des Parcours de soins

                                jeudi 29 mars 2018   10
Analyse des
séquences de
traitement direct
sur 2 ans

patients de Rhône-Alpes
ayant eu un cancer du
poumon
Patients métastatiques et non
métastatiques

                                jeudi 29 mars 2018   11
4

Innovations méthodologiques
 Du Machine learning au Process Mining

                                         jeudi 29 mars 2018   12
Du Data mining au
machine learning
                                                                           Le passage vers le machine learning
                        Le data mining consiste à fouiller les
                                                                           consiste à apprendre de manière
                        données qui proviennent de la collecte
                                                                           automatisée     et    supervisée les
                        automatisée. Puis de les croiser avec
                                                                           corrélations des données afin d’être
                        d’autres sources de données afin de
                                                                           capable de produire une réponse
                        chercher une corrélation entre ces
                        données via les différentes méthodes
                        « classiques ».

               Le Machine Learning est un champ d’étude de l’intelligence artificielle permet ainsi d’observer le
             comportement des patients en se basant sur les faits et les traitements réels, au-delà de la description
                                            théorique du schéma thérapeutique

                                                                                                                   jeudi 29 mars 2018   13
Machine learning
Construire des modèles
encore plus aboutis

                                   Classer                      Identifier                 Analyser

                         Classer les patients dans des         Identifier la         Prédire les coûts ou les
                         groupes de profils basés sur       surexpression de        complications médicales
                          des variables complexes et     variables dans un profil     de nouveaux patients
                                  combinées

                                                                                                                jeudi 29 mars 2018   14
1. SÉLECTIONNER AUTOMATIQUEMENT                                   2. POUR CRÉER AUTANT                                                   3. EN FONCTION
Machine learning   LES VARIABLES PERTINENTES PARMI LES
                           DIZAINES DISPONIBLES
                                                                                DE PROFILS PATIENTS QUE BESOIN                                           D’UN OBJECTIF PRÉCIS

                                                                                                                                                            Expliquer le coût

découvrir des profils patient                                                                  PRÉSENCE D'INFECTIONS
                                                                                                NON CLASSANTES VIH
                                                                                                                                                                    ou

                                                                                                                                                         Mesurer des risques :
                                                                                          NON                            OUI
                          Nombre de                                                    N = 26 706                     N = 21 920                     ré-hospitalisations ou présence
                         doses reçues                                                  1 540 € / p                    8 688 € / p
                                                                                                                                                            de complications
                                                         Diagnostics

                                                                                                                     PRÉSENCE
                                                                                    PRÉSENCE D’UNE
                                                                                                                D’UNE COMMORBIDITÉ
                                                                                INFECTION BACTÉRIENNE
                                                                                                              ENDOCRINO-METABOLIQUE                      EXEMPLE D’UN PROFIL PATIENT

                       Genre
                                         Présence d’un                     NON                              OUI                           OUI
                                            cancer                      N = 25 369                       N = 1 337                     N = 19 078
                                                                        1 420 € / p                     3 680 € / p                    2 388 € / p

                                                                                                                                          NON
                        Âge de la                                      DOSES REÇUES                      PRÉSENCE
                                                                                                                                        N = 2 842        1. Présence d’infections
                         maladie                                       ENTRE 5 ET 10                   D’UN CANCER
                                                                                                                                       6 300 € / p          non classables VIH

                                        Âge du patient                                                                                                   2. Présence d’une comorbidité
                                                                                             NON                            NON                             endocrino-metabolique
                                                                                          N = 21 980                      N = 1 170
                                                                                          1 280 € / p                    4 540 € / p
                         Coûts

                                          Date                                                OUI                           OUI
                                                                                           N = 3 389                      N = 167
                                                                                           140 € / p                     9 510 € / p

                                                                                                                                                                                     jeudi 29 mars 2018   15
Le machine
learning      1 nouveau patient         Modèle de machine learning             Prédictions
Prédire des   = des caractéristiques      « Random Forest Classifier »
outcomes      + un historique médical
                                                                         85% de chances d’être
                                                                         réhospitalisé sous 30 jours

                                                                         12% de développer une
                                                                           infection opportuniste

                                                                           Mortalité à 12 mois
                                                                              accrue de 5%

                                                                                               jeudi 29 mars 2018   16
Du machine
learning au     Discipline de recherche relativement jeune qui se trouve entre :
process
mining            o l’intelligence artificielle et le Data Mining
                  o la modélisation et l’analyse des processus

                Cette technologie se base sur les données extraites des systèmes informatiques
                contenant des informations sur les processus tels qu’ils se sont réellement passés

                Le Process Mining une discipline qui se positionne entre l’analyse de processus et l’analyse de
              données qui permet ainsi d’observer la succession de prise en charge des patients et de caractériser
                                              les différents types de trajectoires

                                                                                                                 jeudi 29 mars 2018   17
Quelles sont
les finalités                Découverte des processus :

                1   Découvrir, les processus tels qu’ils se sont réellement
                                           passés

                    Comparaison à un modèle de processus

                2   Vérifier si le modèle théorique ou prévu correspond
                                       bien à la réalité

                            Amélioration des processus :

                3          Mettre en place des chemins cliniques
                        Identifier précocement les patients à risques

                                                                              jeudi 29 mars 2018   18
Le Process Mining

l’étude des parcours

Le parcours de soins de
chaque patient est unique

                            jeudi 29 mars 2018   19
Le Process Mining
Synthèse des trajectoires en 1
modèle

                                 jeudi 29 mars 2018   20
Vous pouvez aussi lire