News

ANALISI DEI BIG DATA: LA DIFFICILE IMPRESA

Dal I Annual Meeting della Rete Cardiologica, Roma, 28 settembre 2022

In un progetto complesso come “Health Big Data”, l’analisi dei dati è fondamentale e strategica. Tra i gruppi di lavoro coinvolti nel progetto vi è quindi un working group (il WG 6) che ha l’obiettivo di uniformare la risposta in termini di analisi alle esigenze incredibilmente variegate delle diverse Reti e dei singoli IRCCS che ne fanno parte e all’eccezionale complessità ed eterogeneità dei dati che da questi vengono prodotti nell’ambito degli studi che via via vengono realizzati.

Nell’ambito del progetto Health Big Data, l’unità operativa del Politecnico di Milano ha messo a punto un addendum progettuale allo studio VavirimS, approvato dal comitato etico del centro clinico capofila dello studio e in via di approvazione dai comitati etici degli altri IRCCS partecipanti. Ne ha parlato, al Meeting di Roma della Rete Cardiologica, l’Ingegner Francesca Ieva, MOX Lab, Dipartimento di Matematica del Politecnico di Milano.

L’addendum allo studio VavirimS ha come obiettivo lo sviluppo di metodologie innovative di analisi dei dati, a partire dai dati di VavirimS, ma tentando anche di estrapolare un modello di analisi che sia poi trasferibile ad altri studi retrospettivi di analoga portata nell’ambito della Rete Cardiologica (come il progetto CV-PREVITAL).

Nello specifico, il Politecnico ha supportato, con avanzate metodologie di analisi statistica:

  • l’indagine sulla capacità predittiva dell’imaging sull’endpoint primario dello studio VavirimS (rimodellamento avverso del ventricolo sinistro);
  • la validazione dell’analisi dei dati di imaging provenienti dai diversi centri partecipanti allo studio sulla piattaforma REDCap;
  • la risposta alla domanda: quanto è predittivo l’Imaging e quanto l’aver portato l’immagine all’interno di uno studio rappresenta un valore aggiunto rispetto a ciò che si può ricavare dai semplici dati di registro, dalla semplice informazione clinica? In pratica, l’integrazione di quei dati di imaging e sui biomarker con i dati di registro per identificare (con metodi di machine learning sviluppati ad hoc) una più efficace stratificazione del rischio dei pazienti soggetti a rimodellamento, e un’associazione con gli endpoint primari e secondari dello studio;
  • l’adeguata modellazione della struttura gerarchica dei dati, derivante dalla natura multicentrica dello studio, per tenere ben conto della dipendenza tra unità osservate e valutare la trasferibilità dei protocolli e dei risultati nei diversi centri partecipanti al progetto. Perché sapere chi sono e a quale centro sono riferibili i diversi pazienti può favorire il flusso di analisi, perché l’essere ospedalizzati in un centro o in un altro può avere un effetto casuale, che induce una certa variabilità.

 


Approfondisci