Google Flu Trends e la previsione di epidemie

Dopo Google Health,lanciato lo scorso mese di maggio e descritto in un precedente articolo di questa rubrica (Santoro 2008), il colosso di Mountain View ha lanciato nei giorni scorsi un nuovo strumento al servizio della salute. Si tratta di Google Flu Trends, un sistema in grado di prevedere con un certo anticipo i picchidi influenza che, prossimamente, si diffonderà negli Stati Uniti (Helft 2008). Finora, ad occuparsi di questo aspetto erano (e lo sono tuttora) i prestigiosi Centers for Disease Control and Prevention di Atlanta (CDC), l'ente preposto negli Stati Uniti per controllare e prevenire le malattie, specialmente quelle infettive (e che in Italia abbiamo imparato a conoscere anche attraverso film di successo come Virus letale), attraverso le segnalazioni provenienti da un campione significativo di medici sentinella dislocati sul territorio americano. Attraverso questa procedura, le previsioni,seppur accurate, richiedono però alcuni giorni per poter essere elaborate. Google Flu Trends, al cui sviluppo hanno collaborato gli stessi esperti dei CDC, lavora invece in tempo reale e si basa sulle segnalazioni provenienti da chi utilizza il motore di ricerca per cercare termini legati all'influenza come per esempio "febbrealta", "tosse", "dolori muscolari", "termometro","rimedi contro il freddo", ecc. Il funzionamento di Google Flu Trends si basa infatti sulla stretta relazione che esiste tra la frequenza delle ricerche che quotidianamente sono condotte sui sintomi influenzali e il numero di persone che, nei giorni immediatamente successivi a quelli in cui la ricerca è operata, effettivamente si ammalano. Inoltre, poiché Google è in grado di conoscere anche l'area nella quale una ricerca è operata, ecco che il sistema messo a punto dagli esperti è in grado di prevedere, con congruo anticipo, come la malattia si distribuirà a livello regionale (figura 1).


Figura 1 | La home page di Google Flu Trends


Il sistema è basato su Google Trends, uno dei tanti strumenti sviluppati da Google in anni recenti e che appartiene a quella categoria di prodotti "prototipali" (cioè ancora in fase di test) nati da idee innovative partorite dai "Google Labs". Tale strumento non misura le parole più ricercate in assoluto, ma quelle che, in un determinato periodo di tempo,subiscono i maggiori incrementi tra quelle ricercate. In altre parole si può dire che il sistema non misura la "popolarità assoluta"di un termine (o di un insieme di termini riconducibili a un concetto), ma la sua "popolarità relativa" in un certo periodo di tempo. Uno strumento perfetto quindi per intercettare e analizzare tendenze (da cui il nome Google Trends) nell'effettuare ricerche che possono variare nel corso delle settimane e dei mesi e che non a caso trova spesso applicazioni nell'area del marketing per monitorare la popolarità in Internet di prodotti commerciali o in politica per misura la popolarità di un candidato alle elezioni(se ne è fatto ampio uso durante l'ultima campagna elettorale per eleggere il nuovo presidente degli Stati Uniti). Dall'area del marketing a quella del monitoraggio delle malattie ad ampia diffusione e con un certo grado di infettività il passo è stato breve, favorito anche dalle ultime statistiche che identificano inoltre il 60% la percentuale degli americani che si rivolge a Google per cercare informazioni sanitarie.

L'affidabilità di Google Flue Trends è stata verificata confrontando il "trend" delle ricerche su Google di termini riconducibili ai sintomi influenzali effettuate negli ultimi 5 anni rispetto ai dati raccolti dai CDC nello stesso periodo. Dal risultato di tale confronto non è emersa alcuna differenza significativa arrivando addirittura a osservare, per le due curve, un totale sovrapposizione (figura 2). Addirittura, in un esperimento condotto lo scorso anno, Google Flu Trends è stato in grado di prevedere come e dove si sarebbero maggiormente verificati casi di influenza con due settimane di anticipo rispetto alle previsioni degli stessi CDC.


Figura 2 | Il confronto nel corso degli ultimi 5 anni tra i datidei CDC e quelli di Google Flu Trends 

 


Come spesso capita ogni volta che Google rilascia un nuovo strumento, da più parti sono state sollevate obiezioni sulla possibile violazione della privacy degli utenti che operano le ricerche sulle quali è elaborato il "trend". Tuttavia, come gli stessi responsabili di Google fanno osservare, nessuna delle informazione raccolte è riconducibile a una specifica persona e l'analisi della tendenza è elaborata esclusivamente su dati aggregati. Inoltre, per mantenere alto il profilo del progetto e per preservarne il ruolo altamente"sociale", è stato deciso che il servizio sarà ospitato su Google.org (l'organizzazione filantropica di Google) e non conterrà alcun genere di pubblicità.

Le potenzialità di questi strumenti sono notevoli. C'è chi pensa di estenderne l'impiego ad altre malattie presenti in America (dove è più facile poterne verificare l'attendibilità attraverso un incrocio con i dati ufficiali raccolti dagli organismi istituzionali). La stessa Google ha inoltre l'intenzione di proporre il servizio Flu Trends ad altri paesi al di fuori degliStati Uniti. Ma c'è anche chi ricorda che tali sistemi potrebbero non essere immuni da errori perché, ad esempio, potrebbero non essere in grado di operare con quelle malattie comuni tra la popolazione (come quella degli anziani) che generalmente non effettua ricerche in Internet.

A onor del vero, Google Flue Trends non è la prima applicazione del suo genere. Altre esperienze in passato hanno infatti cercato di usare Internet per raccogliere informazioni sulle malattie per cercare di individuare possibili focolai (Guth 2008). Nessuna di queste, tuttavia, è basata sull'analisi del database delle ricerche operate su Google per individuare una malattia. Anche per queste ragioni Google Flu Trends può essere fatto rientrare tra quelle applicazioni del web 2.0 nelle quali l'"intelligenza collettiva"e il contributo di ciascuno dei milioni di utenti della rete è messa a disposizione di tutti al fine di rispondere a uno specifico quesito.

I risultati di questa esperienza sono descritti in un manoscritto disponibile sul portale di Google Flu Trends (Ginsberg 2008) e, considerato il loro straordinario valore e le possibili ricadute in termini di sanità pubblica, saranno presto pubblicati sulla prestigiosa rivista Nature in un articolo firmato sia da Google che dai CDC.

Bibliografia
Santoro E. Google Health e le cartelle sanitarie on line: una nuova sfida per Google. Partecipasalute 25 giugno 2008. http://www.partecipasalute.it/cms_2/node/919 (accesso verificato il 14 novembre 2008).
Helft M. Google uses searches to track flu's spread. New Yourk Times 11 novembre 2008. http://www.nytimes.com/2008/11/12/technology/internet/12flu.html (accesso verificato il 14 novembre 2008).
Guth RA. Sniffly surfing: Google unveils flu-bug tracker. Wall Street Journal 12 novembre 2008. http://online.wsj.com/article/SB122644309498518615.html (accesso verificato il 14 novembre 2008).
Ginsberg J, Mohebbi MH, Patel RS, Brammer L. Smolinski MS, Brilliant L. Detecting influenza epidemics using search engine query data. Nature 2008, in press. http://www.google.org/about/flutrends/manuscript.pdf (accesso verificato il 14 novembre 2008).

Eugenio Santoro
Laboratorio di Informatica Medica, Dipartimento di Epidemiologia
Istituto di Ricerche Farmacologiche "Mario Negri", Milano
E-mail: santoro@marionegri.it  

Eugenio Santoro
Laboratorio di Informatica Medica
Dipartimento di Epidemiologia
eugenio.santoro@marionegri.it

Inserito da Eugenio Santoro il Dom, 30/11/2008 - 17:46