Con Google Genomics il DNA va nel cloud
di Mattia Schieppati
-
9 Dicembre 2014
Il gigante dei motori di ricerca propone a ospedali e università un progetto futuristico per l'archiviazione dei dati genetici. Business o progresso per la scienza?
È la frontiera più delicata dei big data, ed è quella che riguarda tutte le informazioni relative alla nostra salute: chi le raccoglie, chi le gestisce e chi le immagazzina. Dati sensibili che riguardano il massimo livello di privacy e il cui valore, oggi, con i progressi continui e quotidiani della scienza, si possono solo intravedere.
Per questo giustamente l'ultimo numero dell'edizione italiana della
MIT Technology Review dedica un approfondimento affascinante (e inquietante, sotto più di un punto di vista) sull'iniziativa lanciata lo scorso marzo - e passata piuttosto sotto silenzio - da Google, che è stata battezzata Google Genomics. Si tratta di un
servizio di cloud computing per l'
archiviazione di genomi raccolti e mappati da ospedali e università. Come spiega l'approfondimento, Google ha iniziato a lavorare su questo progetto non più di 18 mesi fa, incontrando scienziati e costruendo un'interfaccia, o API, che gli permette di trasferire i dati del DNA nelle suo server farms e di condurre esperimenti utilizzando la stessa tecnologia di database che indicizza il web e traccia miliardi di utenti di internet. Un grande motore di ricerca sui tratti genetici di milioni e milioni di pazienti: il collegamento e il confronto di migliaia, e forse milioni di genomi, daranno una spinta in avanti alle scoperte mediche dei prossimi dieci anni, sottolineano i ricercatori del MIT.
«Vediamo i biologi passare dallo studio di un genoma alla volta allo studio di milioni (di genomi)», ha spiegato David Glazer, il software engineer che ha guidato questo lavoro e che precedentemente era a capo della progettazione del social network Google+. «L'opportunità è quella di applicare le innovazioni nella tecnologia dei dati per ottenere dei vantaggi in questo passaggio». Alcuni scienziati non hanno fiducia in questo progetto perché sostengono che i dati del genoma siano troppo complessi per Google; secondo altri, però, stiamo per assistere a un grande cambiamento. Quando Atul Butte, un esperto di bioinformatica di Stanford, ha sentito Google presentare il suo progetto, ha commentato dicendo che gli era finalmente chiaro «come si dovevano essere sentiti gli agenti di viaggio alla presentazione di Expedia».
Uno sguardo al futuro sempre più presente, insomma, ma come in ogni operazione lanciata da Google, c'è anche una semplice e immediata questione di business: ad accelerare il trasferimento dei dati sul cloud, spiega l'approfondimento, ha contribuito la guerra al ribasso che ha visto come protagonisti Google ed Amazon. Ora, Google farà pagare circa 25 dollari l'anno per archiviare un genoma, e qualcosa in più per usarli nei calcoli. La dimensione dei dati scientifici primari che rappresentano il genoma di una singola persona corrisponde a circa 100 gigabyte, anche se una versione rifinita del codice genetico di una persona è molto più piccola, inferiore a un gigabyte, e costerebbe solo 0,25 dollari l'anno.
Glazer non ci ha detto quanto è grande Google Genomics o quanti clienti ha, ma almeno 3.500 genomi provenienti da progetti pubblici sono già archiviati nel server di Google. Glazier sostiene inoltre che non vi sia ancora un collegamento tra il cloud di Google e i suoi sforzi più speculativi riguardanti l'assistenza sanitaria, come la compagnia di Google, Calico, fondata quest'anno con l'obiettivo di studiare soluzioni per allungare la vita umana. «Ciò che li collega è solo la crescente consapevolezza che la tecnologia può far progredire lo stato dell'arte nelle scienze biologiche».