Un nuovo metodo per l’identikit tridimensionale dei cromosomi
Un gruppo coordinato dalla Scuola internazionale superiore di studi avanzati (SISSA) di Trieste, ha ricostruito al computer un modello tridimensionale del genoma umano. La forma del DNA (oltre alla sua sequenza) incide significativamente sui processi biologici ed è dunque fondamentale per conoscerne la funzione. Questo lavoro ha fornito un primo identikit tridimensionale per il genoma umano, approssimato ma realistico.
Grazie alle caratteristiche della nuova metodologia, la ricostruzione strutturale basata su informazioni sperimentali e su metodi statistici è destinata a perfezionarsi ma mano che saranno disponibili nuovi dati sperimentali. La ricerca, condotta in collaborazione con l’Università di Oslo, è stata pubblicata su Scientific Reports (una rivista del gruppo Nature).
Il sequenziamento del genoma è una pietra miliare della biologia moderna perché permette di accedere all’intera “lista di istruzioni” (la sequenza chimica del corredo genetico) per lo sviluppo e la funzionalità degli organismi. Sequenziare il genoma è un po’ come scrivere su un foglio la serie esatta dei colori delle perline di una collana: pur sapendo come questi si succedono lungo il filo non si può però conoscere la forma della collana. La forma del filo di DNA può essere molto articolata, nel nucleo cellulare infatti i cromosomi sono “sciolti” in una matassa apparentemente caotica. Poiché la forma dei cromosomi può avere un’influenza decisiva sul loro funzionamento ed è dunque fondamentale conoscerla, anche perché, pensano gli scienziati, la matassa del DNA nel nucleo è solo apparentemente caotica e avrebbe invece una “geografia” precisa e tipica per i vari tessuti e stadi di vita cellulare.
«Descrivere con precisione la forma della matassa formata dai cromosomi è purtroppo incredibilmente complicato – spiega Cristian Micheletti, professore della SISSA e coordinatore del nuovo studio -. Nel nostro caso ci siamo basati sulle informazioni sperimentali sulle “coppie di prossimità”. Provate a immaginare di dover ricostruire la mappa di una città – spiega lo scienziato – avendo però a disposizione soltanto informazioni del tipo “la posta si trova davanti alla stazione”, “la farmacia è vicina alla palestra”, “il mercato ortofrutticolo è nei pressi del campo di calcio” e via dicendo. Se avete poche di queste informazioni la vostra mappa sarà grezza, e in alcuni casi indeterminata. Ma se ne avete centinaia, migliaia, o ancora di più, allora la vostra mappa diventerà sempre più precisa e aderente alla realtà. Questa è stata la logica che abbiamo seguito».
Le coppie di prossimità sono quindi le informazioni sulla vicinanza fra due punti della mappa. Quelle del DNA nel nucleo cellulare sono state fornite da una tecnica (definita “geniale” da Micheletti) denominata “Hi-C”, sviluppata nel 2010 da alcuni gruppi di ricerca statunitensi. In questa tecnica chimico/fisica vengono legati assieme pezzetti di genoma che si trovano vicini nel nucleo, e questi sono poi identificati dalla loro sequenza. Raccogliendo grandi quantità di queste coppie di prossimità si è così scoperto quali punti dei cromosomi si trovano vicini nel nucleo. Questa è oggi la tecnica più potente per indagare l’organizzazione del DNA nel nucleo ma resta ancora insufficiente per dedurne la forma complessiva. «Per questo abbiamo pensato di provare ad andare “oltre”» commenta Micheletti.
«Abbiamo usato un database pubblico di coppie di prossimità derivanti, inizialmente, da un unico esperimento di Hi-C. Nel database erano contenute le informazioni su centinaia di migliaia di coppie di prossimità», spiega Marco Di Stefano, ricercatore che nel 2014 si è dottorato (proprio con questo lavoro) alla SISSA e primo autore della ricerca. Di Stefano è attualmente post-doc al Centro nazionale di analisi genomica di Barcellona. I ricercatori hanno creato un modello virtuale “coarse grained” (con cioè un certo grado di semplificazione) di tutti i cromosomi in una conformazione tridimensionale “base”. Hanno poi identificato i punti dove si situavano i due pezzetti di DNA di ciascuna coppia di prossimità, per poi avvicinarli, piegando opportunamente il filamento.
«Facendo quest’operazione per tutte le coppie di prossimità note sperimentalmente abbiamo ottenuto una struttura, ingarbugliata ma non casuale, che ci ha svelato la forma di tutti i cromosomi del genoma umano, che risiedeva nascosta nei dati – spiega Di Stefano -. Va da sé che più coppie si usano, più preciso sarà il modello 3D che otterremo».
In realtà Micheletti e colleghi, dopo questa prima fase, hanno aggiunto al modello una nuova serie di dati sperimentali. «Proprio mentre stavamo lavorando è stato pubblicato un nuovo set di dati “Hi-C”, più dettagliato del precedente, per cui abbiamo utilizzato anche quelli – afferma Micheletti – A dire il vero avevamo un po’ di timore che la nostra nuova metodologia non fosse ancora abbastanza robusta e che la nuova serie di dati potesse entrare in conflitto e “sfasciare” il modello 3D precedentemente ottenuto. Ma quasi con stupore abbiamo visto che l’assetto rimaneva piuttosto simile al precedente. Anzi, veniva semplicemente raffinato grazie ai nuovi dati e quasi per incanto le varie zone dei cromosomi andavano a collocarsi nei punti corretti del nucleo. Questo ci convince ancor più di essere riusciti a descrivere con buona approssimazione il dato reale, e speriamo che i dati raccolti in futuro ci consentano di svelare con sempre maggior dettaglio la forma del DNA racchiuso nelle nostre cellule».