Le membrane cellulari sono un mosaico fluido di lipidi e proteine
Definizione
All’inizio degli anni Cinquanta, la descrizione della doppia elica del DNA (acido deossiribonucleico) rese chiaro che l’eredità biologica risiede nell’ordine lineare di quattro nucleotidi. La replicazione del DNA garantisce la trasmissione fedele di tale informazione alle cellule figlie, ma la questione cruciale è come questa informazione venga interpretata e messa in opera. In altre parole, come può un alfabeto chimico di quattro unità dirigere la costruzione e il funzionamento di organismi tanto diversi quanto un lievito, una pianta o un mammifero? Molti aspetti della trasformazione dell’informazione genetica in forma e funzione restano complessi, soprattutto quando si considerano organismi pluricellulari, ma il codice con cui l’informazione è scritta e i principi con cui viene letta sono stati chiariti in misura sostanziale.
Già prima della piena comprensione del codice genetico era noto che i geni orientano la sintesi proteica. Le proteine costituiscono la maggior parte dell’architettura cellulare e svolgono la gran parte delle funzioni catalitiche, strutturali e regolatorie. Le loro proprietà derivano dalla sequenza di venti tipi di amminoacidi disposti in catene polipeptidiche; la sequenza primaria condiziona il ripiegamento tridimensionale e, quindi, l’attività. L’informazione contenuta nel DNA specifica l’ordine degli amminoacidi di ogni proteina, ma il DNA non converte direttamente questa informazione in catene polipeptidiche: affida il compito a una serie di intermedi e di macchine molecolari.
Quando una cellula necessita di una determinata proteina, un tratto definito di DNA, il gene, viene copiato in una molecola di acido ribonucleico (RNA) tramite un processo enzimatico catalizzato da RNA polimerasi, detto trascrizione. L’RNA informazionale risultante viene poi interpretato dall’apparato di traduzione per assemblare la corrispondente catena di amminoacidi. In forma sintetica, il flusso dell’informazione può essere espresso come:
\[ DNA \;\rightarrow\; RNA \;\rightarrow\; Proteina \]
Questo principio, spesso indicato come dogma centrale della biologia molecolare, descrive il percorso prevalente dell’informazione genetica nelle cellule di tutti i domini della vita. In ogni istante, nelle cellule umane avvengono simultaneamente numerosissime trascrizioni e traduzioni, un flusso continuo e coordinato dall’assetto regolatorio cellulare (Figura 03.04-01).
La trascrizione inizia in siti specifici del DNA, i promotori, e termina in sequenze di arresto; nelle cellule eucariotiche, i trascritti primari subiscono una serie di trasformazioni prima di essere tradotti. Tra queste, lo splicing rimuove segmenti non codificanti (introni) e ricombina tra loro segmenti espressi (esoni). La rimodellazione del trascritto può essere estesa: lo splicing alternativo permette a un singolo gene di generare molteplici varianti di RNA messaggero, ampliando il repertorio proteico senza aumentare proporzionalmente il numero di geni. In alcuni casi, ulteriori modificazioni come l’editing dell’RNA o l’aggiunta di cappucci e code regolano stabilità, localizzazione e capacità traduttiva del messaggero.
Non tutti i geni hanno come prodotto una proteina. Un’ampia frazione del genoma viene trascritta in RNA con funzioni proprie, essenziali per l’espressione genica e l’omeostasi cellulare. Tra i principali tipi di RNA funzionali si annoverano:
- RNA ribosomiale (rRNA), componente strutturale e catalitico del ribosoma, sede della formazione dei legami peptidici;
- RNA transfer (tRNA), adattatori molecolari che riconoscono triplette nucleotidiche sul messaggero e portano l’amminoacido corrispondente;
- snRNA e snoRNA, coinvolti rispettivamente nello splicing e nella maturazione/modifica di altri RNA;
- microRNA e siRNA, piccoli RNA regolatori che modulano la stabilità o la traduzione degli mRNA;
- lncRNA (RNA lunghi non codificanti), che partecipano al controllo trascrizionale ed epigenetico, talvolta fungendo da impalcature per complessi proteici.
La traduzione converte la sequenza dell’mRNA in una sequenza amminoacidica. L’informazione è letta in triplette (codoni), ciascuna delle quali specifica un amminoacido o un segnale di stop. Il codice genetico è ridondante (più codoni possono indicare lo stesso amminoacido) e quasi universale tra gli organismi. Il ribosoma, costituito da rRNA e proteine, coordina l’appaiamento codone-anticodone tra mRNA e tRNA e catalizza la formazione del legame peptidico. Questo processo richiede energia e un’accurata rete di fattori accessori che assicurano fedeltà e velocità adeguate.
Pur essendo generale, lo schema DNA→RNA→proteina ammette rilevanti varianti. Oltre allo splicing eucariotico, esistono fenomeni quali l’editing dell’RNA e l’uso di codici leggermente diversi nei mitocondri. Inoltre, in alcuni contesti biologici il flusso può invertirsi, come avviene nella trascrizione inversa dei retrovirus, in cui un RNA viene copiato in DNA ad opera di una trascrittasi inversa. Queste eccezioni non smentiscono il principio generale, ma ne precisano la portata e i limiti operativi.
Infine, l’architettura attuale dell’espressione genica potrebbe derivare da sistemi più antichi e semplici. L’ipotesi del “mondo a RNA” propone che, nelle prime fasi dell’evoluzione, molecole di RNA abbiano svolto sia funzioni informative sia catalitiche, fornendo un antecedente plausibile alla successiva emergenza di DNA e proteine come supporti specializzati dell’informazione e della catalisi.
