La frase "un gene codifica per una proteina" è una delle espressioni più fondamentali della biologia molecolare. Ma cosa significa esattamente? Un gene è una sequenza specifica di nucleotidi nel DNA che contiene le istruzioni per la sintesi di una proteina.
Introduzione al DNA e ai Geni
Il DNA, o acido desossiribonucleico, è una molecola a doppia elica composta da quattro tipi di basi azotate: adenina (A), timina (T), citosina (C) e guanina (G). Queste lettere si appaiano specificamente (A con T, C con G) formando una struttura a doppia elica che ricorda una scala a chiocciola. Le 4 lettere formano i "gradini" della scala mentre i "corrimano" sono costituiti da una catena di zuccheri pentosi (deossiribosio) e gruppi fosfato. L'insieme di base azotata, zucchero e gruppo fosfato forma il nucleotide, l'unità monomerica caratteristica degli acidi nucleici.
Il DNA è organizzato in cromosomi, strutture altamente condensate che si trovano nel nucleo delle cellule eucariotiche. Ogni cromosoma contiene molteplici geni, e la loro disposizione e sequenza sono cruciali per il corretto funzionamento cellulare. I geni sono composti da regioni codificanti, chiamate esoni, e da regioni non codificanti, chiamate introni. Gli esoni contengono le informazioni necessarie per la produzione delle proteine, mentre gli introni vengono rimossi durante il processo di maturazione dell’RNA. La sequenza di un gene inizia con una regione promotrice, che è essenziale per l’inizio della trascrizione. La regione promotrice contiene siti di legame per i fattori di trascrizione, proteine che regolano l’attività del gene.
Il Processo di Trascrizione: Da DNA a RNA Messaggero
La trascrizione è il primo passo nella conversione delle informazioni genetiche dal DNA in proteine. L’RNA sintetizzato durante la trascrizione è chiamato RNA messaggero (mRNA). Questo mRNA è una copia complementare della sequenza di DNA del gene, ma con una differenza significativa: l’uracile (U) sostituisce la timina (T) come base azotata. In questo libro chiamato DNA, sono presenti alcune "frasi" (sequenze di ATCG), i geni, che contengono le istruzioni per costruire le proteine.
L'informazione, per arrivare ai costruttori delle proteine, i ribosomi, deve passare attraverso un intermediario: l'RNA messaggero (mRNA). Questo avviene tramite la trascrizione, il processo in cui un enzima, una proteina che accelera una reazione chimica, chiamato RNA polimerasi II, legge il DNA e crea una copia temporanea, l'mRNA, formata da un solo filamento. Questo enzima si muove lungo il DNA in direzione 5′ → 3′, costruendo l'mRNA con un alfabeto simile a quello del DNA, ma con una differenza: al posto della T, usa la U (uracile). Quindi, quando legge una A sul DNA, mette una U sull'mRNA, e viceversa e quando legge una C mette una G e viceversa.
Leggi anche: Reazioni metaboliche e geni: dettagli
Un altro passo cruciale nella maturazione dell’mRNA è lo splicing, durante il quale gli introni vengono rimossi e gli esoni vengono uniti insieme. Questo processo è mediato da un complesso di proteine e RNA chiamato spliceosoma. Una volta completato, l’mRNA maturo viene trasportato dal nucleo al citoplasma, dove servirà come modello per la sintesi proteica.
DNA e RNA differiscono, oltre che per il numero di filamenti e la lettera U, anche per o zucchero pentoso che li costituisce, infatti, nell'mRNA è presente il ribosio.
- Cappuccio all'estremità 5′: un "cappuccio" chimico viene aggiunto all'inizio dell'mRNA per proteggerlo e aiutarlo a legarsi ai ribosomi nella fase successiva.
- Coda di poli-A all'estremità 3′: una lunga coda di adenine (poli-A) viene aggiunta alla fine dell'mRNA, per stabilizzarlo e facilitarne l'uscita dal nucleo.
- Splicing: in questa fase vengono rimossi i tratti di RNA non codificanti (introni) e uniti tra loro i tratti codificanti (esoni), quelli che effettivamente portano le istruzioni per costruire le proteine.
Ora l'mRNA maturo è pronto per lasciare il nucleo e portare il suo messaggio ai ribosomi nel citoplasma, dove verranno costruite le proteine.
La Sintesi Proteica: Cos'è e Come Funziona
La traduzione è il processo attraverso il quale l’mRNA viene utilizzato come modello per sintetizzare una proteina. Questo avviene nei ribosomi, complessi macromolecolari costituiti da RNA ribosomiale (rRNA) e proteine. La sintesi proteica o traduzione è il passo successivo alla trascrizione, in cui l'informazione contenuta prima del DNA e poi nell'mRNA viene "tradotta" nel linguaggio delle proteine.
Proprio come tradurre un testo da una lingua all'altra, la cellula decodifica la sequenza di nucleotidi (A, U, C, G nell'RNA) in una sequenza di amminoacidi. Le proteine, infatti, sono polimeri, lunghe catene di amminoacidi a loro volta composti da carbonio, idrogeno, ossigeno, azoto e talvolta zolfo. Per portare a termine la traduzione, gli amminoacidi non si assemblano in modo autonomo ma la cellula impiega i ribosomi, organelli costituiti da due subunità (una maggiore e una minore) di RNA ribosomiale (rRNA) e proteine.
Leggi anche: Leggi l'articolo completo su Reazioni, Metabolismo e Geni
I ribosomi "leggono" la sequenza di nucleotidi dell'mRNA a gruppi di tre, chiamati codoni, e a ogni codone associano la sequenza complementare, l'anti-codone, presente su un'altra categoria di RNA, i tRNA o RNA di trasporto. L'anti-codone è specifico per un amminoacido, caricato sul tRNA dall'enzima aminoacil-tRNA sintetasi. Per comprendere meglio, vediamo passo passo come avviene questo processo.
- Inizio della traduzione: il sito A accoglie il tRNA con l'amminoacido associato (l'amminoacil-tRNA) e permette il riconoscimento tra codone (dell'mRNA) e anticodone (del tRNA).
- Allungamento del polipetide: nel sito P, se il legame è corretto, avviene il legame peptidico tra l’amminoacido associato al tRNA e la proteina in formazione.
- Terminazione della traduzione: nel Sito E (da exit, uscita) il tRNA, ormai privo dell'amminoacido, può lasciare il ribosoma.
Codoni specifici come UAA, UAG e UGA segnalano al ribosoma che la traduzione deve terminare e a questo punto la proteina può essere rilasciata. Ogni codone corrisponde a un amminoacido specifico, l’unità di base delle proteine. La traduzione inizia con il codone di inizio, generalmente AUG, che codifica per l’amminoacido metionina. Il tRNA possiede un anticodone, una sequenza di tre nucleotidi complementare al codone dell’mRNA. Questo meccanismo di riconoscimento garantisce che l’amminoacido corretto venga aggiunto alla catena polipeptidica in crescita. Il processo di traduzione termina quando il ribosoma incontra un codone di stop (UAA, UAG o UGA), che non codifica per nessun amminoacido.
I codoni sono sequenze di tre nucleotidi sull’mRNA che specificano quali amminoacidi verranno aggiunti durante la sintesi proteica. Esistono 64 codoni possibili, ma solo 20 amminoacidi, il che significa che alcuni amminoacidi sono codificati da più di un codone. La presenza di codoni multipli per un singolo amminoacido offre una certa tolleranza agli errori nelle mutazioni del DNA. I codoni di inizio e di stop giocano un ruolo cruciale nel determinare i confini della traduzione. Il codone di inizio (AUG) non solo segnala l’inizio della traduzione ma codifica anche per la metionina, che spesso viene rimossa dopo la sintesi proteica. L’accuratezza nella lettura dei codoni è essenziale per la corretta sintesi proteica.
Facciamo un esempio pratico: il ribosoma scorre l'mRNA e incontra inizialmente il codone di inizio AUG, che codifica per l'amminoacido metionina (Met). Un tRNA specifico, con l'anticodone complementare, si lega al sito A del ribosoma, portando con sé la metionina. Il codone successivo sull'mRNA, ad esempio GUC, specifica l'amminoacido valina (Val). Un altro tRNA, con l'anticodone CAG, si posiziona nel sito A, recando la valina. A questo punto, la metionina, precedentemente legata al tRNA nel sito P, forma un legame peptidico con la valina nel sito A. Il tRNA "scarico" nel sito P si sposta nel sito E e viene rilasciato, mentre il tRNA con la catena peptidica (Met-Val) si trasloca nel sito P. Il sito A è ora libero per accogliere il tRNA corrispondente al codone successivo. Questo processo si ripete, con l'aggiunta sequenziale di amminoacidi alla catena in crescita, finché il ribosoma non incontra un codone di stop (UGA, UAA o UAG) sull'mRNA, segnalando la fine della traduzione e il rilascio della proteina completa.
Ogni codone, quindi, codifica per un particolare amminoacido (o un segnale di inizio o fine della traduzione), determinando così l'ordine preciso in cui gli amminoacidi verranno assemblati per formare la proteina. Il ribosoma deve essere molto preciso, un solo errore può causare la perdita di struttura della proteina e anche della sua funzione.
Leggi anche: Approfondimento sulla Funzione dei Geni
Il Codice Genetico: Un Linguaggio Universale e Degenerato
Il codice genetico è il motore che guida la sintesi delle proteine, guidando il processo a partire da come viene organizzata l'informazione nel DNA, passando dalla copia temporanea di mRNA. Due aspetti fondamentali del codice genetico sono la sua universalità e la sua degenerazione. La degenerazione, invece, deriva dal fatto che i 64 codoni possibili (generati dalle quattro basi azotate in triplette) codificano per soli 20 amminoacidi; tre di questi codoni agiscono come segnali di terminazione (UAG, UAA, UGA), mentre i restanti 61 specificano gli amminoacidi. Questa ridondanza implica che più codoni possono codificare per lo stesso amminoacido, un aspetto cruciale del codice genetico.
La decifrazione di un unico codice che traduce l’informazione contenuta nel DNA in proteine, completata a metà degli anni Sessanta, è considerata una delle più grandi scoperte del Novecento. Il c. g. è perciò considerato universale ed è presente in tutti gli organismi viventi conosciuti. In realtà esistono delle eccezioni nel ruolo interpretato dai codoni. Nell’uomo, il c. g. nucleare e quello mitocondriale sono simili, ma non identici.
Poiché l’mRNA è un polimero lineare di quattro nucleotidi diversi (adenina, guanina, citosina e uracile), esistono 43=64 possibili combinazioni di tre nucleotidi, a ognuna delle quali corrisponde un amminoacido. Essendo le proteine costituite da soli 20 diversi amminoacidi, gran parte degli amminoacidi è specificata da più di una tripletta, e il c. g. La degenerazione del codice implica che un singolo tRNA possa corrispondere per appaiamento di basi a più di un codone e che ad ognuno degli amminoacidi debba corrispondere più di un tRNA.
L’appaiamento tra codone e anticodone è regolare per quanto riguarda A-U e G-C per le basi nelle prime due posizioni del codone, ma ammette l’appaiamento G-U nella terza posizione. In generale, quando la base in terza posizione dei codoni è una pirimidina (U o C), uno stesso anticodone può appaiarsi a due codoni alternativi. Questo appaiamento ‘incerto’ spiega come mai molti dei codoni alternativi per lo stesso amminoacido differiscono solo nel terzo nucleotide della tripletta.
Il codice genetico sembra essersi evoluto in modo che codoni specificanti amminoacidi simili siano a loro volta simili. Ad esempio, i codoni che codificano l’acido aspartico (GAC e GAT) e l’acido glutammico (GAA e GAG) garantiscono che l’incertezza nella terza base in un codone GAX (dove X è un qualsiasi nucleotide) abbia un effetto minimo.
Regolazione dell'Espressione Genica
La regolazione dell’espressione genica è un processo complesso che controlla quando, dove e quanto un gene viene espresso. Uno dei principali meccanismi di regolazione è il controllo della trascrizione. I fattori di trascrizione sono proteine che si legano a sequenze specifiche di DNA vicino ai geni, modulando l’attività della RNA polimerasi. La regolazione può avvenire anche a livello di maturazione dell’RNA. Lo splicing alternativo, ad esempio, permette la produzione di diverse varianti di mRNA da un singolo gene, aumentando la diversità delle proteine prodotte. Infine, la regolazione può avvenire a livello della traduzione e della degradazione proteica. La disponibilità di ribosomi e tRNA, così come la presenza di sequenze regolatorie nell’mRNA, possono influenzare l’efficienza della traduzione.
Implicazioni Biomediche
La comprensione del processo mediante il quale un gene codifica per una proteina ha enormi implicazioni biomediche. Le mutazioni nei geni possono alterare la sequenza delle proteine, portando a malattie genetiche. Le tecnologie di editing genetico, come CRISPR-Cas9, permettono di correggere mutazioni specifiche nel DNA, offrendo nuove speranze per il trattamento di malattie genetiche. La comprensione della regolazione dell’espressione genica è cruciale anche per lo sviluppo di terapie mirate. Infine, la ricerca sulla codificazione genica ha portato allo sviluppo di biotecnologie avanzate, come la produzione di proteine ricombinanti per uso terapeutico.
Proteomica
La proteomica è lo studio del proteoma, l’insieme delle proteine prodotte o modificate da un organismo o un sistema biologico. Il proteoma è dinamico in quanto le proteine espresse da una cellula possono variare nel tempo. La proteomica viene applicata anche in medicina, per esempio nella ricerca di biomarcatori.
Le istruzioni per la costruzione, o meglio la sintesi, delle proteine, sono contenute nel DNA e in particolare nei geni. Gli elementi costitutivi delle proteine sono, a prescindere dalla funzione o dalla forma finale della proteina, gli amminoacidi. Esistono 20 amminoacidi che differiscono tra loro per una specifica porzione nella loro molecola: la cosiddetta catena laterale.
La sintesi di ogni proteina inizia quando alcune specifiche informazioni presenti in un gene, ossia una precisa sequenza di DNA, sono trascritte in una corrispondente sequenza di RNA messaggero. Quest’ultimo a sua volta viene utilizzato per tradurre il linguaggio dei geni, la sequenza degli acidi nucleici, in una corrispondente catena di amminoacidi. All’interno di ciascuna proteina, gli amminoacidi sono disposti in catene più o meno lunghe e sono legati l’uno all’altro da legami peptidici. Le catene possono quindi “ripiegarsi” su se stesse in particolari forme tridimensionali essenziali alla funzione delle proteine e non specificate dalla sequenza genica.
In uno stesso organismo le proteine presenti in ciascun tipo di cellula e tessuto variano molto, anche nel tempo. Possono per esempio variare a seconda dello stadio di sviluppo, delle condizioni interne o degli stimoli che provengono dall’ambiente. Di frequente vengono anche degradate e sostituite. La proteomica studia i diversi aspetti delle proteine, tra cui le possibili interazioni tra le stesse o le loro modifiche.
Esistono molte tecniche per studiare le proteine. Tra quelle più usate in proteomica c’è l’elettroforesi. In particolare, si può far ricorso all’elettroforesi bidimensionale o 2D PAGE (two-dimensional polyacrylamide gel electrophoresis), in cui le proteine contenute nel campione vengono separate su un gel di poliacrillammide in due momenti diversi in base a due loro caratteristiche: il punto isoelettrico e il peso molecolare. Un’altra tecnica molto usata è la spettrometria di massa, grazie alla quale è possibile identificare e quantificare le proteine in un campione sfruttando il rapporto tra massa e carica.
Tabella Riassuntiva dei Codoni e Amminoacidi Corrispondenti
| Codone | Amminoacido | Note |
|---|---|---|
| AUG | Metionina (Met) | Codone di inizio |
| UAA, UAG, UGA | Nessuno | Codoni di stop |
| GUC | Valina (Val) | Esempio di codone |