Come le Istruzioni in Codice Vengono Tradotte in Proteine: Il Processo Fondamentale della Sintesi Proteica

Le informazioni contenute nel DNA vengono utilizzate dalla cellula per sopravvivere ed esercitare le proprie funzioni attraverso la sintesi delle proteine, macromolecole che svolgono molti ruoli biologici (strutturale, catalitico, regolatorio…). Il passaggio dal gene, l’unità funzionale del DNA, alla proteina avviene in due fasi: la trascrizione del DNA genera l’RNA, la traduzione dell’RNA porta alla sintesi della proteina.

Possiamo immaginare il DNA come il manuale di istruzioni della cellula. Questo manuale è diviso in capitoli, i geni. È stato stimato che il genoma umano (l’insieme dei geni presenti nel DNA delle cellule umane) contenga circa 20.000 sequenze che forniscono alla cellula le istruzioni per sintetizzare proteine (in gergo si dice che “codificano una proteina”). La porzione di DNA non codificante è enorme e il suo ruolo non è ancora ben compreso. Si ipotizza che buona parte di questo abbia funzioni regolatorie ed è noto che i telomeri, porzioni di DNA non codificante poste alla fine dei cromosomi, servono a proteggere il DNA.

Ogni cellula eucariote, nel DNA presente nel nucleo, custodisce le istruzioni necessarie per sintetizzare le proteine, le "tuttofare" del nostro organismo. Queste molecole, straordinariamente versatili, vengono assemblate grazie alla sintesi proteica, il processo biochimico attraverso il quale l'informazione genetica contenuta nel mRNA viene convertita in proteine. La sequenza di nucleotidi (ATCG) del DNA contiene l'informazione genetica che viene temporaneamente copiata nell'RNA (AUCG) - trascrizione - e, successivamente, grazie al codice genetico viene poi tradotta in una sequenza di amminoacidi - traduzione -, le unità di base che compongono le proteine.

Il Processo di Trascrizione: Da DNA a RNA Messaggero

Il DNA, l'acido desossiribonucleico, è definito la molecola della vita, al suo interno sono contenute tutte le informazioni che ci rendono unici. Possiamo immaginarlo come un libro di istruzioni scritto con un alfabeto di quattro lettere: adenina (A), timina (T), citosina (C) e guanina (G), le basi azotate. Queste lettere si appaiano specificamente (A con T, C con G) formando una struttura a doppia elica che ricorda una scala a chiocciola. Le 4 lettere formano i "gradini" della scala mentre i "corrimano" sono costituiti da una catena di zuccheri pentosi (deossiribosio) e gruppi fosfato.

L'insieme di base azotata, zucchero e gruppo fosfato forma il nucleotide, l'unità monomerica caratteristica degli acidi nucleici. Ognuno dei due filamento di DNA ha una direzione precisa, come una strada a doppio senso, indicata dalle estremità 5′ e 3′, che riflettono la chimica dello zucchero presente all'estremità del filamento. In questo libro chiamato DNA, sono presenti alcune "frasi" (sequenze di ATCG), i geni, che contengono le istruzioni per costruire le proteine. Queste parti di DNA sono formate da sezioni codificanti, gli esoni, che trasportano le informazioni vere e proprie per la proteina, e sezioni non codificanti, gli introni, che vengono rimossi prima che il messaggio venga tradotto.

Leggi anche: Shape Shake Foodspring: Funziona?

Non tutte le proteine vengono sintetizzate in ogni cellula e/o in ogni momento. Il primo passaggio nella sintesi di una proteina consiste nella trascrizione del DNA, che possiamo considerare come un “ordine di produzione”. In questo processo, la sequenza del gene viene copiata mediante la sintesi di una molecola di acido ribonucleico (RNA). Come il DNA, l’RNA è costituito da nucleoidi contenenti un gruppo fosfato, uno zucchero (il ribosio) e una base azotata (adenina, citosina, guanina e uracile [U], questo ultimo in sostituzione della timina presente nel DNA). Similmente a quanto avviene nella duplicazione, un filamento di DNA funge da stampo per la sintesi del nuovo acido nucleico: il filamento di RNA è quindi complementare al filamento di DNA.

L’enzima chiave della trascrizione è l’RNA polimerasi. Questo enzima, assieme a proteine accessorie, si lega al DNA in corrispondenza di una zona a monte del gene che deve essere trascritto, chiamata promotore. Sequenze chiamate enhancer controllano l’attivazione della trascrizione. Man mano che la doppia elica di DNA si svolge, l’RNA polimerasi aggiunge nucleotidi al filamento di RNA; la sintesi avviene in direzione 5’-3’. Nelle cellule umane esistono tre tipi di RNA polimerasi: l’RNA polimerasi II sintetizza l’RNA messaggero (mRNA) che codifica la sequenza della proteina, mentre l’RNA polimerasi I e III sintetizzano l’RNA ribosomiale (rRNA) e l’RNA transfer (tRNA) coinvolti nel processo di traduzione. Una sequenza di stop segnala alla polimerasi quando interrompere la sintesi dell’RNA.

L'informazione, per arrivare ai costruttori delle proteine, i ribosomi, deve passare attraverso un intermediario: l'RNA messaggero (mRNA). Questo avviene tramite la trascrizione, il processo in cui un enzima, un proteina che accelera una reazione chimica, chiamato RNA polimerasi II, legge il DNA e crea una copia temporanea, l'mRNA, formata da un solo filamento. Questo enzima si muove lungo il DNA in direzione 5′ → 3′, costruendo l'mRNA con un alfabeto simile a quello del DNA, ma con una differenza: al posto della T, usa la U (uracile). Quindi, quando legge una A sul DNA, mette una U sull'mRNA, e viceversa e quando legge una C mette una G e viceversa. DNA e RNA differiscono, oltre che per il numero di filamenti e la lettera U, anche per o zucchero pentoso che li costituisce, infatti, nell'mRNA è presente il ribosio.

L’RNA messaggero subisce poi un processo di maturazione, in cui vengono eliminate alcune sequenze intercalanti (introni) e mantenute solo le sequenze codificanti (esoni); l’RNA maturo è perciò più corto di quello appena sintetizzato (pre-mRNA). Grazie al processo di splicing,da un singolo trascritto possono essere generati più mRNA maturi che codificano forme alternative di una stessa proteina.

Modifiche all'mRNA durante la trascrizione:

Leggi anche: Pancia piatta a 50 anni: la guida

  • Cappuccio all'estremità 5′: un "cappuccio" chimico viene aggiunto all'inizio dell'mRNA per proteggerlo e aiutarlo a legarsi ai ribosomi nella fase successiva.
  • Coda di poli-A all'estremità 3′: una lunga coda di adenine (poli-A) viene aggiunta alla fine dell'mRNA, per stabilizzarlo e facilitarne l'uscita dal nucleo.
  • Splicing: in questa fase vengono rimossi i tratti di RNA non codificanti (introni) e uniti tra loro i tratti codificanti (esoni), quelli che effettivamente portano le istruzioni per costruire le proteine.

Ora l'mRNA maturo è pronto per lasciare il nucleo e portare il suo messaggio ai ribosomi nel citoplasma, dove verranno costruite le proteine.

La Sintesi Proteica: Cos'è e Come Funziona

Quando la cellula è in possesso dell’ordine di produzione (mRNA), può inviarlo alle fabbriche delle proteine, i ribosomi. È in questi organelli, costituiti da proteine e rRNA e localizzati nel citoplasma, che avviene l’assemblaggio della proteina. Il processo di traduzione dell’RNA si basa sull’esistenza di un codice genetico che mette in relazione la sequenza del DNA con la sequenza degli amminoacidi, le unità base delle proteine. Esistono 20 tipi di amminoacidi (leucina, glicina, metionina…). Una sequenza di tre nucleotidi è detta codone e codifica l’informazione per un singolo amminoacido. Il codice è ridondante: più codoni possono codificare per lo stesso amminoacido. Un esempio per chiarire: sia il codone AAA che il codone AAG codificano per la lisina, ma sia il codone AAA sia il codone AAG codificano solo per la lisina. Esistono 3 codoni di stop, che segnalano la fine della sequenza codificante. Gli amminoacidi arrivano nel ribosoma trasportati dai tRNA. Una porzione del tRNA (anticodone) si appaia al codone corrispondente e permette che sia il corretto amminoacido a legarsi alla catena di amminoacidi nascente. Mutazioni nella sequenza nucleotidica portano a mutazioni nella sequenza amminoacidica della proteina.

La sintesi proteica o traduzione è il passo successivo alla trascrizione, in cui l'informazione contenuta prima del DNA e poi nell'mRNA viene "tradotta" nel linguaggio delle proteine. Proprio come tradurre un testo da una lingua all'altra, la cellula decodifica la sequenza di nucleotidi (A, U, C, G nell'RNA) in una sequenza di amminoacidi. Le proteine, infatti, sono polimeri, lunghe catene di amminoacidi a loro volta composti da carbonio, idrogeno, ossigeno, azoto e talvolta zolfo. Per portare a termine la traduzione, gli amminoacidi non si assemblano in modo autonomo ma la cellula impiega i ribosomi, organelli costituiti da due subunità (una maggiore e una minore) di RNA ribosomiale (rRNA) e proteine.

I ribosomi "leggono" la sequenza di nucleotidi dell'mRNA a gruppi di tre, chiamati codoni, e a ogni codone associano la sequenza complementare, l'anti-codone, presente su un'altra categoria di RNA, i tRNA o RNA di trasporto. L'anti-codone è specifico per un amminoacido, caricato sul tRNA dall'enzima aminoacil-tRNA sintetasi. Per comprendere meglio, vediamo passo passo come avviene questo processo.

Fasi della traduzione:

Leggi anche: 150g di proteine: la guida completa

  1. Inizio della traduzione: il sito A accoglie il tRNA con l'amminoacido associato (l'amminoacil-tRNA) e permette il riconoscimento tra codone (dell'mRNA) e anticodone (del tRNA).
  2. Allungamento del polipetide: nel sito P, se il legame è corretto, avviene il legame peptidico tra l’amminoacido associato al tRNA e la proteina in formazione.
  3. Terminazione della traduzione: nel Sito E (da exit, uscita) il tRNA, ormai privo dell'amminoacido, può lasciare il ribosoma. Codoni specifici come UAA, UAG e UGA segnalano al ribosoma che la traduzione deve terminare e a questo punto la proteina può essere rilasciata.

Facciamo un esempio pratico: il ribosoma scorre l'mRNA e incontra inizialmente il codone di inizio AUG, che codifica per l'amminoacido metionina (Met). Un tRNA specifico, con l'anticodone complementare, si lega al sito A del ribosoma, portando con sé la metionina. Il codone successivo sull'mRNA, ad esempio GUC, specifica l'amminoacido valina (Val). Un altro tRNA, con l'anticodone CAG, si posiziona nel sito A, recando la valina. A questo punto, la metionina, precedentemente legata al tRNA nel sito P, forma un legame peptidico con la valina nel sito A. Il tRNA "scarico" nel sito P si sposta nel sito E e viene rilasciato, mentre il tRNA con la catena peptidica (Met-Val) si trasloca nel sito P. Il sito A è ora libero per accogliere il tRNA corrispondente al codone successivo. Questo processo si ripete, con l'aggiunta sequenziale di amminoacidi alla catena in crescita, finché il ribosoma non incontra un codone di stop (UGA, UAA o UAG) sull'mRNA, segnalando la fine della traduzione e il rilascio della proteina completa.

Ogni codone, quindi, codifica per un particolare amminoacido (o un segnale di inizio o fine della traduzione), determinando così l'ordine preciso in cui gli amminoacidi verranno assemblati per formare la proteina. Il ribosoma deve essere molto preciso, un solo errore può causare la perdita di struttura della proteina e anche della sua funzione.

Il Codice Genetico: Un Linguaggio Universale e Degenerato

Il codice genetico è il motore che guida la sintesi delle proteine, guidando il processo a partire da come viene organizzata l'informazione nel DNA, passando dalla copia temporanea di mRNA. Due aspetti fondamentali del codice genetico sono la sua universalità e la sua degenerazione. È definito universale perché è presente e viene usato in tutti gli organismi viventi con piccole eccezioni. La degenerazione, invece, deriva dal fatto che i 64 codoni possibili (generati dalle quattro basi azotate in triplette) codificano per soli 20 amminoacidi; tre di questi codoni agiscono come segnali di terminazione (UAG, UAA, UGA), mentre i restanti 61 specificano gli amminoacidi. Questa ridondanza implica che più codoni possono codificare per lo stesso amminoacido, un aspetto cruciale del codice genetico.

Secondo il dogma l'informazione è contenuta nel DNA che è in grado di replicarsi in maniera che essa sia conservata da una generazione all'altra. L'informazione contenuta nel DNA è quella necessaria per la produzione di una proteina. L'informazione contenuta negli acidi nucleici deve dunque essere tradotta in una sequenza di amminoacidi che costituiscono la singola proteina. Il processo della sintesi proteica prevede che l'informazione contenuta nella sequenza di nucleotidi degli acidi nucleici sia convertita in una sequenza di amminoacidi, ovvero in una proteina. Per effettuare la sintesi proteica è necessario un tipo particolare di RNA, il messaggero (mRNA) che lascia il nucleo e si porta nel citosol. Qui viene inserito nei ribosomi, corpuscoli liberi nel citosol oppure legati al reticolo endoplasmatico rugoso costituiti da RNA (ribosomiale) e proteine, nei quali avviene l'assembramento degli aminoacidi in proteina.

I biologi hanno cercato di capire come l'informazione contenuta nei nucleotidi potesse trasformarsi, potesse essere tradotta, in una sequenza di amminoacidi ed hanno inizialmente ipotizzato che un singolo nucleotide codificasse per un amminoacido. In questo modo tuttavia il codice genetico avrebbe codificato solo per quattro dei venti amminoacidi esistenti nella struttura delle proteine. In maniera analoga si è allora ipotizzato occorressero due nucleotidi per codificare un amminoacido, in tal modo le possibili combinazioni sono date da 4 (numero di nucleotidi) elevato a 2 (numero dei membri della coppia) ovvero 16. Sedici combinazioni non sono ancora sufficienti a codificare per 20 amminoacidi, dunque l'ipotesi successiva è stata di 3 nucleotidi per ogni amminoacido: 43 = 64.

Pertanto l'analisi accurata dei risultati fenotipici di esperimenti di mutazioni puntiformi, di delezioni o inserzioni, ha dimostrato che un gruppo di nucleotidi, la tripletta, è in grado di codificare per un singolo amminoacido. Sino al 1960 non è stato possibile capire come l'informazione contenuta nel DNA potesse trasformarsi nelle istruzioni per produrre una proteina poiché non si conosceva l'esistenza dell'RNA messaggero che fu isolato appunto in quell'anno. I polinucleotidi sintetici si devono a L. Heppel e M. Singer, è stato così possibile utilizzarli come "stampo" per la sintesi proteica ideata grazie a J.H. Matthaei in vitro in un sistema privo di cellule capace di iniziare la sintesi non appena vi fosse aggiunto un messaggero. Quando il polinucleotide era costituito solo da una base (ad esempio l'uracile) si doveva ottenere un polipeptide con un unico amminoacido ripetuto (nell'esempio la fenilalanina). Dall'analisi della composizione in amminoacidi dei polipeptidi così prodotti dai messaggeri sintetici, è stato possibile individuare tutti i codoni ovvero le triplette del codice genetico.

Qualche anno dopo, nel 1964 si giunse anche alla dimostrazione che erano implicati nel processo di sintesi proteica anche i tRNA che riconoscono il codone del messaggero e sono legati ad uno specifico amminoacido. Osservando la tabella nella quale abbiamo riportato il codice genetico, si può notare che per molti amminoacidi è segnato più di un codone (tripletta), per questo motivo si dice che il codice è degenerato.

Una curiosità: i codoni con nucleotidi pirimidinici in seconda posizione codificano prevalentemente per amminoacidi idrofobici, mentre quelli con purine nella medesima posizione codificano per amminoacidi prevalentemente polari. Di conseguenza di quanto detto, un'eventuale mutazione nella terza lettera del codone porterà generalmente allo stesso amminoacido, mentre nella seconda porterà alla sostituzione di amminoacidi simili e la stessa cosa si può dire della prima posizione.

La sintesi delle proteine comporta la traduzione delle istruzione dalla sequenza nucleotidica dell'mRNA (il "linguaggio" degli acidi nucleici) in una sequenza di amminoacidi (il "linguaggio" delle proteine). Ogni amminoacido, che deve essere incorporato nella proteina, viene innanzitutto attaccato a una molecola specifica di tRNA.

Ma come fa l'RNA di trasporto a sapere esattamente qual è il punto di aggancio sull'RNA messaggero secondo le indicazioni del DNA? In realtà, si tratta di un meccanismo abbastanza semplice. Tuttavia i codici di cui il DNA dispone sono solo quattro (adenina, timina, guaina, citosma), dunque, per aumentare il numero dei messaggi cifrati da parte del DNA, è necessario accrescere il numero di combinazioni possibili. La chiave del meccanismo con cui funziona il tRNA adattatore è l'appaiamento fra tre delle sue basi (l'anticodone) e tre basi delFmRNA (il codone). Ogni molecola di tRNA ha nella sua sequenza di basi un anticodone complementare a una sequenza di tre basi - cioè a un codone - del filamento di mRNA.

L'intero processo concerne il ribosoma, un organulo cellulare formato da RNA ribosomico e proteine, che funge da sito per il montaggio della molecola proteica. Ogni ribosoma è formato da due subunità, una più grande e una più piccola: la subunità grande è dotata di "tasche" per l'inserimento del tRNA, mentre la subunità piccola ha i siti per l'attacco dell'mRNA . Per iniziare la sintesi di un polipeptide, un fìlamento di mRNA si associa a un ribosoma e al tRNA che porta il primo amminoacido da incorporare nella catena proteica. L'RNA messaggero ha una tripletta di basi che viene riconosciuta dal ribosoma come segnale d'inizio.

Una volta che il primo amminoacido si trova nella posizione specificata dal codone di inizio dell'mRNA, il successivo codone lega l'anticodone complementare del tRNA che trasporta l'amminoacido seguente. Si forma così il primo dipeptide che rimane attaccato al tRNA dell'aminoacido che è arrivato per ultimo. Il ribosoma quindi, senza rilasciare il tRNA che trattiene il dipeptide, impegna il codone successivo liberando il primo codone e il primo tRNA. L'amminoacido corrispondente al nuovo codone arriva legato al suo tRNA e viene aggiunto al dipeptide a formare un tripeptide. L'ultimo tRNA viene quindi rilasciato e il polipeptide si stacca dal ribosoma e dal tRNA. La catena polipeptidica è completa.

Il codice genetico che stabilisce le corrispondenze fra triplette di basi dell'RNA e amminoacidi è lo stesso per le cellule di tutti gli organismi esaminati, dai batteri ai funghi, dalle piante agli animali.

È costituita da un filamento singolo, polimerizzato in direzione 5’ → 3’, utilizzando come stampo il filamento 3’ → 5’ del DNA, filamento detto antisenso. L’enzima che catalizza la polimerizzazione è l’RNA polimerasi che riconosce sullo stampo una particolare sequenza nucleotidica detta promotore. La catena di DNA viene aperta dall’enzima stesso e la sintesi dell’mRNA procede fino a che l’RNA polimerasi non incontra una seconda sequenza nucleotidica, detta sequenza di terminazione, giunta alla quale la trascrizione termina. Nei procarioti questo trascritto è pronto per la successiva traduzione; negli eucarioti deve subire la maturazione, detta anche splicing. Infatti nel secondo caso il trascritto primario, che viene detto pre-mRNA, possiede dei tratti detti introni, i quali non vanno tradotti. Gli unici tratti che verranno espressi sono gli esoni. Il pre-mRNA subisce quindi una rielaborazione: sulla estremità 5’ viene legata una molecola di 7-metilguanosina detta CAP (cappuccio) mentre all’estremità 3’ viene aggiunto un segmento di numerosi residui di adenosina detta coda poli-A. Il CAP è necessario per rendere stabile l’mRNA.

Prima di essere diretto al citoplasma, però, gli introni vengono rimossi ed eliminati mentre gli esoni vengono legati assieme, per formare l’mRNA maturo. I ribosomi sono organuli presenti nel citoplasma; negli eucarioti spesso sono associati al reticolo endoplasmatico. Queste strutture complesse, che si muovono fisicamente lungo una molecola di RNA detto messaggero, catalizzano la formazione del legame peptidico tra gli amminoacidi, formando così la catena polipeptidica. I ribosomi sono formati da due parti separate, dette subunità (maggiore e minore), ciascuna delle quali contiene il proprio rRNA. Nei procarioti i ribosomi hanno un tasso di sedimentazione di 70 S (svedberg): la subunità maggiore è di 50 S mentre quella minore è di 30 S. Durante il processo di allungamento, la parte iniziale dell’mRNA può essere disponibile all’attacco di un altro ribosoma, che forma un nuovo complesso di inizio.

I primi passi del lungo cammino che porterà i biologi alla comprensione dei meccanismi con cui il DNA controlla le cellule furono mossi da un medico inglese, Archibald Garrod, nel 1908. Egli, studiando le possibili cause alla base di una malattia detta alcaptonuria, ipotizzò che ci potessero essere degli errori congeniti del metabolismo, quindi qualcosa che fosse ereditario. Nel 1941 George Beadle, un genetista, capì che i geni controllano la sintesi degli enzimi. Con Edward Tatum, un altro genetista, utilizzò la comune muffa del pane, Neurospora crassa, per allestire una serie di esperimenti; impiegando i raggi X per indurre le mutazioni, essi capirono che, ad una certa mutazione, corrispondeva la perdita di funzionalità di un certo enzima.

Nel 1961 Niremberg e Matthaei idearono la maniera di decifrare il codice genetico. Essi utilizzarono degli estratti cellulari contenenti tutti i componenti necessari alla sintesi proteica ma privi di RNA messaggero, in cui venne successivamente aggiunto un mRNA sintetico, costituito da ripetizioni continue della stessa base azotata, l’acido poliuridilico o poli-U. Di volta in volta uno dei venti amminoacidi necessari veniva sostituito con lo stesso amminoacido marcato radioattivamente; dopo la centrifugazione fu quindi possibile scoprire il polipeptide marcato, che era composto interamente dall’amminoacido fenilalanina e quindi, indirettamente, la tripletta (codone) corrispondente, cioè UUU. Con un metodo analogo furono decifrati tutti i codoni possibili per i 20 amminoacidi. Come si può notare dalla tabella sottostante che li riporta, esistono in genere diversi codoni per lo stesso amminoacido: il codice genetico è quindi ridondante.

Tabella del Codice Genetico

Come si legge la tabella del codice genetico? Facciamo un esempio: mettiamo di dover scoprire qual è l'amminoacido corrispondente al codone AGC. La prima lettera è la A: quindi seguiremo il terzo blocco dall'alto (quello con la lettera A più grande, subito a sinistra). Poi ci posizioniamo sulla colonna della G e, seguendo sempre il blocco con la A grande, cerchiamo la lettera G sull'ultima colonna.

U C A G
UUU Fenilalanina Serina Tirosina Cisteina UCU
UUC Fenilalanina Serina Tirosina Cisteina UCC
UUA Leucina Serina STOP STOP UCA
UUG Leucina Serina STOP Triptofano UCG
CUU Leucina Prolina Istidina Arginina CCU
CUC Leucina Prolina Istidina Arginina CCC
CUA Leucina Prolina Glutammina Arginina CCA
CUG Leucina Prolina Glutammina Arginina CCG
AUU Isoleucina Treonina Asparagina Serina ACU
AUC Isoleucina Treonina Asparagina Serina ACC
AUA Isoleucina Treonina Lisina Arginina ACA
AUG Metionina Treonina Lisina Arginina ACG
GUU Valina Alanina Acido Aspartico Glicina GCU
GUC Valina Alanina Acido Aspartico Glicina GCC
GUA Valina Alanina Glutammato Glicina GCA
GUG Valina Alanina Glutammato Glicina GCG

tags: #come #le #istruzioni #in #codice #vengono

Scroll to Top