La frase "un gene codifica per una proteina" è una delle espressioni più fondamentali della biologia molecolare. Ma cosa significa esattamente?
Definizione di Gene
Un gene è un'unità di informazione ereditaria degli organismi viventi, che occupa una posizione fissa (locus) su un cromosoma. L’idea di gene si è evoluta con l’avanzare delle scoperte della genetica e della biologia molecolare e la sua definizione si è contestualmente ampliata.
Dal concetto astratto di gene come semplice espressione di un determinato carattere, proprio della genetica formale (ossia della genetica mendeliana che ignora le caratteristiche chimico-fisiche dei determinanti ereditari), si è così passati alla definizione di gene come unità di trascrizione, ossia una sequenza di acido nucleico (DNA, o più raramente RNA in alcuni virus) che porta l’informazione per produrre un particolare prodotto genico.
Un gene è una sequenza specifica di nucleotidi nel DNA che contiene le istruzioni per la sintesi di una proteina. Il DNA, o acido desossiribonucleico, è una molecola a doppia elica composta da quattro tipi di basi azotate: adenina (A), timina (T), citosina (C) e guanina (G).
Il DNA è organizzato in cromosomi, strutture altamente condensate che si trovano nel nucleo delle cellule eucariotiche. Ogni cromosoma contiene molteplici geni, e la loro disposizione e sequenza sono cruciali per il corretto funzionamento cellulare.
Leggi anche: Dal DNA alle proteine: un processo fondamentale
Pertanto sono geni:
- I geni strutturali, destinati a essere trascritti e tradotti in catene polipeptidiche.
- I geni a RNA, che vengono solo trascritti e specificano molecole di RNA funzionali, appartenenti a varie classi (RNA transfer, RNA ribosomali, microRNA), deputati al controllo dell’espressione genica e della sintesi proteica.
I primi sono quelli di gran lunga più studiati: a tal punto che, a meno di precisazioni, il termine designa il gene che esprime una catena polipeptidica.
Struttura di un Gene
I geni sono composti da regioni codificanti, chiamate esoni, e da regioni non codificanti, chiamate introni. Gli esoni contengono le informazioni necessarie per la produzione delle proteine, mentre gli introni vengono rimossi durante il processo di maturazione dell’RNA.
Un gene comprende anche regioni di controllo che precedono e seguono la regione codificante. I confini di un gene sono definiti dai punti in cui la trascrizione inizia e finisce. All’interno c’è la regione codificante, formata dalla sequenza nucleotidica che costituisce il trascritto primario, che viene poi tradotto nella sequenza amminoacidica della corrispondente proteina.
La sequenza di un gene inizia con una regione promotrice, che è essenziale per l’inizio della trascrizione. La regione promotrice contiene siti di legame per i fattori di trascrizione, proteine che regolano l’attività del gene.
Leggi anche: Infiammazione e PCR: la connessione
A entrambi i lati della regione codificante abbiamo sequenze di DNA che vengono trascritte ma non tradotte, e che rappresentano elementi di controllo della sintesi proteica:
- una regione detta promotore, a controllo dell’espressione genica, responsabile dell’attacco della RNA polimerasi che consente l’inizio della trascrizione;
- un sito di inizio della trascrizione (cap sequence) alla estremità 5′ dell’RNA;
- una regione non tradotta all’estremità 3′ (o 3′ UTR);
- una coda poliadenilica (polyA) che costituisce un segnale di protezione per il trascritto;
- regioni regolative distali (enhancer) e silenziatori.
Nei geni eucariotici sono presenti sequenze non tradotte, dette introni, situate tra singole zone codificanti (esoni), che vengono eliminate attraverso la maturazione del trascritto primario (splicing).
La maggior parte dei geni nei procarioti è priva di introni e consta di un unico filamento ininterrotto di DNA codificante, definito cistrone. I geni procariotici sono spesso disposti in operoni, regioni in cui diversi geni vicini tra loro sono sotto il controllo di un unico promotore. Nel genoma procariotico la densità genica è molto alta, infatti circa l’80% del genoma è costituito da geni.
Trascrizione e Traduzione
Le due fasi essenziali dell’espressione genica sono:
- La trascrizione: in cui la sequenza (quasi sempre di DNA) che codifica un polipeptide viene trascritta in un filamento di RNA messaggero. La trascrizione è il primo passo nella conversione delle informazioni genetiche dal DNA in proteine. L’RNA sintetizzato durante la trascrizione è chiamato RNA messaggero (mRNA). Questo mRNA è una copia complementare della sequenza di DNA del gene, ma con una differenza significativa: l’uracile (U) sostituisce la timina (T) come base azotata.
- La traduzione: in cui la sequenza sull’mRNA viene tradotta a livello dei ribosomi per dar luogo alla sintesi proteica. La traduzione è il processo attraverso il quale l’mRNA viene utilizzato come modello per sintetizzare una proteina. Questo avviene nei ribosomi, complessi macromolecolari costituiti da RNA ribosomiale (rRNA) e proteine.
Maturazione dell'mRNA
Un altro passo cruciale nella maturazione dell’mRNA è lo splicing, durante il quale gli introni vengono rimossi e gli esoni vengono uniti insieme. Questo processo è mediato da un complesso di proteine e RNA chiamato spliceosoma.
Leggi anche: Valori Alti di PCR: Cosa Significa?
Una volta completato, l’mRNA maturo viene trasportato dal nucleo al citoplasma, dove servirà come modello per la sintesi proteica.
Codoni e Sintesi Proteica
Ogni codone corrisponde a un amminoacido specifico, l’unità di base delle proteine. La traduzione inizia con il codone di inizio, generalmente AUG, che codifica per l’amminoacido metionina.
Il tRNA possiede un anticodone, una sequenza di tre nucleotidi complementare al codone dell’mRNA. Questo meccanismo di riconoscimento garantisce che l’amminoacido corretto venga aggiunto alla catena polipeptidica in crescita.
Il processo di traduzione termina quando il ribosoma incontra un codone di stop (UAA, UAG o UGA), che non codifica per nessun amminoacido.
I codoni sono sequenze di tre nucleotidi sull’mRNA che specificano quali amminoacidi verranno aggiunti durante la sintesi proteica. Esistono 64 codoni possibili, ma solo 20 amminoacidi, il che significa che alcuni amminoacidi sono codificati da più di un codone. La presenza di codoni multipli per un singolo amminoacido offre una certa tolleranza agli errori nelle mutazioni del DNA.
I codoni di inizio e di stop giocano un ruolo cruciale nel determinare i confini della traduzione. Il codone di inizio (AUG) non solo segnala l’inizio della traduzione ma codifica anche per la metionina, che spesso viene rimossa dopo la sintesi proteica.
L’accuratezza nella lettura dei codoni è essenziale per la corretta sintesi proteica.
Regolazione dell'Espressione Genica
La regolazione dell’espressione genica è un processo complesso che controlla quando, dove e quanto un gene viene espresso. Uno dei principali meccanismi di regolazione è il controllo della trascrizione. I fattori di trascrizione sono proteine che si legano a sequenze specifiche di DNA vicino ai geni, modulando l’attività della RNA polimerasi.
La regolazione può avvenire anche a livello di maturazione dell’RNA. Lo splicing alternativo, ad esempio, permette la produzione di diverse varianti di mRNA da un singolo gene, aumentando la diversità delle proteine prodotte.
Infine, la regolazione può avvenire a livello della traduzione e della degradazione proteica. La disponibilità di ribosomi e tRNA, così come la presenza di sequenze regolatorie nell’mRNA, possono influenzare l’efficienza della traduzione.
Implicazioni Biomediche
La comprensione del processo mediante il quale un gene codifica per una proteina ha enormi implicazioni biomediche. Le mutazioni nei geni possono alterare la sequenza delle proteine, portando a malattie genetiche.
Le tecnologie di editing genetico, come CRISPR-Cas9, permettono di correggere mutazioni specifiche nel DNA, offrendo nuove speranze per il trattamento di malattie genetiche. La comprensione della regolazione dell’espressione genica è cruciale anche per lo sviluppo di terapie mirate.
Infine, la ricerca sulla codificazione genica ha portato allo sviluppo di biotecnologie avanzate, come la produzione di proteine ricombinanti per uso terapeutico.
Il Progetto Genoma Umano e Oltre
Il Progetto internazionale ENCODE (Encycopedia of DNA elements), reso possibile dal completamento del Progetto Genoma umano nel 2003, ha l’obiettivo di caratterizzare con metodi informatici e su larga scala tutte le sequenze che compongono il genoma umano e i trascritti da esse derivati (trascrittoma).Da questo studio sistematico sono emerse molteplici caratteristiche del genoma umano che hanno reso obsoleta la definizione classica di «un gene, una proteina», o quella di gene come unità di trascrizione.
Infatti oggi sappiamo che una parte notevole dei geni non codifica proteine e che uno stesso locus genico può codificare una grande varietà di trascritti e proteine attraverso siti di inizio e di terminazione della trascrizione alternativi, e siti di splicing alternativi. In alcuni casi lo splicing alternativo può generare RNA messaggeri che codificano proteine non correlate tra loro, usando differenti schemi di lettura del codice. Secondo diversi dati, infine, la disposizione dei geni non è sempre contigua ma spesso si hanno diversi geni sovrapposti l’uno con l’altro, sia sullo stesso filamento di DNA che su filamenti opposti.
L’idea che emerge, dunque, è che i geni.
Solo in tempi più recenti si è scoperto che questo, che era considerato un assioma della biologia molecolare, è vero solo in parte e che anzi negli organismi complessi come l’uomo da un singolo gene vengono spesso generate più proteine.
Di tutto il nostro genoma solo il 2% codifica per proteine; il restante 98% veniva definito poco carinamente “DNA spazzatura”, proprio perché non genera nessuna proteina. Le sue funzioni rimangono ancora parzialmente sconosciute, ma stiamo iniziando a scoprirle: sappiamo, ad esempio, che parte di questo DNA viene trascritto in RNA, ma qui il processo si arresta e non prosegue con la sintesi di una proteina.
Sono chiamati RNA non codificanti (ncRNA) e ne esistono diversi tipi, classificati in base alle loro dimensioni e funzioni. I ncRNA hanno un ruolo importante nella regolazione dell’espressione genica; sono in grado di “accendere” o “spegnere” determinati geni, interagendo con il DNA in posizioni precise che dipendono dalla loro sequenza e sono stati associati a un grande numero di processi fisiologici e patologici.
Ritorniamo a quel 2% di DNA codificante: sappiamo che possono esserci una serie di modificazioni a carico dell’RNA, cosicché la successione di amminoacidi nella proteina non corrisponda più alla sequenza del DNA iniziale.
Mutazioni Genetiche
Le mutazioni sono cambiamenti nella sequenza di basi del DNA. Pertanto, una mutazione genetica può determinare un cambiamento in un codone e nel tipo di aminoacido che verrà tradotto. Il più delle volte, le mutazioni genetiche si verificano spontaneamente durante la replicazione del DNA. Ciò avviene a causa dell'esposizione delle cellule ad agenti mutageni e ad infezioni patogene.
I due tipi di mutazioni su cui ci concentreremo sono le inserzioni/delezioni e le sostituzioni.
Le inserzioni descrivono l'aggiunta di uno o più nucleotidi non necessari, mentre le delezioni sono la rimozione di uno o più nucleotidi. Questi eventi causano una mutazione frameshift. Ciò significa che ogni codone successivo alla mutazione subirà un cambiamento. Come si può notare, l'aggiunta o la rimozione anche di un solo nucleotide modifica in modo significativo la sequenza del DNA e, di conseguenza, il polipeptide da sintetizzare.
Questo può risultare in un danno nell'organismo. Le sostituzioni possono descrivere la sostituzione del nucleotide corretto con un nucleotide non corretto.
Tabella dei Codoni e Amminoacidi Corrispondenti
Il codice genetico descrive infatti come i codoni (o tripletta di nucleotidi) presenti sulle molecole di mRNA corrispondano a specifici aminoacidi. I codoni sono sequenze di tre nucleotidi e sono noti anche come triplette. Questi nucleotidi possono essere adenina, uracile, citosina e guanina. Le combinazioni di tre di queste basi codificano i singoli amminoacidi. Quando i codoni vengono letti in successione durante la sintesi proteica (traduzione), viene formata una catena di amminoacidi che andrà a costituire un polipeptide.
Di solito il codice genetico viene visualizzato come una ruota o una tabella.
| Codone | Amminoacido |
|---|---|
| CCU | Prolina |
| ACA | Treonina |
| AUG | Metionina (Inizio) |
| UGA, UAG, UAA | Stop |
tags: #un #gene #una #proteina #definizione