Determinazione della Struttura Primaria delle Proteine e i Metodi Utilizzati

La struttura primaria di una proteina è il livello più fondamentale della sua organizzazione strutturale e rappresenta la sequenza lineare degli amminoacidi che la compongono. Questa sequenza determina in gran parte la conformazione tridimensionale e la funzione della proteina stessa.

La struttura primaria di una proteina è definita come la sequenza lineare di amminoacidi uniti tra loro da legami peptidici. Ogni proteina è costituita da una specifica sequenza di amminoacidi, che viene determinata geneticamente. La sequenza degli amminoacidi in una proteina è unica e specifica per ogni tipo di proteina. Anche una piccola variazione nella sequenza può avere un impatto significativo sulla struttura e funzione della proteina.

La determinazione della struttura primaria è il primo passo per lo studio delle proteine. Senza una conoscenza precisa della sequenza amminoacidica, è difficile prevedere come una proteina si piegherà e quali funzioni biologiche potrà svolgere.

Le proteine sono costituite da amminoacidi, che sono i mattoni fondamentali delle proteine. Esistono 20 amminoacidi standard che si combinano in varie sequenze per formare diverse proteine. I legami peptidici sono i legami covalenti che uniscono gli amminoacidi in una catena polipeptidica. Questi legami si formano durante una reazione di condensazione, in cui il gruppo carbossilico di un amminoacido reagisce con il gruppo amminico di un altro, rilasciando una molecola di acqua.

La sequenza degli amminoacidi in una proteina è determinata dal codice genetico.

Leggi anche: Determinazione Proteine Latte: Confronto Metodi

Metodi Tradizionali di Sequenziamento delle Proteine

Il sequenziamento delle proteine è il processo di determinazione della sequenza degli amminoacidi in una proteina.

  • Degradazione di Edman: è una tecnica chimica che permette di rimuovere sequenzialmente gli amminoacidi dalla terminazione N di una proteina, identificandoli uno alla volta.
  • Spettrometria di massa: è una tecnica più moderna e potente che permette di analizzare grandi proteine e complessi proteici. In questa tecnica, la proteina viene frammentata in peptidi più piccoli, che vengono poi ionizzati e analizzati in base al loro rapporto massa/carica.
  • Sequenza genomica: permette di dedurre la sequenza delle proteine a partire dalla sequenza di DNA.

La struttura primaria di una proteina è fondamentale per la sua funzione biologica. Le proteine svolgono una vasta gamma di funzioni biologiche, tra cui catalizzare reazioni chimiche (enzimi), trasportare molecole (emoglobina), fornire supporto strutturale (collagene) e regolazione dei processi cellulari (ormoni).

La struttura primaria è anche cruciale per l’interazione delle proteine con altre molecole. Inoltre, la struttura primaria è importante per la regolazione e la modifica delle proteine. Le mutazioni nella sequenza primaria di una proteina possono avere effetti significativi sulla sua funzione.

Una mutazione è una modifica nella sequenza di DNA che può portare a un cambiamento nella sequenza degli amminoacidi di una proteina. Le mutazioni possono essere causate da errori durante la replicazione del DNA, esposizione a radiazioni o agenti chimici, o da processi biologici come la ricombinazione genetica. Alcune mutazioni possono portare a malattie genetiche. D’altra parte, la variabilità nella sequenza primaria può anche essere una fonte di diversità biologica.

La relazione tra la struttura primaria e le funzioni proteiche è complessa e affascinante. Ad esempio, gli enzimi sono proteine che catalizzano reazioni chimiche. La sequenza degli amminoacidi nel sito attivo di un enzima è cruciale per la sua capacità di legare i substrati e catalizzare la reazione. Le proteine di trasporto, come l’emoglobina, hanno sequenze specifiche di amminoacidi che permettono loro di legare e rilasciare molecole come l’ossigeno. Le proteine strutturali, come il collagene, hanno sequenze ripetitive di amminoacidi che formano strutture stabili e resistenti. In sintesi, la struttura primaria di una proteina è la chiave per comprendere come essa svolge le sue funzioni biologiche.

Leggi anche: Determinazione Quantitativa delle Proteine

L'Avvento dell'Intelligenza Artificiale: AlphaFold e il Futuro della Determinazione Strutturale

I metodi computazionali hanno fatto da spartiacque tra la scorsa generazione di tecnologie e AlphaFold, l’intelligenza artificiale sviluppata da Google che viene in aiuto alla biologia molecolare così come la conosciamo.

Un sofisticato algoritmo di intelligenza artificiale (AI) creato dalla divisione DeepMind di Google è riuscito a determinare la forma di una proteina, con risultati di elevata affidabilità in tempi di calcolo rapidi (fino a 30 minuti) rispetto ai risultati ottenuti con metodi sperimentali, che arrivano a decenni di studio. Si tratta di un progresso straordinario nella comprensione della “macchina della vita”.

Nel 1994 prese luogo il primo CASP, Critical Assessment of Structure Prediction (CASP). Siamo rimasti bloccati sul problema del ripiegamento delle proteine per quasi 50 anni. Proprio qualche mese fa, al CASP14-2020, il sistema di intelligenza artificiale sviluppato da DeepMind ha raggiunto l’obiettivo a lungo ricercato: prevedere con precisione la forma delle proteine solo dalla loro sequenza.

La società britannica orientò la successiva ricerca di AlphaFold verso un’altra strada in previsione del CASP14, concentrandosi sui meccanismi fisico-geometrici (e sui loro limiti) di ripiegamento proteico, che riportano a forme e funzioni a noi già conosciute. Accuratezza e velocità ne hanno determinato la vittoria.

L’intelligenza artificiale elaborata ha impiegato circa mezz'ora per ottenere la forma finale di una proteina batterica, sulla quale i ricercatori avevano lavorato per una decina di anni senza ottenere risultati rilevanti.

Leggi anche: Consigli per dimagrire la pancia

Per darvi un’idea più precisa del successo di AlphaFold in numeri: al CASP12 (tenutosi nel 2016) la miglior squadra ottenne un punteggio medio di circa 40 nella categoria più difficile della competizione. Al CASP13 la prima versione di AlphaFold ha ottenuto un punteggio medio di quasi 60 nella stessa categoria. Quest’anno AlphaFold ha ottenuto un punteggio medio di 87.

Il team di ricerca ha sviluppato AlphaFold pensando alla proteina piegata come un “grafico spaziale”: i residui sono i nodi, i bordi collegano i residui in stretta vicinanza tra loro. La rete neurale sviluppata prova a interpretare la struttura del grafico spaziale, apprendendo implicitamente dal grafico in costruzione e utilizzando, ad esempio, sequenze evolutivamente correlate, allineamento di sequenze multiple (MSA) e una rappresentazione delle coppie di residui di amminoacidi.

Per arrivare a ciò, il sistema di intelligenza artificiale è stato addestrato con dati - reperibili e disponibili pubblicamente - di circa 170 000 strutture proteiche dalla banca dati delle proteine, uniti alle informazioni ricavate da database contenenti sequenze proteiche di struttura ignota.

Si apre pertanto una incredibile strada verso la determinazione della struttura delle proteine in tempi brevi. Una quantità limitata di dati potrebbe infatti essere sufficiente per elaborare la complessità di una qualsiasi proteina in poco tempo, proprio grazie al potente algoritmo sviluppato da DeepMind.

Ormai da decenni si ipotizza che malattie degenerative come Alzheimer, Parkinson e fibrosi cistica siano causate da un ripiegamento non funzionale di specifiche proteine. Quasi tutte le proteine hanno dimensioni comprese tra 1 e 100 nm. Ciò rende difficile lo studio della struttura proteica stessa, date le nano-dimensioni da cui è caratterizzata.

La struttura di una proteina ne definisce l’interazione con altre proteine (e, più in generale, altre molecole) dell’organismo, determinandone quindi la sua stessa funzione. Solo per citarne alcune, una proteina può trasmettere impulsi nervosi, trasportare molecole, fungere da catalizzatore e gestire l’evoluzione delle cellule.

Tabella: Punteggi Medi di AlphaFold nei CASP

CASP Punteggio Medio (Categoria Più Difficile)
CASP12 (2016) 40
CASP13 (AlphaFold v1) 60
CASP14 (AlphaFold v2) 87

tags: #determinazione #della #struttura #primaria #delle #proteine

Scroll to Top