Proteine del Coronavirus: Tipi e Funzioni

Il sopraggiungere dell’epidemia del nuovo coronavirus (denominato prima “novel Coronavirus 2019” o 2019-nCoV, ora SARS-CoV-2, da Severe Acute Respiratory Syndrome Coronavirus 2; la malattia causata è detta COVID-19) a fine 2019 rappresenta ancora una grande sfida per la comunità scientifica. Si sta compiendo uno sforzo enorme per raccogliere il maggior numero di informazioni nel minor tempo possibile e, infatti, nel solo periodo da gennaio 2020 a giugno 2020, sono stati pubblicati oltre 10 000 articoli scientifici sull’argomento. Si sono verificate anche altre epidemie dovute a coronavirus negli ultimi 17 anni: l’epidemia di SARS, nel 2003, e la MERS (Middle East Respiratory Syndrome), nel 2012. Tuttavia, queste due epidemie sono state così efficientemente controllate che i vaccini prodotti per limitarne la diffusione non sono stati utilizzati. Infatti, il vaccino contro il SARS-CoV si è fermato alle fasi I e II dei clinical trial1,2, mentre quello contro il MERS-CoV è ancora in fase di sperimentazione.

La pandemia di COVID-19 attualmente in corso ha urgentemente spinto l’intera comunità scientifica a dedicare enormi sforzi, lavoro e risorse all’identificazione e allo sviluppo di nuove strategie farmacologiche per arrestare l’infezione da SARS-CoV-2 (di seguito indicato con CoV-2). Come nell’arte della guerra, per poter sconfiggere il nemico è fondamentale conoscere: com’è fatto il virus, qual è la sua forma? Come infetta le cellule umane? Come cresce, replica e si sviluppa nelle cellule ospite? Di che cosa ha bisogno per sopravvivere? A molte di queste domande è già stato risposto.

Ma come si possono ottenere queste informazioni senza poter vedere il nemico? Una particella virale e tutto il macchinario molecolare che usa per replicarsi e sopravvivere nelle cellule ospite non è né visibile a occhio nudo né usando un classico microscopio ottico. È qui che entra in gioco la biologia strutturale, il cui scopo è proprio quello di identificare la struttura tridimensionale delle macromolecole biologiche, come le proteine e gli acidi nucleici, e di correlarla con la loro funzione fisiopatologica. Questa disciplina scientifica si basa su tecniche estremamente avanzate che consentono di visualizzare e analizzare molecole invisibili e di combattere invisibili agenti patogeni.

Il primo isolamento documentato del CoV-2 a partire da campioni prelevati di pazienti infetti è stato realizzato all’ospedale Spallanzani di Roma1 e ha permesso di intraprendere lo studio del nuovo agente patogeno virale in diversi laboratori a livello internazionale. Le immagini delle particelle virali, isolate da persone di tutto il mondo, sono state ottenute usando un microscopio particolate che sfrutta elettroni anziché fotoni come sorgente di radiazione, ossia il microscopio elettronico a trasmissione (TEM). Le proprietà ottiche degli elettroni rendono possibile osservare oggetti fino a 1-10 000 volte più piccoli di 1 µm (10−6 m). Ora sappiamo che il CoV-2 fa parte, più nello specifico, dei β-coronavirus, costituiti da un RNA a singolo filamento con senso positivo (v. Il mondo sorpredente del genoma di SARS-CoV-2), di circa 29,9 kilobasi (kb; 1 kilobase = 1000 basi).

Una particella virale (il virione) di CoV-2 ha un nucleocapside composto dall’RNA genomico e ricoperto da proteine fosforilate che interagiscono con la membrana virale durante l’assemblaggio del virione, giocando un ruolo critico nel potenziare la replicazione del virus2. L’RNA genomico e il nucleocapside sono avvolti da un doppio strato di fosfolipidi in cui sono immerse diverse proteine che svolgono ruoli cruciali per l’infezione e la replicazione: la proteina S, la proteina di membrana (M), l’emoagglutinina esterasi (HE) e la proteina del rivestimento (E).

Leggi anche: Infiammazione e PCR: la connessione

Durante l’infezione della cellula ospite, il genoma virale agisce come RNA messaggero (v. Il mondo sorpredente del genoma di SARS-CoV-2) e dirige la sintesi di due grandi poliproteine (pp1a e pp1ab) che contengono al loro interno proteine più piccole necessarie alla produzione di nuove particelle virali all’interno delle cellule infette. Tale insieme di proteine comprende: un complesso di replicazione/trascrizione, diverse proteine strutturali necessarie a costruire virioni e due proteasi4,5.

Principali Proteine del Coronavirus

I coronavirus sono caratterizzati da diverse proteine che svolgono ruoli chiave nel ciclo vitale del virus. Di seguito, sono descritte alcune delle proteine più importanti:

  • Glicoproteina S (“spike”): Il virus mostra delle proiezioni sulla propria superficie, della lunghezza di circa 20 nm. Tali proiezioni sono formate dalla glicoproteina S (“spike”, dall’inglese “punta”, “spuntone”). Tre glicoproteine S unite compongono un trimero; i trimeri di questa proteina formano le strutture che, nel loro insieme, somigliano a una corona che circonda il virione. Le differenze principali di questo nuovo Coronavirus rispetto al virus della SARS sembrano essere localizzate proprio in questa proteina spike.
  • RNA e proteina N: Il genoma dei Coronavirus è costituito da un singolo filamento di RNA a polarità positiva di grande taglia (da 27 a 32 kb nei diversi virus); non sono noti virus a RNA di taglia maggiore. Il complesso RNA virale - proteina N costituisce il cosiddetto nucleocapside. È da segnalare che dagli studi sulla proteina N è emerso che quest'ultima sia coinvolta anche nella trascrizione e nella replicazione dell'RNA virale.
  • Proteina E: «In particolare, la proteina E, ancora non particolarmente studiata nelle sue caratteristiche di azione, e presente in tutti i coronavirus ed è caratterizzata da un basso tasso di mutazione - spiega il prof Tito Calì, del Dipartimento di Scienze biomediche dell’Università di Padova e correspondig author della ricerca -. Il nostro studio si è focalizzato quindi sulle proteine E ed M di SARS-CoV-2, ed è emerso che esse giocano ruoli diversi nel meccanismo di produzione delle particelle virali all’interno della cellula.
  • Proteasi principale (Mpro): La protease principale di CoV-2, che effettua il maggior numero di tagli, pesa 33,8 kDa e si chiama Mpro, altrimenti conosciuta come proteasi 3C-simile (simile alla chimotripsina). La Mpro è fondamentale per la replicazione virale ed è assente nelle cellule umane.

Meccanismo di Replicazione e Trascrizione

Il meccanismo di replicazione e trascrizione del genoma di SARS-CoV-2 sembra comune a quello di altri coronavirus. Allora, perché questo virus ha manifestazioni epidemiologiche e cliniche così diverse dagli altri coronavirus? Una volta che il coronavirus è entrato nella cellula, il suo genoma a RNA viene immediatamente tradotto dai ribosomi e da proteine specifiche della cellula ospite.

Si forma una poliproteina gigante, detta pp1ab, codificata dal gene replicasi (replicase), a partire da due regioni del genoma virale che possono essere tradotte in proteine e pertanto dette “cornici di lettura aperte” (ORF, Open Reading Frames). La pp1ab è tagliata in 16 proteine più piccole non strutturali (nsp, non structural proteins)3,4. È da notare che due delle proteine prodotte precocemente dall’RNA virale (nsp3 ed nsp5) sono coinvolte ne taglio di pp1ab. Tutte le 16 nsp sono necessarie per la replicazione dell’RNA genomico (gRNA) e la produzione dei vari RNA messaggeri (mRNA) sub-genomici virali (sgRNA, i frammenti del genoma da cui vengono tradotte le proteine virali). Queste proteine “impacchettano” il genoma virale e sono necessarie alla produzione di nuovi virioni.

Inoltre, sempre dal tratto a valle del gene replicasi, sono prodotte sei proteine accessorie (3a, 6, 7a, 7b, 8, 10) il cui ruolo non è ancora del tutto chiaro. La maggior parte del genoma è occupato dal gene replicasi, che codifica per 16 nsp, prodotte dal taglio della poliproteina pp1ab. A valle, è presente l’informazione per le proteine strutturali e accessorie.

Leggi anche: Valori Alti di PCR: Cosa Significa?

La replicazione dell’RNA, cioè la produzione di più copie del genoma virale, è un processo continuo. Il nuovo gRNA viene prodotto per intero grazie alla sintesi di un filamento intermedio negativo (che decorre in direzione 3′→5′; linea arancione tratteggiata nella Figura 2A), che serve da stampo per produrre un nuovo gRNA positivo. Questo processo coinvolge principalmente la proteina nsp12, che è un’RNA polimerasi dipendente dall’RNA (RdRp), e che sintetizza il primo filamento negativo legandosi all’estremità 3′ del gRNA.

Al contrario, la sintesi degli sgRNA, è un processo discontinuo, ossia avviene “a salti”, come illustrato nella Figura 3. Ogni sgRNA ha, all’estremità 5′, una sequenza di 70 nt chiamata Leader (L), che è presente una volta sola all’estremità 5′ dell’intero gRNA. La sintesi discontinua degli sgRNA dipende da sequenze, chiamate sequenze regolatrici della trascrizione (TRS), presenti a valle del Leader (TRS-L) e che precedono ogni sgRNA (TRS-B) (Figura 1). Questo processo assicura la produzione di ogni sgRNA, che è, sostanzialmente, una fusione tra la sequenza Leader all’estremità 5′ dell’RNA virale e la sequenza dell’sgRNA, preceduto dalla TRS-B.

Proteina Spike (S)

Una tra le proteine bersaglio del virus più interessanti a questo scopo è la proteina Spike (S). Questa proteina decora la superficie del virus formando delle protuberanze caratteristiche (facendolo sembrare una corona - da cui il nome “Coronavirus”). Per gentile concessione del Dott.

Nel giro di due mesi dai primi casi di COVID-19, due gruppi di ricerca hanno determinato in modo indipendente la struttura della proteina Spike utilizzando la criomicroscopia elettronica [1],[2], facendo vedere che essa è costituita da tre catene uguali associate (si dice che è “trimerica”) e costituita da una regione che somiglia al gambo di un fiore con, al posto della corolla, la regione essenziale per il contatto con le cellule da infettare (chiamato RBD, dall’inglese receptor-binding domain, “dominio che lega il recettore”). Questa parte della molecola è flessibile come una banderuola al vento, ed è in grado di “cercare” nei dintorni il recettore ACE2 con cui interagire.

La proteina S è una delle più interessanti e studiate tra quelle che contribuiscono al legame con il recettore dell’ospite e alla patogenesi virale. La proteina S “decora” la superficie del virus ed è responsabile per l’aspetto a corona della superficie virale, da cui il nome coronavirus. Questa è usata dal virus come una chiave per entrare nelle cellule ospite15. Agisce legando il recettore sulle cellule bersaglio, induce l’endocitosi dei virioni e catalizza la fusione tra le membrane cellulari e virali, assicurando l’ingresso dell’RNA genomico virale nel citoplasma delle cellule. La proteina S rappresenta anche il bersaglio principale del sistema immunitario, attivandolo e inducendo la produzione di anticorpi. Per questa ragione è considerata il bersaglio primario di farmaci antivirali e vaccini.

Leggi anche: Scopri Klotho

L’organizzazione strutturale di CoV-2-S è molto simile a quella delle proteina S di altri coronavirus come SARS-CoV e MERS-CoV. Essa è una proteina trimerica transmembrana formata da tre unità identiche, dette protomeri (Figura 5). La struttura della CoV-2-S è formata da tre proteine identiche (protomeri, rappresentati rispettivamente in verde, rosso e blu) assemblate in un trimero. Ogni protomero di CoV-2-S (per esempio, quello blu nella Figura 5) comprende due subunità funzionali: una responsabile per il legame al recettore sulle cellule bersaglio (la subunità S1) e l’altra coinvolta nella fusione con la membrane cellulare (subunità S2).

La CoV-2-S, come varie proteine spike di altri SARSr-CoV, è tagliata da proteasi cellulari al confine tra le subunità S1 ed S2, generando due regioni separate che rimangono legate in modo non covalente nella cosiddetta “conformazione di prefusione”. Infatti, CoV-2-S esiste in due differenti conformazioni, chiamate “su” (up) e “giù” (down) (Figura 6B). Nella conformazione “giù”, la CoV-2-S non può mediare la fusione della CoV-2 con la membrana della cellula ospite.

Proteasi Principale (Mpro)

La protease principale di CoV-2, che effettua il maggior numero di tagli, pesa 33,8 kDa e si chiama Mpro, altrimenti conosciuta come proteasi 3C-simile (simile alla chimotripsina). La Mpro è fondamentale per la replicazione virale ed è assente nelle cellule umane.

Il meccanismo di azione di Mpro è simile a quello di altre proteasi. Tutte le proteasi possiedono due residui amminoacidici chiave: un residuo attivatorio (di solito un’istidina, His) che rimuove protoni da un gruppo ossidrilico o tiolico della catena laterale di un secondo residuo (di solito una serina, Ser, o una cisteina, Cys) che agisce come potente nucleofilo, ossia un potente donatore di elettroni. La catalisi inizia con la deprotonazione del tiolo (sostanzialmente un alcol in cui l’atomo di ossigeno è sostituito da un atomo di zolfo) della Cys145 da parte dell’His41, che è seguita dall’attacco nucleofilico della cisteina de-protonata al carbonio del legame peptidico della proteina substrato.

Viene quindi rilasciata una proteina virale più piccola con terminale amminico libero, il residuo di istidina, His41, della proteasi recupera la sua forma de-protonata e si forma un intermedio tioestere che collega il nuovo carbossi-terminale del substrato al tiolo Cys145. Successivamente, si forma un tioestere intermedio che lega il nuovo terminale carbossilico al tiolo della Cys145. Il tioestere è quindi idrolizzato per generare un terminale carbossilico sulla poliproteina rimanente, rigenerando l’enzima libero.

Jin e collaboratori hanno ottenuto la struttura cristallografica ad alta risoluzione della proteina Mpro in complesso con N3 (Figura 3), una molecola nota per legare e inibire la proteasi principale di altri coronavirus, come SARS-CoV e MERS-CoV (codice di accesso in PDB: 6lu7)6. L’analisi della struttura mostra che la proteina appare come dimero (Figura 3A), formato da due subunità identiche di 306 amminoacidi (A e B). I domini I e II hanno una tipica struttura a barile β in cui i filamenti β si dispongono in modo antiparallelo, mentreil dominio III è formato da cinque α-eliche. Il dominio III è unito al dominio II da un lungo ripiegamento (residui 185-200). Il sito di legame al substrato consiste in una cavità profonda che è posta in prossimità dell’interfaccia del dimero tra i domini I e II e contiene la diade catalitica Cys145-His41 (Figura 3C).

L’analisi della struttura ha consentito di capire che l’inibitore N3 lega fortemente la cavità dell’Mpro che normalmente alloggia il substrato, formando un legame covalente con la Cys145. Come la Mpro di SARS-CoV, quella di CoV-2 taglia le poliproteine pp1a e pp1ab in specifiche posizioni amminoacidiche, identificando i siti di taglio grazie a particolari “sequenze di base” nelle poliproteine7. Le posizioni dei residui che appartengono alle sequenze di base nelle poliproteine sono nominate a seconda della posizione relativa rispetto al sito di taglio ed è possibile identificarle in modo molto specifico (per i dettagli, vedere la legenda della Figura 3C e la referenza bibliografica n.

La struttura dell’Mpro di CoV-2 in complesso con l’inibitore N3 fornisce un modello e delle informazioni che possono essere usati per identificare altre molecole organiche capaci di legare la tasca catalitica dell’Mpro con più alta affinità, e condurre così allo sviluppo di nuovi farmaci antivirali specifici per il CoV-2.

tags: #proteine #del #coronavirus #tipi #e #funzioni

Scroll to Top