La pandemia di COVID-19 ha spinto la comunità scientifica a dedicare enormi sforzi all'identificazione e allo sviluppo di nuove strategie farmacologiche per arrestare l’infezione da SARS-CoV-2 (CoV-2). Per sconfiggere il virus, è fondamentale conoscere la sua struttura, come infetta le cellule umane, come si replica e di cosa ha bisogno per sopravvivere.
Una particella virale e tutto il macchinario molecolare che usa per replicarsi e sopravvivere nelle cellule ospite non è visibile a occhio nudo né usando un classico microscopio ottico. È qui che entra in gioco la biologia strutturale, il cui scopo è proprio quello di identificare la struttura tridimensionale delle macromolecole biologiche, come le proteine e gli acidi nucleici, e di correlarla con la loro funzione fisiopatologica.
Questa disciplina scientifica si basa su tecniche estremamente avanzate che consentono di visualizzare e analizzare molecole invisibili e di combattere invisibili agenti patogeni. Nei prossimi paragrafi, partendo dalla descrizione dell’architettura complessiva del virus, verranno descritte le strutture delle tre protein di CoV-2 che sono considerate attualmente come i migliori bersagli farmacologici potenziali, ovvero la proteasi principale Mpro, la proteina Spike (S) e l’RNA polimerasi dipendente dall’RNA (RNA dependent RNA polymerase, RdRp). Verrà anche analizzata la relazione che lega le strutture di queste molecule alle loro funzioni fisiopatologiche.
Architettura del Virus SARS-CoV-2
Il primo isolamento documentato del CoV-2 a partire da campioni prelevati di pazienti infetti è stato realizzato all’ospedale Spallanzani di Roma e ha permesso di intraprendere lo studio del nuovo agente patogeno virale in diversi laboratori a livello internazionale.
Le immagini delle particelle virali, isolate da persone di tutto il mondo, sono state ottenute usando un microscopio particolato che sfrutta elettroni anziché fotoni come sorgente di radiazione, ossia il microscopio elettronico a trasmissione (TEM). Le proprietà ottiche degli elettroni rendono possibile osservare oggetti fino a 1-10 000 volte più piccoli di 1 µm (10−6 m).
Leggi anche: Proteine delle Uova in Polvere
Ora sappiamo che il CoV-2 fa parte, più nello specifico, dei β-coronavirus, costituiti da un RNA a singolo filamento con senso positivo (v. Il mondo sorpredente del genoma di SARS-CoV-2), di circa 29,9 kilobasi (kb; 1 kilobase = 1000 basi). Una particella virale (il virione) di CoV-2 ha un nucleocapside composto dall’RNA genomico e ricoperto da proteine fosforilate che interagiscono con la membrana virale durante l’assemblaggio del virione, giocando un ruolo critico nel potenziare la replicazione del virus.
L’RNA genomico e il nucleocapside sono avvolti da un doppio strato di fosfolipidi in cui sono immerse diverse proteine che svolgono ruoli cruciali per l’infezione e la replicazione: la proteina S, la proteina di membrana (M), l’emoagglutinina esterasi (HE) e la proteina del rivestimento (E). Il capside virale (in grigio), che contiene l’RNA a singolo filamento associato alle proteine del nucleocapside, è costituito da un doppio strato lipidico in cui sono inserite le proteine di superficie (S in rosso; E in giallo; M in arancio; HE in bianco).
Durante l’infezione della cellula ospite, il genoma virale agisce come RNA messaggero e dirige la sintesi di due grandi poliproteine (pp1a e pp1ab) che contengono al loro interno proteine più piccole necessarie alla produzione di nuove particelle virali all’interno delle cellule infette. Tale insieme di proteine comprende: un complesso di replicazione/trascrizione, diverse proteine strutturali necessarie a costruire virioni e due proteasi.
Proteasi Principale Mpro
La protease principale di CoV-2, che effettua il maggior numero di tagli, pesa 33,8 kDa e si chiama Mpro, altrimenti conosciuta come proteasi 3C-simile (simile alla chimotripsina). La Mpro è fondamentale per la replicazione virale ed è assente nelle cellule umane.
Il meccanismo di azione di Mpro è simile a quello di altre proteasi. Tutte le proteasi possiedono due residui amminoacidici chiave: un residuo attivatorio (di solito un’istidina, His) che rimuove protoni da un gruppo ossidrilico o tiolico della catena laterale di un secondo residuo (di solito una serina, Ser, o una cisteina, Cys) che agisce come potente nucleofilo, ossia un potente donatore di elettroni.
Leggi anche: Cause dell'Aumento di Proteine nelle Urine
La catalisi inizia con la deprotonazione del tiolo (sostanzialmente un alcol in cui l’atomo di ossigeno è sostituito da un atomo di zolfo) della Cys145 da parte dell’His41, che è seguita dall’attacco nucleofilico della cisteina de-protonata al carbonio del legame peptidico della proteina substrato. Viene quindi rilasciata una proteina virale più piccola con terminale amminico libero, il residuo di istidina, His41, della proteasi recupera la sua forma de-protonata e si forma un intermedio tioestere che collega il nuovo carbossi-terminale del substrato al tiolo Cys145.
Successivamente, si forma un tioestere intermedio che lega il nuovo terminale carbossilico al tiolo della Cys145. Il tioestere è quindi idrolizzato per generare un terminale carbossilico sulla poliproteina rimanente, rigenerando l’enzima libero.
Jin e collaboratori hanno ottenuto la struttura cristallografica ad alta risoluzione della proteina Mpro in complesso con N3, una molecola nota per legare e inibire la proteasi principale di altri coronavirus, come SARS-CoV e MERS-CoV (codice di accesso in PDB: 6lu7). L’analisi della struttura mostra che la proteina appare come dimero (Figura 3A), formato da due subunità identiche di 306 amminoacidi (A e B).
I domini I e II hanno una tipica struttura a barile β in cui i filamenti β si dispongono in modo antiparallelo, mentre il dominio III è formato da cinque α-eliche. Il dominio III è unito al dominio II da un lungo ripiegamento (residui 185-200). Il sito di legame al substrato consiste in una cavità profonda che è posta in prossimità dell’interfaccia del dimero tra i domini I e II e contiene la diade catalitica Cys145-His41 (Figura 3C).
L’analisi della struttura ha consentito di capire che l’inibitore N3 lega fortemente la cavità dell’Mpro che normalmente alloggia il substrato, formando un legame covalente con la Cys145. Come la Mpro di SARS-CoV, quella di CoV-2 taglia le poliproteine pp1a e pp1ab in specifiche posizioni amminoacidiche, identificando i siti di taglio grazie a particolari “sequenze di base” nelle poliproteine.
Leggi anche: Le Migliori Proteine Prozis
La sovrapposizione di sequenze delle Mpro di 12 coronavirus, inclusi CoV-2, SARS-CoV e MERS-CoV, mostra che i residui che rivestono la tasca che lega il substrato sono fortemente conservati.
La struttura dell’Mpro di CoV-2 in complesso con l’inibitore N3 fornisce un modello e delle informazioni che possono essere usati per identificare altre molecole organiche capaci di legare la tasca catalitica dell’Mpro con più alta affinità, e condurre così allo sviluppo di nuovi farmaci antivirali specifici per il CoV-2.
Una delle metodiche che è usata correntemente per identificare nuovi composti capostipiti è lo screening virtuale. Lo screening virtuale è una tecnica computazionale che permette di analizzare grandi numeri di dati (highthrouput screening) di librerie di migliaia di composti chimici, per identificare molecole che abbiano maggiori probabilità di legare il bersaglio farmacologico.
Il legame del composto chimico al bersaglio viene simulato in silico (ossia in maniera totalmente predittiva), riducendo fortemente i costi, il tempo e lo sforzo rispetto allo stesso screening eseguito sperimentalmente. Jin e collaboratori hanno usato proprio questa tecnica per identificare molecole con un volume corrispondente a quello della tasca catalitica dell’Mpro, partendo dalla sua struttura cristallografica in complesso con N3.
Tutti i composti, tipicamente piccole molecole organiche, conservate in una specifica banca dati, sono stati testati in silico per individuare quelli che, date le proprietà geometriche e chimiche, potessero essere potenzialmente in grado di legare la Mpro nella tasca catalitica. Lo screening dei composti viene effettuato tramite programmi dedicati. In questo caso è stato usato Glide (versione 8.2). Questa analisi ha portato all’identificazione di un composto, detto cinaserina, che ha mostrato il punteggio più alto e la modalità più sensata di legame alla tasca catalitica dell’Mpro.
Di rilievo è il fatto che la cinaserina non è tossica per le cellule umane, mostrando una citotossicità del 50% a concentrazioni più alte di 200 μM, mentre è capace di inibire l’Mpro di CoV-2 a concentrazioni più basse (IC50=125 μM). Infatti, una volta che un nuovo composto è identificato, viene inizialmente somministrato ad animali da esperimento, e successivamente agli esseri umani nel corso di sperimentazioni cliniche per testarne sicurezza ed efficacia.
Una strategia alternativa per accelerare i tempi è quella di testare l’attività di molecole esistenti e già approvate per altre patologie. Jin e collaboratori hanno applicato questa strategia per trovare velocemente farmaci contro COVID-19. Infatti, hanno analizzato oltre 10 000 composti come ligandi possibili della Mpro, inclusi farmaci già approvati, alcuni candidati per le sperimentazioni cliniche e anche dei prodotti naturali. Tra questi, hanno identificato un derivato del 5-fluorouracile, il Carmofur (1-hexylcarbamoyl-5-fluorouracil), che è risultato capace di legare ed inibire l’Mpro.
Il Carmofour è stato già approvato come farmaco antitumorale ed è usato per trattare il cancro del colon retto fin dal 1980. Sempre, Jin e collaboratori hanno risolto la struttura cristallografica dell’Mpro in complesso con il Carmofour, scoprendo le basi molecolari dell’efficacia del composto. In particolare, l’acido grasso di Carmofour lega la Cys145 attraverso un legame covalente, inibendo l’enzima.
Proteina Spike (S)
I virus evolvono continuamente le proteine della loro superficie per potenziare l’interazione con i recettori sulle cellule ed entrare in esse con maggior efficienza secondo il modello chiave-serratura. La proteina S è una delle più interessanti e studiate tra quelle che contribuiscono al legame con il recettore dell’ospite e alla patogenesi virale.
La proteina S “decora” la superficie del virus ed è responsabile per l’aspetto a corona della superficie virale, da cui il nome coronavirus. Questa è usata dal virus come una chiave per entrare nelle cellule ospite. Agisce legando il recettore sulle cellule bersaglio, induce l’endocitosi dei virioni e catalizza la fusione tra le membrane cellulari e virali, assicurando l’ingresso dell’RNA genomico virale nel citoplasma delle cellule.
La proteina S rappresenta anche il bersaglio principale del sistema immunitario, attivandolo e inducendo la produzione di anticorpi. Per questa ragione è considerata il bersaglio primario di farmaci antivirali e vaccini.
L’organizzazione strutturale di CoV-2-S è molto simile a quella delle proteina S di altri coronavirus come SARS-CoV e MERS-CoV. Essa è una proteina trimerica transmembrana formata da tre unità identiche, dette protomeri (Figura 5). La struttura della CoV-2-S è formata da tre proteine identiche (protomeri, rappresentati rispettivamente in verde, rosso e blu) assemblate in un trimero.
Ogni protomero di CoV-2-S (per esempio, quello blu nella Figura 5) comprende due subunità funzionali: una responsabile per il legame al recettore sulle cellule bersaglio (la subunità S1) e l’altra coinvolta nella fusione con la membrane cellulare (subunità S2). La CoV-2-S, come varie proteine spike di altri SARSr-CoV, è tagliata da proteasi cellulari al confine tra le subunità S1 ed S2, generando due regioni separate che rimangono legate in modo non covalente nella cosiddetta “conformazione di prefusione”.
Infatti, CoV-2-S esiste in due differenti conformazioni, chiamate “su” (up) e “giù” (down) (Figura 6B). Nella conformazione “giù”, la CoV-2-S non può mediare la fusione della CoV-2 con la membrana della cellula ospite.
RNA Polimerasi Dipendente dall'RNA (RdRp)
Durante l’infezione della cellula ospite, il genoma virale agisce come RNA messaggero e dirige la sintesi di due grandi poliproteine (pp1a e pp1ab) che contengono al loro interno proteine più piccole necessarie alla produzione di nuove particelle virali all’interno delle cellule infette. Tale insieme di proteine comprende: un complesso di replicazione/trascrizione.
La replicazione virale inizia con l’adsorbimento del v. alla cellula, fenomeno che richiede un’interazione tra specifiche strutture di superficie del virione (antirecettori) e recettori della membrana citoplasmatica della cellula. All’adsorbimento segue poi la penetrazione del v., che può avvenire per traslocazione del virione attraverso la membrana cellulare, per endocitosi all’interno di vacuoli citoplasmatici o per fusione dell’involucro pericapsidico del v. con la membrana citoplasmatica cellulare.
All’interno della cellula, l’acido nucleico virale viene liberato da quanto rimane del rivestimento proteico (decapsidazione) e inizia a essere espresso. Dal momento in cui il v. penetra nella cellula a quello in cui cominciano a prodursi i primi virioni di progenie, esso non è più rilevabile nella cellula come entità infettante, motivo per il quale questo periodo è stato chiamato fase di eclisse.
Questa è caratterizzata da un’intensa attività metabolica per consentire l’espressione del genoma virale, la sua replicazione e la produzione delle proteine strutturali che andranno a costituire i virioni di progenie. Tali fasi sono dirette dal v. secondo strategie replicative caratteristiche di ciascun gruppo. La replicazione virale si completa con il montaggio (o assemblaggio) delle subunità proteiche virali che, racchiudendo l’acido nucleico ed eventuali altri componenti interni, formano i virioni di progenie.
| Proteina Virale | Funzione Principale | Importanza Farmacologica |
|---|---|---|
| Mpro (Proteasi Principale) | Taglia le poliproteine virali per la replicazione | Bersaglio per farmaci antivirali |
| Proteina Spike (S) | Media il legame al recettore cellulare e la fusione | Bersaglio per vaccini e terapie |
| RdRp (RNA Polimerasi) | Replica il genoma virale | Bersaglio per farmaci antivirali |