Banche Dati Proteiche: Definizione e Tipi

Il Protein Data Bank (PDB) è un database che contiene tutte le strutture di proteine osservate sperimentalmente fino ad ora.

Esplorazione dello Spazio Conformazionale delle Proteine

Usando un sofisticato algoritmo di campionamento abbiamo esplorato in modo accurato lo spazio conformazionale di un polipeptide di 60 amminoacidi.

Questo ha permesso di generare circa 30000 strutture compatte con tutte le caratteristiche delle proteine osservate in natura, quali un alto contenuto di eliche e di foglietti beta.

Queste 30000 configurazioni includono tutte le strutture esistenti in natura di proteine di taglia simile e molte altre strutture mai osservate.

Analizzando in dettaglio le differenze tra le prime e le seconde, abbiamo dimostrato che le proteine naturali sono caratterizzate da un numero significativamente più elevato di contatti tra amminoacidi vicini in sequenza.

Leggi anche: Banca dati alimenti crudi: focus sulle proteine

Le proteine naturali sono quindi come corde avvolte a maglie corte.

Riferimenti bibliografici: 6(11): e1000957 (2010).

Il Nodo UNIPD di ELIXIR

Il DSB ospita il nodo UNIPD di ELIXIR, l'infrastruttura di ricerca europea per i dati nelle scienze della vita.

ELIXIR fornisce alla comunità scientifica un'infrastruttura all'avanguardia per la bioinformatica, con piattaforme e servizi avanzati per l'analisi di dati genomici, proteomici e metabolomici.

Il DSB ospita diverse banche dati, registri, strumenti e predittori inclusi nel Piano di Erogazione dei Servizi del nodo italiano di ELIXIR.

Leggi anche: Dati e tendenze su vegani e vegetariani in Italia

Numerose risorse mantenute e sviluppate presso il DSB sono riconosciute a livello globale come centrali nel contesto della biologia strutturale, in particolare per quanto riguarda il campo delle proteine intrinsecamente disordinate.

Banche Dati Specializzate

MobiDB

MobiDB è una risorsa unica che funge da knowledge base per le proteine e le regioni intrinsecamente disordinate.

Pubblicata per la prima volta nel 2012, ha l'obiettivo di fornire una panoramica esaustiva del ruolo funzionale delle regioni disordinate nelle proteine.

MobiDB mira a generare nuove conoscenze e a catturare il significato funzionale delle regioni disordinate elaborando e combinando fonti complementari di informazioni.

Aggrega annotazioni sul disordine tratte dalla letteratura e da evidenze sperimentali, insieme a predizioni, per tutte le sequenze proteiche conosciute.

Leggi anche: Proteine delle Uova in Polvere

I dati curati dalla letteratura provengono direttamente da risorse terze, grazie a estese collaborazioni con numerose banche dati e consorzi.

Le predizioni di MobiDB sono integrate in UniProtKB, InterPro, PDBe e altre banche dati.

DisProt

DisProt fornisce annotazioni curate manualmente di proteine intrinsecamente disordinate tratte dalla letteratura.

Mentre MobiDB offre funzionalità di previsione del disordine, il cuore della comprensione del disordine proteico risiede nella disponibilità di annotazioni sperimentali verificate e curate manualmente.

Rispetto a MobiDB, che aggrega dati e amplia le annotazioni basandosi su predizioni affidabili, DisProt fornisce informazioni dettagliate sulle condizioni sperimentali grazie all'adozione dello standard Minimum Information About Disorder (MIADE), una collaborazione attiva con i consorzi Gene Ontology (GO) ed Evidence and Conclusion Ontology (ECO).

DisProt rappresenta la verità di riferimento per l'iniziativa Critical Assessment of protein Intrinsic Disorder (CAID), utilizzata per una valutazione imparziale dei predittori di disordine, inclusa la valutazione del metodo AlphaFold.

PED (Protein Ensemble Database)

Il Protein Ensemble Database (PED) è la risorsa primaria per il deposito di insiemi strutturali di proteine intrinsecamente disordinate.

L'obiettivo principale del PED è fornire una piattaforma in continua crescita per le voci di insiemi strutturali, con un sistema di deposito intuitivo e mantenendo alti standard di qualità dei dati e i principi FAIR (Findable, Accessible, Interoperable, Reusable).

PED è collegato alle principali risorse per il deposito di dati sperimentali primari sugli insiemi, tra cui BRMB, SASBDB e PCDDB.

Gli insiemi del PED sono prevalentemente modellati utilizzando dati SAXS, spettroscopia NMR, dati FRET e le loro combinazioni.

I dati NMR includono spostamenti chimici (CSs), effetti Overhauser nucleari (NOEs), accoppiamenti J, accoppiamenti dipolari residui (RDCs), dati di rilassamento e miglioramenti della rilassamento paramagnetico (PREs).

PED fa parte della rete 3D-Beacons.

APICURON

APICURON è una piattaforma progettata per accreditare e riconoscere i contributi scientifici, con un'attenzione particolare alla registrazione degli eventi di biocurazione per garantire un adeguato riconoscimento e visibilità per i ricercatori.

La piattaforma fornisce riconoscimento per i contributi a artefatti scientifici oltre le pubblicazioni tradizionali, inclusi dati di ricerca, software, strumenti, e formazione.

Collaborando con piattaforme come ORCID e BIP! Scholar, APICURON assicura che gli scienziati ricevano un adeguato riconoscimento per i loro contributi, promuovendo al contempo pratiche sostenibili nella ricerca.

DOME Registry

DOME Registry è un database progettato per gestire e accedere a informazioni complete relative alla validazione e riproducibilità degli studi basati sul machine learning.

tags: #banca #dati #proteine #definizione #e #tipi

Scroll to Top