Ontologija gena
Ontologija gena/Genska ontologija | |
---|---|
Skraćenica | GO |
Datum osnivanja | 1998. |
Vrsta | Biološka baza ontoloških podataka |
Status | Aktivna |
Glavno sjedište | Slobodni pristup |
Članstvo | Globalno |
Jezik | Engleski |
Glavni organ | Konzorcij za ontologiju gena |
Br. volontera | Neograničen |
Veb-sajt | http://geneontology.org/ |
Ontologija gena (eng. Gene Ontology: GO) glavna je bioinformatička inicijativa za objedinjavanje zastupljenosti atributa gena i genskih proizvoda u svim vrstama.[1] Preciznije, cilj projekta je
- održavanje i razvoj svog kontroliranog rječnika gena i svojstava genskih proizvoda;
- označavanje gena i genskih proizvoda, te asimilacija i širenje podatke o bilješkama;
- pružanje alata za lahak pristup svim aspektima podataka predviđenih projektom i omogućavanje funkcionalne interpretacije eksperimentalnih podataka koristeći GO, naprimjer putem analize obogaćenja.[2][3] GO je dio većeg napora u klasifikaciji, Otvorene biomedicinske ontologije, jedan od prvih članova kandidata za OBO livnicu.[4]
Dok se označavanje gena fokusira na gene i genske proizvode, ontologija gena usredotočuje se na funkciju gena i genskih proizvoda. GO također proširuje napore koristeći jezik markiranja za izradu podataka (ne samo gena i njihovih proizvoda već i kuriranih atributa) mašinski čitljivih, i to na način koji je objedinjen u svim vrstama (dok se konvencije genske nomenklature razlikuju u zavisnosti od biološkog taksona).
Pojmovi i ontologija
[uredi | uredi izvor]S praktičnog gledišta, ontologija je prikaz nečega o čemu znamo. "Ontologije" se sastoje od prikaza stvari koje se mogu otkriti ili direktno uočiti, kao i odnosa između tih stvari.
U biologiji i srodnim domenama ne postoji univerzalna standardna terminologija, a upotreba izraza može biti specifična za vrstu, područje istraživanja ili čak određenu istraživačku skupinu. To otežava komunikaciju i razmjenu podataka. Projekt genske ontologije pruža ontologiju definiranih pojmova koji predstavljaju svojstva genskog proizvoda. Ontologija pokriva tri domena:
- ćelijska komponenta, dijelove ćelije ili njenog vanćelijskog okruženja;
- molekulska funkcija, elementarne aktivnosti genskog proizvoda na molekulSKom nivou, poput vezanja ili kataliza;
- biološki proces, operacije ili skupove molekulskih događaja s definiranim početkom i krajem, koji se odnose na funkcioniranje integriranih životnih jedinica: ćelije, tkiva, organi i organizmi.
Svaki GO pojam u ontologiji ima svoj naziv, koji može biti:
- riječ ili niz riječi;
- jedinstveni alfanumerički identifikator;
- definicija sa navedenim izvorima, i
- ontologija koja ukazuje na domen kojem pripada.
Termini mogu imati i sinonime, koji se klasificiraju kao tačno ekvivalentni nazivu, širi, uži ili povezani; reference na ekvivalentne koncepte u drugim bazama podataka i komentari o značenju ili upotrebi izraza. GO ontologija je strukturirana kao usmjereni aciklični grafikon, a svaki pojam je definirao odnose sa jednim ili više drugih pojmova u istm domenu, a ponekad i na drugim domenima. GO rječnik je dizajniran da bude neutralan prema vrstama i uključuje termine koji se primjenjuju na prokariote i eukariote, pojedinačne i višećelijse organizme.
GO nije statična, a dopune, ispravke i izmjene predlažu i traže od njih članovi istraživačkih i anotacijskih zajednica, kao i oni koji su direktno uključeni u GO projekt.[5] Naprimjer, komentator može zatražiti određeni termin koji predstavlja metabolički put ili se dio ontologije može revidirati uz pomoć stručnjaka iz zajednice (npr.[6]). Predložene izmjene pregledaju urednici ontologije i primjenjuju se prema potrebi.
Datoteke GO ontologije i napomena su besplatno dostupne na web stranici GO[7] in a number of formats, or can be accessed online using the GO browser AmiGO. Projekt Ontologija gena također nudi mapiranje svojih pojmova za preuzimanje u druge sisteme klasifikacije.
Primjeri termina
[uredi | uredi izvor]- id: GO:0000016
- ime: laktazna aktivnost
- ontologija: molekulska_funkcija
- def: "Kataliza reakcije: laktoza + H2O=D-glukoza + D-galaktoza". [EC:3.2.1.108]
- sinonim: "lactase-phlorizin hydrolase activity" BROAD [EC:3.2.1.108]
- sinonim: "aktivnost laktoza-galaktohidrolazew" EXACT [EC:3.2.1.108]
- xref: EC:3.2.1.108
- xref: MetaCyc:LACTASE-RXN
- xref: Reaktom:20536
- is_a: GO:0004553 ! hidrolazma aktivnost, hidroliziranje spojeva O-glikozila
Podatak o izvoru:[8]
Označavanje
[uredi | uredi izvor]Označavanje genoma obuhvata praksu pribavljanja podataka o genskom proizvodu, a GO oznake za to koriste termine iz GO. Bilješke kustosa GO integrirane su i distribuirane na web stranici GO, gdje se mogu direktno preuzeti ili pregledati na mreži pomoću AmiGO.[9] Pored identifikatora genskog proizvoda i relevantnog izraza GO, GO oznake imaju najmanje sljedeće podatke:
- Referenca korištena za izradu napomena (npr. članak u časopisu);
- Šifra dokaza koja označava tip dokaza na kojima se zasniva napomena;
- Datum i kreator napomene
Dodatne informacije, ovisno o rerminu GO i korištenim dokazima, kao i posebne informacije, poput uvjeta pod kojima se funkcija poštuje, također se mogu uključiti u napomenu GO.
Kodiranje dokaza dolazi iz kontroliranog rječnika kodova Ontologije koda dokaza, koji pokriva i ručne i automatizirane metode označavanje.[10] Naperimjer, Traceable Author Statement (TAS) znači da je kustos (kurator) pročitao objavljeni naučni rad i da metapodaci za tu napomenu navode taj rad; Izvučeno iz sličnosti sekvence (ISS) znači da je ljudski kustos pregledao rezultate pretraživanja sličnosti sekvenci i potvrdio da je biološki značajan. Oznake iz automatiziranih procesa (naprimjer, preslikavanje bilješki kreiranih korištenjem drugog rječnika označavanje) dobivaju kod Izvučeno iz elektronske bilješke (IEA). U 2010. godini preko 98% svih GO oznaka izvedeno je računarski, ne od strane kustosa, ali od 2. jula 2019. računarski je izvedeno samo oko 30% svih GO oznaka.[11][12]
Budući da ove oznake ne provjerava čovjek, GO konzorcij smatra da su marginalno manje pouzdane i da su obično na višem nivou, manje detaljni pojmovi. Cjeloviti skupovi podataka o označavanjima mogu se preuzeti s web stranice GO. Da bi podržao razvoj anotacija, GO konzorcij pruža radionice i mentore novim grupama kustosa i programera.
Mnogi algoritmi mašinskog učenja dizajnirani su i implementirani za predviđanje napomena o genetičkoj ontologiji.[13][14]
Primjeri označavanja
[uredi | uredi izvor]- Genski proizvod : Aktin, srčani mišić alfa 1, UniProtKB:P68032
- GO termin: heart contraction ; GO:0060047 (biološki proces)
- Kod dokaza: Inferencija mutantnog fenotipa (IMP)
- Referenca: PubMed
- Označio: UniProtKB, 6. jun, 2008
Podatak o izvoru:[15]
Alati
[uredi | uredi izvor]Dostupan je veliki broj alata,[16] kako na mreži, tako i za preuzimanja koja koriste podatke koje pruža projekt GO. Velika većina njih dolazi od trećih strana; konzorcij GO razvija i podržava dva alata, AmiGO i OBO-Edit.
AmiGO[9][17] je internetska aplikacija koja omogućava korisnicima da pretražuju, pregledavaju i vizualiziraju ontologije i podatke o oznakama genskog proizvoda. Također ima alat BLAST-a,[18] tools allowing analysis of larger data sets,[19][20] and an interface to query the GO database directly.[21]
AmiGO može se koristiti na mreži na web stranici GO za pristup podacima koje pruža GO konzorcij ili se može preuzeti i instalirati za lokalnu upotrebu, u bilo kojoj bazi podataka koja koristi shemu baze podataka GO (npr.[22]). Besplatni softver otvorenog koda dostupan je kao dio distribucije go-dev softvera.[23]
OBO-Edit[24] je uređivač ontologije otvorenog koda, neovisan o platformi, koji je razvio i održava Konzorcij za genetičku ontologiju. Implementiran je u [[Java (programski jezik] | Java]] i koristi pristup orijentiran na grafove za prikaz i uređivanje ontologija. OBO-Edit uključuje sveobuhvatni interfejs (sučelje) za pretraživanje i filtriranje, s opcijom prikazivanja podskupina pojmova, kako bi ih vizualno razlikovali; korisnički interfejs se takođe može prilagoditi prema korisničkim željama. OBO-Edit također ima rezoner koji može zaključiti veze koje nisu izričito navedene, na osnovu postojećih odnosa i njihovih svojstava. Iako je razvijen za biomedicinske ontologije, OBO-Edit može se koristiti za pregled, pretraživanje i uređivanje bilo koje ontologije. Slobodno je dostupan za preuzimanje.[23]
Konzorcij
[uredi | uredi izvor]Konzorcij za gensku ontologiju je skup bioloških baza podataka i istraživačkih grupa koje su aktivno uključene u projekt genske ontologije.[12] To uključuje niz baza podataka o model organizama i baze podataka o više vrsta, grupe za razvoj softvera i namjensku redakciju.
Historija
[uredi | uredi izvor]Ontologija gena je prvobitno konstruirana 1998., u organizaciji Konzorcija istraživača koji su proučavali genome tri modelnih organizma: Drosophila melanogaster (voćna mušica), Mus musculus (miš) i Saccharomyces cerevisiae (pivski ili pekarski kvasac).[25] Mnoge druge baze podataka o model-organizmima pridružile su se Konzorciju ontologoje gena, doprinoseći ne samo anotacijskim podacima, već i razvoju ontologija i alata za pregled i primjenu podataka. Mnoge velike baze podataka o biljkama, životinjama i mikroorganizmima daju svoj doprinos ovom projektu.[7] As of July 2019, the GO contains 44,945 terms; there are 6,408,283 annotations to 4,467 different biological organisms.[7] Postoji značajna literatura o razvoju i upotrebi GO-a, a ona je postala standardni alat u bioinformatičkom arsenalu. Njihovi ciljevi imaju tri aspekta: izgradnja ontologije gena, dodjeljivanje ontologije genima/genskim proizvodima i razvoj softvera i baza podataka za prva dva objekta.
Počinje se pojavljivati i nekoliko analiza genske ontologije, koristeći formalna svojstva razreda (metasvojstva), koja su nezavisna od domena. Naprimjer, vidi ontološka analiza bioloških ontologija.[26]
Također pogledajte
[uredi | uredi izvor]- BLAST
- Blast2GO[27]
- Uporedna toksikogenomska baza podataka
- DAVID bioinformatika
- Interferom
- Nacionalni centar za biomedicinsku ontologiju
Reference
[uredi | uredi izvor]- ^ The Gene Ontology Consortium (januar 2008). "The Gene Ontology project in 2008". Nucleic Acids Research. 36 (Database issue): D440–4. doi:10.1093/nar/gkm883. PMC 2238979. PMID 17984083.
- ^ Dessimoz, Christophe; Škunca, Nives, ured. (2017). The Gene Ontology Handbook. Methods in Molecular Biology. 1446. doi:10.1007/978-1-4939-3743-1. ISBN 9781493937431. ISSN 1064-3745. S2CID 3708801.
- ^ Gaudet, Pascale; Škunca, Nives; Hu, James C.; Dessimoz, Christophe (2017). "Primer on the Gene Ontology". The Gene Ontology Handbook. Methods in Molecular Biology. 1446. str. 25–37. doi:10.1007/978-1-4939-3743-1_3. ISBN 978-1-4939-3741-7. ISSN 1064-3745. PMC 6377150. PMID 27812933.
- ^ Smith B, Ashburner M, Rosse C, Bard J, Bug W, Ceusters W, Goldberg LJ, Eilbeck K, Ireland A, Mungall CJ, Leontis N, Rocca-Serra P, Ruttenberg A, Sansone SA, Scheuermann RH, Shah N, Whetzel PL, Lewis S (novembar 2007). "The OBO Foundry: coordinated evolution of ontologies to support biomedical data integration". Nature Biotechnology. 25 (11): 1251–5. doi:10.1038/nbt1346. PMC 2814061. PMID 17989687.
- ^ Lovering, Ruth C. (2017). "How Does the Scientific Community Contribute to Gene Ontology?". u Dessimoz, C; Skunca, N (ured.). The Gene Ontology Handbook. Methods in Molecular Biology (jezik: engleski). 1446. Springer (New York). str. 85–93. doi:10.1007/978-1-4939-3743-1_7. ISBN 978-1-4939-3741-7. ISSN 1064-3745. PMID 27812937.
- ^ Diehl AD, Lee JA, Scheuermann RH, Judith Blake (april 2007). "Ontology development for biological systems: immunology". Bioinformatics. 23 (7): 913–5. doi:10.1093/bioinformatics/btm029. PMID 17267433. Greška u vankuverskom stilu: name u nazivu 4 (pomoć)
- ^ a b c "The Gene Ontology Resource". Gene Ontology Consortium.
- ^ Sjcarbon,Gene Ontology Consortium Wiki (10. 7. 2013). "AmiGO_2_Manual:term_Page" (html).
- ^ a b AmiGO--the current official web-based set of tools for searching and browsing the Gene Ontology database
- ^ "Evidence Code Ontology". Evidence Code Ontology.
- ^ du Plessis L, Skunca N, Dessimoz C (novembar 2011). "The what, where, how and why of gene ontology--a primer for bioinformaticians". Briefings in Bioinformatics. 12 (6): 723–35. doi:10.1093/bib/bbr002. PMC 3220872. PMID 21330331.
- ^ a b "The GO Consortium". Arhivirano s originala, 2. 7. 2014. Pristupljeno 16. 3. 2009.
- ^ Pinoli P, Chicco D, Masseroli M (juni 2013). "Computational algorithms to predict Gene Ontology annotation". BMC Bioinformatics. 16 (6): S4. doi:10.1186/1471-2105-16-S6-S4. PMC 4416163. PMID 25916950.
- ^ Cozzetto, Domenico; Jones, David T. (2017). "Computational Methods for Annotation Transfers from Sequence". u Dessimoz, C; Skunca, N (ured.). The Gene Ontology Handbook. Methods in Molecular Biology (jezik: engleski). 1446. Springer (New York). str. 55–67. doi:10.1007/978-1-4939-3743-1_5. ISBN 978-1-4939-3741-7. ISSN 1064-3745. PMID 27812935.
- ^ The GO Consortium (16. 3. 2009). "AmiGO: P68032 Associations".
- ^ Mosquera JL, Sánchez-Pla A (juli 2008). "SerbGO: searching for the best GO tool". Nucleic Acids Research. 36 (Web Server issue): W368–71. doi:10.1093/nar/gkn256. PMC 2447766. PMID 18480123.
- ^ Carbon S, Ireland A, Mungall CJ, Shu S, Marshall B, Lewis S (januar 2009). AmiGO Hub; Web Presence Working Group. "AmiGO: online access to ontology and annotation data". Bioinformatics. 25 (2): 288–9. doi:10.1093/bioinformatics/btn615. PMC 2639003. PMID 19033274.
- ^ "AmiGO BLAST tool". Arhivirano s originala, 20. 8. 2011. Pristupljeno 13. 3. 2009.
- ^ AmiGO Term Enrichment tool Arhivirano 7. 4. 2008. na Wayback Machine; finds significant shared GO terms in an annotation set
- ^ AmiGO Slimmer Arhivirano 29. 9. 2011. na Wayback Machine; maps granular annotations up to high-level terms
- ^ GOOSE Arhivirano 1. 3. 2009. na Wayback Machine, GO Online SQL Environment; allows direct SQL querying of the GO database
- ^ The Plant Ontology Consortium (16. 3. 2009). "Plant Ontology Consortium". Pristupljeno 16. 3. 2009.
- ^ a b "Gene Ontology downloads at SourceForge". Pristupljeno 16. 3. 2009.
- ^ Day-Richter J, Harris MA, Haendel M, Lewis S (august 2007). "OBO-Edit--an ontology editor for biologists". Bioinformatics. 23 (16): 2198–200. doi:10.1093/bioinformatics/btm112. PMID 17545183.
- ^ Ashburner M, Ball CA, Judith Blake, Botstein DB, Butler H, Cherry JM, Davis AP, Dolinski K, Dwight SS, Eppig JT, Harris MA, Hill DP, Issel-Tarver L, Kasarskis A, Lewis S, Matese JC, Richardson JE, Ringwald M, Rubin GM, Sherlock G (maj 2000). "Gene ontology: tool for the unification of biology. The Gene Ontology Consortium". Nature Genetics. 25 (1): 25–9. doi:10.1038/75556. PMC 3037419. PMID 10802651. Greška u vankuverskom stilu: name u nazivu 3 (pomoć)
- ^ Deb, B. (2012). "An ontological analysis of some biological ontologies". Frontiers in Genetics. 3: 269. doi:10.3389/fgene.2012.00269. PMC 3509948. PMID 23226158.
- ^ Götz S, García-Gómez JM, Terol J, Williams TD, Nagaraj SH, Nueda MJ, Robles M, Talón M, Dopazo J, Conesa A (juni 2008). "High-throughput functional annotation and data mining with the Blast2GO suite". Nucleic Acids Research. 36 (10): 3420–35. doi:10.1093/nar/gkn176. PMC 2425479. PMID 18445632.
Vanjski linkovi
[uredi | uredi izvor]- AmiGO - the current official web-based set of tools for searching and browsing the Gene Ontology database
- Gene Ontology Consortium - official site
- PlantRegMap - GO annotation for 165 plant species and GO enrichment Analysis Arhivirano 13. 5. 2020. na Wayback Machine
- SimCT — web-based tool to display relationships between biological objects annotated to an ontology, in the form of a clustering tree.
- SerbGO — a GO tool to compare the capabilities of different programs to show their common features and their differences and to find which tools, if any, have some specific user-required capabilities for GO analysis.
- Domain-centric Gene Ontology Arhivirano 2. 1. 2015. na Wayback Machine — database of domain-centric ontologies on functions, phenotypes, diseases and more.