计算机科学

首页 > 计算机科学

基因本体

2018-08-24 13:52:08     所属分类:本体(计算机科学)

基因本体论(Gene ontology (GO))是一种系统注释物种基因及其产物属性的方法[1]。它的目标是:1)维护和发展有限的基因及其产物属性描述的词汇;2)注释基因及其产物,同化和传播注释数据;3)提供方便的工具访问数据;4)实现在实验数据的基础上,使用GO进行程式解析,例如基因富集组分分析。它主要包括三个分支:细胞组件、分子功能和生物过程。

GO也是一个更大的系统分类项目的一部分,这个项目是开放生物医学系统注释(Open Biomedical Ontologies (OBO))[2]

与基因命名法不同,除了维护和控制发展基因及其产物性质描述的词汇,基因本体论也致力于使用机器学习可以理解的标记语言来进行基因标注,这样统一所有物种的基因注释(而基因命名法注释会根据不同的生物系统分类而有不同的注释)。

随着生物技术的发展越来越快,人们得到的数据越来越多。需要寻找一种方法来组织整理这些信息。GO(gene ontology)基因本体论提供了一个省时省力的解决方案,基因产物在数据库中被赋上GO的词条,进而科学家们可以到数据库中去查询这些生物学的相关信息。基因本体是一个有向无环图(DAG)型的本体。目前,GO中使用了is_a、part_of和regulates三种关系。

目录

  • 1 GO term 及本体论
    • 1.1 示例条目
  • 2 参见
  • 3 参考文献

GO term 及本体论

实际上,本体论是指对所知知识的加以阐述,是对可勘察到的事物及其相互联系的描述。在生物信息领域, 搜寻信息的一个主要的瓶颈就是, 不同的生物学及相关领域使用不同的术语,让信息查找变得困难,也使数据的交流和分享更加困难。例如在一些不同的医疗数据库中,可能会存在很多不一致的描述,给数据的分享和挖掘带来的很多麻烦。基因本体论(Gene Ontology)提供了统一定义的条目来表示基因产物的属性。

Gene Ontology 包括三个域:

  • 细胞组件英语Cellular componentcellular component),细胞的每个部分和细胞胞外环境。
  • 分子功能(molecular function),基因产物在分子级别的主要活动,比如结合以及酶催化。
  • 生物过程英语Biological processbiological process),分子事件的过程或集合,可以定义开始和结束的事件或行动,在集成的活的单位中发生,例如,细胞,组织,器官,和生物中。

在基因注释中的每个GO term会有个条目名称,通常是一个词或着一串词;有一个唯一的ID,通常由字母和数字组成;一个引用源的定义;一个命名域来指示所属的域。每个条目(term)也会有同义名(synonyms),同义名所指示内容与该条目完全等同,能够连接到其它相关数据库。每个条目会有条目涵义以及使用的注释。基因本体是一个有向无环图(DAG)型的本体,每个条目都与其它的同域或者不同域的条目定义了关系。GO被设计成种属中立的语言,能够使用在包括原核生物、真核生物、单细胞生物和多细胞生物上。

GO不是静止不变的,它是由一些研究和注释社区以及与GO项目直接相关人士提出建议或请求来进行的添加、修正或改动的。例如,一个注释者可能要求某一个条目来表示一个代谢通路,或者在社区专家的帮助下可以修改注释的某个部分。建议的修改通过GO的评审后,会被整合到合适的地方。

GO注释文件可以在GO官网[3]免费下载到,并且有多种不同的格式,或者使用GO browser AmiGO[4]网站来进行访问使用。GO项目也提供向其它分类系统连接的图的下载。

示例条目
id: GO:0000016
name: lactase activity
namespace: molecular_function
def: "Catalysis of the reaction: lactose + H2O=D-glucose + D-galactose." EC:3.2.1.108
synonym: "lactase-phlorizin hydrolase activity" BROAD EC:3.2.1.108
synonym: "lactose galactohydrolase activity" EXACT EC:3.2.1.108
xref: EC:3.2.1.108
xref: MetaCyc:LACTASE-RXN
xref: Reactome:20536
is_a: GO:0004553 ! hydrolase activity, hydrolyzing O-glycosyl compounds
数据来源[5]

参见

  • 本体语言
  • UMLS

参考文献

  1. ^ The Gene Ontology project in 2008. Nucleic Acids Research. 2008-1, 36 (Database issue): D440–D444. ISSN 0305-1048. PMC PMC2238979 请检查|pmc=值 (帮助). PMID 17984083. doi:10.1093/nar/gkm883. 
  2. ^ Smith, Barry; Ashburner, Michael; Rosse, Cornelius; Bard, Jonathan; Bug, William; Ceusters, Werner; Goldberg, Louis J; Eilbeck, Karen; Ireland, Amelia. The OBO Foundry: coordinated evolution of ontologies to support biomedical data integration. Nature biotechnology. 2007-11, 25 (11): 1251. ISSN 1087-0156. PMC PMC2814061 请检查|pmc=值 (帮助). PMID 17989687. doi:10.1038/nbt1346. 
  3. ^ Gene Ontology Consortium | Gene Ontology Consortium. www.geneontology.org. [2018-08-06] (英语). 
  4. ^ Consortium, Gene Ontology. AmiGO 2: Welcome. amigo.geneontology.org. [2018-08-06] (英语). 
  5. ^ 示例条目. 

上一篇:受控词表
下一篇:本体工程
相关推荐