OBO Foundry 本体开发原则
(OBO Foundry Ontology Development Principles)
OBO 是 Open Biological and Biomedical Ontologies (开放性生物与生物医学本体) 的简称。OBO Foundry (可直译为开放性生物与生物医学本体铸造) 是一个由众多生物与生物医学本体开发者发起的基于自愿基础上的国际联盟 (http://obofoundry.org/) 。 OBO Foundry的使命是开发一簇可互操作的逻辑上合理并且科学上准确的本体。
为了完成OBO Foundry 的使命,OBO Foundry参与者自发地共同开发并遵守一系列原则。OBO Foundry 的这些原则是用来规范OBO Foundry本体,并根据他们对提交评审的本体进行评价。这些原则都是很好的做法,即使没有计划向OBO Foundry提交的本体也可以考虑使用它们。
迄今为止,OBO Foundry 的原则包括:
1.开放(Open): 本体必须公开开放供所有人使用。
2.常见的格式(Common Format): 本体必须用常见的语法和公共形式语言来进行表述。
3.统一资源标识符/标识符空间(URI/Identifier Space): 本体中的每个类和属性必须具有唯一的资源标识符(URI)。
4.版本(Versioning): 本体提供者具有用于识别不同的连续版本的程序。
5.范围(Scope): 本体具有明确的范围和符合该范围的内容。
6.文本定义(Textual Definitions): 对本体有代表性的的词条要有文本及逻辑形式定义。
7.关系(Relations): 本体应使用根据特定共享的关系属性明确定义本体词条之间的关系。
8.文档(Documentation): 本体论的所有者应努力提供尽可能多的文档。
9.有记录的多用户使用(Documented Plurality of Users): 本体应该有多个独立的人或组织使用。
10.合作的承诺(Commitment To Collaboration): 本体的开发应以协作的方式进行。
11.权威的归属(Locus of Authority): 应有一个人负责本体与外界的沟通。
12.命名约定(Naming Conventions): 本体的开发要有一些命名的规则与约定。
13.维护(Maintenance): 本体需要反映科学共识的变化,以保持准确性不受时间影响。
关于这些原则的详细介绍如下:
综述 ( Summary )
这些原则是用来规范OBO Foundry本体,并根据他们对提交评审的本体进行评价。我们认为这些原则都是很好的做法,并且建议即使没有计划向OBO Foundry提交本体,也应考虑它们。
These principles are intended as normative for OBO Foundry ontologies, and ontologies submitted for review will be evaluated according to them. We consider these to be generally good practice, and recommend they be considered even if there are no plans to submit an ontology for review by the Foundry.
原则1: 开放 ( Open )
本体必须公开开放供所有人使用,除以下两项外不受任何其他约束:
- (a) 必须承认其来源
- (b) 在原始名称或具有相同标识符的情况下,不得更改和随后以涂改的形式重新分发。
The ontology MUST be openly available to be used by all without any constraint other than:
- (a) its origin must be acknowledged and
- (b) it is not to be altered and subsequently redistributed in altered form under the original name or with the same identifiers.
原则2: 常见的格式 ( Common Format )
- 总结:本体以包含可接受的具体的语法的公共正式语言来进行表述。
- 目的:一个通用的格式允许最大数量的人访问和重用一个本体。
- Summary:The ontology is made available in a common formal language in an accepted concrete syntax.
- Purpose:A common format allows the maximum number of people to access and reuse an ontology.
原则3: 统一资源标识符/标识符空间 ( URI/Identifier Space )
本体中的每个类和关系(属性)必须具有唯一的URI (即,统一资源标识符)。
Each class and relation (property) in the ontology must have a unique URI (i.e., Uniform Resource Identifier).
原则4: 版本 ( Versioning )
本体提供者具有用于识别不同的连续版本的程序。
The ontology provider has procedures for identifying distinct successive versions.
原则5: 范围 ( Scope )
本体具有明确的范围和符合该范围的内容。
目的
- 防止本体之间的重叠,
- 促进用户搜索特定内容,以及
- 可以快速选择感兴趣的本体,
实施和建议
- 应明确说明覆盖的领域(范围)。
- 理想情况下,范围应该相当狭窄。
- 超出范围的必需条款应从适当的本体导入。
The ontology has a clearly specified scope and content that adheres to that scope.
Purpose
- prevents overlaps between ontologies,
- facilitates user searches for specific content, and
- enables quick selection of ontologies of interest.
Implementation and Recommendations
- The domain (scope) covered should be clearly stated.
- Ideally the scope should be fairly narrow.
- Required terms that are out of scope should be imported from the appropriate ontology.
原则6: 文本定义 ( Textual Definitions )
- 对实质性和有代表性的词条有文本定义以及具有充分必要条件的形式逻辑定义。
- 对于缺乏文本定义的术语,应该有证据表明一种为所有未定义词条术语提供定义的策略。
- 文本定义应该是唯一的(即没有两个术语应该共享一个定义)
- Textual definitions (SOP) for a substantial and representative fraction, plus equivalent formal definitions (for at least a substantial number of terms).
- For terms lacking textual definitions, there should be evidence of implementation of a strategy to provide definitions for all remaining undefined terms.
- Text definitions should be unique (i.e. no two terms should share a definition).
原则7: 关系 ( Relations )
本体应使用根据OBO关系本体定义的定义模式明确定义的关系。
The ontology uses relations which are unambiguously defined following the pattern of definitions laid down in the OBO Relation Ontology.
原则8: 文档 ( Documentation )
- 本体的所有者应努力提供尽可能多的文档。
- 文档应详细说明本体生命周期特有的不同过程,并针对不同的受众(用户或开发人员)。
- The owners of the ontology should strive to provide as much documentation as possible.
- The documentation should detail the different processes specific to an ontology life cycle and target various audiences (users or developers).
原则9: 有记录的多用户使用 ( Documented Plurality of Users )
- 概要:本体开发人员应该记录本体被多个独立的人或组织使用的情况。
- 目的:这个原则旨在确保本体论处理一个相关的科学领域,并以有用和可持续的方式进行。
- 履行:本体开发人员应提供链接/引用使用证据(出版物,外部本体;见下面的示例)作为审查过程的输入项。
- Summary:The ontology developers should document that the ontology is used by multiple independent people or organizations.
- Purpose:This principle aims to ensure that the ontology tackles a relevant scientific area and does so in a usable and sustainable fashion.
- Implementation:The ontology developers should provide links/citations to evidence of use (publication, external ontology; see examples below) as input to the review process.
原则10: 合作的承诺 ( Commitment To Collaboration )
摘要
OBO Foundry本体发展与许多其他以标准为导向的科学活动一样,应以协作的方式进行。
目的
合作的好处有三个方面:
- 避免重复工作;
- 提高互操作性; 和
- 确保本体内容科学合理,符合社区需求。
Summary
OBO Foundry ontology development, in common with many other standards-oriented scientific activities, should be carried out in a collaborative fashion.
Purpose
The benefits of collaboration are threefold:
- Avoid duplication of work;
- Increase interoperability; and
- Ensure that ontology content is both scientifically sound and meets community needs.
原则11:权威的归属 ( Locus of Authority )
摘要
应该有一个人负责社区和本体论开发者之间的沟通,与联盟就所有与联盟有关的事项进行沟通,根据科学进展调停涉及维护的相关讨论,并确保所有用户反馈 被解决。
Summary
There should be a single person who is responsible for communications between the community and the ontology developers, for communicating with the Foundry on all Foundry-related matters, for mediating discussions involving maintenance in the light of scientific advance, and for ensuring that all user feedback is addressed.
原则12: 命名约定 ( Naming Conventions )
选定的公约:
- 对主标签使用rdfs:label
- 为每个已声明的实体(例如类,属性)只包含一个rdfs:label
- 书写标签,同义词等,就像用简单的英文文本一样。 即使用空格分开单词,只能将专有名称(例如帕金森病)大写。 不要使用CamelCase,do_not_use_underscores
- 拼写缩略语。 缩写可以包含为一个单独的属性。
Selected Conventions:
- Use rdfs:label for the primary label
- Include exactly one rdfs:label for every declared entity (e.g. class, property)
- Write labels, synonyms, etc as if writing in plain English text. ie use spaces to separate words, only capitalize proper names (e.g. Parkinson disease). Do not use CamelCase, do_not_use_underscores.
- Spell out abbreviations. Abbreviations can be included as a separate property.
原则13: 维护 ( Maintenance )
本体需要反映科学共识的变化,以保持准确性不受时间影响。
The ontology needs to reflect changes in scientific consensus to remain accurate over time.