(图片来源网络,侵删)
dbSNP(The Single Nucleotide Polymorphism Database)是由美国国家生物技术信息中心(NCBI)与国家人类基因组研究所(NHGRI)联合开发和维护的重要数据库,专注于收集和存储不同物种的遗传变异信息,该数据库不仅包括SNP数据,还涵盖了短插入缺失多态性、微卫星标记及短重复序列等多种类型的遗传多态性,下面将深入探讨dbSNP数据库的多个方面:
1、数据提交与ID分配 数据提交:研究者或机构可以将发现的SNP位点信息提交至dbSNP数据库,以供全球科研社区共享。 ID分配:每个新提交的SNP位点首先被赋予一个唯一的NCBI Assay ID (ss),如果多个独立提交的SNP位点在比对到参考基因组的相同位置,则它们被认为是冗余的,并会被分配一个新的Reference SNP ID (rs),这种标识方法有效地减少了数据的冗余,提高了数据使用的效率。
2、数据类型与收录内容 核心数据类型:dbSNP主要收录SNP数据,即个体DNA序列中单个核苷酸的变化,如A变为G。 其他遗传变异:除了SNP,数据库还记录了短插入缺失多态性、微卫星标记和短重复序列等其它类型的遗传标记。