人类基因组单核苷酸多态性的研究进展与动态 The research development of single nucleotide polymorphisms in human genome 摘要:第一张人类基因组序列草图已经公布,正式图预计也将于2003年4月完成。但序列图只基于少数个体,它反映了基因组稳定的一面,并未反映其变异或多态的一面,而正是这种多态性,即基因组序列的差异构成了不同个体与群体对疾病的易感性、对药物与环境因子不同反应的遗传学基础。人类基因组中存在广泛的多态性,最简单的多态形式是发生在基因组中的单个核苷酸的替代,即单核苷酸多态性(single nucleotide polymorphisms, SNPs)。SNP通常是一种二等位基因的(biallelic),即二态的遗传变异,在CG序列上出现最为频繁。在转录序列上的SNP称为cSNP。SNP的数量大、分布广。按照1%的频率估计,在人类基因组中每100~300个核苷酸就有一个SNP。因此,整个人类基因组(3.2 X 109bp)中至少有1,100万以上的SNPs,在任何已知或未知基因内和附近都可能找到数量不等的SNP 目前普遍认为,作为数量最多且易于批量检测的多态标记,SNP在连锁分析与基因定位,包括复杂疾病的基因定位、关联分析、个体和群体对环境致病因子与药物的易感性研究中将发挥愈来愈重要的作用。迄今,对多基因疾病候选基因的SNPs研究已积累了丰富的数据,基于这些SNPs的关联分析也正方兴未艾。本文阐述了SNP的特征、不同研究者对基于SNP进行关联分析的观点以及SNP的研究进展与动态。
最近,国际SNP研究组织TSC (The SNP Consortium) 与国际人类基因组测序组织(the International Human Genome Sequencing Consortium)共同报道了人类因组中1.42 百万个SNPs ,使SNP的密度达到1/1.9 kb[23],Sachidanandam等估计约60,000 SNPs位于外显子区域,这张高密度的SNP图谱将有助于发现那些对疾病诊断与治疗有益的重要基因。截止2001年5月,已有2.84 百万存放在NCBI的数据库dbSNP 中 (http://www.ncbi.nlm.nih.gov/SNP/),Marth 等[24]将这些 SNPs归为1.65百万个非冗余的SNPs。