Nucleic Acids Res.:识别基因组CpG岛的新方法

2010/07/26 01:03:05

来自哈尔滨医科大学生物信息科学与技术学院的研究人员在包括癌症在内的一些重大疾病的分子标志物识别方面获得了重要的成果,对人类疾病的早期发现和治疗有着重要的临床意义。这些成果已发表在国际著名学术期刊_Nucleic  Acids  Research_等10余个专业期刊。

领导这一研究的是哈尔滨医科大学生物信息科学与技术学院院长李霞教授,她作为生物信息学学科带头人,先后承担科研课题28项,其中国家863高科技计划项目2项(主持1项,副组长1项)、国家973前期项目1项(主持)、国家自然科学基金4项(主持3项),获省部级奖3项,厅局级奖8项,在国内外重要学术刊物和学术会议上发表学术论文110余篇(SCI  42篇、EI  18篇),累计SCI影响因子90.137,总引次数114,主编着作等8部。

重大疾病如癌症、心脏病、高血压、糖尿病等,其发生、发展是多基因、多通路、跨层面的遗传与环境因素共同作用的结果。采取何种方法及时发现疾病产生后特有的分子标记,对于了解发病机理、进行早期诊断,选取个性化治疗方案有着重大意义,也是现代医学转变治疗疾病思维重要理念的体现。李霞课题组在发现重大疾病的分子标志研究上取得的突破,有助于解决复杂疾病研究中的特征基因识别难题。

人类发现的肿瘤标志物已有百余种,但临床常用的仅20多种,能用于大规模人群普查的肿瘤标志物更少。临床上肿瘤的高发生率和死亡率迫切需要新的早期诊断用的生物标志物和新的肿瘤标记物检测技术。

另外近期来自阿拉巴马大学伯明翰分校临床蛋白质组学主任James  Mobley希望能利用血清,血浆和尿液,寻找胰腺癌的液体,或者蛋白标记物。但是一开始,他就陷入了“Catch-22”(美国谚语,从《第22条军规》延伸而来,是指互相抵触之规律或条件所造成的无法脱身的困窘)——为了能得到深入实验的经费,他们需要首先获得一份前导实验数据。然而当研究人员试图识别胰腺癌蛋白标记物的时候,摆在他们面前的是大量的不确定性,他们需要选择是从哪一种体液和组织中分析蛋白标记物,还需要从低通量,中通量,还是高通量平台中选择一种。

为了解决这些问题,研究人员首先开始查找文献,了解已经出版的有关血液和尿液样品实验数据,他们发现大多数之前的研究都是利用小型的合并样品,结合低通量实验平台,比如2D胶,来识别和检测蛋白。

肿瘤标记物首先是通过利用从肿瘤细胞中提取的单克隆抗体发现的。在获得抗血清后,通过免疫吸附去掉正常细胞,留下肿瘤特异性的抗原,筛选并评估这些候选物成为了寻找新的肿瘤标记物的经典方法。但是筛选并评估候选物的方法费时又耗力,而且当实验室的经费又不足的时候,如何获得进一步的研究进展,以及获得更多的科研经费,是许多实验室都头疼的事情,上述的这一研究提供了一个很好的范例,指出了在这种情况下,研究人员应该采取的实验策略,也就是说实际上,各实验室的研究人员在进行实验的第一步的时候,就要综合考虑好各方面的因素,包括实验经费,遇到的困难,以及如果不成功如何处理等。


Nucleic Acids Research 2010 38(1):e6; doi:10.1093/nar/gkp882

CpG_MI: a novel approach for identifying functional CpG islands in mammalian genomes

Jianzhong Su, Yan Zhang, Jie Lv, Hongbo Liu, Xiaoyan Tang, Fang Wang, Yunfeng Qi, Yujia Feng and Xia Li

CpG islands (CGIs) are CpG-rich regions compared to CpG-depleted bulk DNA of mammalian genomes and are generally regarded as the epigenetic regulatory regions in association with unmethylation, promoter activity and histone modifications. Accurate identification of CpG islands with epigenetic regulatory function in bulk genomes is of wide interest. Here, the common features of functional CGIs are identified using an average mutual information method to differentiate functional CGIs from the remaining CGIs. A new approach (CpG mutual information, CpG_MI) was further explored to identify functional CGIs based on the cumulative mutual information of physical distances between two neighboring CpGs. Compared to current approaches, CpG_MI achieved the highest prediction accuracy. This approach also identified new functional CGIs overlapping with gene promoter regions which were missed by other algorithms. Nearly all CGIs identified by CpG_MI overlapped with histone modification marks. CpG_MI could also be used to identify potential functional CGIs in other mammalian genomes, as the CpG dinucleotide contents and cumulative mutual information distributions are almost the same among six mammalian genomes in our analysis. It is a reliable quantitative tool for the identification of functional CGIs from bulk genomes and helps in understanding the relationships between genomic functional elements and epigenomic modifications