说说LD

2011/02/11 13:59:51

最近也比较忙,很少上我的博客了,有朋友想和我交流关于转座子和LD,我很高兴.先就LD写点自己的想法吧

这东西,我也是关注了比较长的时间,断断续续的,直到现在好象有点明白了,但也仅限于理论.最近也在申报这方面的一个课题,也不知能不能拿下来.

要讨论LD呢首先是要搞清楚它的概念(最准确的概念要去看文献了,我的博客上有这方面的文献).我也是说自己的理解.很明显的,连锁不平衡是两个非等位基因间的连锁不平衡.举例来说A,a,是一对等位基因,B,b是另一对等位基因,那A和a间就没什么连锁不平衡的问题,你要考查的是A和B间是否存在连锁不平衡,或者A和b间是否存在连锁不平衡.当然,这是最简单的一种情况.因为连锁不平衡研究的对象是一个群体,自然群体,这个群体中的等位基因就不是只有A和a那么简单了,一个位点可能有N个等位基因,所以,你要检测的可能是A2和B6间是否存在连锁不平衡.如果这里的A2是一种分子标记,例如一个SNP,而B6是一种表型性状,如果它们间存在连锁不平衡(真实存在的连锁不平衡,也即是由于A2和B6(该性状控制的基因),由于物理位置较近或者就是决定B6的基因),那么你就得到了和某个性状关联的分子标记.这里就有一个问题了,连锁不平衡是怎样度量的,怎样检测连锁不平衡的存在.有许多表示连锁不平衡的方法,这个需要感兴趣的自己去看,其中最常用的是D和r2.

但是,我们得清楚,最希望找到的连锁不平衡是:两个等位基因间由于物理距离较近而产生的连锁不平衡,因为我们是要利用连锁不平衡进行基因定位、基因精细等位或者克隆。但由于其它的原因也会产生连锁不平衡,这些原因包括群体结构、群体混合、突变等等(这方面也要自己去看文章)。所以得有方法消除这些因素的影响,主要是利用统计学的方法(具体有什么方法,怎么用还是得自己去找)。

除了连锁不平衡以外,还有一个比较重要概念是连锁不平衡的范围以及连锁不平衡的衰减速率。连锁不平衡的范围(这个概念是我自己的理解不是专业术语,外文里有专门的词来描述,我不知中文翻成什么,反正知道意思就行了)。也就是相距多远的两个基因间能够检测到连锁不平衡,比如100kb,200kb等等。这个涉及到什么问题呢?你应该用多少分子标记去分析才可能找到和性状关联的分子标记(也就是和性状间存在连锁不平衡的分子标记)。比如连锁不平衡的范围为100kb,那么你选择分子标记时,每100kb(或者密度更高)选择一个分子标记,就比每200kb选一个分子标记去进行连锁不平衡作图,得到和性状关联的分子标记的几率高。我以前看文章时也没搞明白为什么要弄个这个东西出来,现在想明白了。有的文章,专门报道这个东西。还有一个比较重要的概念是连锁不平衡的衰减(也是我自己的理解,意思是这样的)。还是举例说明吧。比如说相距1000kb的两个分子标记等位基因间存在连锁不平衡,其实你关心的不是这两个分子标记,你关心的是这个范围内你想研究的某个决定你研究的性状的基因,而这个基因的位置呢是未知的(如果知道了你也就不用研究了)。

所以仅仅考虑连锁不平衡,你只能说这个性状控制基因在1000kb的范围内,而这个范围内有许多基因,你不知道哪个基因控制你研究的性状。但通过连锁不平衡衰减的分析你就能进一步缩小这个范围(也有专门的方法进行这个分析的)。这个分析的原理应该是这样的(我的理解)。物理距离离你性状控制基因越远,其连锁不平衡值越小,这样就能产生一条曲线,你就可以在这条曲线中去找和你性状控制基因位点最近的那个分子标记(这个曲线中有你研究的性状及分子标记)。如果这个区域都没什么衰减你要进一步缩小距离就比较困难了。连锁不平衡作图在人类中用得比较多,在水稻中,你感兴趣的那段区域是什么样子就不知道了。好象水稻里还没有文章报道这个。

有点晚了,先写到这吧。有些专业术语应该把英文原名附上来的,但懒得找了,下次如果有时间修改下,补上吧。这一口气写下来,加上自己也算初学者难免有不对的地方,如果有人发现,请指出下。