特征因子(Eigenfactor)的背景及部分性质

2009/09/12 02:19:49

特征因子(Eigenfactor,中文名由任胜利老师提出)可能是09年以来最受关注的期刊评价新指标。一方面因为特征因子创新性的将学界热切期望的“引文质量”纳入测评范围,颇具理论价值。另一方面,汤姆森公司(SCI体系的掌控者)09年初已经将其作为新版JCR的指标,正式开始实际应用。

下面就特征因子的发展背景及部分性质进行一点讨论。

Garfield提出的期刊影响因子,已对科学发展产生了巨大影响。但随着研究的深入,影响因子也暴露出诸多缺陷:如易被人为操纵、统计错误、不能跨学科比较、选源标准问题以及对非英文期刊不公平等。另外,期刊影响因子隐含假设:在剔除论文数量因素后,期刊越多的被引用则其影响力越高。显然,此假设成立需要满足“所有引文重要性等价”的条件。但每条引文的重要性是否等价是值得讨论的,如在总被引频次相等的情况下,被《nature》或《science》大量引用的论文影响力显然会大于只被一些低水平期刊引用的论文。因此,要更为准确的反映期刊论文影响,还需考虑每条引文本身的价值。影响因子对于期刊的评价远非完美,理论上和实践上都需要更为准确的期刊评价指标。

Pinski等人提出以引用某论文的论文被引频次作为权,迭代计算引文加权重要性的思想。但限于计算复杂性,此思想鲜见实际运用。1998年,Google公司创始人Brin和Page提出PageRank算法,用类似于Pinski等人的方法,计算网页的重要性和进行网页排序,成为Google王朝的奠基之石。随着计算机性能的提升和PageRank算法的成功,研究者开始注意到将PageRank算法用于引文分析的广阔前景。

在这样的背景下,2007年,美国华盛顿大学和加州大学的Bergstrom等人组成的研究小组发布了一个新的期刊引文评价指标——Eigenfactor。与影响因子不同,Eigenfactor的基本假设是:期刊越多的被高影响的期刊所引用则其影响力也越高。Eigenfactor使用Thompson公司的Journal Citation Reports (JCR)为数据源,构建剔除自引的期刊5年期引文矩阵,以类似于 PageRank的算法迭代计算出期刊的权重影响值,实现了引文数量与价值的综合评价。这一新指标以期刊影响力为权,以更贴近实际的权重网络形式重构了最早由Price提出的引文网络。其计算思想也与社会网络分析中用于描述节点在关系网络里权力和地位的特征向量中心度相似,重要的不同之处是Eigenfactor的算法避免了孤立点的影响。

Eigenfactor的部分特征包括:

1)同时测量了引文的数量和“质量”,理念上更为先进,理论假设更为合理,无视自引,并相对难以伪造。

2)其结果更好的体现了《NATURE》和《SCIENCE》等顶尖刊物的真实影响力和学术地位。

3)是一个总量性指标,与影响因子等篇均性指标差别明显,具有一些影响因子难以比拟的优点。当然,其派生出了论文影响分值(Article Influence Score)则是较典型的“篇均”性指标。

4)拉大了“好”期刊和“差”期刊的差距,但同时存在对于“差”期刊的区分度较弱的问题。