◇◇新语丝(www.xys.org)(xinyusi.org)(groups.google.com/group/xinyusi)◇◇    什么学术评价指标都难不倒中国人    ·方舟子·   要怎么比较准确地评价一个科研人员的学术成就,是一个比较麻烦的问题, 在中国尤其麻烦。   理论上,由同行来做评议是最合理的做法,因为同行懂行,对你的成就知根 知底。但是这种评价方法存在着问题。第一,比较麻烦,需要对某一个人发表的 所有论文都有很详细的了解。第二,主观,没有一个客观的标准,好、坏是由同 行说了算的。这就涉及到人际关系,尤其是在中国这种人情社会,同行评议往往 变成了互相吹捧,就像中国搞的学术成果鉴定会一样。第三,不公开,外界的人 没法知道。例如,职称评定时一般也有同行评议,但是评议结果外人是看不到的。   所以,就需要有一种既简单又客观而且是公开的评价科研人员学术成就的方 法。有什么样的方法呢?   一个人的学术成果是通过论文发表出来的。一个最简单、最直观的指标就是 看这个科研人员发表了多少篇论文。你看某一个科研人员的介绍,往往也会说到 现在他发表了多少篇论文。但是这种简单的方法存在着很大的问题:只看数量, 不看质量。发表的论文多不等于贡献就大。有可能发表的论文都是垃圾、灌水、 没有什么人看的论文。   特别是中国现在搞论文大跃进,这个问题就更严重了。曾经有一段时间,中 国有的大学为了鼓励人们在国际期刊发表论文,每发表一篇国际期刊论文就奖励 几千、上万块钱,刺激了大家批量生产论文。有的中国科研人员一年能够发表几 十、上百篇论文,这能够说明他的贡献就特别大吗?   中国的大学后来学乖了,强调不能发表了论文就算数,还要看发表的论文期 刊的档次,发表高档次期刊的论文才给奖励,期刊档次越高,奖励越多。曾经有 的学校开出,发表一篇最高档期刊的论文奖励一百万元。   要怎么区分期刊的高低档呢?一般用的方法是看这份期刊的影响因子的多少。 所谓影响因子,可以简单地理解成,在过去的两年这份期刊发表的论文平均被引 用的次数,被引用的次数越多,说明期刊的影响力越大。中国特别看重期刊的影 响力,把它叫做几分,例如在影响因子10的期刊上发了论文,就说发表了一篇十 分的论文。   但是这种方法也存在着问题。在影响力大的期刊上面发表论文不等于这篇论 文的影响力就大。高档期刊的发表论文其实大部分都没有啥影响。而反过来,在 影响力小的所谓的低档期刊期刊发表的论文,有的反而影响力很大。很多获得诺 贝尔奖的工作是发表在所谓的低档期刊上的。发表论文的期刊的影响力并不等于 论文的影响力。   能体现论文的影响力的是论文本身被引用的次数。有一种评价学术成就的办 法是看这个人发表的论文总共被引用的次数是多少。很多人的简介往往会提一下 到现在他发表的论文总共被引用了多少次。但是这个指标也存在着问题。如果一 个人发表过一两篇被引用次数非常多的论文,但是他的其他论文引用次数都很少, 就会夸大了他的学术成就。特别是那些引用次数非常高的论文不一定就是特别重 要的论文。在生物化学领域,那些引用次数奇高,被引用过十几万、几十万次的 论文,往往是因为发明了某种实验方法,大家都用了,在写方法与步骤的时候就 都引用一下,当然引用次数非常高。但是那是技术问题,能说有多么重要吗?而 且,被引用次数比较多的论文很多是综述文章,但是综述文章的重要性不如引用 次数较低的原创文章。   所以去简单地算一个人发表的论文的引用总数是多少也不是一个很好的办法。 那么为了避免这种情况,就平均一下吧,将某一个人发表的论文的被引用的总数 除以他发表的论文的总数,得出一个他发表的论文的平均引用数。但是,这种方 法也有问题,对那些发表论文比较少的人会有利,而发表论文比较多的人反而不 利,即使发表过不少引用很高的论文,但是也有不少的引用很低的论文,平均了, 重要性就降低了。   所以需要一种方法能够同时兼顾到论文的引用数和论文的篇数。在大约二十 年前,加州大学圣地亚哥分校(UCSD)物理教授赫希,他是阿根廷的移民,提出 了一种办法,叫做H指数,就是想解决这个问题的。这个方法提出来没多久,我 就知道了。当时我碰巧去加州大学尔湾分校拜访一个在那里当物理教授的中学同 学。他们系有一个物理教授,是从台湾来的,很关心中国大陆学术腐败的现象, 听说我去了,来跟我见面。我谈到,现在中国学术评价存在着很大问题,看论文 的数量,不看论文的质量。这个教授说,UCSD的一个教授新提出了一种评价的方 法——H指数就是想解决这个问题的,你应该把它介绍到中国大陆。   回家之后,我就将赫希的那篇论文找出来看,觉得的确是一种比较合理的方 法。我当时在《中国青年报·冰点周刊》有一个专栏,就写了一篇文章介绍H指 数。后来,我到中科院的研究所或者中国的大学跟科研人员交流,也建议使用H 指数作为一种评价的指标。那么什么是H指数呢?   H指数的定义是,如果某一个人的H指数是N,表明他发表的所有论文当中, 有N篇的论文被引用次数不少于N。是一个很简单的定义。而要找出一个人的H指 数也很容易。将这个人发表过的所有论文都找出来,根据这些论文被引用次数的 高低,按序排列,往下查,直到某一篇论文的序号大于它被引用的次数,将这个 序号减去1,就是这个人的H指数。比如说赫希,他提出H指数的时候,他发表的 所有的论文按被引用次数排序的结果,从第50篇论文开始,被引用的次数比序号 要小,将50减去1,49就是赫希在当时的H指数,也就是说,他到那个时候发表的 所有的论文有49篇被引用的次数都不少于49次。   H指数有天生的缺陷,不适合评价那些比较年轻的低年资的科研人员,因为 他们发表的论文太少了,不管他们发表的论文的被引用次数有多高,H指数也不 可能大于他们发表的论文数。H指数只适用于评价那些高年资的科研人员,年资 越高,越有利,因为H指数只会随着论文篇数和时间增加或不变,不会减少。不 过这个问题不大,因为人们要知道的就是这些地位已确立的高年资的科研人员的 学术贡献。低年资的还有发展前途。   另一个问题,是不同的领域H指数的情形不一致。生物医学领域因为发表的 论文被引用的数量在所有的领域中是最多的,导致生物学家的H指数偏高,所以H 指数不适合做跨领域的比较,不宜将一个生物学家的H指数跟一个物理学家做对 比,说这个生物学家的学术贡献比那个物理学家要大。这个问题也不大。人们关 心的是同一个领域的科学家的贡献的大小。如果用H指数来评价同一个领域的科 学家的学术贡献,是比较准确的,美国顶级大学的教授的H指数一般比普通大学 的教授的H指数高,美国科学院院士的H指数一般也要比顶级大学的普通教授的H 指数高,而诺贝尔奖等科学大奖的获奖者的H指数又要比一般的美国科学院院士 的H指数高。   这种评价方法因为比较合理,很快流传开去了,被各个大学、科研机构都采 用。有一些网站、论文数据库,还会列出某一个人的H指数是多少,因为很容易 算。中国也逐渐地采用H指数,中国科研人员也会说他的H指数是多少。   但是,H指数这种评价方法也是有不合理之处的,也有漏洞可利用。第一, 在算一个人的H指数的时候,只看论文被引用的次数,不去区分引用是论文作者 自己引用,还是别人引用。越来越多的科研人员,特别是在中国,很喜欢引用自 己发表过的论文,甚至是大量引用自己发表的论文,就为了让自己论文的被引用 次数显得特别高。这样就会导致H指数虚高。   第二,在算H指数的时候,不去看论文有多少作者,以及这些论文作者对这 篇论文的贡献的多少。只要是一篇论文的共同作者,不管这篇论文有多少作者, 不管这个作者只是挂名的,那篇论文都算是他的了。现在有一些论文共同作者非 常多,甚至一篇论文有几百个、上千个作者,往往是一个很大型的项目等很重要 的论文,被引用的次数很多,人人都有份,也会导致H指数虚高。   由于存在这些缺陷,而且问题越来越严重,导致H指数的重要性越来越下降 了,已经没有那么可靠了。有人提出来,要对H指数进行改造。要去看论文被引 用的情况,是别人引用,还是自己引用。要将自己引用的排除掉,不算在引用次 数里。其次,要看论文的合作者的情况。一篇论文的引用次数,要主要归给最重 要的作者,也就是第一作者和通讯作者(即课题负责人);其他的作者,分给的 引用次数就少一点,甚至没有。   但是,这么区分之后,就对每一篇论文都要具体分析,去看有多少作者,作 者的贡献是怎么样的,引用的情况是怎么样的,是自己引用,还是别人引用。这 样就变得麻烦了,就不再是一种简单的办法了。   即使采用了这么麻烦的方法,也没法防备有人弄虚作假去拔高自己的H指数。 你想要区分自己引用和别人引用?那没问题,很多中国科研人员现在采用的做法 是串通起来相互引用,被他人引用次数都升高了。这怎么去区分?一篇论文要只 看最重要的第一作者和通讯作者?这也难不倒中国人。中国这十几二十年已经出 现了一种趋势,一篇论文的作者有多个共同第一作者和多个共同通信作者。到最 后也就变成了一篇论文前面一大堆的共同第一作者,后面一大堆的共同通信作者, 没有别的作者了,也是变成了人人有份了。   我在最早向中国介绍H指数的那篇文章最后,已经预言了,H指数也会被中国 科研人员玩坏的。不管什么再合理的、再复杂的评价学术的方法,都难不倒中国 人去抓它的漏洞。中国人的智慧在弄虚作假方面是无穷的。   2026.5.1.录制   2026.5.8.整理 (XYS20260607) ◇◇新语丝(www.xys.org)(xinyusi.org)(groups.google.com/group/xinyusi)◇◇