同行评议科研评价方法反思

所属栏目:社会科学论文 论文作者:/

  同行评议是科学界对科研项目和成果进行评审、评价的一种方法[1],被广泛用于科研管理。进入 21 世纪以来,随着我国科技管理体制的改革和制度创新,如何进一步完善评价体制、建立公平公正的学术环境和创新机制等问题已经引起广泛的重视。

  龚旭分析并指出了影响同行评议公正性的三方面因素,即评议过程本身的因素和评议过程外的因素,以及评议过程中的制度性因素和非制度性因素[2].周颖、王蒲生认为利益冲突的问题影响到同行评议的公正性,指出国外同行评议系统采用披露与回避的治理手段来应对同行评议中的利益冲突问题,并提出如果同行评议制度能够具有可操作性,将有益于科学同行评议工作走向规范化[3].王前等探讨了跨学科同行评议的合理性,指出跨学科评议的评审专家专业背景各异,在评审非本专业的成果时很难准确和全面[4].康敬奎认为交叉学科的同行评议存在失公正性、失科学性、失实效性的问题[5].为了弥补同行评议的不足,贺颖等提出利用科学知识图谱来判定交叉学科相近研究领域及热点研究主题,并据此确定合适交叉学科同行评议专家遴选的方法[6].

  这些研究对于进一步完善同行评议机制具有重要的作用。但是所有这些研究仍然局限于关于同行评议的方法和学术共同体内部评议标准的讨论。然而,对科学技术活动评议的问题并不仅仅是学术共同体内部的问题。随着现代科学的技术化和技术的科学化的特征,不仅科学的社会价值凸显,许多新兴科学技术的实验已经“放大”到整个社会,公众也直接或间接地参与到科学活动中。科学、技术、经济和社会已经交织在一起。在这样的科技与社会经济一体化的背景下,同行评议也面临着前所未有的挑战:一方面,如果从研究对象和方法上来讲,严格意义上的科学同行越来越少; 另一方面,从科学技术与社会的关系来看,许多研究已经涉及到对人的自然与环境的深度干预,公众参与科学评价的诉求日益高涨,科技评价不能不考虑其社会影响和公众的可接受性。科技评价的价值规范维度已经成为同行评议中不可或缺的内容。

  2002 年,经过同行评议,以“用酶技术开发大麦及高麸型饲粮及其产业化研究”为名的瘦肉精的研发获得国家科技进步二等奖。然而,以盐酸克伦特罗为主要成分的“瘦肉精”,虽然可明显地促进动物生长,并增加瘦肉率,但是由于其半衰期长、代谢慢,容易沉积于动物体内。人吃了含有瘦肉精的肉制品后,急性中毒者常表现为头晕、呕吐、腹痛、腹泄、肌肉震颤、心跳过速、呼吸困难和神经紊乱等症状,严重的会危及生命[7].2010 年度,谢剑平的研究成果“卷烟危害性评价与控制体系建立及其应用”获得国家科技进步二等奖。2011 年,谢剑平以“卷烟降焦减害”的应用研究当选工程院院士。但是在工程院评审尚未结束时,学术圈内和圈外就开始了关于“卷烟降焦减害”是否是伪科学、降焦是否能真正减轻对健康的危害等问题的激烈争辩[8].事实上,无论是科技进步奖的评审还是工程院院士评审,都经过了层层的严格的同行评议的程序。然而评议的结果却未能得到社会公众的认可,甚至引起公众的质疑和非议。人们不禁要问,为什么经过专家同行评议的结果不能被社会接受? 仅仅由“同行”参与的评议的正当性是否能够得到辩护? “外行”是否有资格参与对科学技术的评价? 为此,我们认为,有必要对同行评议这一评价方法进行深度反思。

  1 同行评议的诞生与科学的自主性

  同行 评 议 ( peer review) 从 英 文 词 源 来 看,“peer”指同资格、同能力的人,“review”指坚定性地或审慎地查阅或检查。同行评议意即同能力、同资格的人审慎地进行鉴定、检查科学成果的方法[9].美国国会技术评估办公室高级专家库宾( Chubin)认为,“同行评议是用于评价科学工作的一种组织方法。这种方法常常被科学界用来判断工作程序的正确性,确认结果的可靠性以及对有限资源的分配,诸如杂志版面、研究资助、公认性和特殊荣誉”[10].

  我国学者郭碧坚和韩宇认为,同行评议指的是某一或若干领域的专家采用一种评价标准,共同对涉及上述领域的一项事物进行评价的活动。如果在科学系统,评价对象则为一项知识产品---人们进行知识生产活动所得产品。知识产品可分为精神产品( 如论文、论着、新工艺) 与物质产品( 如新工具、新产品)[11].尽管同行评议的定义不一而足,但有关它的定义都涉及到三个重要的要素: 即评价人( 评价主体) 、评价的标准和被评价的对象( 评价客体) .同行评议源于对专利申请的审查。1416 年,威尼斯共和国在世界上率先实行专利制度,它在对发明者提出的新发明、新工艺等进行审查,以确定是否授予发明者对发明的垄断权时,就采用了邀请同一行业或最接近行业的有一定影响的从业者帮助判断的做法[12].而有记载的最早的同行评议可追溯到1665 年英国皇家学会的《哲学会刊》---世界上第一本科学期刊,该期刊只发表经过皇家学会审查的论文[13].20 世纪 30 年代,美国率先把同行评议引进到科研项目经费的评审工作中。随即,这一做法为欧美国家广泛采用,成为国际学术界通用的学术水准评价手段[10].20 世纪 50 年代初,美国国家科学基金会采用同行评议评审科研项目,首开同行评议在科研管理中应用的先河。以此为标志,在美国形成了一套比较完整的同行评议评估体系[14].我国于 1982 年设立中国科学院科学基金,1986 年 2月成立国家自然科学基金委员会,这标志着一个在学术共同体内,由专家民主决策科学基金分配的同行评议机制正式引入我国。经过 30 年的发展,作为“一种有组织的用于评价科研工作的方法”,同行评议在我国已成为科学界对科研成果评价的主要方法之一[15].

  同行评议的产生与科学的演进与发展历程有着密切的关系。科学精神的萌芽源于古希腊的理性自然观。在亚里士多德那里,科学是灵魂把握真理的五种能力之一。而自然是独立于人、有规律且可以认识的对象。科学是一种独立的、自主的和自由的活动。但在中世纪,宗教排斥人的理性,自然科学的发展顺从宗教神学的思想,此时的科学和哲学都只是神学恭顺的婢女。只要科学不从根本上反对神学,没有对宗教信仰产生威胁时,宗教就能够容忍科学的存在[16].然而,一旦科学发展超越了宗教教义所允许的范围,对宗教信仰本身构成了威胁,就会遭到宗教的反对、禁止甚至制裁。文艺复兴为近代科学的产生提供了条件,启蒙运动则为之传播提供了发展方向。科学逐渐摆脱宗教神学的束缚,恢复了科学的自主精神,实现了自己的社会化建制。由此,被宗教神学束缚一个多世纪的科学精神得以发展。

  尤其是,科学的理性和实证精神成为那个时代的精神气质乃至社会风尚。正如汉金斯( Hankins) 所说:18 世纪的自然哲学家相信,科学革命正在改变人类的一切活动,理性是正确方法的关键,它甚至会毁坏宗教法庭的基础[17].启蒙运动将真理和价值的起点转移到主体上,科学研究可以遵循其自身的规律,科学具有了自主性的特点。

  实验方法的建立使得自然科学最终与神学分道扬镳。由直觉思辨的研究发展到实证的研究,以实验事实为依据、并由实验事实加以检验,为现代意义下的科学奠定了基础[18].最初人们认为科学是一种特殊的智力活动,科学家在科学规范的指导下,运用科学方法,通过观察而后实验获得关于自然界的知识。这种知识可以不断从经验事实中得到证实,从而使人们能够掌握“既定的”,即使是科学家也“不能控制”的自然规律[9].在这种认识论的指导下,科学逐渐从神学和形而上学脱离。科学独立于其它领域,科学活动有别于政治文化、宗教等领域的规范而遵循自身的研究规范。17 世纪成立了科学史上第一个制度化自主科学组织---英国皇家学会。这标志着制度化自主科学的形成[9].而同行评议在皇家学会《哲学会刊》的应用,开启了科学家对同行的研究工作进行评价的制度化进程,建立起了科学家内部有组织的进行学术交流和质量控制的有效制度[9].可以说,同行评议是自主性科学制度的重要环节和体现。

  三百多年来,由科学共同体自身评判科学活动及其成果价值的“同行评议”,一直被视为科学自主性的象征。科学自主性体现科学及其外部环境间的关系,即,科学作为一个整体的存在,同政治、经济等其他的社会建制一样,具有独立的价值,这种价值不取决于科学以外的权威或力量[19].默顿从社会学角度,利用结构功能主义分析了科学作为一种自主的社会制度的特性。他认为科学所追求的基本价值目标是“扩展被证实了的知识”,它包含客观性和原创性这两个基本的价值要素,构成科学制度的各个分系统结构和功能就围绕这一制度性目标而构建和展开。科学规范系统是科学价值的体现和实现科学价值的手段。默顿认为,构成“现代科学的精神特质( scientificethos) ”的四项规范为科学“最充分的发展提供了制度环境”.这四项规范包括: 普遍性; 公有性; 无私利性; 有组织的怀疑[20].而同行评议则为这四项规范的实现提供了制度保障,即科学家团体可以通过科学内部的机制运行管理,而不需要来自外部的干扰和影响。默顿对科学社会学的研究表明,对一项研究的评价应该唯一地依据其本身的价值来进行,其他各种社会属性不应对评价产生大的影响[21].据此,同行评议要求科学家在评价其同行的工作时,惟以研究本身的科学价值为依据,而不为其他因素( 包括科学以外的力量或权威) 所左右,独立地做出判断,以使科学不受其他因素的干扰。

  由此可见,同行评议的诞生不是偶然的。它是科学自主、自由精神的体现,也是科学发展的一个必要和必然的阶段。

  2 科学活动的新特点对同行评议的影响

  然而,20 世纪以降,科学活动的特点发生了很大的变化。科学从专注于探索客观现象和观察事实,转向理论与应用并重,甚至更多地关注其应用价值,以应用、市场为导向。从最近几年的诺贝尔物理学和化学奖的颁布也可以看出,科学与技术之间的相互渗透突出,科学技术化与技术科学化的特征更加明显。科学技术的发展更多地以社会需求为导向,由此也带来了交叉科学的迅速发展和科学技术活动不确定性的凸显。

  ( 1) 科学的社会建构随着科学的历史发展,科学活动的特点包括科学研究的目的与手段发生了很大的变化。在古希腊时,科学主要以沉思与观察为主要手段,借助于对自然现象的观察与理性分析来认识和把握自然界。科学是无涉功利目的的活动。近代以降,实验科学的诞生,为衡量科学知识的可靠性提供可重复性、可检验性等手段,为“科学性”提供了可靠的认识。这些意义上的科学与技术彼此是相互独立的,技术被看作是科学的应用,科学与生产及应用少有直接的关系。然而现代科学活动所需要的资源对外部社会的依赖性越来越大,科学和技术、政治、经济、文化、社会等的关系也越来越紧密,越来越复杂。一方面,科学以技术和市场为支撑,科学进步依赖技术工具的创新,科学研究需要资本市场的支持; 另一方面,科学研究的目的也多半以需求为导向,包括技术需求和市场需求。换言之,科学研究的目的和手段都发生了变化,科学不再以纯粹地探索自然的奥秘为宗旨,而是以社会实践中的需求为导向,具有明显的功利性与价值指向---包括经济价值、政治价值和文化价值,社会结构、环境、文化、政治以及经济等各种要素对科学技术活动的影响变得越来越大。在这一意义上,科学与技术的结合就不仅仅是科学应用于技术的问题,而呈现出科学、技术、经济、政治等多元要素一体化的倾向。科学成为一种兼备功能化、功利化和价值内在化的社会建构,科学活动也已经不仅仅是科学共同体的内部事务了。

  ( 2) 科学研究的跨学科特征同行评议体现了科学共同体在评价系统中的权威作用。同行评议中的“同行”指的是库恩所提出的“科学共同体”.科学共同体是由科学家组成的专业的团体,具有共同的追求目标。对科研项目和科研结果进行评价是科学共同体的功能之一,而同行评议就是对研究成果守门把关的重要手段。然而,科学与技术的交融与渗透,也带来了科学技术研究的团队化和跨学科特征,“同行”的概念变得越来越难以界定。吉本斯( Gibbons) 指出,同行评议方法特别适用于这样的领域: ( 1) 得到充分发展的研究领域,且拥有世界范围内的学术共同体和结构分明的科学奖励系统; ( 2) 其科学问题( 或有价值的工作) 是由研究共同体本身所决定的研究领域[2].但在上述领域之外,尤其是在跨学科领域或新兴的研究领域等就很难找到真正的同行。但是另一方面,许多学术成果恰恰集中在交叉学科、边缘学科、综合学科和新领域。广义上的科学共同体成员已经很难评价新兴学科的成果,导致了合适评议人的来源日益窄小,在每一个相关领域,也许都可以找到大批的评议人,但在学科的交叉之处可能找不到几个。而处于离学科交叉之处太远的人,又可能做出太挑剔或者不适当的评议。科学家总是在跟同行评议打交道,他们频繁地在执行者与评价人或被告人与陪审员之类的角色间转换[22].但是,真正具有综合性知识背景的同行是非常有限的。合适评议人的来源可能缩小到只包括那些很可能存在利益冲突的人,因为他们与申请者的关系密切,更了解研究的内容。

  如果从这个来源之外遴选的评议人,将会导致不称职的、不完善的和不合适的评议; 但在这个来源之内遴选,朋友关系、竞争对手和职业关系将会危及评议的质量[22].

  科学研究的跨学科特征对于同行评议来说还带来了另一个挑战,即标准的多元化问题。由于科学研究的主体的多元化,势必要求“同行”也来自于不同领域,而不同领域的同行往往具有不同的价值标准,即使有非常明确的评议标准,也会因主体的不同价值取向而采取相对灵活的标准。胡托涅米( Huut-oniemi) 指出,评价跨学科研究很难,因为缺乏各学科能提供的得到一致同意的评价标准[23].当评议的内容不符合评议专家的偏好标准时,专家有权利对其投出反对的一票。

  ( 3) 科学研究后果的不确定性一直以来,追求确定性是大多数人认为科学之为科学的本质,是人类认识尤其是科学认识追求的目标,科学的发展史曾经是一部追寻确定性的历史。

  科学是求真的,而真理被认为是唯一的。然而随着科学认识对象的日益复杂,以及科学、技术和社会的相互影响的日益加强,科学知识在生产、应用中显示了种种不确定性,包括科学技术活动后果本身的不确定性和对这一后果评价的不确定性。这些不确定性产生的原因部分是由科学以外的因素干扰而形成的,部分来自于科学技术本身的复杂性、后果的长远性、累积性,以及我们认识的阶段性和有限性。比如说,有关转基因技术的后果的争议就既涉及到转基因技术后果的潜在性和长远性、累积性,也涉及到多元价值中人们对技术风险的可接受性差异。在这样的背景下,对转基因技术应用后果的评价,如果仅仅由科学共同体按照常规的科学评价方法对其理论和实验的可靠性进行分析评价,而不追问该技术的潜在风险以及公众是否愿意接受这样的风险和后果,显然是不够的。这也是目前我国公众在转基因技术问题上存在质疑甚至反对的原因之一。

'); })();