学术定量化：最不坏的选择_国学网-国学经典-国学大师-国学常识-中国传统文化网-汉学研究

学术定量化：最不坏的选择

http://www.newdu.com 2025/05/21 01:05:18 中国儒学网佚名参加讨论

    学术定量化：最不坏的选择
    邓曦泽
    【作者按：此文发表于《博览群书》2010年8期，发表时有所删节。】

    关于学术界“数篇篇”的定量评价机制，近些年来一直有人讨论、质疑，而南京大学中国社会科学研究评价中心2010-2011年度《中文社会科学引文索引（CSSCI）来源刊物》目录公布后，关于学术评价机制的讨论更是鹊起。
    大家的问题主要集中在两个方面：许多评价机构将CSSCI作为学术评价进而作为利益分配的最重要标准，甚至唯一标准，此种做法的合理性究竟有多大？而更根本的问题则是：CSSCI这种文献计量学角度的统计与评价工具自身的合理性有多大？许多讨论者主要聚焦于前一问题，因为前一问题直接关系学者们的切身利益。实际上，两个问题是相关的，后者更根本，虽然它并不完全决定前者。这里准备从后一问题进入前一问题。
    一、引文索引的初衷
    1958年，美国情报学家尤金·加菲尔德创建了美国科学信息研究所（ISI），后于1963年创办了《科学引文索引》（SCI），然后将引文数据库的做法从自然科学推广到人文社会科学，分别于1973年、1978年创办了《社会科学引文索引》（SSCI）和《艺术和人文学科引文索引》（A&HCI）。美国科学信息研究所还有影响因子（IF）这一数据统计与评价。CSSCI就是模仿美国的引文数据库建立的中文社会科学方面的引文数据库。
    SCI、SSCI、A&HCI、CSSCI的目的都是为研究者提供方便，而其采取的具体方式则是通过引文情况让研究者尽快知道他要研究的问题的最新研究进展，哪些研究成果受到了其他研究者的重视（包括肯定与批评），并通过引文线索，预测该问题的可能趋向。
    自从20世纪知识爆炸以来，人类新增的知识根本无法让人完全了解，甚至同一细小领域的新增知识也根本无法完全了解。这里的新知识是中性的，包括有价值的与无价值的。1980年代初，“世界上平均每天发表1.3－1.4万篇论文”，平均每6.4秒有一篇论文问世（注：原文为“平均每35秒”，系计算错误。若取均值每天1.35万篇，当为平均每6.4秒就有一篇），“各种书籍每年增加25万种……而1976年的大学毕业生到1980年已有50％的知识陈旧了”（田夫、王兴成主编：《科学学教程》，科学出版社，1983年，p300－301）。而至目前，仅中国的CNKI数据库的重要子库“中国期刊全文数据库”每天就增加1万多篇文献。由此可知，全世界每天新增的文献（含论文、著作、实验报告等）何其庞大。一个研究者一辈子不要说穷尽阅读所有既有与新增文献，就是他的小专业的文献，也根本不可能穷尽。当然，并非所有新增知识或新增文献都是有价值的，都值得去关注、阅读。而哪些文献可读或不可读，需要选择。
    谁来为研究者提供文献初选呢？引文数据库就应运而生了。
    如何让研究者尽快知道哪些新知识是有价值的甚至是很有价值的，从而让他尽快把握研究前沿，进一步拓展、深化研究，增进人类文明？考察引文情况，是让研究者尽快把握前沿的一种比较有效的手段。如果一个研究者要引用某篇文献，说明该文献值得重视。而一篇文献值得重视，则有两种可能，或者提供了新的正面的值得肯定的知识，或者提供了新的负面的值得否定的知识。这两种情况的文献，对于其他研究者的研究来说（而不是对于问题的解决本身来说），都是有效文献。前者之价值不言而喻，后者也不是无价值的，因为后者可以使其他研究者少走弯路。除了这两种有效文献，许多新增知识（即新增文献）都是无效文献，它们根本没有提供值得肯定或否定的新的知识，所以，此类文献根本不值得重视，根本不应该纳入研究者的视野。事实上，许多文献的产生之日就是其沉没之日，成为人类知识与文明的累赘。所以，一篇文献的被引用情况，大体反映了该文献的价值。
    引文数据库就是对文献的引用情况进行统计、分析，告诉研究者。它的统计对象是研究者对文献的引用，这种引用包括了研究者对文献或肯定或否定的评价。但是，引文数据库本身并不对研究者对文献的引用是否妥当作出评价，而只是进行数据统计与分析，它提供的数据是客观的。概言之，研究者的引用蕴涵了他对被引文献的评价，而引文数据库则是收集、统计了研究者的文献引用情况，以转述的方式告知其他研究者；研究者的引用可能有主观因素，但引文数据库的转述则是客观的，这就是研究者引用文献与引文数据库提供引文索引的关系。所以，建设引文数据库的初衷乃是为了有效地进行文献积累。至于其他研究者如何对待数据库提供的信息，那是他们自己的事。实际上，一个研究者，只要他真愿意利用数据库，一定能获得极大的便利。当然，有些研究者引用了许多无效文献，甚至有些极有价值的文献在很长时间内根本无人引用，但是，引文数据库根本无能力处理此类问题，故此类情况根本不是引文数据库的责任。引文数据库只是为研究者提供一种便捷的参考手段，而不是要取代研究者对文献的检索。面对庞大的新增知识，如果没有数据库，研究者将多耗许多精力在文献检索上。如果全世界每年只产生100篇论文，引文数据库就毫无必要。
    二、引文索引成为学术评价与利益分配标准
    引文索引是以刊物而不是一个具体文献为统计单位，进入数据库的刊物就是某某引文索引来源刊物（多数是期刊）。在统计学意义上，来源刊物显示的是，该刊发表的论文被引用较多。这间接意味着，来源刊物所发表的文章被引用较多。根据上面关于引用即被重视的讨论，这进一步间接意味着，来源刊物所发表的文章通常较有价值。这一结论对于一个刊物来说，大体可以成立，但是，这一结论无法落实到具体某篇论文。我们完全不能说某个来源刊物上的文章都是有价值的，更不能说同一期刊上的文章的价值都是相等的。
    研究成果需要被评价，这是因为只有经过评价，才能遴选，促进知识积累与文明积累。同时，只有经过评价，才可能对研究者的利益进行合理分配。国外如何对学者进行利益分配，姑且不论。就国内来说，学术界（以及教育界）的利益分配机制一直是一个大问题（姑且不论暗箱操作等不公正因素）。以前，学术界和其他行业一样，都是吃“大锅饭”，论资排辈。20世纪80年代以后，物质生产行业开始实行绩效考核，通过生产产品的数量与质量来评价劳动成果，并以之为根据，进行利益分配。与这些行业相比，学术界的分配改革慢得多。这主要不是由于学术界的惰性，而是由于学术的特性。其他行业的产品的数量尤其是质量，是容易衡定的，但是，学术产品的质量很难衡定。对于学术产品来说，质量的重要性远大于数量。优秀的研究成果为人类知识与文明提供有效增量，而平庸的文献根本不可能提供有效增量，根本没有价值，反而成为其他研究者以及后人的文化累赘与负担。读者在它身上停留5秒钟，它就浪费了读者5秒钟的生命。正是由于学术垃圾太多，才需要遴选，引文索引才有必要与价值。
    但是，引文索引对文献价值的评价，只是非常间接的，根本不能对刊入座。那如何才能准确评价一篇文献的学术价值呢？这个问题，很难可靠地解决。如何可靠地评价一篇文献的价值，在知识论上是很难的，因为任何人掌握的知识都不能说就是真理。只要真理标准没有得到公认，评价就会产生分歧。不过，自然科学要比社会科学以及人文科学更容易获得可靠的衡量，毕竟数学计算、实验数据、实验检验以及经验运用的客观性要高很多。社会科学领域的文献的学术价值，虽然不是不可衡量，但要软性得多，其可靠性受诸多因素制约。
    最重要的是受专业分化的限制。由于知识的积累，一个人不能研究太多的领域与问题，现代学术的专业分工日益细化。虽然不少人呼吁跨专业跨领域，但实际上除了对极其个别的精英，这是不现实的，绝大多数学者（包括许多优秀的学者）不要说不能精通大学科，甚至小专业都无法精通。所以，谁来衡量一篇专业文献的学术价值？只有本专业很小一部分人才能衡量。
    其次是受范式的制约。即便在同一专业内，范式的不同，也会导致对同一篇文献的评价产生重大分歧。库恩在《科学革命的结构》中认为，当新旧范式并存时，二者是不能通约的，也就很难对同一篇文献产生一致评价。马克斯·普朗克在他的《科学自传》中回顾自己的生涯时，悲伤地谈到：“一个新的科学真理的胜利并不是靠使它的反对者信服和领悟，还不如说是因为它的反对者终于都死了，而熟悉这个新科学真理的新一代成长起来了”（库恩：《科学革命的结构》，北京大学出版社，2003年，p136）。自然科学尚且经常出现无法就评价达成一致的情况，何况社会科学。社会科学比自然科学更容易受立场、价值倾向等的制约。
    对一篇文献，如果聚集该专业的专家来衡量，又能否获得比较可靠的评价呢？可靠性似乎相对较高，但也很不稳定，因为这同样要受各位专家的范式、立场、价值观念的制约。如果文献的论点、方法与专家比较一致，可能会获得较高评价，但这很可能恰恰说明该篇文献的价值较低而不是较高，因为它提供的东西的创新度不够。如果一篇文献与专家的观点或方法差异很大，它得到的评价很可能很低，但这并不能证明该文的价值就很低。对于这种情况，该篇文献的价值有两种可能：很高或很低。创新度很高的研究成果，在开始时，其命运常常不济，其被认可的时间常常要隔很长一段时间。这种情况，在近代自然科学史中有许多例证，如伽利略的新发现就遭到了激励而长期的反对。对此类现象，库恩的范式理论给出了合理的解释。就社会科学看，海德格尔用《存在与时间》去申请教授，也被教育部长给否决了。所以，有人说，创新度超过百分之三十，就很难被当前学界所接受。我们猜猜，如果爱因斯坦把新创立的相对论拿去投稿，结局可能是什么呢？
    其实，即便聚集一些专家来衡量一篇文献，能得到可靠的评价，这种手段也是不现实的，因为此种评价方式的社会成本太大，社会根本不可能提供如此巨大的人财物力来对数量庞大的文献进行逐一评价。
    如果再介入私利人情等因素，对一篇文献评价的可靠性更难得到保证。
    因此，要可靠地评价一项研究成果的学术价值，不论是在知识论上，还是在社会成本上，都是很难的。总言之，很难保证一项研究成果学术价值评价的科学性。
    在这种情况下，借助引用来间接评价一篇文献的学术价值，不失为一种相对有效的方法。一篇文献，如果被引用，通常来说，可以间接说明它是有价值的，因为通常来说，引用者会比较认真地阅读该篇文献，也只有他熟悉该篇文献所讨论的问题，他才会去肯定或否定该篇文献，从而引用它。所以，将引用作为衡量一篇文献学术价值的一个评价指标，是合理的。当然，这一指标不是唯一的，甚至不是最重要的。
    有些人在批评CSSCI时，不应忘记，当前，大学以及其他科研机构把CSSCI作为评价标准，尤其是作为利益分配标准，乃是出于打破学术“大锅饭”，促进学术来考虑的。学术需要被评价，这样才可能甄别优劣，有利于学术积累。学术被评价的前提则是产生了研究成果，而研究成果是从学者的劳动中来。学者为什么要从事学术呢？当然有一些学者是为了学术而学术，但是，大多数学者是受功利驱动而从事学术的。即便为学术而学术的学者，他也有基本的利益诉求。一个良性制度，不是遏制人们的利益诉求，而是善于诱导、规范人们的利益诉求，利用利益杠杆，使人们的劳动投到符合集体以至人类利益的活动中。所以，采取尽量合理的利益分配方式，有利于激励人们投身于学术。虽然我们可以说，目前，把CSSCI（以及SCI等）借用为利益分配方式仍不够科学，但是，这种方式难道比“大锅饭”更糟糕？难道比那种领导决定分配，“黄马褂”想赏给谁就赏给谁的分配方式更糟糕？进步总是渐进的，总是相对的。有些问题，永远都没有彻底的解决之法，只有相对较好之法。科学评价标准尤其是社会科学评价标准问题，恐怕就属于永远也给不出彻底解决之法的情况。不论就学术成果自身价值来说，还是就利益分配来说，引文索引的学术定量评价真正保证的不是科学性，而是公正性，即提供客观数据，而其科学性受制于研究者的引用水平，所以相对性较大。科学性与公正性是两回事，二者可能一致，也可能分离。
    对于CSSCI（以及SCI等），我们可以批评它的种种不足，但是，在没找到更好的评价标准的情况下，怎么办呢？没有更优的替代方案，现有方案有再多问题，也是最好的。在这个意义上，学术定量化，即使不是好的选择，也可谓最不坏的选择。明白此点，可以减少许多不必要的分歧、指责与怨气。
    引文索引的主要功能是进行文献检索以及科研文献交流分析，使研究者尽快把握学术前沿动态，如果把一些没有的功能赋予给它，显然既是高估了它，也是冤枉了它。对学术定量评价的批评，尤其是对CSSCI的批评，目前有一些批评找错了对象。例如，把CSSCI作为学术评价与利益分配的最重要标准甚至唯一标准（“以刊评文），这显然是学术评价机构的问题，而不是CSSCI的问题。有人指责CSSCI来源刊物的遴选不够公正，可能存在暗箱操作，这不是CSSCI这种手段本身的问题，而是遴选期刊的工作人员的问题。这与高考出题、阅卷等选拔手段的不科学不能归咎于高考制度一样。有的期刊为了进入CSSCI，炮制虚假数据，甚至相互勾结，未经作者允许私自捏造文献引用，甚至胁迫作者引用特定刊物的文献（这种虚假引用，有人称为“做文献”或“做引用”），这也不是CSSCI的问题。有的CSSCI期刊出卖版面，甚至受贿；有的人为迎合评价体系，为在CSSCI期刊上发文章而花钱买版面，甚至行贿，这更不是CSSCI这种手段本身的问题，这与高考舞弊的问题不能归咎于高考制度一样。一个搞错对象的具体案例是中国政法大学杨玉圣的《炮轰CSSCI》，该文指出了CSSCI的四大问题（来源期刊有明显的地域偏向；一些因收费而广受批评的刊物被收入，一些广受好评的刊物被排斥在外；学科分布失衡；CSSCI沦为实权人物敛财的工具）。不论杨玉圣所述是否真实，其矛头所指对象都不对，即不应该指向“CSSCI（引文索引）”，而应该指向“南京大学中国社会科学研究评价中心（的操办者）”。而杨玉圣认为该废除该标准（当指CSSCI这一引文索引本身，而不是指在某次具体遴选中入选的具体期刊），就更错了。
    因此，对于CSSCI，应分别地看，其价值归价值，问题归问题。属于CSSCI自身问题的，当然应该改进。对CSSCI的价值与应改进之处，田卫平的看法比较中肯，他说：“包括CSSCI在内的各种‘核心期刊’评价指标体系，有比没有好，多头比寡头好。当前最需要做的，是如何根据中国学术期刊的实际，科学地设定各项指标参数，使评价机制更完善，促使各类期刊优胜劣汰，步入良性循环；而不是把洗澡水与孩子一起泼掉，又倒退回到过去那种没有评价体系、办刊人自娱自乐、缺乏竞争意识、水平高低仅由上级领导或个别‘权威’说了算的境况中”（薄洁萍：《聚焦“中文社会科学引文索引”：不能承受之重》，载《光明日报》2010年5月18日第11版）。但是，我们不能指望引文索引可以改进到没有问题的程度。用经济学的话讲，我们永远不要奢望没有机会成本的收益。
    实际上，真正“数篇篇”，还算是守规则的。今天的学界，比“数篇篇”更恶劣的，也令人感到悲哀的，乃是有些评委与评审机构根本不守任何已颁行的明确制度（“显规则”），连“篇篇”都不数，完全按照“潜规则”行事，只讲人情、关系、利益勾结与交换，指鹿为马，举枉措直。对此类拒不执行制度的恶劣行径，CSSCI或其他一切评价体系再完善，又怎奈其何？制度不能自己发生作用，执行自己。而监管体系不完善、制度执行环境不佳（尤其是后者）导致的问题，并不能归咎于评价体系本身。
    因此，对CSSCI，需要的是改进，而不是否定。
    三、学术评价与利益分配方式的改进
    对于人类知识积累来说，重要的是学术评价；对于学者来说，学术评价与利益分配都重要，而利益分配则是以学术评价为根据的。所以，做好学术评价，有利于进行公平的利益分配，调动学者积极性，促进学术。
    对于改进学术评价，有许多可操作的措施。
    （一）刊物做好遴选工作，提高文章质量
    这又可在两方面操作。
    （1）审稿专家化。一个刊物的专职编辑人员应该主要从事编务工作，审稿工作主要应该交给专家去做。因为当代学术的知识量太大，一个刊物涉及的领域再小，对于一个编辑来说都太大，他很难具备对该刊所涉领域文章的有效鉴别力，因而很难进行有效的遴选。对于审稿，一个编辑可以进行初审，但初审的标准要宽，尽可能避免淘汰了优秀稿件。淘汰优秀的稿件比误用平庸的稿件，损失更大。对于不可把握的稿件，有一种简单的判断方法。对于一个问题，如果大多数学者都用某种方法来讨论，而某甲不按该种方法讨论，即他的方法与众不同，同时，如果我们并不能确定某甲的方法是错误的，或不能证明某甲的方法比常规方法更糟糕，那么，虽不能说某甲的方法就是优秀的，但至少已经摆脱了平庸。这种新异的稿件，可能很好，可能很差，应该放过，让专家进行评审。而那种问题与方法跟大多数学者差不多的论文，再好也好不到哪里去。此外，容易模仿的东西的价值一定不高；在同一个问题上没有超越前人的东西，价值也很低，此两种情况都算不上真正的学术。
    审稿专家化，这需要一个刊物聘用大量的专家做兼职。这是必要的。如果聘用大量专家做专职编辑，则成本过大。美国期刊界通行的同行专家评审，就是审稿专家化，不过，同行评审有时会表现出库恩所说的科学团体的某些特征，“在科学研究中彼此冲突的规则不能共存，除非在革命时期，这时这一专业的主要任务是罢黜百家，定于一尊”（库恩：《科学革命的结构》，北京大学出版社，2003年，p153），即在科学发展的常规时期，科学团体为维护本团体的学术声誉与利益，而具有排他性，党同伐异。但是，我们找不到比同行评审更好的办法，因为没有人能给出科学评价可操作的客观的可靠标准。
    （2）专家年轻化。这一点，似乎无人专门论及。要多聘用年轻的专家（中青年）做审稿专家。这是因为年轻人更有开拓性，更能接受新事物，接受不同看法，也更能接受批评。库恩说：“关于年轻人在基础科学研究中作用的这种概括是如此普遍以致成了老生常识”，“获得新范式、做出这些基本发明的人，几乎总是非常年轻的人，或者是新进入一个其范式将由他们所改变的领域的人”，“因为很明显，他们很少在以前的实践中受常规科学传统规则的束缚，他们特别有可能看出，那些规则已不再适用了，并且去设计出另一套规则替代它们”（库恩：《科学革命的结构》，北京大学出版社，2003年，p83）。在今天，博士不在稀缺，所以，大体来说，可以多聘请博士毕业，且在50岁以下的中青年做评审专家。尽管许多毕业不久的博士只是讲师或副教授，但他们的创造力通常远胜于50岁以后的教授。
    做好遴选工作，提高文章质量，这是刊物的功能与义务。就刊物发表论文、引文索引收录刊物，把好遴选关，引文索引中数据的科学性才更可靠。
    （二）限定引文索引在学术评价中的权重
    将引文索引来源刊物纳入学术价值评价指标，是必要的，但应该限制在整个评价指标中的权重，至于权重多少，则另当别论。当然，改进引文索引，自是不言而喻，但无论如何改进，索引也是有缺陷的，故应该限制其权重。下面论及的跨学校小专业专家评价、引文索引、网络公开评价、中长期评价等都需要限制权重。多头评价比寡头评价好，但多头评价涉及权重的分配问题。引文数据库提供的统计学数据虽然科学性未必很高，但其他评价方式的科学性也是无法保证的，并且，引文数据库统计的引文本来主要就是专家评价，同行引用就蕴涵了专家的评价。就单项权重看，我认为，相比之下，引文索引最客观、最公正，其所占权重应该最大，不应低于40％。
    （三）跨学校小专业专家评价
    学术评价主要在三方面关涉学者利益：科研奖金、科研评奖、职称评定。而职称是基本的、重要的核心利益。对于职称评定，以自主评聘的大学而论，大多数大学都是由院系的教授委员会来对要晋升职称的申请人进行学术评价，此种做法的科学性较低，因为一个学院至少是一个大专业，甚至有多个大专业，教授委员会的几个成员只对很有限的领域具有鉴别力，而几个成员鉴别力的交集更小，因此造成许多成员对职称晋升者的研究领域缺乏鉴别力。在这种情况下，无论教授本心多么公正，对于自己无法判断的晋升者，他想不乱投票都不行，想做伯乐也做不了。他最公正的做法只能是根据晋升者在SCI、SSCI、A&HCI、CSSCI（以及其他评价体系）的来源刊物上发表了多少文章来判断，也就是“数篇篇”。数篇篇不够科学，但至少比较公正。
    由于一个学校的小专业研究者很少，因此，可以联合多所大学，甚至在全国范围内建立小专业专家数据库，由小专业专家通讯评审决定职称晋升，还可以组织小专业专家会审。而在遴选专家时，在基本资质具备的条件下，也应促进专家年轻化。
    对于科研评奖以及科研基金的申请，也可以采取小专业专家评价。而对于一个院系科研奖金的评定，则无此必要，因为此项工作每年都要进行，涉及的人数众多，如果采取小专业专家评价，成本过大。
    在当今技术条件下，跨学校小专业专家评价完全可以借助网络来完成，甚至专家会审都可以借助网络来完成，从而降低评审成本。
    （四）网络公开评价
    对于职称评定与科研评奖，还可以借助网络进行公开评价（涉密的除外）。每个申报人公布自己的申报要求，并把自己的成果公布在网上，论文、报告等，可以全文发布在网上（如果涉及产权，可以禁止复制与下载），让公众评议。公众通过实名注册（必须输入身份证号码）发表评议，以减少或避免诽谤、中伤、造谣等恶意评议。评议时可以用真名，也可以用假名，但学历、学位、职称、年龄这几项信息必须公开，以便其他读者大致估计评议者的资质。在综合统计网络评价时，对于实名评议的，可以将其评价的影响力系数设为1，而对于假名评议的，则可将其评价的影响力系数设为小于1（如0.8），即：同一个评分，假名评议者的评分乘以0.8来计算，这样，他的评价对于申请人的影响力就减少了。这样做，既是鼓励实名评价，也有利于降低心怀不公正的假名评议者的影响力。
    （五）中长期评价
    引文索引通常反映的是近几年的引文情况，这对基础研究与效应周期较长的研究很不利。因此，还可以对研究成果进行中长期评价，就研究成果在2年后5年内、10年内甚至更长时间内的被引用情况、社会效应（指非经济效应）、经济效应等作出评价。此项评价，可以不作为常规评价，不计入100％权重之内，而由申请人另行提供，作为加分。
    （六）学术打擂与摆擂
    介于真正的重大创新在初期很难被人们接受，可以采取学术打擂的方式，发现创新人才，对之进行奖励、破格晋升，并为之提供更好的研究条件。这种方式对年轻学者有利。当然，这是非常规的学术评价方式。
    打擂者提出打擂申请，认为自己对某问题作出了重大创新，包括推翻了权威理论，开辟了新的领域、问题、方法等，因此他要求组织专门的辩论会，对自己的成果进行认定。如果打擂者的成果被确认，则他应得到奖励。
    由于打擂需要为个别人组织辩论会，需要成本，为了减少乱打擂的情况，可以规定让打擂者缴纳一定的打擂成本费，这成本费不论打擂失败，均不退还，因为如果打擂成功，收益会远远大于成本费。
    虽然打擂也未必真能对成果作出可靠鉴定，但是，打擂有一个附带的重要好处，打擂者可以借此机会把自己的成果更有效地公之于众，如果某些有实力的人知道并认可了他的成果、潜力等，可以为他提供许多帮助。
    如果某个研究者认为自己的研究成果很有价值，在该专业难以超越，他还可以摆擂。摆擂期限可以设为5年、10年、20年等。如果他未被打倒，则他可以获得相应奖励。对于摆擂者，也可收取费用。
    （七）以奖代惩，允许长期不出成果
    有些研究的研究周期很长，尤其是基础研究。为了让研究者有一个基本的生存环境，应该允许研究者在相当长一段时间内不出成果，给予其基本待遇，而不予惩罚。但对于要晋升的研究者，则应该拿出成果。此即以奖代惩。对于那种从事长周期研究的学者，也应该理解，一项制度的实施是有成本的，如果对长期不出成果的人都允许晋升，则鼓励庸人和懒人。所以，此类学者应该明白，因未出成果而得不到晋升，乃是他从事研究的机会成本。
    （八）结语：尽快走向按质评价
    学术定量化，只是中国当前情况下最不坏的选择，而不是最好的选择，不是长久之计。
    最好的选择就是论质量。例如，按照今天的定量评价，爱因斯坦最早发表的关于狭义相对论的文章，我估计在目前中国的好多大学，连副教授都评不上。
    按照今天的定量评价，多年未发表著作的罗尔斯根本评不上教授。但是，罗尔斯为什么评上教授了呢？最重要的原因是，美国学术界有基本共识（也就是公共交往平台），他们对什么是好的，什么是不好的，能够达成基本一致的评价。他们通过罗尔斯的其他表达（如演讲）就可以判定罗尔斯是杰出的。而在目前的中国学术界，公共平台还基本没有，还需要很长的时间来建立。基本有效的公共平台是按质评价的必要条件。至于公共平台的修正与改进，则属于范式转换的问题。第二点，美国学术界的潜规则很少。潜规则很少，乃是显规则设计比较合理且执行有力的结果。
    目前中国学术评价的定量化，比起领导意志说了算，黄马褂想赏给谁就赏给谁，有进步，但还需要大力优化，按质评价。但是，按质评价，主要不是学术管理机关（如科研处）的任务，而是学术界自身的任务。例如，对于学术交往的公共平台，这需要学术界自己形成与建立，学术管理机关是管不了的。
    在当前条件下，如何尽可能按质评价？我认为该分两种情况处理。对于真正有创新的人物，要按质评价。这种人其实很少，他们需要的职称指标等资源并不多。而对于大多数创新不大，说他没水平却又有点，说他有水平却又不突出的，则数篇篇，定量考核。
    那么，又该如何区分创新较大与创新不大的学者呢？我认为，学术打擂是一种很不错的手段。华山论剑，拿出来比划比划，更能甄别良莠。
    庚寅年四月十五/2010年5月28日
     (责任编辑：admin)

学术定量化：最不坏的选择

http://www.newdu.com 2025/05/21 01:05:18 中国儒学网 佚名 参加讨论

http://www.newdu.com 2025/05/21 01:05:18 中国儒学网佚名参加讨论