论科学计量学六大文献分析定律
摘 要:在科学计量学(文献计量学和情报计量学)里,除了洛特卡定律、布拉德福定律、齐普夫定律、普赖斯定律、加菲尔德定律还应加上沈氏文献均衡分析定律。这六大定律构成了科技文献分析模式的基本结构框架。多年来前五大定律一直是科学计量学、文献计量学、情报计量学工作者们必须掌握的基本知识,并受到学术界的高度重视。值得指出的是,它们之间既存在着高度的一致性,又存在着一定的联系和区别。但现在在我们看来,还有一个重要定律也必须加以重视,那就是我们提出的科技文献均衡分析定律。研究科技文献情报流量的特性时,既要集中注意研究文献及其基本特征总和的各种不同的统计学规律,又要探索这些总和中规律对指导实践有用的统计学参数。本文主要介绍科学生产率的分布规律;科学技术文献的集中与分散规律;各种词汇、术语在科学文献中的分布规律;科学技术文献的老化规律;科学技术文献的相互引用规律和它们的实际应用;科技文献均衡分析规律及其应用;并对它们之间的相互关系作进一步做出研究和探讨。
关键词:科学计量学;洛特卡定律;布拉德福定律;齐普夫定律;普赖斯定律;加菲尔德定律;沈氏文献均衡分析定律
中文分类号: 文献标识码: 文章编号:
在科学计量学(文献计量学和情报计量学)里,除了洛特卡定律、布拉德福定律、齐普夫定律、普赖斯定律、加菲尔德定律还应加上沈氏文献均衡分析定律。这六大定律构成了科技文献分析模式的基本结构框架。多年来前五大定律一直是科学计量学、文献计量学、情报计量学工作者们必须掌握的基本知识,并受到学术界的高度重视。值得指出的是,它们之间既存在着高度的一致性,又存在着一定的联系和区别。但现在在我们看来,还有一个重要定律也必须加以重视,那就是我们提出的科技文献均衡分析定律。下面我们就这六大科学计量学分析定律展开讨论。科学技术情报流一般是指科技文献出版物和未发表的材料的总和。它们以交流科技情报为目的而产生并应用于社会实践之中。科技文献情报流在整个情报系统中表现出一系列的规律,这些规律可以通过对科技文献本身的基本特征(包括作者、术语、杂志名称、引文、出版年月等等)进行排序和统计分析加以揭示。研究科技文献情报流量的特性时,既要集中注意研究文献及其基本特征总和的各种不同的统计学规律,又要探索这些总和中规律对指导实践有用的统计学参数。本文主要介绍科学生产率的分布规律;科学技术文献的集中与分散规律;各种词汇、术语在科学文献中的分布规律;科学技术文献的老化规律;科学技术文献的相互引用规律和它们的实际应用;科技文献均衡分析规律及其应用;并对它们之间的相互关系作进一步做出研究和探讨。
一、洛特卡定律
洛特卡定律(Lodka’s law)是由美国学者A.J.洛特卡(A.J.Lodka,1880-1949)在20世纪20年代率先提出的描述科学生产率的经验规律,又称“倒数平方定律”。描述科学生产率的经验规律它描述的是科学工作者人数与其所著论文之间的关系:写两篇论文的作者数量约为写一篇论文的作者数量的1/4;写三篇论文的作者数量约为写一篇论文作者数量的1/9;写N篇论文的作者数量约为写一篇论文作者数量的1/ n2……,而写一篇论文作者的数量约占所有作者数量的60%。该定律被认为是第一次揭示了作者频率与文献数量之间的关系,描述科学生产率的频率分布规律。1926年,在美国一家人寿保险公司供职的统计学家洛特卡经过大量统计和研究,在美国著名的学术刊物《华盛顿科学院报》上发表了一篇题名为“科学生产率的频率分布”的论文,旨在通过对发表论著的统计来探明科技工作者的生产能力及对科技进步和社会发展所作的贡献。这篇论文发表后并未引起多大反响,直到1949年这一成果才引起学术界关注,并誉之为“洛特卡定律”。洛特卡定律是对两组数据统计的推广,是对信息生产的一般理论估计,而不是一个精确的统计分布,因而有其局限性。
洛特卡定律的一般表达公式:
f(n)= c/na
其中,n为单个作者发文数且1≤n≤T;
T为单个作者最大发文数;
f(n)为发表n篇论文的作者的比例;
a与c为常数。
若把每个来源看成是科学论文作者,相应的项目为期刊论文。如果撰写n篇论文的作者出现的频率(即占作者总数的比例)为f(n),c为常数,表示作者取样总数的比例,则有:f(n)=c/n2这就是著名的洛特卡平方反比分布定律。下面我们来求常数c。
令n=1,2,3......,则两边取累积和:
由于f(n)表示撰写n篇论文的作者出现的频率显然就有:
二、布拉德福定律
布拉德福定律(Bradford’s law)是由英国著名文献学家S.C.Bradford于二十世纪1934年代率先提出的描述文献分散规律的文献计量学经验定律。
(一)布拉德福定律产生的背景
1.文献的分散是普遍的客观现象。在科学研究和文献工作中,布拉德福深深感到科学文献的分散。他发现:一个学科的论文分散在其他学科的杂志期刊上是屡见不鲜的。
2.科学统一性原则。科学统一性原则是布拉德福定律产生的思想基础。布拉德福认为:按照科学统一性原则,科学技术的每一个学科都或多或少、或远或近地与其他任何一个学科相关联。
3.文献统计研究是布氏定律产生的基础。布拉德福本人在长期的文献工作中,对科学文献进行大量的统计研究,掌握了文献分散的特点,发现了其中的某些规律性;并在文献统计的基础上经过数学推导,得出了与上述理论推导一致的结论,为布拉德福分散定律的正式确立奠定了基础。
(二)布拉德福定律的形成及其基本原理
1、布拉德福定律的提出
布拉德福在《文献学》中写道: “如果将科技期刊按其刊载某学科专业论文的数量多少,以递减顺序排列,那么可以把期刊分为专门面对这个学科的核心区、相关区和非相关区。各个区的文章数量相等,此时核心区、相关区,非相关区期刊数量成: 1:n:n2……的关系。”布拉德福定律的文字表述结论是建立在将等级排列的期刊进行区域分析的方法之上的。
2、布拉德福定律的确立
维克利(Vickery)是英国的文献学家。他还创造性的提出了自己的修正和补充。指出
了布拉德福在论证过程中的某些自相矛盾之处,提出了新的见解:1.布拉德福分布图形是曲线,不是直线; 2.布拉德福不只局限于划分为三个区,而同样运用于多个区的情形;3.布拉德福定律的实际组成为语言描述和图像描述;
维克利的论证和补充,使布拉德福文献分布的图像与定律在结构上得到了统一,丰富了布氏分布理论的内容,使其在形式上趋于完整,为布拉德福定律的确立和发展做出了重要贡献。后来布拉德福定律获得了国际图书馆学情报学界的普遍承认并被人们广泛接受,维克利的工作无疑起了决定性的作用。除了维克利之外,还有许多文献学家和情报学家对布氏定律进行了深入研究,如布鲁克斯(Brookes),布鲁克斯以数学公式描述了这一定律,发展图像分析方法,为其实际应用开辟了新的道路。
3、布拉德福定律的基本原理及其适用性
布拉德福定律的基本原理是由其区域描述、图像描述、数学推导三个部分组成的。关于布拉德福定律在网络环境中的适用性,国外学者在1997 年Almind 提出网络计量学这一概念后就进行了相关的研究。Bar-Ilan 通过将学位论文及其发布新闻与期刊及其论文的分布进行比较分析,然后根据布氏定律确定了以“疯牛病”为主题的核心新闻组,发现布氏定律同样适合于网页环境,但此研究是针对某一主题且数据具有一定局限性,不具备广泛适用性。Cui 通过对美国排名前25 位的医学院网页进行链接分析,他发现了网址链接的集中离散分布现象且网址数之间的比值为78:452:1201,接近1:4:42,这一结果表明医学院网页链接符合布拉德福定律,由于数据选取的局限性,对于这一定律是否适用于所有的网络环境则有待进一步验证。Tsay MY,yang YH 对MEDLINE 数据库中关于RCT的文献作了文献计量分析,发现通过区域分析可知第四区的期刊数明显大于预测值,但是四个区的期刊数之比较接近于l:2.5:2.52(6.25):2.53(15.6),符合传统的布氏定律,但又有明显的不同,文中对布氏定律的验证方法具有单一性,不能从多方面证明这种适用性。Behrens H 和Luksch P 对无机晶体结构数据库中晶体学主题的文献进行分析,利用莱姆库勒函数对样本数据进行拟合分析,验证得知晶体学主题的文献符合布氏定律的分布,这一研究主要针对数据库数据且只对数据进行了单一方法的分析,并不能代表所有网络信息的分布。Cristina Faba-Perez 通过对网络空间被链情况的图像分析发现,所得图像并不符合典型的布氏定律分布且通过区域分析可知各个分区的比例数也都不满足1:n:n2 的关系。
三、齐普夫定律
齐普夫定律(Zipf's Law)是文献计量学基本定律之一,1948年美国哈佛大学语言学教授G.K.齐普夫(George K. Zipf )对英语文献中单词出现的频次进行大量统计以检验前人的定量化公式而提出的。该定律指出文章中单词的频次(f)与其排列的序号(r)之间存在着下述定量的关系,齐普夫认为:“如果有一个包含n 个词的文章,将这些词按其出现的频次递减地排序,那么序号r和其出现频次f之积fr,将近似地为一个常数。即fr=C(为常数),(式中r=1,2,3.…),即词频分布定律最普通而又最典型的表达。此后, 许多工具书大都采用类似观点和说法 。如英国著名的语言学著作《语言与语言词典》 中的释义是:“(词频分布定律) 是指谈话者或写作者使用的词的分布和频次的总描述。Fr=C,方程式中F=频次,r=序号,即频率表上的位置;C=常数。方程式表示词使用的总次数和词频表上的位置之间有一个固定比率。”但是齐普夫的表达仅适宜于中频词的情况,高频与低频词与该表述偏差较大。于是对词频分布规律又有许多补充和深化的研究。
词频分布原因的假说。词频分布规律是有较为丰富内涵的,学术界认为正态分布是描述自然科学的典型分布,而齐普夫分布将成为揭示社会科学规律的典型分布,所以社会科学界一直很重视这个定律。讨论词频分布何以呈现那种特殊的形状,对其成因提出假说,建立适当的理论模型描绘其分布过程是当前研究工作的热点,目前较重要的假说有2个:①“省力法则”假说。提出这一假说的是齐普夫。他认为,在语言交流过程中,“省力法则”同时体现在说话人和听话人身上。说话人希望组成语言的词少,而且一词多义,以节省其精力。听话人认为最好是一词一义,使听到的词与其确切涵义容易匹配,减少他理解的功夫。这2种节省精力的倾向最后平衡的结果,便是词频的那种双曲线型分布。②“成功产生成功”假说。这方面以H.A.西蒙的研究最为著名。西蒙构造了一个概率模型,他所作的一个重要假说是:“在文献中,一词使用的次数越多,则再次使用的可能性越大”。该模型最后导出的分布与齐普夫分布相当接近,普赖斯后来建立了一个相类似的模型,又明确地提出了“成功产生成功”的假说。齐普夫定律已经在语言学、情报学、地理学、经济学、信息科学等领域有了广泛的应用,而且取得了不少可喜成果。中国数学家和语言学家周海中曾经指出:齐普夫定律是描述词频分布规律的强大数学工具;作为经验定律,它仍有不足之处,有待进一步完善。研究词频分布对编制词表,制定标引规则,进行词汇分析与控制,分析作者著述特征具有一定意义。经验表明,中频词往往是包含大量有检索意义的关键词。而一篇文献全文输入计算机后,计算机是很容易检出中频词的。因此,词频分布也是文献自动分类、自动标引的研究对象。
如果将一篇较长的文章(约5000字以上)中每个词按其出现频次递减排列起来(高频词在前,低频词在后),并用自然数给这些词编上等级序号,出现频次最高的为1级,其次为2级……这样一直到D级,如果用f表示词在文章中出现的频次,用r表示词的等级序号,则有:fr=C(C为常数)
如果等级r与频次f都取对数,则图4-4中的双曲线变成一条直线(图4-5)。与之等价的数学表达式为:ln(r)+ln(f)=ln(C)
图4-5中的虚线表示理想化形式,一般地,斜率为k的任一直线可表示为:
这条直线由图4-5中实线表示。如果将这一方程改写可得:kfr=C
如果说fr=C是齐夫定律的一般形式,这便是齐普夫定律的修正形式。
图1 齐普夫词频分布曲线示意图
如果等级r与频次f都取对数,则图4-4中的双曲线变成一条直线(图4-5)。与之等价的数学表达式:lnr+lnf=lnc
图4-5中的虚线表示理想化形式,一般地,斜率为k的任一直线可表示为:Klnr+lnf=lnc
这条直线由4-5中实线表示。
巴塞罗那自治大学数学研究中心的研究者最近使用数学和统计学的专业知识,对齐普夫定律(Zipf's law)进行了严格的研究。他们使用了古登堡计划(the Project Gutenberg)的数据库——古登堡计划是一项将版权过期的英语书籍电子化的互联网计划,包含3万多篇英语文本,可以免费获取。这么大规模的研究在该领域前所未有,此前的研究大多只采用几十篇文本的数据集。分析结果表明,如果除去少数只出现了一两次的词语,有55%的文本完全地符合齐夫定律,而如果考虑所有的词语,仍然有40%的文本完全符合齐夫定律。该研究的负责人科拉尔(á.Corral)称,如果进一步忽略只出现3至5次的词语,符合齐普夫定律的文本数还会更多。
四、普赖斯定律
普莱斯(Price)是著名的科学家与科学史学家,他在其代表名著《小科学,大科学》一书中曾有如下的论述:“在同一主题中,半数的论文为一群高生产能力作者所撰,这一作者集合的数量上约等于全部作者总数的平方根”。普赖斯定律是衡量各个学科领域文献作者分布规律,因为科技情报学起源于文献计量学,科学计量学和文献计量学有很多的研究方法似乎类似的,所以普赖斯定律也成了研究科技情报学的方法之一。
(一)普赖斯定律
普赖斯(1922.1.22~1983.9.3)Derek John de Solla Price,美国科学家、科学计量学奠基人和情报科学创始人之一。犹太人。 1942年毕业于伦敦大学物理系,1946年获物理学博士学位。历任耶鲁大学教授、皮博迪博物馆的历史科技仪器馆馆长等职。主要是发现了科学文献指数增长规律,绘制了著名的普赖斯曲线。普赖斯所取得的成就基本上奠定了科学学的核心分支学科——科学计量学的诞生,理所当然成为“科学计量学之父”。著名学者Belver Griffith曾这样颂扬他:“普赖斯在科学文献方面的理解和成就促使了在文献计量领域的一场革命,也使得我们对科学学理解取得了飞跃性的进展。”现在国际《科学计量学》杂志和美国科学史学会都设有D.普赖斯奖。 普赖斯(Price)是著名的科学家与科学史学家,他在其代表名著《小科学,大科学》一书中曾有如下的论述:“在同一主题中,半数的论文为一群高生产能力作者所撰,这一作者集合的数量上约等于全部作者总数的平方根”。
在洛特卡定律的基础上,普赖斯进一步研究了科学家人数与科学文献数量,以及不同能力层次的科学家之间的定量关系,提出了著名的普赖斯定律和一些其他重要结论。在《小科学,大科学》一书中,普赖斯写道:“科学家的总人数,大致是按杰出科学家人数的平方增长的。”所谓普赖斯定律(Price ’sLaw)即平方根定律:科学家总人数开平方,所得到的人数撰写了全部科学论文的50%。
式中:n(x)为撰写x篇论文的作者数,I= n max 为该学科规定时期内最高产的作者数;N为该学科领域全部作者总数。
如果设最高产的那位科学家所发表的论文数为n max,将科学家们发表论文的总数记为x(1, nmax),则普赖斯定律可用下式表示:
(1/2)x(1, nmax) = x(m, nmax) = x(1,m)
式中,m为普赖斯假定的这样一个数,即个人的论文数大于m的科学家们所发表的论文总数恰好等于全部论文总数的一半,而式中x(m, nmax)的意义恰好表征了这一半论文。
这里的关键是如何确定m的数值?普赖斯根据洛氏定律,借用数学结论,经推导得出:m≈0 .749(nmax 1/2)。这是洛特卡定律的一个重要推论。这说明,发表了0.749(nmax 1/2)篇以上论文的科学家们所发表的论文总数等于全部论文总数的一半;或者说,杰出科学家中最低产的那位科学家所发表的论文数,等于最高产科学家发表论文数的平方根的0.749倍。普赖斯还曾试图找出全体科学家总数中杰出科学家的比例关系。经过进一步推导和计算,得出:R≈0.812/nmax 1/2式中,R是杰出科学家人数与全体科学家总数之比。这是普赖斯得出的洛特卡定律的又一个重要推论。普赖斯定律和普赖斯指数是促进情报学发展的定律之一,情报学主要是根据实际的信息来做出总结,是一门分析的艺术,而普赖斯定律是情报学分析的方法和参考标准,尤其是在文献作者的整理和数据的分析方面。
(二)普赖斯指数
1971年普赖斯提出了一个衡量各个学科领域文献老化量度指标——普赖斯指数。即“指在一个具体学科内,把对年限不超过5年的引文数量与引文总数之比当做一个指标,用以量度文献的老化速度与程度。自然,普赖斯指数越大,文献老化越快”。普赖斯根据《科学引文索引》(SCI)的分析,发现科技领域前沿的那些文献的平均年龄。现在一年中被引用文献中的一般,其年龄不超过5年。为此,普赖斯把受引的文献分成两个部分:其一是“有现时作用的文献”;其二是“档案性”文献。前者是在其出版5年内被引用的文献,后者则是出版5年后仍被引用的文献。这里表明文献的被引用行为有一个变化,出版5年后仍被引用,说明“有现时作用”的文献已转变成“档案性”文献了。档案性文献数量多寡,是受学科自身性质决定的。
普赖斯指数=近五年的被引用的文献数量 / 被引用的文献总量 ×100%
普赖斯本人认为,普赖斯指数要优于半衰期和引文中值年龄,它即可用于某一领域的全部文献,也可用于评价某种期刊、某一机构、有一作者和谋篇文章。半衰期与普赖斯指数者两个指标,系按不同方式反映了影响老化因素的相关关系。把半衰期作为一个常量来计算时,采用的是某一年中所有的引文一半,并以其出版的年度作为引文年龄。当把普赖斯指数作为一个常量计算时,采用的是不超过5年的引文,并计算这部分引文占全部引文的百分比。普赖斯指数的数值范围大概是这样划分:22%-39%为档案性文献区间,75%-80%为有现时性作用的文献区间。一般而言,物理和生物化学方面的期刊的指数为60%-70%,x射线学和放射学为55%-60%,社会科学为40%-45%,植物学20%左右,语言学和历史学少于10%。
(三)普赖斯科学地形图谱
1965年,借助费城《科学引文索引》普赖斯又发表了一篇著名的论文:《科学论文的网络》。后来普赖斯又将这篇论文发表在science杂志(1965)。在这篇论文中他祥细而又创造性地研究了科学论文之间的引证和被引证关系。以及由此形成的所谓“引证网络”。普赖斯研究证明。每篇论文平均引证参考文献数目是15篇,除评论性文章之外,凡每年被引证四次以上的论文,即可列为“经典文献”。按此标准,在数学、地质学和植物学中,大多数是经典之作。在化学工程、机械工程、冶金工程和物理学中,大多数“昙花一现”之作。在化学和生理学中,则两者各半。根据网络分析的原理,他进而提出了能指明科学研究前沿的定量模型。普赖斯最后强调指出,第一流的科学家都应密切注视他的同事和同代人的工作。因为科学研究前沿依赖近期的研究成果。在网络图上,必有密集分布的小条或小块。,如果把这些小条小块研究清楚,我们就可以绘制出当代科学的“地形图”。着随着这门“科学地形图学”的建立,人们就可以指出各类期刊、各个国家、各国科学家、各种科学论文等等在科学地形图上所占的位置。他们之间的相互联系和相对重要性。这样对科学技术评价方面的应用研究将会发挥着很大的理论指导作用。美国德雷克塞尔大学的格里菲思认为,《科学论文的网络》同样是科学计量学奠基之作。“字里行间看来更令人信服”,因为这篇论文“第一次富有意义地用原始资料,编织出一个明析的科学模型,其结论是惊人的漂亮和富有睿智”。这篇论文奠定了现在的知识图谱学。
五、加菲尔德定律
尤金·加菲尔德(Eugene Garfield 1925.9.16—),是美国著名的情报学家和科学计量学家,SCI(Science Citation Index,即科学引文索引)及ISI(Institute for Scientific Information,即美国科学信息研究所,现为汤森路透科技集团的创始人,1955年,在Science发表论文“Citation Index es for Science”提出“引文索引”的设想,即提供一种文献计量学的工具来帮助科学家识别感兴趣的文献。他提出了引文索引和引文技术的概念,从而打破了分类法和主题法在检索方法中的垄断地位,开创了从引文角度来研究文献及科学发展动态的新领域。
1961年在宾西法尼亚大学获得结构语言学博士学位。 加菲尔德科学交流与信息科学生涯始于1951年。一个偶然的机会,在美国化学家协会100周年庆典上,他结识了韦尔奇医学索引项目负责人,并加入该项目做兼职工作。正是这份工作给他带来了巨大影响,改变了他的人生轨迹。加菲尔德发现他真正感兴趣的不是化学实验,而是查询化学文献。参与韦尔奇医学索引项目的经历激发了他的灵感,他将在项目完成过程中遇到的问题作为自己一生的工作方向。参加该项目的三年中加菲尔德才思泉涌,完成了一生中最重大的理论发现和构想的雏形。由于他的化学知识背景,使得他始终以一个文献检索用户的眼光发现问题,以一个科学家的严谨态度解决问题,以一个文献信息学门外者视角思考问题,因此,其思想远比一个学院派理论家的观点深刻。
(一)加菲尔德定律
加菲尔德定律是在二十世纪六十年代由美国《引文索引》主编E.加菲尔德提出,加菲尔德通过对一些综合性和专业性检索工具中所摘用的期刊数量及收录论文的数量的比研究指出:“一个学科文献的尾部,很大程度上是由其它学科文献的核心部分所组成。事实上学科之间交叉如此之大。以至于所有科学技术学科的核心文献仅仅有1000多种期刊。也可能少于500种。”加菲尔德定律旨在反映科技期刊中的科学论文的交叉程度,论文交叉是严重的。以至数量上相对较少的期刊就集中包括了全部论文数量的大部分。因此,也被称之谓加菲尔德文献集中定律(Garfield’s Law of Concentration)。它与前面介绍的布拉德福文献分散定律描述的情况正好相反。
(二)影响因子
影响因子(Impact Factor,IF)是汤森路透(Thomson Reuters)出品的期刊引证报告(Journal Citation Reports,JCR)中的一项数据。即某期刊前两年发表的论文在该报告年份(JCR year)中被引用总次数除以该期刊在这两年内发表的论文总数。这是一个国际上通行的期刊评价指标。影响因子现已成为国际上通用的期刊评价指标,它不仅是一种测度期刊有用性和显示度的指标,而且也是测度期刊的学术水平,乃至论文质量的重要指标。影响因子是一个相对统计量。E·加菲尔德于1972年提出。查询外文期刊影响因子,可使用外文数据库Web of Science中的JCR(Journal Citation Reports),其中JCR Science Edition用于查询自然科学类期刊,JCR Social Sciences Edition用于查询人文社会科学类期刊。 它隶属于汤森路透集团。该网站需要授权才可访问,需要用大学代理账号。
1、计算方法
影响因子,许多著名学术期刊会在其网站上注明期刊的影响因子,以表明在对应学科的影响力。如,美国化学会志、Oncogene等。中国大陆各大高校(如清华大学、中国科学技术大学、南开大学、中国农业大学、吉林大学、哈尔滨工业大学、浙江大学、上海大学、大连理工大学等)都以学术期刊的影响因子作为评判研究生毕业的主要标准。影响因子是以年为单位进行计算的。以1992年为例,计算某期刊在该年的影响因子:
X=以1992年为基点、某期刊于1990和1991年在1992年全部被引用之论文总次数
Y=以1992年为基点、某期刊1990和1991年全部论文发文量的总和
IF1992年 =(X(1990年,1991年) / Y(1990年,1991年))
在1998年,美国科技信息研究所所长尤金·加菲尔德(Eugene Garfield)博士在《科学家》(The Scientists)杂志中叙述了影响因子的产生过程。说明他最初提出影响因子的目的是为《现刊目次,Current Contents》评估和挑选期刊。人们所说的影响因子一般是指从1975年开始,《期刊引证报道》(Journal Citation Reports,JCR)每年提供上一年度世界范围期刊的引用数据,给出该数据库收录的每种期刊的影响因子。JCR是一个世界权威性的综合数据库。它的引用数据来自世界上3000多家出版机构的7000多种期刊。专业范围包括科学、技术和社会科学。JCR是世界上评估期刊唯一的一个综合性工具,因为只有它收集了全世界各个专业的期刊的引用数据,JCR光盘版有许多很好的界面,显示了期刊之间引用和被引用的关系。可以告诉人们,那些是最有影响力的期刊,那些是最常用的期刊,那些是最热门的期刊。除影响因子外还给出:期刊最新排序(Current Rank)、刊名缩写(Abbreviated Journal Title)、国际统一刊号(ISSN)、总引用数(Total Cites)、及时性索引(Immediacy Index)、总文章数(Total Article)、被引半衰期(Cited Half-Life)。
近年来,随着人们对引文分析研究的深入,开始认识有多种科技期刊的引文峰值区域不一定都集中于论文发表的第一、二年,有些学科或地区的期刊的引文峰值区域可能会延至第三年、第四年......。因此有人提出更一般的影响因子定义:
其中nk-i代表第k年对期刊在k-i年发表论文的引用次数;Nk-i则代表该刊在k-i年发表的论文数量。
2、影响因子的决定因素
从计算公式看,影响因子虽然只和被引次数和论文数直接相关,但实际上,它与很多因素有密切联系。决定影响因子大小的因素现主要有以下5个方面:(1)论文因素。如论文的出版时滞、论文长度、类型及合作者数等。出版时滞较短的刊物更容易获得较高的影响因子。若刊物的出版周期较长,则相当一部分的引文因为文献老化(超过2年)而没有被统计,即没有参与影响因子的计算,从而降低了影响因子。大量统计资料表明,刊载论文如果是热门课题,且篇幅较短,发表较快,则被引率将很快达到高峰,进而使期刊的影响因子上升很快,然后又迅速下降;刊载完整研究性论文的期刊,持续被引用时间长,影响因子升高较持久。也有资料表明,论文的平均作者数与论文的总被引频次呈显著的正相关。(2)期刊因素。如期刊大小(发表论文数)、类型等。在计算影响因子时,刊载论文数仅统计论文、简讯和综述,而对评论、来信、通讯和其他一些常被引证的栏目的文章则不进行统计。根据经验判断,期刊发表论文数量与影响因子和总被引频次的大小有密切联系。在多数情况下,论文量少的期刊容易得到高影响因子,并且这部分期刊的影响因子在年度之间会有较大的波动;而论文量多且创刊年代久的期刊往往容易得到较高的总被引频次。此外,还与其他引证指标如:即年指标、期刊被引用半衰期、地区分布数、基金论文比以及期刊发行范围和发行量等指标有密切关系。期刊的规模和结构不同会造成期刊影响因子的不同。一般来讲,同种类型的期刊形成的规模越大,这些期刊的影响因子总的来讲就越大;期刊中所含的“热门”课题或“热门”专业的文章越多,总被引频次就越高,同时这种期刊的影响因子也就越大。(3)学科因素。如不同学科的期刊数目、平均参考文献数、引证半衰期等都会对期刊的影响因子和总被引频次产生影响。期刊的影响因子和总被引频次均以论文的引证与被引证的数量关系为基础。一个学科的引文数量,总体水平取决于两个主要因素:一是各学科自身的发展特点;二是该学科期刊在数据库来源期刊中所占的比例。从总体上来说,某学科来源期刊越多,该学科期刊的总被引频次和影响因子就越大。这两大因素决定了学科影响因子和总被引频次分布的不均衡性。生物学期刊一直是SCI期刊中比较引人注目的一类期刊,它不仅在期刊数量上明显多于其他学科,而且在总被引频次和影响因子的数量上也有显著优势,从而说明生物科学在当代科学中所处的重要位置。此外,影响因子还受期刊所涉及的学科在专业意义上的社会覆盖面的影响,如果某个科技期刊在专业意义上的社会覆盖面非常小,而且同类期刊又很少,那么它的影响因子就不可能很高 。不同的学科由于其内在的科研规律不同,在做研究时所需引用他人的科研成果情况就不尽相同。这些区别至少在两个方面会影响到影响因子的大小,一方面的区别是需要引用他人成果多少的情况,另一方面的区别是引用他人成果的时间情况。由于影响因子一般都只按近两年内的期刊中所引用的文献计算,可以看出按近两年内的引文年限分布情况做的排序结果和通过用影响因子方法对杂志的排序结果同样也具有一致性,这同样说明了影响因子不能正确地反应出不同学科期刊之间影响力的大小。由于历史的原因,一个国家不同学科的建设和发展都是不平衡的,甚至同一学科中的不同分支也存在这种情况。有的学科规模很小,但从事这一学科的科研人员多,而且对这一学科的资金投入也大,相关的学科杂志也较多,这样就会形成一种规模优势。而往往那些规模较小的学科就不具备这种规模优势,从而这类期刊的影响因子和总被引频次也不会高。就学科规模发展速度的快慢而言,不同的学科有“冷”、“热”之分。“热”门学科由于时代的需要其规模发展速度是很快的,这种学科的文章在其规模迅速发展的期间将具有很高的被引用率;而“冷”门学科则正好相反。但是,这种“冷”与“热”的划分往往并不是出于科学本身的发展需要,而经常是由于经济、社会等一些非科学因素的制约而造成的。还有一些学科包含了许多热门的课题,这些“热门”课题的文章虽有较高的被引用率,但并不具备多大的科学价值。据以上分析可以认为:这种仅仅因为学科规模的大小和发展速度的快慢而造成的论文被引用率高低的不同,或者是引起相关杂志和机构的影响因子大小的不同,从而造成在重要性的排序上的不同,不是科学木身发展造成的,是其他的一些经济的、历史的和社会的非科学因素造成的,因此对规模小或是“冷”专业的学科进行的这种评价是极为不公平的,也是不合理的。(4)检索系统因素,如参与统计的期刊来源、引文条目的统计范围等。对于特定刊物来说,在中外的检索系统中,由于其所收录的期刊群体组成的差异较大,因而所计算的影响因子值有较大的差异,并且同一刊物在不同语种的检索系统中具有明显不同的影响因子和总被引频次。(5)名人效应的影响,名人效应常表现为:一方面人们常引用名人的文章来增加自己文章的权威性,即便是在还有别的更适合自己文章引用的文献时也是这样;另一方面是署有名人名字的文章或被名人所推荐的文章很容易在所谓的高档次的杂志上发表,因而也容易被SCI或CSCD所收录,且有时文章本没有名人科研成果,却为了能在高级刊物上发表署上了名人的名字,所以过分地强调被引用或收录情况,将给文章的总被引频次和影响因子带来人为的偏差。
(四)引文分析
引文分析(Citation Analysis)是利用数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,进而揭示其中的数量特征和内在规律的一种文献计量分析方法。引文分析方法的数学基础是概率论与数理统计。在进行分析比较时,已将其作用排除在测度结果之外了。科技文献的引证与其被引证现象进行研究的过程。使用的方法有图论、模糊集合、数理统计等数学方法和逻辑思维方法,目的在于揭示文献所蕴含的情报特征和相关关系。现代科学论文的一个重要特征是,在“参考文献”标志下依序列出所援引文献的著录事项。参考文献 (被引用文献)与正文(引用文献) 的简单逻辑关系就是引文分析的基础和背景。致力于引文分析理论和技术研究的文献学家主要有格罗斯、.布朗等。普赖斯于1956年发表重要著作《科学论文的网络》,为引文分析奠定理论基础,E.加菲尔德于1953年受法律业务工具书《谢泼德引文》的启发,于1961~1963编成《科学引文索引》(SCI),使引文分析具备了实用的工具。引文分析适于探索科学的微观结构,便于超越时间空间,跨学科组织文献,同传统的分类法和主题法截然不同,使文献有序化,有利于对文献由表及里地深入展开分析,更易于量化。引文分析中还有一些辅助概念,运用也较普遍:①文献耦合。一篇参考文献被两篇文献引用便构成一个引文偶,引文偶愈多,说明两篇文献关系愈密切。②同被引。两篇论文共同被后来的一篇或多篇论文所引用的现象,其量度是同被引强度,即两篇(或多篇)文献同被后来的文献所引用的频次,显然,同被引频次愈高,两篇论文相关性愈强。③自引。作者引用自己以前发表的独撰与合撰论文的现象,自引还可以扩展到杂志、学科、地区、团体乃至国家对文献的反身自用。引文分析主要用于指导编制各种新型检索工具,为科学管理提供量化的依据,探讨科学的结构,评价与选择期刊,考察科学著作及科学家的社会影响等。关键是开发或引进更为有效的分析方法。
1、引文分析的类型
从不同的角度和标准来划分,引文分析方法有着不同的类型。如果从获取引文数据的方式来看,有直接法和间接法之分。前者是直接从来源期刊中统计原始论文所附的被引文献,从而取得数据并进行引文分析的方法;后者则是通过“科学引文索引”(SCI)、“期刊引用报告”(JCR)等引文分析工具,查得引文数据再进行分析的一种方法。若从文献引证的相关程度来看,则有自引分析、双引分析、三引分析等类型。如果从分析的出发点和内容来看,引文分析大致有三种基本类型:(1)引文数量分析:主要用于评价期刊和论文;研究文献情报流的规律等。(2)从引文间的网状关系或链状关系进行研究:科学论文间存在着一种引用关系网,如A被B引, B被C引, C又被A引等。研究这种关系主要用于揭示学科的发展与联系,并展望未来前景等。(3)从引文反映出的主题相关性方面进行研究:主要用于揭示科学的结构和进行文献检索等。
2、引文分析的主要内容
从不同的角度或从各种基本要素出发,对科学引文的分布结构进行描述和分析,便形成引文分析的基本内容,一般包括:
(1)引文年代分析。一般来说,随着年度的由远而近,引文量呈增长趋势,即时间愈近,被引用的文献愈多;文献被利用的峰值是该文章发生以后的第二年。如果以引文年代为横轴,各年引文量为纵轴,在坐标图上描绘各年数据点,然后用一条线连接起来,便可得到一条引文年代分布曲线。通过对该曲线的分析,不仅可以了解被引文献的出版、传播和利用情况,而且可以研究科学发展的进程和规律,特别是在文献老化和科技史的研究中,引文年代分析更是一种广泛应用的有效方法。
(2)引文量分析。引文量是某一主体对象含有的参考文献数量。它是引文链的基本特征之一。通过引文数量的分析,不仅可以揭示文献引证与被引证双方的相互联系,而且还可以从定量的角度反映出主体之间的联系强度。如果两篇论文或两种期刊之间的引文数量大,就可以认为它们之间的引证强度大,说明其联系较紧密。引文量的分布规律可从下列几个方面分析:
A、引文量的理论分布:我们将一定量的论文的引文量数据进行分析比较,发现其变化规律表现为以平均数为中点,接近中点的频数最多,离平均数远的频数趋于减少,形成中间高两极低的正态理论分布。
B、引文篇数分布:即每篇研究论文平均占有的引文篇数的分布。它不仅反映了论文作者引用文献的广度和深度,而且还能说明引文与被引文的学科内容之间的联系强度。
(3)集中与离散规律分析。引文分布的集中性与离散性是相对于一定的测度指标而言的。引文按来源期刊的分布,引文篇数的频数以平均数为中心的分布,引文按年度、语种、文献类型等的分布,都表现出这种集中与离散的趋势。
(4)引文类型分析。科学研究中引用的文献很广,有期刊论文、图书和特种文献。对被引文献的类型进行分析,将有利于确定文献情报搜集的重点。
(5)引文语种分析。引用文献是由不同语种的文献构成的。某一语种的文献被引用量愈大,则说明该语种比较常用和重要。考察和分析引文语种的分布,对于人们有计划地引进外文文献、译文选题、外语教育等,颇有参考价值。
(6)引文国别分析。对引文的国别分析,特别是各国文献互引情况的统计分析,可以探明各国互引文献的状况,弄清国际文献交流的数量和流向。
3、引文分析的局限性
著者引用文献是一个人为控制的思维和判断过程,而作为其表现形式的引用文献,仅仅是宏观的、表面的测度,受到许多限制因素的影响。
(1)关系上假联系的影响。引用文献的原因多种多样,两篇论文可能出于完全不同的原因或从不同的角度引用同一篇早期文献,一篇可能是引用其方法,另一篇可能是引用其结果,那么这两篇文献在内容上的联系就有可能是虚假的。引文有些是发生在前言和篇名中;有些是发生在正文中;有些发生在结论或讨论中。在这些情况下,作者对原著的引用内容和程度是不相同的。引文对原著的关系和重要性也各不相同,但在的引文分析中,对它们都是同等看待,不加区分的。这样也容易造成成假关系。新刊的论文得不到大量引用;小型期刊被引率往往低于大型期刊;引而未用或用而未引的情况也时有发生。文献引用中的这些现象都会影响引文分析方法的应用和效果。
(2)马太效应的影响。有的研究者认为,在文献引用方面也存在着马太效应的影响。人们往往以“名著”、“权威”作为选择引文的标准,有的确是出于需要,也有的则是为了装饰门面,抬高自己论文的身价。一种期刊因为发表名人的文章而为众人所引用,以至引起连锁反应,结果其引文率很高。这种马太效应的心理作用,掩盖和影响着文献引用的真实性。
六、沈氏科技文献均衡分析定律
我本人在学习和研究《经典经济学》理论时由于受阿尔弗雷德·马歇尔(Alfred Marshall,1842—1924)的供需价格均衡理论启发,于2003年在《科学学研究》杂志发表了《科技创新一般均衡理论--对科技成果创新度评价的科学计量学分析》一文,在这篇文章里,首次提出科技文献均衡分析理论。后来又在此理论的基础上提出它的应用性前景。并于2014年又在《教育科学博览》杂志发表了《科技创新指标体系的构建及其科学意义--基于科技创新一般均衡理论的应用性研究》。这两篇论文构成了我提出的整个科技文献分析方法的核心内容。下面就这方面情况进一步分析介绍如下:
(一)科技创新的一般均衡现象
科学研究表明,科学家科技成果的科技创新程度往往与其科研成果发表前论文检索的重复率和发表后论文检索的引用率之间具有一定的相关性。这种相关性主要表现为论文检索重复率越大,其创新性越小;重复性越小,其创新性越大。论文检索引用率越大,其创新性越大;引用率越小,其创新性越小。因此,在数学坐标系里,科技成果的论文检索重复率曲线和论文检索引用率曲线之间必然存在一个交叉点,并在一定的状态下形成一种均衡。这个均衡点即为科技创新的均衡点,这个均衡状态即为科技创新的一般均衡状态或称科技发展的一般均衡状态。据此,我们可以根据这个均衡点确定科技成果创新的程度。科技创新现象是科技工作者的创造性智力劳动现象。科学家和工程师从事于科学发现与技术发明都可以看成是一种科技创新现象。对科技创新的评价一直是科学技术学界或科学计量学界的研究重点。过去人们对科技创新的评价主要是从定性的角度进行研究,并为此已做了大量的工作。但从定量的角度评价科技创新还只是近几十年随着科学计量学的兴起而开始的事情。现在人们对科技创新评价的计量分析主要是从科技成果的引用率上进行探讨,并形成了诸如SCI、SSCI、EI等多种评价体系和评价模型。我认为,这些评价体系和评价模型存在一定的片面性。不能全面准确地反映科技成果创新的实际程度,因此有必要对其进行重新认识,并寻找更新的评价体系和评价模型,只有这样才能更好地揭示科技创新的本质及其规律。根据科技创新与科技成果的重复率和引用率的相互关系及其形成的均衡状态,提出科技创新的一般均衡理论。该理论不仅把科技成果的引用率纳入科技创新评价体系和评价模型,而且把科技成果的重复率也纳入科技创新评价体系和评价模型,并找到它们之间的相互均衡关系。从而在科学计量学上重新揭示了科技创新的本质及其变化发展规律。从科学计量学角度研究科技创新的一般均衡现象尽管是一项非常复杂而艰难的科研工作,但从某种意义上讲,它更能全面的把握科技创新全过程。因此,我们认为从科技创新的一般均衡现象入手,揭示科技创新的本质及其变化发展规律,将成为未来科技创新问题研究的一个非常重要的研究方向。只有沿着这个方向认识下去,才能更准确、更全面地把握科学技术创新的本质及其变化发展规律。
1、评价科技创新的两大重要指标体系
(1)科技论文重复率及其重复率定理
我们知道,科技人员在从事于科研活动的一开始就要进行科研立项,为了了解该研究课题的创新性,管理部门都要对其科研课题进行检索,了解其研究工作开展之前有多少相同的和相类似的研究课题或研究成果。并就此对其科研项目的创新性进行评估。如果通过检索发现其研究项目重复率大,就说明其科研项目创新度小,反之则创新度大。创新度大就给予资助,创新度小就不给予资助。科研论文重复率的确定,就是根据这一做法对某位科学家科研论文重复的情况进行检索,看看有多少与其科研论文内容一致和类似的论文。通过相同或相似论文的数量统计,了解其科研论文的重复率。如果相同或相似的论文多,就说明其重复率大,如果少就说明重复率小。所谓科研论文重复率就是通过对某位科学家发表科研论文之前的一定时间年限里其它科学家发表的相同或相似论文数量的统计,所确定的与其论文相同或相似的变化率。也可以说,科技论文重复率是指在不同的年限内与其相同科研论文相同或相类似论文发表数量的变化率。利用科研论文重复率或相同率的多少就可以了解某位科学家某项科研成果的创新程度。因此,科研论文重复率或相同率的确定对评价科研成果的创新度无疑是一个非常重要的科学计量学指标。科研成果重复率也可以从参考文献中获得,即科技人员发表论文时,其论文后面的参考文献多少也可以判断其重复率大小。参考文献数量越多,就说明其论文的创新性越小,反之就越大。参考文献是判断科技成果重复率的重要指标。
科学家的科研论文创新度与科学家科研论文发表前的论文检索重复率(参考文献数量)具有非常重要的关系。这种关系表现为论文检索重复率(参考文献数量)越大,其科技创新度越低,论文检索重复率(参考文献数量)越小,其科技创新度越大;科技创新度与检索出的重复论文数(参考文献数量)表现出如下曲线(图1所示)。科技创新度与重复论文数(参考文献数量)之间表现出来的这种普遍规律现象我们称之谓科研论文检索重复率定理。
图2 科技创新度与论文重复率的关系示意图
以纵轴OP表示科技论文的创新度,横轴OQ表示检索出的重复论文数,论文重复率曲线DD就是按照不同创新度下相对应的重复论文数而描绘出来的曲线。曲线上的各点都表示在不同创新度状态下的重复论文数。例如,论文重复率曲线上的E点就是表示,当论文的创新度为Pe时,重复论文数为Qe。
(2)科技论文引用率及其引用率定理
我们知道,为了了解某位科学家的科技成果创新度、影响度的大小,通常可以采取检索的方式,看看他的科研成果被别人引用的情况。引用的越多说明其科研成果越有创新,越有科技价值,反之则没有创新,没有科技价值。如果有价值就支持他进一步研究,如果没有价值就减少或取消对其科研工作的资助。科研论文引用率的确定,就是根据这一做法对科学家科研论文引用的情况进行检索,看看有多少其它科学家的科研论文引用了它的内容。通过引用论文数量的统计,就可以了解其科研论文的引用率。如果引用的论文多,就说明其引用率大,如果引用的论文少,就说明引用率小。科研论文引用率的确定,就是通过对科学家发表科研论文之后的一定时间年限里其它科学家引用率的论文数量的统计,了解其论文被引用的程度。用科研论文所引用的数量变化情况来确定某位科学家的科研论文的影响度大小、创新性强弱是衡量其科技成果创新性的一个非常重要的方法。所谓科研论文检索引用率是指科学家的某些科研论文发表后,通过检索,其在一定的时间年限里被其它学者发表论文所引用的论文数的变化率。科研论文检索引用率在某种意义上讲代表了这篇论文发表后的影响程度,也反映了这篇论文的创新度的大小。因此,其无疑也是确定科技成果创新度的一个非常重要的科学计量学指标。
科技创新度与科学家所发表论文的检索引用率具有一定的相关性,这种相关性表现为论文检索引用率越大,其科研论文的科研成果创新度越大,其论文检索引用率越低,其科研成果的创新度越小。科技创新度与检索出的引用论文数之间表现出如下曲线(图2所示)。科技创新度与引用论文数之间表现出来的这种普遍规律现象我们称之谓科研论文检索引用率定理。
图3 科技创新度与论文检索引用率的关系示意图
纵轴OP表示科技论文的创新度,横轴OQ表示论文引用数。论文引用率曲线SS就是根据在每一创新度下相应的引用论文数而描绘出来的曲线。曲线上的各点表示在这一创新度上的引用论文的数量。例如,论文引用率曲线上的E点就是表示,当科技创新度为Pe时,引用论文的数量为Qe。
2、科技创新均衡的形成
(1)科技创新均衡
科技创新均衡是一种科技成果的论文检索重复率与论文检索引用率之间相一致时的科技创新度。用图形来表示就是这一科技成果的论文检索重复率曲线与论文检索引用率曲线相交之点的科技创新度。如图3所示。在图中,纵轴OP表示科技创新度,横轴OQ表示重复论文的数量和引用论文的数量。曲线DD代表论文重复率曲线,曲线SS代表论文引用率曲线。论文重复率曲线与论文引用率曲线的相交点E就是均衡点。E点所确定的科技创新度Pe就是该科研成果的均衡科技创新度。而E点所确定的论文数量Qe就是该科技成果达到均衡状态的均衡论文数。因此,E这个均衡点既确定了均衡科技创新度,也确定了均衡论文数。
图4 科技创新的一般均衡曲线
(2)科技创新度均衡的形成
科技创新均衡是科技成果的论文检索重复率(参考文献数量)曲线和论文检索引用率曲线的相互作用及科技创新度本身的波动而形成的。这可以从以下两方面来理解。
一方面,科技创新度过高的情形(如图4所示)。如果科技创新度过高,其论文引用率就会增加,而其论文重复率则会减少。论文重复数量就会少于论文引用数量。出现引用率大于重复率。这样该项研究就会获得进一步支持。随着后继者的不断引用,后继者的同类研究将会增加,随之论文重复率就会不断上升,这样就必然导致同类研究的科技创新度下降,最后降至一个新的均衡状态。
另一方面,科技创新过低的情形(如图4)。当科技创新度过低时,其论文重复率就会增加,而其论文引用率则会减少。论文引用数量就会少于论文重复数量,出现重复率大于引用率。这样该项研究就得不到进一步的资助。此类创新度低的研究项目就会被自然淘汰。更新的、更具有创新性的科研项目就会产生出来,从而促进其创新度不断上升,最后升至一个新的均衡状态。
从以上两种情况的分析,无论是科技创新度过高的情况,还是科技创新度过低落情况,都有动力导致科技创新度趋向新的均衡。因此,科技创新度的一般均衡过程的形成是具有其内在必然规律的,这种内在必然规律我们称之谓科技创新的一般均衡定律。
如图4所示,纵轴OP表示科技创新度的大小,横轴OQ表示重复论文数或引用论文数的多少。DD'和SS' 分别是论文重复率曲线和论文引用率曲线。
图5 均衡科技创新度的形成示意图
第一种情形是:当科技创新度为P1时,论文的引用数为Q1,而论文的重复数为Q2,形成论文引用率大于论文重复率。即OQ1>OQ2。因此,从均衡理论上讲,这必然导致科技创新度下降的压力增大。(如由P1下降到Pe)促使论文的重复率数量和引用率数量趋向均衡以及其科技创新度趋向均衡点E。形成均衡科技创新度Pe和均衡论文数量Qe。
第二种情形是:当科技创新度为P2时,论文的重复数为Q3,而论文的引用数为Q4,形成论文重复率大于论文引用率。即OQ3>OQ4。因此,从均衡理论上讲,这必然导致科技创新度上升的压力增大。(如由P2上升到Pe)促使论文的引用率数量和重复率数量趋向均衡以及其科技创新度趋向均衡点E;形成均衡科技创新度Pe和均衡论文数量Qe。
根据以上科技创新的一般均衡曲线我们可以看出以下几种情况:
第一、从一般均衡曲线上我们可以看到,E点以上部位的科研成果,由于其论文检索重复率小、论文引用率大,因此,其科技创新性就强,科技价值就大。而在E点的以下部位,由于其论文检索重复率大、论文引用率小,因此,其科技创新性就弱,科技价值就小。
第二、当某项科研成果其论文检索重复率为零时,其论文检索引用率即反映出其科技创新程度;当其论文检索引用率为零时,其论文检索重复率即反映出其科技创新程度。
第三、当某项科技成果的论文检索重复率和论文检索引用率都为零时,表明此项科技成果的创新度为零。
第四、衡量科技成果创新度(科技价值)的大小既取决于其科研论文的检索重复率大小,也取决于其论文检索引用率大小。重复率和引用率可以看成是科技研究领域非常重要的两种基本力量它们的相互作用决定了科技研究创新性的大小。而科技研究的创新性则决定了科研工作的实际价值的大小,因此,科技创新度不仅自动调节着科技工作的决策方向,同时也促进着科研资源的不断优化配置。
总之,在我们看来,科技创新均衡的形成具有其本身的内在动力机制。这种内在动力机制是科学技术创新本身发展规律的反映。科技创新均衡现象的发生与发展无时不受科技创新发展规律的控制和调节。根据论文检索重复率曲线和论文检索引用率曲线相互作用关系,我们发现,科学家科技成果的科技创新程度与其科研成果发表前的论文检索重复率(参考文献数量)和发表后的论文检索引用率具有确定性的相关性。这种相关性表现在论文检索重复率(参考文献数量)越大,其创新性越小,论文检索重复性(参考文献数量)越小,其创新性越大;同时,论文检索引用率越大其创新性越大,论文检索引用率越小,其创新性越小。科技成果的论文检索重复率和论文检索引用率曲线之间也同样存在确定性的交叉联系现象,并在彼此之间的交叉点上形成一种均衡,我们把这种均衡称之谓科技创新的一般均衡。而将这一均衡理论称之谓科技创新的一般均衡理论。
3、科技创新均衡对科技资源配置的调节
科技创新均衡的形成过程表明,科技创新均衡是科学技术发展的必然趋势和正常的发展状态。而脱离均衡点的科技创新必然导致科技创新过强或过弱、过热或过冷的失衡状态。通过均衡科技创新度的形成,促进科学技术创新不断地由失衡状态转向均衡状态。形成科学技术发展的均衡协调进步的机制。这就是科学技术发展过程中的均衡科技创新机制。通过这种均衡科技创新状态的形成过程,科技竞争的创新机制对科技资源的配置发挥着积极有效的调节作用。
首先,科技创新均衡的形成是论文重复率与论文引用率波动的结果,同时也是科技创新给予两者双方的控制信号,是用来调节论文重复率与论文引用率之间相互关系的杠杆。当科技创新处于失衡状态时,表明科学技术体系出现了科技创新过强或过弱的状况,这样就会对论文引用者或论文重复者的行为产生影响,也会对科学技术管理者(科技政策制定者)和科研人员的行为产生影响。使他们对科技创新过程中产生的调控信号做出相应的反应。并调整各自的行为,进而促使重复论文数和引用论文数以及科技创新度向均衡状态转变。
其次,科技创新过强或过弱,过热或过冷都意味着科技资源配置的不合理。存在着论文重复率和论文引用率过度现象。造成科技资源的浪费或利用不足。通过科技创新均衡的形成过程,科技创新机制对于科技资源的配置不合理的状态可以发挥有效的调节作用。使科学技术的发展趋势向科技创新的均衡状态转化,实现科技资源的合理配置。
论文引用率和论文重复率是科学技术创新过程中两大基本力量,它们的相互作用决定了科技创新均衡的形成。而科技创新均衡则是科技创新的基本调节信号和杠杆,调节着论文引用率和论文重复率的平衡,促进着科技资源的优化配置的实现。论文引用率和论文重复率以及科技创新度的变化相互依存,相互影响,构成了科学技术发展过程中的核心机制—科技创新调节机制,这一机制贯穿于整个科技发展的始终。这一机制就好象一个无形之手,控制和调节着科技创新的整个过程。但这个无形之手也不是万能的,政府有形之手也将对其进行适当补充和调节。就象经济市场规律一样,供给与需求曲线均衡不是万能的,这个无形之手调控着市场,但也要受到政府之有形之手的干预和控制。
综上所述,我们认为科学家科技成果的创新度与其科研成果发表前论文检索的重复率(参考文献数量)和发表后论文检索的引用率具有一定的相关性。这种相关性主要表现为论文检索的重复率越大,其创新性越小,重复性越小,其创新性越大;论文检索的引用率越大,其创新性越大,引用率越小,其创新性越小。因此,科学家科技成果论文检索的重复率曲线和论文检索的引用率曲线之间在坐标系里必然存在一个交叉点,并形成一定的均衡状态。这个均衡点即为科技创新的均衡点,这个均衡状态即为科技创新的一般均衡状态。据此,从科学计量学上,我们可以根据这个均衡点和均衡状态评价科技成果创新的程度。科技创新均衡的形成对我们更好地揭示科学技术创新的本质及其发展规律具有十分重要的意义。科技创新问题是一个非常重要的学术问题。近年来引起了很多学者的高度关注,但大部分的研究主要还是从定性方面进行描述,而进行定量分析则是近十多年来随着科学计量学、信息计量学和文献计量学的兴起而出现。但目前对科技创新工作的评价主要是采用科学文献引用率这个指标来进行分析。诸如,IF(SCI、SSCI、EI)等等。我们觉得光从引文率指标体系来确定科技创新度的大小是不全面的,而应该将科技论文的检索重复率也作为衡量其创新度的指标之一,并找出它们之间的相关性,确定其均衡点,只有这样才能更准确地认识科技创新。在我们看来科技创新的一般均衡理论则比较好地解决了这一问题。
4、科技成果创新评价指标体系的构建
(1)科技创新度定律
根据科技创新的一般均衡规律,科技人员的科技成果创新度与其科技成果重复率和科技成果引用率之间具有一定的相关性。这种相关性主要表现为科技成果重复率越大,其创新性越小;重复性越小,其创新性越大。科技成果引用率越大,其创新性越大;引用率越小,其创新性越小。根据这个规律,我们提出:科技创新度定律(S&T innovation law)。就是:“科技成果创新度(P)与科技成果引用率(S)成正比;与科技成果重复率(D)成反比”。用数学公式表述如下:
这个定律是“科技创新一般均衡规律”的数学化表达,它对我们充分认识科技创新一般均衡具有一定的重要作用和意义。根据这个定律,我们还可以分析科技成果创新度的大小,建立科技创新因子(S&T Innovation factor,STIF),科技创新指数(S&T innovation index,STII)科技创新评价指标体系。
(2)影响因子、创新因子、创新指数
A、影响因子及其计算公式
影响因子(Impact Factor,IF)是美国ISI(科学信息研究所)的JCR(期刊引证报告)中的一项数据。 即某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。这是一个国际上通行的期刊评价指标。影响因子(Impact factor,缩写IF)是指某一期刊的文章在特定年份或时期被引用的频率,是衡量学术期刊影响力的一个重要指标,由美国科学情报研究所(ISI)创始人E·格里菲尔德(Eugene Garfield)在1960年代创立,其后为科学(文献)计量学的发展带来了一系列重大革新。自1975年以来,每年定期发布于“期刊引用报告”(Journal Citation Reports)。影响因子是以年为单位进行计算的。其数学公式与计算方法:
IF=A/B
以1992年为例,计算某期刊在该年的影响因子:
A=以1992年为基点、某期刊于1990和1991年在1992年全部被引用之论文总次数
B=以1992年为基点、某期刊1990和1991年全部论文发文量的总和
IF1992年 =A(1990年,1991年) / B(1990年,1991年)
许多著名学术期刊会在其网站上注明期刊的影响因子,以表明在对应学科的影响力。如,美国化学会志、Oncogene等。
B、科技创新因子及其计算公式
科技创新因子(S&T Innovation factor,STIF): 又叫创新因子(Innovation factor,IF)。我们把某期刊前两年发表论文的被引用总次数(他引论文总数)除以该期刊在这两年内发表论文的参考文献总数(引他论文总数)。为了和影响因子发布时间同步,科技创新因子(创新因子)也是以年为单位进行计算的。其数学计算公式与计算方式:
以1992年为例,计算某期刊在该年的科技创新因子(STIF):
X=以1992年为基点,某期刊于1990和1991年全部论文的被引用总次数;
Y=以1992年为基点,某期刊1990和1991年全部论文的参考文献总和;
STIF(1992年) = X(1990年,1991年) / Y(1990年,1991年)。
C、 科技创新指数及其计算公式
科技创新指数(STII),又叫创新指数(II)。什么是科技创新指数(S&T innovation index,STII)?所谓科技创新指数,简单说就是指科技人员在科技创新过程中,科技成果创新度的大小与引用率(他引率)成正比;与重复率(引他率)成反比。这样就形成了一个比值,这个比值再乘一个100%所形成的一个数值就是科技创新指数。用数学公式表述如下:
STII((S&T innovation index)表示科技创新指数;
说明:科技人员论文发表一年,二年,三年,四年,五年......若干年后,所形成的数据,可采用相同方式处理。即首先确定基点年份,然后将这个基点年份发表论文所有的历年引用文献数相加,形成这个基点年份历年引用文献数总和。通常的做法是确定一个基点年(论文发表年),然后向后推二年,将这两年的引用文献数相加。例如:将2012年做为某科技人员发表论文的基点年(论文发表年),那就向后推2013年,2014年的引文数据(他引文献数),并将这两年的引用文献数相加,形成这两年的引用文献总数。这两个年份的引用文献数据(他引文献)就是被统计年数据。
说明:科技人员论文发表一年、二年、三年、四年、五年......若干年后,所形成的数据,可采用相同方式处理.即首先确定基点年份,然后将这个基点年份发表论文所有的参考文献数相加,形成这个基点年份参考文献数总和。通常的做法是确定一个基点年(论文发表年),然后将这个基点年份的参考文献相加。例如将2012年做为某科技人员发表论文的基点年(论文发表年),并将这个基点年份所产生的参考文献数(引他文献数)相加,形成这个年份的参考文献总数。这个基点年份发表论文的参考文献数据(引他文献)就是被统计年数据。这只是重复文献数据产生的一种方式之一,还有其它方式。
科技创新因子(STIF)与科技创新指数(STII)对科技人员的创新度是相对准确的数值。就象影响因子(IF)相对准确反映科技人员科研成果的影响程度和创新程度一样。但我们认为它们比影响因子(IF)更能全面准确反映科技人员的创新能力。因为这个指标体系比影响因子(IF)指标体系多了一个指标,即重复率(引他率)指标。这个指数就是将引用率(他引率)指标体系与重复率(引他率)指标体系进行均衡处理,形成一个均衡指标体系。但这个指数数据不是一成不变的,他可以形成波动。正是这种波动性,表明其动态性,持续性,发展性,创新性。
(3)科技创新评价指标体系数据库的构建
根据影响因子(IF)、科技创新因子(STIF)与科技创新指数(STII)概念及其计算结果,我们可以建立相应的数据库体系。影响因子数据库现已有多种文献可查,在此不再赘述。以下主要谈谈对科技创新因子(STIF)、科技创新指数(STII)数据库的构建与大量数据采集方式的一些构想:
第一,任何一个科研人员发表论文时,都要引用他人的文献,即在他论文上会留下参考文献数,他引用的参考文献越多相对说明他的论文重复率越高,反之就越低。创新度与重复率(引他率)成反比。即“科技创新度越高,论文重复率就越低,科技创新长越低,论文重复率就越高”。重复率指标体系可以通过以下几种方式建立:(1)论文参考文献数;(2)情报人员通过论文关键词检索重复论文数;(3)参考文献加论文关键词检索重复论文数;(4)通过计算机文献数据库自动检索查出相似论文数;(5)通过论文题目进行相似文献检索;等等。
第二,任何一个科研人员发表论文时,论文都要被别人引用。别人引用的越多,相对来说他的论文的创新度就越高,反之就越低。创新度与引用率(他引率),即与别人对他论文的引用文献数成正比。
第三,任何一个科研人员发表论文,可以形成两组数据:一组为重复率(引他率);另一组为引用率(他引率)。因此,这样我们就可以对其两组数据进行相关性处理。发布这位科技人员的论文创新度评价报告。与此类推,任何一个科研人员他会发表一系列论文,我们可以对其一系列论文产生的两方面的数据进行处理,就可以得到两组数据。然后对这两组数据进行相关处理,发布这位科技人员系列论文成果的科技创新度评价报告。
第四,任何一本杂志都有科研人员发表论文,因此,每类杂志都能产生两组数据,然后对它们进行相关性处理,即可形成这个杂志的科技创新评价报告,就象IF,SCI,SSCI,EI一样。每年都可以发布一次。每个杂志的科技创新度是不一样的。发布杂志的科技创新评价报告,可以引导杂志的发展方向,促进杂志水平的提高和进步。
第五,全世界科研人员的创新程度与科技创新因子,科技创新指数呈一定的相关性。不同时间的科技创新度也不一样,这样表现在科技创新因子,科技创新指数上也不一样。不同时间,不同地点,不同国家,不同地区,在科技创新方面都表现出差异。因此,反映在科技创新因子,科技创新指数指标上的数据都会有变化。这种变化说明全世界科技发展的不平衡。有先进,有落后。总之,科技创新因子,科技创新指数指标体系的建立,对了解全世界各国、各地区、各个科研人员的科技创新度都是有帮助的。我们还可以将这些不同国家,不同地区的创新度大小范围连接起来,这样还可以建立一个系列图谱,这就是科技创新图谱(S&T Innovation Pattern,STIP),这样还可以发布全世界科技创新图谱信息报告。
以上就是我们对科技创新因子(STIF)和科技创新指数(STII)数据库建立的一些设想和理论探讨。我们认为现在已经进入了一个大数据时代,计算机处理技术又是如此之发达,这对数据库建立问题的解决已经不是什么大问题。可是这将是一个庞大的系统工程,这个系统工程是需要更多人参与完成的。
4、构建科技创新评价指标体系的实用价值和科学意义
科技创新均衡的形成过程表明,科技创新均衡是科学技术发展的必然趋势和正常的发展状态。而脱离均衡点的科技创新必然导致科技创新过强或过弱、过热或过冷的失衡状态。通过均衡科技创新度的形成,促进科学技术创新不断地由失衡状态转向均衡状态。形成科学技术发展的均衡协调进步的机制。这就是科学技术发展过程中的均衡科技创新机制。通过这种均衡科技创新状态的形成过程,科技竞争的创新机制对科技资源的配置发挥着积极有效的调节作用。
第一,科技创新均衡的形成是科技成果重复率与科技成果引用率波动的结果,同时也是科技创新给予两者双方的控制信号,是用来调节科技成果重复率与科技成果引用率之间相互关系的杠杆。当科技创新处于失衡状态时,表明科学技术体系出现了科技创新过强或过弱的状况,这样就会对科技成果引用者或科技成果重复者的行为产生影响,也会对科学技术管理者(科技政策制定者)和科研人员的行为产生影响。使他们对科技创新过程中产生的调控信号做出相应的反应。并调整各自的行为,进而促使重复科技成果数和引用科技成果数以及科技创新度向均衡状态转变。
第二,科技创新过强或过弱,过热或过冷都意味着科技资源配置的不合理。存在着科技成果重复率和科技成果引用率过度现象。造成科技资源的浪费或利用不足。通过科技创新均衡的形成过程,科技创新机制对于科技资源的配置不合理的状态可以发挥有效的调节作用。使科学技术的发展趋势向科技创新的均衡状态转化,实现科技资源的合理配置。
第三,科技人员发表论文时随意注加参考文献。为此,有什么办法可以防止此类事件发生?我们认为通过发布科技人员论文的科技创新因子(STIF)科技创新指数(STII)就可以防止科研人员随意注加参考文献。因为他的论文参考文献越多就说明其论文的创新度越低。这时随意标明参考文献不仅对其自己不利,对他人也不利。因为参考文献不准确可以影响到影响因子等(IF,SCI,SSCI,EI)指标体系的权威性,准确性。进而影响对科技成果创新度的评价出现偏离。
第四,科技创新因子(STIF)与科技创新指数(STII)数据库的构建对建立一套科技均衡评价体系具有一定的学术价值,其对弥补美国著名科技情报专家E.格里菲尔德(Eugene Garfield) 他提出的影响因子(IF、SCI、EI、SSCI)评价体系之不足具有重要意义。这个评价体系完全具有中国特色,如果我国今后建立了这样一个评价体系,那么就会形成一个科技创新评价产业群,用来带动我国信息情报事业的发展。到时候,我国可以发布各种各样的科技创新因子(STIF)科技创新指数(STII)报告。用来认识我国各个不同时期,不同地区科技发展状况,科技发展水平,最终有效指导我国科技资源配置。
总之,我们认为,从“科技创新的一般均衡规律”到“科技创新度定律”的提出再到“科技创新因子”、“科技创新指数”、“科技创新图谱”指标体系的构建。构成了科技创新的一般均衡理论及其应用研究的全部内容,这是一个符合逻辑的过程。科技成果引用率(他引率)和科技成果重复率(引他率)是科学技术创新过程中两大基本力量,它们的相互作用决定了科技创新均衡的形成。而科技创新均衡则是科技创新的基本调节信号和杠杆,调节着科技成果引用率和科技成果重复率的平衡,促进着科技资源的优化配置的实现。科技成果引用率和科技成果重复率以及科技创新度的变化相互依存,相互影响,促使科学技术创新过程从均衡走向非均衡再走向新的均衡。从而构成了科学技术发展过程中的核心调控机制,即科技创新均衡调控机制,这一调控机制则贯穿于整个科技发展的始终。这一调控机制的揭示对我国科技事业的发展,特别是对科技创新成果的评价以及科技资源的合理配置具有非常重要的指导意义。这个调节机制好似“无形之手”,不断地控制和调节着科技创新事业的发展,但这个无形之手也不是万能的,它也将受到来自政府“有形之手”的干预和调节。
综上所述,作者认为科技成果创新度与其科技成果重复率和科技成果引用率之间具有一定的相关性。这种相关性主要表现为科技成果重复率越大,其创新性越小,重复性越小,其创新性越大;科技成果引用率越大,其创新性越大,引用率越小,其创新性越小。因此,科技成果重复率曲线和科技成果引用率曲线之间在数学坐标系里必然存在一个交叉点,并形成一定的均衡状态。这个交叉点即为科技成果创新的均衡点,这个均衡状态即为科技创新的一般均衡状态。据此,从科学计量学上,我们可以根据这个均衡点和均衡状态评价科技成果创新的程度。科技创新及科技成果创新度评价问题不仅是一个非常重要的学术理论问题,而且也是一个非常重要的管理实践问题。对科技成果创新度的评价,不仅要重视其引用率问题,而且还要重视其重复率问题,只有将这两方面有机结合起来考虑才能更全面、更深刻地解决上述问题。目前,在我国尽管对科技成果创新的评价已做了大量的理论和实践工作。诸如开展了对科技项目的立项的查新和对科技人员科研成果的引用情况进行引文分析等等,但在这些理论与实践工作中,更重视对科技人员科技成果引用率(他引率)这个指标的观察(诸如:SCI、SSCI、EI等),而忽视对科技人员科技成果重复率指标的分析。同时也很少从理论和实践上将这两项指标结合起来综合考虑。因此,我们觉得现在的科技创新评价体系还存在一定的不足之处,即光从科技成果引用率指标体系来确定科技创新度的大小是不全面的,而应该将科技成果重复率(引他率)也作为衡量其创新度的指标之一,并找出它们之间的相关性,确定其均衡点,只有这样才能更准确地认识科技创新。在我们看来科技创新的一般均衡理论则比较好地解决了这一问题。我们认为,科技创新一般均衡理论的建立对我们今后更好地揭示科学技术创新的本质及其发展规律具有一定的学术意义,同时还将对今后科技资源配置优化问题的解决产生一定的重要影响。因此,在我们看来建立科研人员科技成果重复率数据库是非常重要的,它可能比建立引用率数据库更重要,因为这是源头,源头不搞好,科技资源的浪费就无法得到遏制。这样一来对整个国家科技创新事业的发展是极为不利的。作者认为,科技创新一般均衡理论及其科技创新评价指标的构建对我们今后更好地揭示科学技术创新的本质及其发展规律,同时对今后科技创新成果的科学评价以及科技资源配置优化问题的解决产生一定的重要影响。这个规律告诉我们,科技人员是如何通过认识世界和改造世界,并获得大量科技知识信息。如何从一个均衡走向一个均衡过程的,不断取得突破性进展。
这个科技创新一般均衡理论主要参考了阿尔弗雷德·马歇尔(Alfred Marshall,1842—1924)的均衡价格理论,我是将科技创新一般均衡与一般价格均衡理论进行了类比。我们认为在科学技术文献界也存在一个供求关系,不过这不是商品的供求关系,而是知识信息的供求关系。一方面有人供给(引用率);另一方面有人需求(重复率)。这两者必然要形成一个均衡,这个均衡就是科技创新的一般均衡。这两个均衡均在不同阶段对科技创新以及创新后形成商品(科技产品)产生无形之手调节影响。但这种影响都不是万能的,它们都要受到政府有形之手的控制和调节。因此,这两者之间存在着紧密的联系。科技创新成果,在形成的第一个阶段受科技创新一般均衡规律无形之手的调节和控制。因为这是一个无实体的创新过程。在形成商品(科技产品)后,进入市场,就要接受市场价格供求均衡第二个无形之手的调节和控制。所以,这两个均衡在科技创新过程中发挥着同等重要的作用。这个均衡分析理论我认为是继E.加菲尔德引文分析理论之后的又一科学计量学(文献计量学)重要分析理论,它将开辟科学计量学(文献计量学)均衡分析的新时代。这个理论还包括需求弹性问题、科技创新性度弹性问题、科技文献交叉分布问题等等。总之,经济学(经济计量学)方面遇到的问题,在科学技术学(科学计量学、信息计量学、情报计量学)中都能遇到。因此,我认为这个理论将开创一个科学技术学(科学计量学、信息计量学、情报计量学)新纪元。随着全球科技化(信息化、知识化)社会的到来,科学技术学与经济学将会实现统一,科技计量学与经济计量学也将会由此实现统一。因此,这也预示着一门真正意义上的崭新学科:科技经济计量学(信息经济计量学、情报经济计量学)时代的到来。
结 论
总之,从洛特卡定律、布拉德福定律、齐普夫定律、普赖斯定律到加菲尔德定律再到沈氏均衡分析定律。以上这些定律并不是独自不相关的,而是互有联系。是科技期刊流通和管理过程研究的发展。这一发展过程与科学技术发展过程是基本一致的。科学技术从早期的综合混合,到中期的分散细分,再到现在的相互渗透、相互交叉,相互综合,相互均衡。科技期刊的发展过程也是这样,从早期的综合,到中期的专业细分化,再到现代的内容相互交叉,相互渗透,相互均衡。因此,从科技期刊的管理和流通工作研究的发展上看,也是符合从集中到分散再到集中规律,从均衡到非均衡再到新的均衡。所以这些过程也是符合科学技术发展规律的。从洛特卡科学生产率分布定律到我的科学文献均衡分析定律。前后两者之间存在的必然联系我认为都是在把科学技术活动过程当作生产过程来进行分析和定量的。科技文献的生产过程就会遇到生产过剩和生产不足的问题和它们之间如何走向均衡问题以及科技文献均衡如何对科技文献生产过程进行有效调节。过去人们研究科技文献的生产过程是局部的,非均衡的。现在我就是要建立一个整体性的,均衡的理论来改变这种现状。科学技术文献均衡分析方法的建立和应用就是这方面的一种尝试。
参考文献
[1] 严怡民等.情报学基础(M). 武汉:武汉大学出版社,1987.
[2] 庞景安编著.科学计量研究方法论(M).北京:科学技术文献出版社,1999.
[3] 梁立明、武夷山等.科学计量学:理论探索与案例研究(M).北京:科学出版社,2006.
[4] 布劳温等.科学计量学指标-32国自然科学文献与引文影响的比较分析(M)赵红洲,蒋国华译,北京:科学出版社,1989
[5] A.马歇尔.经济学原理(M).北京:商务印书馆,1964.
[6] 沈律.科技创新的一般均衡理论--关于科技成果创新度评价的科学计量学分析(J).科学学研究.2003年第2期.
[7] 沈 律 沈豪.科技创新指标体系的构建及其科学意义--基于科技创新一般均衡理论的应用性研究.(J)教育科学博览.2014(11)
[8] 沈 律 沈 豪.科技创新一般均衡理论及其应用研究—对构建科技成果创新评价指标体系的初步探讨.(J)科研杂志,2015年第25期.
[9] D.Price.Science Since Babylon[M]. Now haven.1961.
[10] D.Price.Little Science,Big Science[M],Columbia University Press,1963.
[11] D.Price.Neteworks of scientific Papers[J],science,149(3683):510-515,july30,1965.
[12] D.Price .A general theory of bibliometric and other cumulative advantage processes[J]. Journal of the American Society for Information Science, 27: 292-306.1976.
[13] E.Garfield.Citation indexes for science: A new dimension in documentation through association of ideas[J]. Science. 122: 108–11.1955.
[14] E.Garfield.Citation analysis as a tool in journal evaluation(J).science,178:471-479,1972.
作 者 说 明:
《论科学计量学六大文献分析定律--对科技文献几种分析理论模式的研究与探讨》一文是我将我的《科学计量学经典五大定律》和《科技创新一般均衡理论及其应用研究》两篇论文有机相结合写的一篇论文。做了些删减,也增加了一些内容。不过很多内容还是与上述两篇文章有重复。
我为什么要写作这样一篇论文?
第一、我认为我的文献均衡分析理论可能是继经典科学计量学理论之后又一重要理论。
第二、我认为二十一世纪我们中国的学者也应该在科学计量学占有一席之地。
第三、我认为我的文献均衡分析理论可以解决一些长期被人们所忽视的科技创新指标问题。