Download PDF
doi: 10.14218/MRP.2020.010
Published online: March 30, 2020
单篇科研论文的引用次数一直都备受关注,它不仅直接反映该篇论文的影响力,而且间接影响刊登该篇论文的学术期刊的办刊水平。在每年的Journal Citation Report中公布的被Science Citation Index(SCI)系统收录的期刊的影响因子(Impact Factor, IF)通常被用来衡量这些期刊的办刊水平,甚至成为科研评价的指标。因此,在科研和学术活动中,我们都会看到或听到某某期刊的IF多少。什么是期刊的IF呢?期刊IF是WoS根据某期刊前两年所发表论文在报告年份中被引用次数除以该期刊在这两年发布的论文总数而决定的。例如,2018版IF就是根据2016-2017两年文章在2018年内的总引用数除以这两年的文章总数计算得来的。例如,某期刊2016-2017两年发表论文200篇,这些论文在2018年内的总被引次数为400次,那么,该期刊2018版(2019年报告年份)的IF=400/200=2.000。
那么,问题来了:论文被引次数是怎么被统计出来的呢?
目前,收集论文的被引次数有两大数据库,即Web of Science (WoS)和Google Scholar。WoS上查到的论文被引用数据来自于该系统中收录的期刊(即SCI期刊)论文和书籍的引用,主要是英文期刊论文和书籍的引用。而Google Scholar系统中所查到的论文被引用数据来自于该系统中收录的SCI期刊论文和书籍和任何非SCI期刊论文、毕业论文、书籍和专利等的引用,并不限于英文的引用。
WoS官方对IF的计算方法中的总引用数是根据WoS系统内所收录的SCI期刊论文对该期刊两年内发表论文的引用计算出来的,也就是说非SCI期刊上的论文对该期刊发表论文的引用是不被计算在内的。这一信息很重要,因为大家经常会收到某某期刊约稿邀请信,信中会提及其Unofficial IF的信息。这个Unofficial IF有两种不同情况:一种是那些期刊已经被SCI收录、但还没有正式IF,该期刊自己根据WoS的数据库中的引用数据计算出来的所谓UnofficialIF;另一种就是那些非SCI期刊根据Google Scholar上引用数据或者按WoS的计算方法自己计算出Unofficial IF。那么,这里就又有问题了。究竟应该以哪种为准呢?因为WoS和Google Scholar统计引用的方法不同,计算出的被引次数自然有差异。以某一具体论文为例:标题为“Traditional Chinese Medicine Induced Liver Injury”的论文于2014年发表在非SCI期刊Journal of Clinical and Translational Hepatology上。这篇论文在Google Scholar引用数为16,其中12篇引文是发表在SCI期刊上的,4篇是发表在非SCI期刊上的。如果按WoS的统计方法,这篇论文的引用次数应该是12,而非实际被引用的16。所以,为了避免误导读者,非SCI期刊在计算Unofficial IF时应按WoS统计方法,尽量跟传统的“IF”保持一致。
同样的,即使是SCI期刊,根据Google Scholar 和WoS数据来计算其被引次数也是不同的。下面举两个具体例子说明:“Trends in Use of and Reproductive Outcomes Associated With Intracytoplasmic Sperm Injection”是一篇于2015发表在美国医学协会杂志(JAMA)上的论文。这篇论文的WoS数据库中的总引用数为20,而在Google Scholar上面的引用数为35。WoS统计的20篇引文当然都是发表在SCI期刊上的,而Google Scholar中的这35个引用情况就有些复杂了:有 22篇引文发表在SCI期刊上面,这其中有17篇已经被WoS统计在内,5篇还未被统计;另外有13次引用来自于SCI期刊的会议展板摘要、非SCI期刊论文、毕业论文、网页和ResearchGate上的重复发布。而WoS中的20篇引文中有3篇还没有被Google Scholar统计在内(图1)。另一篇论文是2015年发表在柳叶刀肿瘤杂志(LANCET ONCOLOGY)上面的论文“HypofractionatedRadiotherapy versus Conventionally Fractionated Radiotherapy for Patients with Intermediate-risk LocalisedProstate Cancer: 2-year Patient-reported Outcomes of the Randomised, Non-inferiority, Phase 3 CHHiPTrial”。这篇论文的WoS总引用数为13,而在Google Scholar的引用数为27。WoS中的13篇引文当然都来自于SCI期刊;而Google Scholar统计的这27次引用中,有19篇发表在SCI期刊上面(其中有10篇已经被WoS统计在内,9篇还未被统计),另外有8次引用来自于非SCI期刊论文、毕业论文和Google Scholar自己的重复统计。而WoS中的13篇引文中有3篇还没有被Google Scholar统计在内(图2)。
“Trends in Use of and Reproductive Outcomes Associated With Intracytoplasmic Sperm Injection”是一篇于2015发表在美国医学协会杂志(JAMA)上的论文。这篇论文的WoS数据库中的总引用数为20,而在Google Scholar上面的引用数为35。WoS统计的20篇引文当然都是发表在SCI期刊上的,而Google Scholar中的这35个引用情况就有些复杂了:有 22篇引文发表在SCI期刊上面,这其中有17篇已经被WoS统计在内,5篇还未被统计;另外有13次引用来自于SCI期刊的会议展板摘要、非SCI期刊论文、毕业论文、网页和ResearchGate上的重复发布。而WoS中的20篇引文中有3篇还没有被Google Scholar统计在内(图1)。
另一篇论文是2015年发表在柳叶刀肿瘤杂志(LANCET ONCOLOGY)上面的论文“HypofractionatedRadiotherapy versus Conventionally Fractionated Radiotherapy for Patients with Intermediate-risk LocalisedProstate Cancer: 2-year Patient-reported Outcomes of the Randomised, Non-inferiority, Phase 3 CHHiPTrial”。这篇论文的WoS总引用数为13,而在Google Scholar的引用数为27。WoS中的13篇引文当然都来自于SCI期刊;而Google Scholar统计的这27次引用中,有19篇发表在SCI期刊上面(其中有10篇已经被WoS统计在内,9篇还未被统计),另外有8次引用来自于非SCI期刊论文、毕业论文和Google Scholar自己的重复统计。而WoS中的13篇引文中有3篇还没有被Google Scholar统计在内(图2)。
从如上数据分析看来:
由于Google Scholar系统收录出版物范围比WoS广,所以从Google Scholar上查到的论文被引次数会比WoS多,但会有重复统计的情况出现。
Google Scholar系统内论文引用信息统计往往早于WoS。
WoS并不是把SCI期刊的所有类型出版物计算在内,比如发表在SCI期刊上的会议摘要就是一个例外。
正如期刊论文的引用总数以及由此衍生的影响因子反映期刊的办刊水平一样,科研工作者的论文被引次数也可以反映个人为所在领域做出的贡献大小。然而,使用WoS和Google Scholar论文引用数据库来统计科研人员论文被引次数时会得出不同的数据。因此,大家在统计自己的论文被引次数时,最好统一标准、使用相同数据库来计算,并明确列出来。
Copyright © XIA & HE Publishing Inc. This is an Open Access article distributed under the terms of the Creative Commons Attribution-Noncommercial 4.0 License (CC BY-NC 4.0), permitting all non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.