前言
科技期刊数据库通过汇总单刊数据再向读者提供文献检索工具,可以极大地方便作者检索、阅读和引用文献。同时,通过提高期刊的可访问性和可见性,期刊数据库不仅促进了学术研究的传播和分享,还通过后台数据归集和引用分析,进一步为学术研究和科研热点提供着数据支持。
随着办刊模式的不断发展,数据库也经过了不断革新和变迁。在传统办刊模式中,期刊要求作者将版权转移给期刊,而读者要阅读全文往往也需要付费[1]。为此,出版行业诞生了比较传统的信息集成商(如EBSCOhost, J-Gate, ProQuest Central等),通过与大量期刊合作再整体给研究机构或大学提供付费服务[2]。信息集成商不仅对期刊的销售提供了便捷的解决方案,同时通过打包形式也能大大提升期刊的曝光量、阅读率和影响力。时至今日,科技期刊很多已采取Open Access (OA)模式出版,不再追求阅读端收费,但被本领域知名数据库收录仍然是提升期刊影响力的重要渠道,同时也是期刊运营成功的重要里程碑事件[3]。
不同领域期刊关注的数据库并不相同,生物医学类期刊更关注PubMed (由美国国家生物技术信息中心维护的免费生物医学文献数据库),Medline (由美国国家医学图书馆管理的、涵盖生物医学和相关领域的文献数据库,数据被PubMed检索),Science Citation Index Expanded (SCIE,科睿唯安WoS检索的自然科学、工程技术、医学等学科高影响力学术期刊数据库),Emerging Sources Citation Index (ESCI,科睿唯安WoS检索的创新性和跨学科期刊数据库),Scopus (由爱思唯尔提供的涵盖科学、技术、医学、社会科学等多学科领域的文献数据库)。此外,人文社科类期刊还比较关注科睿唯安WoS检索的Social Sciences Citation Index (SSCI,社会科学引文索引)或Arts & Humanities Citation Index (AHCI,人文学科引文索引)等数据库[4],工程类期刊可能更关注EI工程索引(欧美国工程信息公司创,现由爱思唯尔管理和维护),Scopus(由爱思唯尔管理和维护)等。值得一提的是,Scopus数据库收录范围较广,不仅检索生物、医学、社科、人文艺术的期刊,还包括工程、物理、化学等工程技术领域,因此收录的期刊数量较多。OA模式出版的期刊可能还会关注Directory of Open Access Journals (DOAJ,涵盖自然科学、医学、社科、工程技术等多学科领域)数据库[5]等。
生物医学类的期刊数据库多而繁杂,但最受广大期刊编辑重视的当属Web of Science (WoS), PubMed, Scopus等数据库[6],其余如SafetyLit, Embase, Biobase, Biological Abstracts, Current Contents, Zetoc等数据库可能不是生物医学编辑优先关注的数据,但它们在各自擅长的领域仍有重要价值。
上述列举的大量生物医学数据库,其收录期刊的标准各不相同同,纳入的期刊数量也差别很大[3,6],但目前还没有研究显示不同数据库收录期刊之间的区别。为此,作者挑选了四个重要的生物医学数据库(PubMed, WoS, Scopus, DOAJ,通过研究PubMed数据库收录期刊被其他三个数据库检索的情况,了解数据库之间共同收录期刊的现状,希望能为期刊编辑筹划申请数据库提供适当参考。
材料与方法
2023年7月15日至8月10日,作者分别在PubMed, Scopus, WoS, DOAJ网站上获得有关数据库最新的期刊收录清单。通过期刊名和ISSN查重检查,对重复和明显错录的信息进行了清理,再基于ISSN号进行对比分析,得到数据库之间互相收录期刊的结果,最后通过Excel进行统计。
本研究旨在研究生物医学期刊被有关数据库收录的情况,因此作者主要以PubMed数据库为切入点进行了重点分析,同时比较了其他数据库互相之间的收录情况。
PubMed收录期刊名单在官网通过*.txt格式公布,每本期刊一个阿拉伯数字序号(JrId),已编号到52,750,但经过分析后发现中间有断号,目前实际收录的期刊数量比序号编录的少一些。Scopus, DOAJ, WoS收录的期刊名单可直接下载为*.xlsx格式。WoS包含的数据库比较多,作者分别下载了所属的SCIE, SSCI, AHCI, ESCI数据库收录期刊数据。同时,将SCIE, SSCI, AHCI数据库进行合并,通过排除重复条目,得到WoS-SCIE/SSCI/AHCI数据库清单(后文将WoS-SCIE/SSCI/AHCI,简称WoS-传统库,与WoS-ESCI进行区别),WoS-ESCI数据库与上述数据库原则上不重叠,因此单独用于进行分析。
为了解不同数据库收录期刊的要求,作者通过查询文献、数据库网站并结合作者的经验,对有关数据库的申请要求进行了总结。
最后,通过WoS数据库记录的期刊国家信息,作者分析了WoS收录期刊数排名前十的国家,对应期刊被其他数据库收录的情况。
数据提取和统计
PubMed数据通过Microsoft Excel进行处理,通过Index和Row公式提取*.txt期刊信息为可分析条目。所有期刊数据,包括PubMed, Scopus, WoS和DOAJ,均通过Excel进行筛选,删除完全没有ISSN的条目,去除题目重复的条目,并将只是标题重复(ISSN不重复)的条目到ISSN portal (https://portal.issn.org/ )进行核实,纠正错误信息。同时,针对ISSN(含pISSN和eISSN)重复的期刊,对重复条目进行了清理(保留1条有效记录)。最后基于ISSN的唯一性通过VLOOKUP函数比对找出任一数据库收录期刊在其他数据库中共同收录的期刊名单,结果通过Excel进行汇总和统计。
结果
数据库期刊数据清理结果
PubMed官网公布的*.txt文件,序号编到了52,750条,通过excel公式提取,实际只得到35,947条杂志记录(减少的是未连续出现的序号,可能是更名为新杂志或被剔除的)。通过重复分析发现题目重复的期刊条目499条,删除其中完全没有ISSN号的141条,得到用于分析的PubMed期刊35,806份。
Scopus收录约44,049条记录,其中发现pISSN有重复2次的162份;eISSN有重复2次的100份,重复3次的21份,重复4次的12份,重复5次的5份,经ISSN平台核实清理。通过重复分析工具发现题目重复的期刊条目365条,经核实确实存在于Scopus数据库和ISSN平台,ISSN平台通常在重复题目上添加期刊的城市或年份以示区分。除4条ISSN缺失或被撤销的条目,其余重复题目的期刊真实存在不能删除。综上,删除90条必须删除的项目,共得Scopus期刊43,959份。
WoS不同数据库之间允许重复,但ESCI和SCIE/SSCI/AHCI数据库原则上不重复,只发现了1份异常(即AHCI库的Agenda, eISSN1013-0950登记到了两本期刊,同时出现在AHCI和ESCI库),其余用于分析的数据未再发现重复条目。DOAJ数据库收录清单没有发现重复的条目。
最终,作者通过Excel去重和ISSN刊名核实以后得到可用于对比分析的各数据库期刊数量是:PubMed(35,806份)、Scopus(43,959份)、WoS-传统库(13,737份)、WoS-ESCI(8,244份,DOAJ(19,726份) (表1)。
表1PubMed (n=35,806)收录期刊被其他数据库收录的情况
数据库 | 数据库期刊总数 | 重复期刊数 (+PubMed) | 重复期刊数占各数据库刊数比例 | 重复期刊数占PubMed刊数比例 |
---|
WoS-ESCI | 8,244 | 2,610 | 31.7% | 7.3% |
DOAJ | 19,726 | 4,049 | 20.5% | 11.3% |
Scopus | 43,959 | 20,680 | 47.0% | 57.5% |
WoS-传统库# | 13,737 | 9,940 | 72.4% | 27.7% |
数据库共同收录期刊分析
以不同数据库信息为基础值,横向对比其他数据库以后得到如下结论:
PubMed
以PubMed收录的35,806份期刊为基础,对比WoS, Scopus, DOAJ数据库的期刊在其中的占比情况,结果显示:WoS-ESCI收录的期刊中,31.7%被PubMed收录;WoS-传统库收录的期刊中,72.4%被PubMed收录;DOAJ收录的期刊中,20.5%被PubMed收录;Scopus收录的期刊中,47.0%被PubMed收录。各数据库期刊被PubMed收录的期刊占比顺序是:WoS-传统库(72.4%) > Scopus(47.0%) > WoS-ESCI(31.7%) > DOAJ(20.5%) (表1)。
Scopus
以Scopus收录的43,959份期刊为基础,对比WoS, PubMed, DOAJ数据库的期刊在其中的占比情况,结果显示:WoS-ESCI收录的期刊中,72%被Scopus收录;WoS-传统库收录的期刊中,99.4%被Scopus收录;PubMed收录的期刊中,57.8%被Scopus收录;DOAJ收录的期刊中,36.4%被Scopus收录。各数据库期刊被Scopus收录的期刊占比顺序是:WoS-传统库(99.4%) > WoS-ESCI(72.0%) > PubMed(57.6%) > DOAJ(36.4%) (表2)。
表2Scopus (n=43,959)收录期刊被其他数据库收录的情况
数据库 | 数据库期刊总数 | 重复期刊数 (+Scopus) | 重复期刊数占各数据库刊数比例 | 重复期刊数占Scopus刊数比例 |
---|
PubMed | 35,806 | 20,703 | 57.8% | 47.1% |
WoS-ESCI | 8,244 | 5,935 | 72.0% | 13.5% |
DOAJ | 19,726 | 7,183 | 36.4% | 16.3% |
WoS-传统库# | 13,737 | 13,658 | 99.4% | 31.1% |
WoS-传统库
以WoS-传统库(WoS-SCIE/SSCI/AHCI)收录的13,737份期刊为基础,对比Scopus, PubMed, DOAJ数据库的期刊在其中的占比情况,结果显示:PubMed收录的期刊中,27.6%被WoS-传统库收录;DOAJ收录的期刊中,11.5%被WoS-传统库收录;Scopus收录的43,959本期刊中,30.9%被WoS-传统库收录。各数据库期刊被WoS-传统库收录的期刊占比顺序是:Scopus(30.9%) > PubMed(27.7%) > DOAJ(11.5%) (表3)。
表3WoS-传统库 (n=13,737) 收录期刊被其他数据库收录的情况
数据库 | 数据库期刊总数 | 重复期刊数 (+WoS-传统库) | 重复期刊数占各数据库刊数比例 | 重复期刊数占WoS-传统库刊数比例 |
---|
Scopus | 43,959 | 13,594 | 30.9% | 99.0% |
PubMed | 35,806 | 9,927 | 27.7% | 72.3% |
DOAJ | 19,726 | 2,275 | 11.5% | 16.6% |
WoS-ESCI
WoS-ESCI收录的期刊被认为是已取得一定影响力的新刊。以WoS-ESCI收录的8,244份期刊为基础,对比Scopus, PubMed, DOAJ数据库的期刊在其中的占比情况,结果显示:PubMed收录的期刊中,7.2%被WoS-ESCI收录;DOAJ收录的期刊中,17.2%被WoS-ESCI收录;Scopus收录的期刊中,13.5%被WoS-ESCI收录。各数据库期刊被WoS-ESCI收录的期刊占比顺序是:DOAJ(17.2%) > Scopus(13.5%) > PubMed(7.3%) (表4)。
表4WoS-ESCI (n=8,244) 收录期刊被其他数据库收录的情况
数据库 | 数据库期刊总数 | 重复期刊数 (+WoS-ESCI) | 重复期刊数占各数据库刊数比例 | 重复期刊数占ESCI刊数比例 |
---|
Scopus | 43,959 | 5,923 | 13.5% | 71.8% |
DOAJ | 19,726 | 3,398 | 17.2% | 41.2% |
PubMed | 35,806 | 2,604 | 7.3% | 31.6% |
WoS-SCIE
以WoS-SCIE收录的9,498份期刊为基础,对比WoS-传统库,Scopus, PubMed, DOAJ数据库的期刊在其中的占比情况,结果显示:WoS-传统库收录的期刊中,69.1%被WoS-SCIE收录;PubMed收录的期刊中,20.8%被WoS-SCIE收录;Scopus收录的期刊中,21.4%被WoS-SCIE收录;DOAJ收录的期刊中,10.0%被WoS-SCIE收录。各数据库期刊被WoS-SCIE收录的期刊占比顺序是:WoS-传统库(69.1%) > Scopus(21.4%) > PubMed(20.8%) > DOAJ(10.0%) (表5)。
表5WoS-SCIE (n=9,498) 收录期刊被其他数据库收录的情况
数据库 | 数据库期刊总数 | 重复期刊数 (+WoS-SCIE) | 重复期刊数占各数据库刊数比例 | 重复期刊数占SCIE刊数比例 |
---|
PubMed | 35,806 | 7,446 | 20.8% | 78.4% |
DOAJ | 19,726 | 1,963 | 10.0% | 20.7% |
Scopus | 43,959 | 9,400 | 21.4% | 99.0% |
WoS-传统库# | 13,737 | 9,498 | 69.1% | 100.0% |
DOAJ
以DOAJ收录的19,726份期刊为基础,对比WoS-传统库,WoS-ESCI, Scopus, PubMed数据库的期刊在其中的占比情况,结果显示:WoS-ESCI收录的期刊,41.3%被DOAJ收录;WoS-传统库收录的期刊中,20.7%被DOAJ收录;PubMed收录的期刊中,11.2%被DOAJ收录;Scopus收录的期刊中,16.3%被DOAJ收录。各数据库期刊被DOAJ收录的占比顺序:WoS-ESCI(41.3%) > WoS-传统库(16.6%) > Scopus(16.3%) > PubMed(11.3%) (表6)。
表6DOAJ (n=19,726) 收录期刊被其他数据库收录的情况
数据库 | 数据库期刊总数 | 重复期刊数 (+DOAJ) | 重复期刊数占各数据库刊数比例 | 重复期刊数占DOAJ刊数比例 |
---|
WoS-ESCI | 8,244 | 3,402 | 41.3% | 17.2% |
Scopus | 43,959 | 7,183 | 16.3% | 36.4% |
PubMed | 35,806 | 4,044 | 11.3% | 20.5% |
WoS-传统库# | 13,737 | 2,275 | 16.6% | 11.5% |
多个数据库互相收录的期刊分析
除了数据库之间两两比较,我们也比较了3个和4个数据库同时收录期刊的情况。随着互相叠加筛选的数据库越多,被共同收录的期刊数减少。表7展示了以不同数据库为初始条件,逐渐叠加其他数据库后得到了确切收录的期刊数量及其在对应数据库的占比情况。结果显示,被WoS-传统库,Scopus, PubMed同时收录的期刊有9,863本,同时被DOAJ检索的期刊数只有1,609本。WoS-ESCI, Scopus, PubMed同时收录的期刊有2,285本,同时被DOAJ检索的期刊数只有922本。
第1数据库 | 第2数据库 | 第3数据库 | 第4数据库 | 期刊数量(占对应数据库期刊总数的比例) |
---|
WoS-传统库# | | | | 13,737 (100%) |
WoS-传统库# | PubMed | | | 9,927 (72.3%, 27.7%) |
WoS-传统库# | Scopus | | | 13,594 (99.0%, 38.0%) |
WoS-传统库# | DOAJ | | | 2,275 (16.6%, 11.5%) |
WoS-传统库# | Scopus | PubMed | | 9,863 (71.8%, 22.4%, 27.5%) |
WoS-传统库# | DOAJ | PubMed | | 1,629 (11.9%, 8.3%, 4.5%) |
WoS-传统库# | Scopus | DOAJ | | 2,242 (16.3%, 5.1%, 11.4%) |
WoS-传统库# | PubMed | Scopus | DOAJ | 1,609 (11.7%, 4.5%, 3.7%, 8.2%) |
WoS-ESCI | | | | 8,244 (100%) |
WoS-ESCI | PubMed | | | 2,604 (31.6%, 7.3%) |
WoS-ESCI | Scopus | | | 5,923 (71.8%, 13.5%) |
WoS-ESCI | DOAJ | | | 3,398 (41.2%, 17.2%) |
WoS-ESCI | Scopus | PubMed | | 2,285 (27.7%, 5.2%, 11.6%) |
WoS-ESCI* | Scopus | PubMed | DOAJ | 922 (11.2%, 2.6%, 2.1%, 4.7%) |
Scopus | | | | 43,959 (100%) |
Scopus | PubMed | | | 20,703 (47.1%, 57.8%) |
Scopus | DOAJ | | | 7,183 (16.3%, 36.4%) |
Scopus | DOAJ | PubMed | | 3,186 (16.2%, 8.9%) |
PubMed | | | | 35,806 (100%) |
PubMed | WoS-ESCI | Scopus | | 2,287 (6.4%, 27.7%, 5.2%) |
PubMed | WoS-ESCI | DOAJ | | 1,101 (3.1%, 13.4%, 5.6%) |
DOAJ | | | | 19,726 |
DOAJ | PubMed | | | 4,044 (20.5%, 11.3%) |
不同国家收录的WoS期刊在其他数据库的表现
选取WoS收录期刊数(含ESCI)前十名的国家,分别是美国(5,772份)、英国(4,500份)、荷兰(1,342份)、德国(1,095份)、西班牙(725份)、瑞士(540份)、中国(444份)、意大利(416份)、巴西(397份)和俄罗斯(376份)。这些国家被WoS收录的期,同时被其他数据库检索的比例趋势见图1。
讨论
通过对比分析,作者发现不同数据库收录的期刊条目差别较大,其中PubMed和Scopus数据库收录的期刊存在少量标题重复和ISSN错误现象,可能是期刊编辑部提交的信息不够准确或者没有及时更新所致。
作者通过数据横向对比首次发现(表6),Scopus期刊被其他数据库收录的比例:PubMed > WoS-传统库 > DOAJ > WoS-ESCI。PubMed期刊被其他数据库收录的比例:Scopus > WoS-传统库 > DOAJ > WoS-ESCI。WoS-传统库期刊被其他数据库收录的比例:Scopus > PubMed > DOAJ。WoS-ESCI期刊被其他数据库收录的比例:Scopus > DOAJ > PubMed。DOAJ期刊被其他数据库收录的比例:Scopus > PubMed > WoS-ESCI > WoS-传统库。结果发现WoS-传统库期刊被PubMed(72.3%), Scopus(99.0%)同时收录的比例高于DOAJ(16.6%) (表3),说明WoS和Scopus, PubMed的收录标准更趋于一致。
WoS-ESCI收录的其他数据库期刊占对应数据库总刊数比例:DOAJ > Scopus > PubMed,说明新刊如果采取OA模式,申请DOAJ可能相对容易;DOAJ收录的其他数据库期刊占对应数据库总刊数比例:WoS-ESCI > WoS-传统库 > Scopus > PubMed,显示DOAJ和WoS-ESCI重复度较高,鉴于ESCI收录的期刊新刊居多,说明新刊采取OA模式的现象越来越普遍[6]。此外,WoS-ESCI收录的期刊和DOAJ收录的期刊同时被Scopus收录的比例最高且都高于PubMed,鉴于ESCI主要收录新兴期刊,而DOAJ专注于收录OA期刊,这个结果说明新刊在申请数据库方面,可以优先考虑WoS-ESCI, Scopus和DOAJ。
通过WoS数据库不同国家期刊收录情况的分析,排名靠前的USA, England, Netherlands, Germany趋势比较一致,Spain和Brazil趋势与上述国家的期刊表现差异较大;China和Switzerland期刊与上述国家期刊的趋势也基本一,说明中国期刊的质量尚可。值得一提的是,DOAJ检索且WoS已收录的传统期刊大国的期刊比例不高,其原因可能是该数据库主要收录OA期刊为主,而传统期刊大国的期刊并不以OA模式为主[8]。不过,DOAJ对中国和俄罗斯在WoS已收录期刊的检索明显要少于其他国家,一定程度上说明我国采取OA模式出版的期刊出版质量有待进一步提升[9]。最后,中国的AHCI和SSCI期刊数量还太少,具有较大的提升空间。中国被ESCI收录的期刊数量比较少,远低于Spain, Brazil, Italy, Russia四国(图1),说明中国办的新刊数量还远远不够,SCIE期刊数量增长的后劲严重不足。
最后,为了直观地了解四大数据库的收录要求,作者通过查询文献[6]、参考数据库网站并结合自身经验,我们对上述数据库的申请要求进行了汇总更新(表8),以便期刊编辑筹划申请数据库时适当参考。本文以申请PMC全文数据库进而被PubMed收录为例。
审核项目 | PMC/PubMed | Scopus | WoS-ESCI | WoS-SCIE | DOAJ |
---|
学科范围 | 生物和医学 | 所有学科 | 所有学科 | 自然科学、生物医学、工程技术 | 所有学科 |
最低要求 | 至少发表25篇以上同行评审的论文(含综述/论著/病例报告) | 有两年以上出版史,建议年发文量不低于50篇 | 有两年以上出版史,建议年发文量不低于40篇 | 有两年以上高质量出版史,具有足够学科影响力 | 1年以上出版历史或发表10篇文章 |
目标领域 | 清晰明确 | 清晰明确 | 清晰明确 | 清晰明确 | 清晰明确 |
同行评议 | 要求 | 要求 | 要求 | 要求 | 要求 |
伦理声明 | 要求 | 要求 | 要求 | 要求 | 要求 |
利益冲突 | 要求 | 要求 | 要求 | 要求 | 要求 |
编委作者分布 | 信息完整,国际分布(单个国家作者占比不超过60%),编委作者占比低于40% | 信息完整,国籍分布,编委作者占比低于40% | 信息完整,国籍分布,编委作者占比低于40% | 信息完整,国籍分布,编委作者占比低于40% | 信息完整,国籍分布,编委作者占比低于20% |
定期出版 | 要求 | 要求 | 要求 | 要求 | 要求 |
出版模式 | 不要求 | 不要求 | 不要求 | 不要求 | 开放获取 |
语言要求 | 英语为主(接受Medline收录的含英文题目和摘要的中文刊申请) | 英文为主,要求至少有英文题目和摘要 | 英文为主,要求至少有英文题目和摘要 | 英文为主,要求至少有英文题目和摘要 | 不限 |
引用情况 | 评估会参考期刊在PubMed中的引用 | 评估会参考期刊在Scopus中的引用 | ESCI申请重点看24条标准,没有特别强调引用 | 针对ESCI期刊评估作者、编委引文情况并进行比较性引文分析内容重要性 | 不要求引用数据,不鼓励公布影响因子等数据在网站 |
可访问性 | 网络版开放获取或开通评估访问权限 | 网络版开放获取或开通评估访问权限 | 网络版开放获取或开通评估访问权限 | 网络版开放获取内容或开通评估访问权限 | 网络版开放获取 |
申请方式 | 出版商在线提交 | 出版商在线提交 | 出版商在线提交 | 自动评估 | 在线提交 |
申请禁止时长 | 两年 | 两年 | 学术评估被拒,两年基本评估被拒,修改后可提交 | 两年 | 六个月 |
局限性
本文以不同数据库收录期刊的ISSN为基础,对比其他数据库共同收录的情况,发现不同数据库之间收录的期刊数据存在局部差异,导致分析结果存在不一致的情况。分析原因包括:数据库错误记录ISSN或同一个期刊名登记了多个不同ISSN的情况,虽然对比分析以前进行过数据清理,难免会有疏漏。尽管如此,不同数据库交互对比过程中发现的差别较小,其比例不会对分析的结果造成显著影响。
结论
不同数据库收录的期刊数量差别较大,但也不乏被各大数据库同时收录的期刊。PubMed, Scopus, WoS-传统库等三个数据库共同收录的期刊数量最多,超过了WoS传统库收录期刊数的70%,说明有关数据库的选刊标准趋于一致,侧面说明被同时收录的期刊办刊水平是比较高的。对于新刊来说,申请WoS-ESCI和Scopus可能比PubMed更容易,如果采取OA出版模式,还可以考虑申请DOAJ数据库。通过WoS收录期刊的国籍分析,发现中国目前创办的新刊数量还远远不够,同时社会和人文领域的期刊数较少,值得国人共同努力。
Declarations
Acknowledgement
感谢裴磊博士对本研究获取Scopus期刊数据的支持。