文献计量数据库的价值:超越检索与发现的数据密集型研究.pdf
Feburary 2020Global Research Report The value of bibliometric databases: Data-intensive studies beyond search and discoveryJonathan Adams, David Pendlebury and Martin Szomszor文献计量数据库的价值:超越检索与发现的数据密集型研究全球研究报告Jonathan Adams、 David Pendlebury和Martin Szomszor2020年2月2作者简介立足过去,放眼未来Jonathan Adams是科睿唯安学术研究事业部旗下科学信息研究所首席科学家。他是伦敦国王学院政策研究所的客座教授。由于在高等教育和政策研究领域的卓越贡献, Jonathan Adams在 2017年被埃克塞特大学授予荣誉理学博士学位。David Pendlebury是科学信息研究所的研究分析主管。自1983年以来,他一直致力于使用 Web of Science数据来探寻科学研究的结构和动态。他与ISI创始人 Eugene Garfield共事多年,并与Henry Small共同开发了基本科学指标( Essential Science Indicators)数据库。Martin Szomszor是科学信息研究所负责人兼研究分析主管。他因与英格兰高等教育资助委员会合作创建了“ REF2014影响力案例研究数据库”,荣膺“ 2015年英国信息时代 50强数据领袖”称号。科学信息研究所(ISI)科学信息研究所( Institute for Scientific Information,简称 ISI)是以信息科学的创始人和先驱尤金· 加菲尔德博士(Eugene Garfield) 的工作为基础。他所创办的公司ISI, 是科睿唯安学术研究事业部 (Web of Science Group)的前身。科睿唯安于2018年宣布重建ISI 。依托于尤金· 加菲尔德博士的宝贵遗产,以及灵活顺应技术的发展进步, ISI旨在成为专业分析的源泉。我们的全球团队拥有行业认可的专家,他们专注于开发现有和全新的文献计量与分析方法,同时与全球学术研究领域的伙伴及同仁开展合作。如今,作为学术研究事业部的附属“研究院”, ISI肩负两大职能: 维护基础知识和编辑严谨度,这是Web of Science引文索引数据库及其相关产品与服务赖以建立的基础。近半个世纪以来,我们可靠的分析和审编一直为研究应用和客观分析提供支持。 Web of Science数据库汇集了经过严格筛选的、结构化的完整数据,深刻揭示了全球最具影响力科研期刊的贡献与价值。这些专家洞见能够帮助研究人员、出版社、编辑人员、图书馆员以及基金针对多元化的受众群体,深入探索期刊价值的关键驱动因素,进而更好地利用现有数据和指标。 开展研究来维持、扩展和改进知识库,并通过我们的报告、出版物、活动以及会议向我们的同仁、合作伙伴、乃至与学术界、企业、基金、出版商和政府有关的研究人员分享知识。ISBN: 978-1-9160868-7-63摘要在2019年,平均每天有来自139个国家和地区的约145,000名各学科研究人员访问Web of Science,为正在进行的科研工作探寻研究信息、发现重要文献。1981年, Web of Science 标引了来自6800种期刊的约50 万篇论文(大量学术论文和综述)。到2019年,这一数字已扩大到源自21,300种期刊的250万篇论文。足见这是一个丰富的数据资源,可满足广泛的分析用途。然而,除了用于检索和发现,关于Web of Science作为文献计量数据库使用的研究却少之又少。我们的分析表明,Web of Science对大多数系统性研究综述而言,是出版物和引用数据的主要来源,而这些研究综述涉及广泛的学科领域。而且, Web of Science收录的科研管理和评估研究方面的研究数量也是其他数据来源的两倍左右。在美国、中国和西欧大部分国家, Web of Science都是此类研究工作的主要数据来源。而Scopus数据库在伊朗和意大利使用更多。对 Web of Science文献题录的结构化使用令生物医学研究人员大为受益。他们有一套成熟的、系统化的方法来评估各类研究综述所依据的原始资料,这些综述反映的是人类健康和疾病控制重大研究课题的发展与现状。 这类出版物的主题结构证明了Web of Science文献对于评述健康政策目标(如癌症、女性健康和心血管疾病、医疗效果管理以及创新方法和疗法的开发)的重要作用。 对此类文献的长时间追踪能发现新研究领域的产生,并为科研资助方向提供参考。找出某一领域的高产作者,则能揭示出专业知识的分布情况;并为比较评估国家政策制定和机构科研管理的相关工作和成果提供支持。我们的分析表明,对大多数系统性研究综述而言, Web of Science是出版物和引用数据的主要来源4引言2019年,平均每天有139个国家和地区的约145,000名研究人员访问Web of Science。他们来自自然科学、社会科学和人文领域的各个学科,而且在人文领域呈增长态势。科研人员利用 Web of Science发起新的研究计划并设计研究课题,然后在Web of Science中索检索、发掘重要文献,为当前的研究工作提供佐证和依据。说来可能令人惊讶,除了检索和发现,关于这个文献计量数据库在科研领域的其他用途,现有的研究少之又少。 Pringle (2008)曾指出,在科研评价工作中,文献计量元数据的应用日益增加。 Schnell (2018)也撰文谈及Web of Science作为首个引文索引数据库在数据分析和科学计量学中的历史地位。最近, Li、 Rollins和 Yan (2018)证实, Web of Science的定量影响并未得到科学研究的严谨考量。他们以 1997-2017年间发表的19,478篇论文为样本,调查了样本论文以何种方式提及Web of Science,并分析了论文的国家、机构和领域分布情况。这似乎是对Web of Science的使用记录开展实证性调查的首例研究。 在本报告中,我们拓展了Li 、 Rollins和 Yan (2018)和 Schnell (2018)的研究,聚焦于研究人员如何使用 Web of Science数据了解整个科学和学术交流体系;以及这些信息如何为具体的科学研究(尤其是系统综述,即systematic reviews, 也称系统评价)以及更有效的科研管理提供支持。Web of Science收录的论文数量及其覆盖的研究领域在过去几十年里显著增加。 1981年,该数据库每年标引的论文数量约为50万篇(大量学术论文和综述),这些论文来自约6,800种期刊。如今,其年度论文标引量约为250万篇,论文来源于约21,300种期刊。这个引文索引数据库涵盖了约2,000万篇美国研究人员发表的论文或约2,700万篇欧盟科研人员的论文:为广泛的分析应用提供了丰富的数据资源。文献记录按期刊进行分类(分类的初衷是方便查找),现在已经成为比较分析的基础。 Web of Science中有254个学科细类(截至 2020年 1月);在“基本科学指标”( Essential Science Indicators)数据库中,有21个学科大类。引文分析经常使用Web of Science的分类框架,即学科关系密切的期刊被划分到一个学科, 这类别意味着某一年里该学科所有论文的平均被引频次是一项有意义的全球基准。然而,科研管理的关注重点往往并不在这样的学科层面,而是在既有期刊类别之内或之间更为细致的“主题”层面。科研正日益成为一项跨学科活动,因为研究主题的关注点常常跨越传统学科结构;而且旨在解决重大挑战的前沿解决方案也往往需要动用多学科力量。也就是说,研究人员也好,负责科研项目选择、资助和成果评估的管理人员也好,他们需要的信息都很可能来自具有针对性的的检索、分析和报告,跨越某个学科领域,而且受到广泛关注。Web of Science数据库汇集的海量信息能回答许多问题。将相关出版物结构化呈现的做法能为揭示研究主题发展与现状的研究综述提供原始材料。对此类文献的长时间跟踪能够发现新研究领域的产生,并指明最有价值的科研资助方向。找出某一领域最高产的作者能够揭示出专业知识的分布情况,并支持科研活动和成果的比较评估。Web of Science 收录的论文数量及其覆盖的研究领域在过去几十年里显著增长。5时间、地点和内容本报告的第一步是探究Web of Science标引的每年发表的关于出版物数据库的文献(包括科研论文和综述)数量,这些文献在标题、摘要和关键词中提及了Web of Science或其他广泛使用的全球出版物数据库的数据分析。我们提取了1999 年到 2019年中期的数据,发现有51,120篇论文明确提及了一个或多个主要书目型数据来源。我们认为此类论文对数据库的使用要超越为撰写一篇科研论文以检索和发现为目的的数据库使用的“正常”水平。通过数据可以看出:相比于数据库的总体增长,此类研究的增长有多快速。虽然上世纪九十年代使用书目数据的研究中很少提及数据库来源,但到 2010年,提及数据库来源的论文数量已经增加到每年1,000篇左右,而且自此之后出现爆发式增长。目前每年有超过1 万篇论文采用某种形式的书目数据开展评述和分析(图1 )。通过数据可以看出:相比于数据库的总体增长,此类研究的增长有多快速。图11981年以来Web of Science每年标引的文献数量(研究论文和综述)以及宣称使用书目数据来源进行分析的论文数量。 2019年数据只包含至9月的数据。5When, what and where? Our first step in this report is to look at the numbers of papers (i.e. both articles and reviews) published each year and indexed in the Web of Science that also reference, in their titles, abstracts and key-words, the analysis of data from the Web of Science or other widely-used, global publication databases.Over the period 1999 through to mid-2019, when we extracted these data, we found 51,120 papers that explicitly referenced the use of one or more major bibliographic data sources. We assume that such an acknowledgment implies that there has been more usage than the normal level of academic search and discovery that would be required to produce a research paper. The data shows how rapid the growth of such studies has been compared to the overall growth of the underlying database. Whereas acknowledgments of database source were rare in studies using bibliographic data in the 1990s, numbers rose to around 1,000 papers per year by 2010 and growth since then has sky-rocketed. There are now over 10,000 papers per year that use bibliographic data in some form for reviews and analytics (Figure 1).The data shows how rapid the growth of such studies has been, compared to the overall growth of the underlying database.1,500,0001,000,0002,000,0002,500,000500,00007,5005,00010,00012,5002,50001981 1983 1985 1987 1989 1991 1993 1995 1997 1999 2001 2003 2005 2007 2009 2011 2013 2015 2017 2019Web of Science每年标引的论文数提及书目数据的论文数Web of Science论文提及书目数据的论文6Web of Science不是此类分析的唯一来源,在其之前还有 Index Medicus( 1879)和 Biosis( 1926),但科学引文索引( SCI, Web of Science数据库的先驱)无疑是科学领域中历史最悠久的引文数据库。此外,也存在其他的重要来源:包括于2004年创建、由出版公司爱思唯尔管理的Scopus数据库;以及没有经过编辑和标引的谷歌学术( Google Scholar)数据库。 为了确保各学科之间的兼容性,本分析不涉及面向特定学科的数据库,如PubMed 、 JSTOR和DBLP,也不考虑arXiv等预印本数据库。之前的很多研究宣称采用了一个以上来源。图 2中的重叠部分显示,在引用了 Web of Science论文数据的29,079篇文献中,有7,212篇文献( 25%)同时使用了Scopus数据,其中1488篇( 5%)还引用Google Scholar的数据。换一个视角来看, 20,511篇研究文章使用了Scopus数据,其中35%也利用了Web of Science数据(图 2)。这是个有趣的结果。谷歌学术在书目信息分析应用中存在一些问题,包括需要分析师和其他科研用户剔除重复的信息并对结果消歧。其覆盖范围方面的信息也是缺失的。谷歌学术的优势是可以免费访问。 Web of Science和Scopus是商用数据库,由专人编辑。哪类文献使用Web of Science?大多为综述,不过Web of Science也受到研究典型学术论文用户的欢迎。这两类文献之间的数据使用情况是不同的。在综述中,选择Web of Science作为其分析和内容来源的比选择Scopus的多大约20% 。然而对于研究论文,宣称使用 Web of Science数据的论文是宣称使用Scopus数据论文的两倍左右。这可能与发表文献内容的性质和分析师的目标有关,这方面的内容在本报告后续讨论(图 3)。发表文献来自何处?来自美国和西欧成熟研究型经济体的文献占相当大的部分,此外还有澳大利亚和加拿大等英联邦国家的文献。不过到目前为止,最大的单个国家贡献来自于中国。在大多数情况下,其主要信息来源是Web of Science。印度和南非等国家的文献中频繁提及谷歌学术( Google Scholar)。采用Scopus数据库更多的国家包括伊朗和意大利。(图4 )图2发表在Web of Science所收录的学术期刊上、而且宣称使用了三大主流书目索引数据库中的一个或多个数据库的论文数量( 1999-2019)6The Web of Science is not the only source for such analyses, and indeed is predated by the Index Medicus (1879) and Biosis (1926), but the nullcience nullitation Index (the forerunner of the Web of Science index) is unnulluestionably the oldest citation database in the sciencesnullnullther inullportant sources existnullThese include the nullcopus database, created in 2nullnullnulland nullananulled by the publishinnullconullpany nulllsenulliernulland the nulloonullle nullcholar database, nullhich is not curated or indexednullIn order to pronullide conullparability across disciplines, this analysis excludes subnullectnullspecific databases such as nullbMed, nullnullTnullnulland nullBnull and does not consider prenullprint indexes such as arnullinullnullMany prior studies report that they hanulle dranulln on nullore than one of these sourcesnullThe onullerlappinnullcircles of the dianullranullin nullinullure 2 shonulls us that of the 29,null79 publications that cited Web of Science publication data, there nullere 7,212 (2nullnull) that also drenullon nullcopus data and 1,null88 (nullnull) of these also used nulloonullle nullcholarnullnullronulla different perspectinulle, sonulle 2null,null11 studies used nullcopus data of nullhich about nullnullnullalso used Web of Science (nullinullure 2)nullThis is an interestinnulloutconullenullnulloonullle nullcholar poses problenull for biblionullraphic use, includinnullthe need for analysts and other research users to denullduplicate and disanullbinulluate the infornullationnullThere is no infornullation on the scope of conulleranullenullThe benefit of nulloonullle nullcholar is free accessnullWeb of Science and nullcopus are conullnullercial and curated sourcesnullWhich types of publications use the Web of Science?The nullanullority are renullienulls, but it is also popular nullith those researchinnullnullore typical acadenullic articlesnullnullata use nullaries betnulleen these tnullo types of publicationsnull nullnullonnullrenullienulls, around 2nullnullnullore chose Web of Science onuller nullcopus as a source for their analysis and contentnull nullnullonnullarticles, honullenuller, about tnullice as nullany report usinnullW eb of Science data conullpared to the nunullber reportinnullnullcopus datanullThis is linullely linnulled to the nature of the publication content and analystnulls obnullectinulles, nullhich nulle discuss later in this report (nullinullure null)nullWhere do the publications come from?The lonnull established research econonullies in the nullnullnulland nullestern nullurope nullanulle up a substantial part of the actinullity, nulloined by the nullnnulllophone diaspora in nullustralia and nullnada, but by far the binullest sinnulle contributor is nullinanullIn the great majority of these cases the primary source of information is from the Web of Science. Google Scholar is frequently acknowledged in countries such as India and South Africa. Countries where the Scopus database was more frequently acknowledged include Iran and Italy. (nullnullre nullnullFigure 2. The nunullbers of studies published in acadenullic nullournals indexed in Web of Science (1999null2null19) that reported their use of one or nullore of the three principal biblionullaphic indexinnull databasesnulldata sources for analysesnull The data for 2null19 conuller only a part year (to nulleptenullber)null20,0965,72nullnull,nullnullnullnull,77nullnull,22null2,07nullnull,7null2Web of Science 29,079 Scopus 20,5nullnull nulloogle Scholar nullnull,079Web of Science :29,079 篇文献Scopus :20,511篇文献谷歌学术 :14,079篇文献7图3发表于Web of Science所收录学术期刊上的文献类型分布( 1999-2019),这些文献宣称使用了三大主流书目索引数据库中的一个或多个数据库图4发表于Web of Science收录学术期刊中的文献地区分布( 1999-2019),这些文献宣称使用了三大主流书目索引数据库中的一个或多个数据库73,00006,0009,000中国美国英国加拿大巴西澳大利亚荷兰西班牙德国比利时法国瑞士丹麦瑞典韩国日本土耳其葡萄牙南非印度意大利伊朗5,000010,00015,00020,000发表的文献的数量(1999-2018)发表的文献数量(1999-2018)研究论文WoS Scopus Google ScholarWoS Scopus Google Scholar综述 会议论文8涉及哪些主题?提及Web of Science和其他书目型数据库是其数据重要来源的论文数量增加的事实表明:对于很多科研人员来说,书目数据在分析、检索和发现方面显然具有实用性和价值。不过,我们也要认识到,数据库被提及次数的增加,也许反映出科研人员行为模式的变化。多年来,人们将Web of Science作为文献分析的主要来源,但自从Google Scholar ( 2004年发布测试版)和 Scopus( 2004)问世以来,科研人员也意识到有必要加入多样化的数据来源需要让其他人确信其信息的出处和质量。具备这些优势的书目记录有哪些特点?有两个使用案例脱颖而出:系统综述和科研评估。两者的方法不同。综述对现有文献的综述有很多方法,特别是针对某学科的特定主题。长期以来,综述一直被视为整个科研文献的最重要组成部分之一,部分综述期刊是其领域内被引用频次最高的系列出版物。 ISI创始人尤金· 加菲尔德认识到了综述和及其撰写者在科研文献中的重要作用。他注意到,综述中的陈述( Statement)对标引具有价值,几乎每一项陈述都被引用。以此类推,引文也对“陈述”进行了标引( Garfield,1976、 1982)。一些综述加入注释列表和近期文献概要而其他综述则非常系统化。一篇优秀的综述对文献集中已被参考、接受和发表的研究结果进行概述,对先前工作的成果和现有知识的状况提供高层级依据。其中包括对依据的评判,为将来的工作提供建议。如此复杂的综述通过荟萃分析汇集数据,供作者评估支持性和反驳性的依据,实现更好的概述。为实现这一重要贡献,最好的起点就是编辑过的、高度结构化的书目型数据库,其中不仅包含综述所需的大量资料,还提供了标引和数据增值让评述者能够快速过滤、筛选手头的资料,并确定优先级。在实践中,很难想象如果没有完整的数据库,如何才能进行有效的综述。综述撰写者有一系列的检索工具,并确信其发现的文献来自权威渠道。这些内容来自那些通过严苛编辑标准的期刊。因此, Web of Science成为综述文献最频繁的来源也就不足为奇了。科研评估加菲尔德在 1955年的科学杂志中提出,被引频次可能能够反映该文献对其他研究人员的影响力( Garfield,1955)。自此之后,科学计量学领域实现了大幅度地扩展。北美、欧洲以及近年大洋洲和亚洲的众多学术群体通过对数据研究以及开发高水平的描述性和比较性指标,为这一领域发展做出贡献。这些研究非常适合于科研管理人员和政策分析人员在国家层级报告和基金项目评估中的应用。在任何领域中的任何研究中,对数据来源进行标识和描述至关重要。因此,在专业期刊和其他跨学科期刊上的大量论文中科研评估的成本和效益是一个热点主题。由于科研投入的全球性增加,对方法和比较结果的政策关注表明科学计量学已实现区域性普及。在任何领域的任何研究中,对数据来源进行标识和描述至关重要。9方法论为确定分析的目标主题,我们查阅了 1999-2019年期间Web of Science中51,120篇论文标题、摘要和关键词中的文字。我们采用了标准的一元主题建模方法,过滤掉文献库中在50%以上文献以及在三篇以下文献中出现过的用语。将所有用语转为小写,编成一套包含36,095个单词的字典。每个单词的权重(在标题、摘要和关键词中出现的次数)作为非负矩阵分解( NMF)算法的输入值,为指定数量的主题生成主题模型。利用Scikit Learn的标准软件包,在Python中执行这一过程。Scikit Learn是一款免费软件机器学习库,用于 Python编程语言( Pedregosa等, 2011)。我们开发了一些模型,每个模型都产生不同数量的主题( 10-50个不等),对其开展定性评估,检查输出的一致性(即模型里主题中的单词是否存在显著关联?)和颗粒度(即其术语有多具体?)。虽然产生很少或大量主题的主题模型是可能的,但文献集的性质通常决定了对于特定分析来说什么是明智的选择。我们发现,产生有用结果的若干个主题所具有的共同特点是:集群的规模相对接近,主题目标集合包含的术语显然互相关联,且足够具体,能够将数据集分为可辨识的集群。在开发阶段,我们不打算测试主题内容的相对多样性,也不探究其涉及Web of Science期刊类别的多少。对于每个主题,我们也避免寻求年份之间的均衡。在实践中,最近几年的数据记录丰富的多,因此每个主题都可能受到这些数据的强烈影响(见图 1)。 我们发现大约30个主题的目标集合,产生相对均衡的集群集合。主题其实是使用相似性阈值的数据记录的任意分割。在本文研究中,我们使用词汇被共用的次数。课题本身共用这些词汇,从而建立起一个家谱图,将主题互相关联。这种方法称为系统树图,能够连续将主题组成对、群和族。与系统树图中相隔较远的主题相比,被聚类在同一集群的主题在术语的使用上更相似。 图 5、 6展示了我们发现的主题之间的关系。通过分析主题论文集中使用最频繁的词汇,可以为每个主题确定一个标签。标签只起到标注作用,要合理地解读,需要对组成主题的实际论文进行审阅。标签不可能绝对化:关于确定组别内容的性质,专家意见不一;随着开展进一步的分析,这些意见也会有所变化。我们发现,设定约30个主题目标时所生成的集群相对较为均衡。10感兴趣的主题一些主题与当前健康领域的政策重点有明显关联;另一些涉及方法论;还有一些呼吁基础研究。一些主题难以解读:主题2 、 5均明显涉及遗传学,尤其是多态性及其与患者疗法的关系,但需要通过专家才能了解为何算法识别出了两个主题,而非一个主题。主题 26涉及社交媒体,不过应在把社交媒体同时作为正确和错误信息来源的情境下对其进行解读,尤其是健康领域。图中大部分论文(主要为综述)涉及的是临床医学和健康领域,以及健康研究领域,包括医疗保健、治疗和创新研究。这并不奇怪,“系统综述”的概念在生物医学研究领域早已建立。首先,由于此类研究关系到生命,因此要实现快速高效的进展,最佳实践是一项关键要求,其知识现状持续受到评价。其次,由于这些领域中投入了大量公共和商业研究基金,当前科研的管理和未来的投入取决于对成果进行定期和有效的监控。Cochrane系统评价数据库( cochrane/ about-us)在这方面尤其重要,在建立标准方面具有全球影响力,并展现出价值和实用性。人们研究了系统综述对多个数据库的使用情况: Bramer等人( 2017)总结道:“作为一项基本要求,系统综述至少应该检索 Embase、 MEDLINE、 Web of Science和谷歌学术,才能确保充分、高效的覆盖。”树图的上半部分包括全球医学重点领域(糖尿病、肥胖症、儿童和妊娠)、疾病控制和诊断(主题19显示植物相关医药策略的重要性在增加)以及一系列愈发重要的与心理健康和管理相关的主题。与此相关的有三个主题( 3、21、 22),涉及医疗健康推广和管理。健康研究、数据和分析组成单独的集群(主题 0、 7、 24、 11)。医疗和健康为主的主题集群旁边是一个单独集群,涉及与未来健康解决方案相关的基因学和分子生物学早期研究阶段。树图的下半部分为与教育和科研生态系统相关的独立主题集群。主题26涉及社交媒体和学术交流,而主题18则涉及医疗保健培训情境下的学习和技能。最后,描述Web of Science数据用于研究和创新管理(主题1 )和科研评估(主题12 、 17)的文献是规模最大的类别,各有超过2000篇相关论文。这三个主题与数据集的其他主题有所不同,因为文献大多为研究论文,而非综述。总体来看,其只占数据使用案例的一小部分。当然,这些论文更多来自从事科学计量学研究的科研人员,描述的是开发或者说明分析方法的研究案例,而非源自从事科研评估的专业人士,这部分人士相对较少发表论文。主题和文献地图除了使用图5 中的家族树谱,我们还可以利用文献地图呈现这些主题。该地图包括我们数据集合中的每篇文献。每篇文献作为一个单独点,根据其文本相似性归类,并描绘主题与集群之间的关系,与系统树图类似。通过文献地图,可以进一步解释这些文献之间的关系。我们一旦确定了地图文献点之间的主题,就可以添加其它信息来揭示更多规律,帮助解读。在本例中,我们加入了第二个版本的地图,其中文献用不同颜色着色,标识哪些是信息计量学论文(红色,标题或摘要包含“科学计量学”、“文献计量学”和“信息计量学”等关键词)或综述(绿色,标题或摘要包含“系统综述”、“荟萃分析”和“文献检索”等关键词)。这样就立即揭示出科学计量学主题与文献集合中其它主题之间的区别。共有4,852篇论文被归类为信息计量学论文,总共有36,957篇论文被归类为综述。有趣的是,我们注意到有 435篇论文被同时归类为信息计量学论文和综述,揭示了利用文献计量方法加强系统评价方法论的趋势正在不断发展。例如,确定学科内的新兴研究领域,利用引证图或关键词分析开展文献主题分析,观察基金趋势等。这有助于提升对如何开展科学研究的理解,提供实用的量化指标,为研究策略提供依据。