多作者署名与研究分析.pdf
多作者署名与研究分析全球研究报告Jonathan Adams、David Pendlebury、Ross Potter和Martin Szomszor2作者简介立足过去,放眼未来Jonathan Adams是科睿唯安学术研究事业部旗下科学信息研究所负责人。他是伦敦国王学院政策研究所的客座教授。由于在高等教育和政策研究领域的卓越贡献, Jonathan Adams在 2017年被埃克塞特大学授予荣誉理学博士学位。Ross Potter是科学信息研究所数据科学家。他在学术界拥有广泛的研究经验,其中包括在美国得克萨斯州休斯敦的月球与行星研究所以及罗得岛州普罗维登斯的布朗大学担任与NASA相关的博士后职务。Martin Szomszor是科学信息研究所研究分析主管。他曾是数据科学( Data Science)负责人,以及全球研究机构识别数据库( Global Research Identifier Database)创始人,他将机器学习、数据集成和可视化技术领域的广泛知识应用到相关工作中。他因与英格兰高等教育资助委员会合作创建了“ REF2014影响力案例研究数据库”,荣膺“ 2015年英国信息时代50 强数据领袖”称号。David Pendlebury是科学信息研究所的研究分析主管。自1983年以来,他一直致力于使用 Web of Science数据来探寻科学研究的结构和动态。他与ISI创始人Eugene Garfield共事多年,并与Henry Small共同开发了基本科学指标( Essential Science Indicators)数据库。 科学信息研究所(ISI)科学信息研究所( Institute for Scientific Information,简称 ISI)是以信息科学的创始人和先驱尤金 加菲尔德博士(Eugene Garfield) 的工作为基础。他所创办的公司ISI, 是科睿唯安学术研究事业部 (Web of Science Group)的前身。科睿唯安于2018年宣布重建ISI ,并决定保留原名。 ISI依托于尤金 加菲尔德博士的宝贵遗产,同时灵活顺应技术的发展进步,旨在成为专业分析的源泉。我们的全球团队拥有行业认可的专家,他们专注于开发现有和全新的文献计量与分析方法,同时与全球学术研究领域的伙伴及同仁开展合作。如今,作为科睿唯安学术研究事业部的附属“研究院”, ISI肩负两大职能: 维护基础知识和编辑严谨度,这是Web of Science引文索引数据库及其相关产品与服务赖以建立的基础。近半个世纪以来,我们可靠的分析和审编一直为研究应用和客观分析提供支持。 Web of Science数据库汇集了经过严格筛选的、结构化的完整数据,深刻揭示了全球最具影响力科研期刊的贡献与价值。这些专家洞见能够帮助研究人员、出版社、编辑人员、图书馆员以及基金针对多元化的受众群体,深入探索期刊价值的关键驱动因素,进而更好地利用现有数据和指标。 开展研究来维持、扩展和改进知识库,并通过我们的报告、出版物、活动以及会议向我们的同仁、合作伙伴、乃至与学术界、企业、基金、出版商和政府有关的研究人员分享知识。ISBN 978-1-9160868-6-93摘要Web of Science中不断涌现出拥有1000个、甚至更多作者,横跨100多个国家的研究论文。众多作者/众多国家的组合产生出复杂的作者署名模式,它不同于传统的典型学术论文,而且推升了论文引用率。在本报告中,我们将描述两种模式,它们将复杂作者署名与引用率提升效应关联在一起:与多作者署名(超过10个作者, 5个以上国家)相关的普遍性引用率提升;超大规模作者署名(超过100个作者,超过30个国家)导致的更具扰动性的结果。在整个Web of Science数据库中,一篇论文最常见的作者人数是三人,全球95%的论文署名作者人数不超过10人(表 1)。一篇论文最常见的作者所属国数量是1 个,全球 99%的论文署名作者所属国数量不超过5个 。( 图 1、表 2)复杂作者署名(多作者、多国家)现象过去五年持续呈上升势头。最大的相对增长与超大规模作者署名的显著增加密切相关。(图2 )对一篇论文来说,多一个国家比多一个作者更有益处:复杂作者署名与研究绩效指标相关(“学科规范化引文影响力” CNCI,图 3);作者人数与引文影响力的小幅持续上升相关联(图4 );国家数量与幅度更大但不太稳定的引文影响力上升相关联(图5 )。作者与引文影响力模式因学科而异。在生物学领域,日益增加的作者和国家数量始终与引文影响力的上升相关联。但在临床医学领域,这种效应更不稳定,更多的作者与国家数量造成更高的CNCI ,高达世界均值的100倍。在化学领域,署名作者人数与引用数量之间没有密切联系(图6 );在粒子物理学领域,当国家数量很多时,影响力值异常之高(图7 )。在国家层面也能观察到多作者署名和超大规模作者署名的影响。具体影响取决于本国研究基础的规模。对所有国家而言,引用影响力随着署名作者人数的增加而增加;但对小国而言,影响力的增加更明显,也更多变(图8 )。在全球占比5%的 10人及以上多作者署名论文中,每个国家均有份额,并通过该份额实现引用影响力的增长。在成长型的小规模研究经济体中,这些论文的平均CNCI是一般论文的5 倍,甚至更多(表3 )。我们建议:在任何样本中,署名作者人数超过10人的论文应当被致谢和单独描述,因为此类文章会影响解读。虽然多作者署名会产生更大的影响力,对于大多数(而非全部)学科领域,这种影响力是一贯的、递进的、规律的;但是对于某些领域,多作者署名则几乎或完全没有影响力。在这方面,数据管理或分析无需作出改变。超大规模作者署名、超过100名署名作者和/或30个国家的论文则应当被区别对待。简单说,这些论文与其他论文不同,它们的影响力不可预测、不具连贯性,有时候可能非常大。要求在国家和机构层面将这些数据从所有相关分析中移除的呼声很高。在临床医学和粒子物理学领域,超大规模作者署名产生的模式尤为特别且不规律。此类效应无法归类于某个大类,在各个学科之间不具有重复性,而且非常不一致。在机构层面,此类论文的存在会带来重大影响,有时甚至能使分析结果失真。4序言科睿唯安学术研究事业部对研究出版物署名作者人数和地址数量的增长进行了长期关注。2012年,Chris King在ISI科学观察(Science Watch)指出,Web of Science数据库中拥有50名以上作者的出版物数量从1998年的400篇左右增加到2011年的1000篇以上。而在同一时期,拥有100名以上署名作者的出版物数量翻倍,达到600篇(King,2012)。2000年以前,单篇论文的最多作者人数很少超过500 。 2004年,千人大关被突破,一篇2500名作者的论文发表。此类文章数量越来越多,现有纪录保持者是ATLAS团队在2015年关于希格斯玻色子的一篇论文有5153名署名作者和500多个机构地址( Aad et al., 2015; Mallapaty, 2018)。作者单位所属国家的数量也有类似的增长。上世纪八十年代,国际合作相对较少,不过此后快速增长;归属于某一国的论文中,超过一半都有一名来自其它国家的合著者( Adams,2013)。此类合作的动因是多种多样的;不过,数据是一个关键驱动因素,在医疗卫生和环境科学领域,论文由多国作者署名的现象的显著增长。一篇关于人类体重趋势的论文创下署名作者所属国(非重复)数量之最达到 108个(超过联合国成员国的一半),机构地址达 1000多个( NCD Risk Factor Collaboration, 2017)。合作的原因和优势得到广泛研究(例如: Katz和Martin , 1997; Bozeman et al,2013)。经济学人( 2016)报道称合著现象呈上升势头,并指出每名作者名下文章数量的增加不代表生产力的增加。该报道指出,“客座作者”和互惠性地给予同事免费署名,造成了全球作者人均论文生产力的实际下降。很久以前, Derek De Solla Price就注意到署名作者人数的增长( Price, 1963)。有些人可能出于文化习惯,将资深成员的名字添加到研究小组的论文署名中( Croll, 1984)。据称在一些等级更森严的国家,这一现象更为普遍。据观察,将系主任列为合著者的生物医学论文数量有所增加( Drenth,1998);不过,多作者署名现象的增加过于普遍,导致我们无法以此来宽泛地解释。在某些领域,已经有人对作者的署名文化和模式进行学科分析,这些领域包括社会科学( Endersby,1996)、经济学( Hudson, 1996)和医学相关研究在医学研究领域,新英格兰医学期刊(New England Journal of Medicine)的单一作者署名文章占比在整个20世纪从98%下降到5%( Constantian, 1999)。署名作者人数的增加引发了一些忧虑( Cronin, 2001):在当代语境下,作者名单上的名字究竟意味着什么?换言之,署名作者是否还能等同于创作者?此外,随着署名作者人数的增加,还有人就集体责任该如何界定提出疑问( Croll, 1984):一篇 100名作者署名的论文与只有一个或几个作者署名的论文是否属于同类论文? King( 2012)指出,署名作者人数超过1000人(称为超大规模作者署名: Cronin, 2001)的论文数量在持续增长。此类论文集中在物理领域,包括国际空间观测台和CERN的论文。Cronin( 2001)得出结论称,超大规模作者署名标志着研究性质的变化。人口研究、流行病学、气候变化、粒子与空间科学这些科研工作面临的重大挑战需要大型团队来应对,随之而来的就是设备、数据收集、纵向研究和分析处理方面的投资需求。对于重大创新,单一研究者的模式已经不太可行。作者署名模式向研究分析师和政策制定者提出了三个问题。首先是如何记录、了解作者署名模式的变化,并确定这些变化属于学科特有现象还是全球普遍现象。其次,出版物的学术影响与愈发庞大的署名作者人数之间是否存在关联,以及超大规模作者署名出版物是否应自成一类,以便分析。第三点是本文没有涉及的一个问题有众多署名作者的论文如何界定其贡献归属(参见 Waltman和Van Eck , 2015)。一篇 100名署名作者的论文与只有一个或几个署名作者的论文是否属于同类论文?5有多少作者? 有多少国家?为了揭示近年来作者署名的总体趋势和当前分布情况,我们研究了2009-2018年间在Web of Science所标引的期刊中,被明确认定为“研究论文(articles)”(非综述或其他文献类型)的1570万篇文献。第一个五年(2009-2013)有690万篇论文;第二个五年(2014-2018)有880万篇论文。正如学术文献所示,作者署名呈现出偏斜分布的状态;大部分论文都只有为数不多的几个署名作者,很小一部分论文有着为数众多的署名作者。另有1414篇论文为“零”署名作者;这些论文为团体署名,其中农业科学论文占60% 。这一时期最常见的署名作者人数是3人(图 1-左)。超过 1000万篇论文(占论文总数三分之二以上)的署名作者人数不超过五人, 1490万篇论文(占论文总数近95% )的署名作者人数不超过10人。这是一项重要的背景统计;虽然多作者署名现象的确有所增加,同时超大规模作者署名现象目前也相对比较常见,但署名作者只有少数几人的论文仍占据研究文献的主流。有大量署名作者的论文依然相对稀少。各国分布情况(图1-右)也提供了重要参考信息目前最常见的情况是所有作者均来自同一国家。鉴于国际合作的增加,这一发现有些出人意料。不过,虽然国际合作网络在欧洲十分常见,但我们最近的G20国家数据分析报告显示,美国大约三分之二的研究论文来自本国,而中国大约四分之三的论文来自本国( Adams et al.,2019)。在亚洲和拉美的众多国家和地区,国际合作网络仍在发展中。图 1为多作者署名模式提供了重要的现实参照:对于何为典型,我们需要谨慎判断。作者署名模式可能有变化,但没有证据表明传统模式遭到颠覆。接下来我们来审视近些年变化的证据。具体做法是将近5 年( 2014-2018)的作者署名分布情况与前一个5 年( 2009-2013)相比较(图 2)。在这两个时期,署名作者人数出现增加。在按作者人数分类的组别中,大多数组别的署名作者人数增幅相似,不过有两点值得关注。首先,相比其他组别的大幅增长,有1-5名署名作者的论文数量增幅较小。其次,有证据表明,拥有大量署名作者( 100)的论文数量有所变化,拥有100-500名署名作者和500-1000名署名作者的论文数量在两个时间段较为接近,而1000名署名作者以上的论文数量则大有增加。当按国家归属来分析论文作者署名情况时,跨国作者署名频次的增长要明显得多。相比 1-5个国家的组别,最多 30个作者国家组别的数量增长更多,而 31-40个作者国家的出现频次则有所下降。 40个以上作者国家的组别却大幅增长。在截至2013年的时间段,作者国家数量超过50个的论文只有3篇;而从2014年起,这些组别的论文数量十分庞大,某些论文甚至归属100多个国家。署名作者人数超过1000人的论文数量大幅增加。6图1在Web of Science论文记录涵盖的10年( 2009-2018)时间内,按署名作者人数划分的论文数量(左)和按作者所属国数量划分的论文数量(右)。这些结果与Waltman和Van Eck ( 2015)得出的结果比较接近。图2作者署名模式的变化情况按作者和国家地址划分。2009-2013和2014-2018年间Web of Science所标引的论文数据。6Article count100Authors101102103104105106107108156101115 1620 2130 31505110010150050110001001+Article count100Unique countries101102103104105106107108156101120 2130 3140 4150 5160 618081100101+20092013 20142018 20092013 20142018Figure 2. Changing profiles of authorship by unique individuals and by unique country addresses. Data for articles indexed in Web of Science for 2009-2013 and 2014-2018.Article count (millions)0 2 4 6 8 100.00.51.01.52.02.5Article count (millions)0 2 4 6 8 10024681012Figure 1. The frequency of articles by count of authors (left) and by count of countries identified in author affiliations (right), for 10 years (2009-2018) of Web of Science publication records. These results compare favourably to those of Waltman and van Eck (2015).6Article count100Authors101102103104105106107108156101115 1620 2130 31505110010150050110001001+Article count100Unique countries101102103104105106107108156101120 2130 3140 4150 5160 618081100101+20092013 20142018 20092013 20142018Figure 2. Changing profiles of authorship by unique individuals and by unique country addresses. Data for articles indexed in Web of Science for 2009-2013 and 2014-2018.Article count (millions)0 2 4 6 8 100.00.51.01.52.02.5Article count (millions)0 2 4 6 8 10024681012Figure 1. The frequency of articles by count of authors (left) and by count of countries identified in author affiliations (right), for 10 years (2009-2018) of Web of Science publication records. These results compare favourably to those of Waltman and van Eck (2015).论文数量(百万篇)论文数量(百万篇)论文数量(百万篇)论文数量(百万篇)Article countArticle countArticle count (millions)Article count (millions)署名作者人数署名作者人数署名国家数量署名国家数量Article countArticle countArticle count (millions)Article count (millions)Article countArticle countArticle count (millions)Article count (millions)Article countArticle countArticle count (millions)Article count (millions)7是否所有领域都有多作者论文?总体趋势很明显:多作者论文数量相对增加,多国作者论文数量大幅增加。这一规律是涉及所有领域,还是仅限于特定研究领域?为探究这一点,我们将Web of Science数据映射至 Web of Science基本科学指标( ESI)中的主要学科。一共有21个学科,涵盖化学和物理学等宽泛领域,外加一个多学科类别,涵盖自然和科学等期刊(表1 )。各个学科之间差异显著。在大多数领域,最常见的署名作者人数是 1-5人。而在生物医学领域,其中有些学科十年间论文发表量超过 100万篇,署名作者人数则趋向于进一步增加。例如在临床医学、微生物学和分子生物学领域,超过10%的论文有10名以上署名作者。在免疫学领域,这一比例接近20% 。与之形成鲜明对比的是植物与动物学,拥有10人或10人以上署名作者的论文约占3% 。物理学和空间科学独树一帜。在这些领域,署名作者人数很少的论文依然普遍(署名作者不超过五人的论文占比分别为74%和 66%),但超大规模作者署名论文的数量多于其他学科(署名作者超过50人的论文分别占0.6%和1.5%)。这些模式表明不同领域之间存在科研文化的差异。目前看来,生物医药学领域目前普遍需要大型团队。而物理学仍然坚持传统的小团队模式,同时也支持需要大规模“超级合作”的工作。社会科学的论文署名作者人数一般较少,数学和工程学也是如此。事实上,10人以上署名的社会科学类论文一旦占比超过1% ,或许就标志着这一领域的文化正在经历转变,因为个人和小团队研究一直是社会科学领域的标准范式。表1按基本科学指标(ESI) 学科划分的Web of Science ( 2009-2018)论文署名作者人数相对频次(以学科类别内的百分比显示)。 7Do all fields have multi-author publications? The overall trend is clear: a relative growth in the numbers of multi-authored articles and a substantial increase in the numbers of articles with authors from many countries. Does this pattern extend across all fields or is it limited to specific research areas?To explore this we assigned our Web of Science data to the major discipline categories in Web of Sciences Essential Science Indicators (ESI). There are 21 categories covering broad areas like Chemistry and Physics plus a Multidisciplinary category, covering journals like Nature and Science (Table 1).There are marked differences between categories. The most common authorship count remains 1-5 in most fields, but in thebiomedical categories some of which have more than one million articles published over the 10-year period this has shifted towards higher counts. For example, in Clinical Medicine, Microbiology and Molecular Biology more than 10% of articles have more than 10 authors and in Immunology this is almost 20%. That contrasts with related areas such as Plant the bar within it is the median for the range. The bar above the box marks 1.5 times the interquartile range (following Tukey: see McGill et al., 1978) and the values beyond that are then high outliers.Figures 4 and 5 show the frequency distribution for the number of articles, in a bar chart, and CNCI (Category Normalized Citation Impact), in a boxplot, for different groups of author and country numbers, respectively. 论文数量CNCI署名作者人数