大规模数据集的出现,使得追踪“科学是怎样运作”成为可能,这激励了来自不同学科背景的研究人员将科学研究的焦点转向科学本身,从而催生了迅速发展的“科学学(Science of Science)”。科学学是针对科学进行整体研究的综合性科学,具备跨学科特征,并且表现为科学观点、科学论文、科学家等尺度不同而相互关联的层次,因而其天然具备复杂系统的特征。最近发表于Nature Human Behaviour杂志的综述文章,从数据、测量和实证方法的角度,审视了“科学学”这一日益增长的跨学科领域的前沿文献。综述探讨了主要实证方法的目标、优势和局限性,以期深化对科学学领域多元化研究方法的理解,并为研究人员提供更多的研究工具。总体而言,新的实证研究方法为我们提供了强大的能力,可以检验关于科学的传统观念和理论框架,发现影响科学生产力的因素,预测科学研究的结果,并制定出有助于推动科学进步的政策。
Lu Liu, Benjamin F. Jones, Brian Uzzi & Dashun Wang | 作者
刘培源 | 译者
Data, measurement and empirical methods in the science of science
科学进步是提高生活水平、健康状况以及社会应对重大挑战(从气候变化到COVID-19大流行[1,2,3])的关键因素。对“科学怎样运行”和“创新在哪里发生”的更深入理解,可以帮助我们更有效地设计科学政策和科学机构,更好地为科学家自身的研究选择提供信息,并为科学和人类创造和捕获巨大价值。基于这些关键前提,近年来,“科学学”(Science of Science)领域取得了重大发展[4,5,6,7,8,9],利用大规模数据集和多样化的计算工具包揭示科学产出和科学应用背后的基本模式。
将科学方法本身作为研究对象的想法由来已久。自20世纪中叶以来,来自不同学科的研究者们一直在探讨关于科学进步的本质,以及科学研究的实践、组织和影响等核心问题。基于这些丰富的历史根源,科学学领域汲取了许多学科的知识,包括信息科学、社会科学、物理科学、生物科学、计算机科学、工程学和设计学等。科学学与元科学、科学计量学、科学经济学、研究方法学、科学技术研究、科学社会学、元知识和定量科学研究等多个研究领域和学术群体,有着紧密的联系[5]。这些群体之间存在一些明显的差异,主要体现在它们的历史起源和最初的学科组成上。例如,元科学(metascience)起源于临床科学和心理学,主要关注严谨性、透明度、可重复性以及其他与开放科学相关的实践和主题。科学计量学社区起源于图书馆和信息科学,特别强调发展稳健和负责任的科学度量和指标。科学技术研究(Science and technology studies)关注科学技术的历史、科学哲学以及科学、技术和社会之间的相互作用。科学学则起源于物理学、计算机科学和社会学,采用数据驱动的方法,强调探讨科学是如何运作的。这些学科都为理解科学做出了基础性的贡献。尽管它们在起源上存在差异,但与理解“科学实践及其对社会的影响”这一共同兴趣相比,这些差异显得微不足道。
出版物数据集涵盖了几乎所有科学门类的论文,使得可以分析通用和特定领域的模式。常用的数据集包括Web of Science (WoS),PubMed,CrossRef,ORCID,OpenCitations,Dimensions和OpenAlex。还有一些数据集包含了论文的文本(CORE)[45,46,47],数据实体(DataCite)[48,49]和同行评审报告(Publons)[33,50,51]。这些数据集进一步支持新的测量,例如,表示论文的内容[52,53],新颖性[15,54]和跨学科性[55]。
图1 科学学数据及其联系。这个图展示了科学学中常用的数据类型,每种数据类型中包含的信息以及数据来源的示例。科学学中的数据集不仅规模不断增长,而且已经扩展到了出版物之外,还整合了上游的资金投资和下游的应用,超越了科学本身。
通过对个体职业的分析,研究人员能够解答如下问题:我们应如何衡量个体的科学生产力?典型的职业生命周期是怎样的?资源和荣誉是如何在个体和职业间分配的?学者的职业生涯可以通过其发表论文 [30,31,106,107,108]来探究,其中重点关注的是职业发展与流动性、发表论文的数量及其引用影响,以及他们所获得的资助[24,109,110]和奖项[111,112,113]。
在过去的几十年里,科学界已经从单独作者转向合著,这种转变显著且稳定,尤其在高引用作品中更为明显[18,129,130]。鉴于这种转变,一个研究领域——“团队科学的科学“(the science of team science)[131,132]已经出现,致力于研究促进或阻碍团队效率的机制。团队规模可以通过论文的合著者数量来代理,研究显示,这可以预测不同类型的进步:较大的团队倾向于发展思想,而较小的团队倾向于打破当前的思维方式[17]。团队特性可以从合著者的背景中推断[133,134,135],从而量化团队在领域、年龄、性别或种族方面的多样性。基于合著的合作网络[130,136,137,138,139]提供了微妙的基于网络的指标,以理解个人和机构的合作。
表1 科学学研究中的经验方法类别方法核心目标和贡献描述性和预测性方法经验规律和可推广的事实建立关于科学的观察规律;确认或否定现有的理论或假设;提供激发新理论的新发现 经典回归进行关于变量之间关系的正式假设检验,并估计其精确性和大小 机械模型模拟基本数据生成过程;提供可证伪的形式理论测试 机器学习用多个抽象层次表示数据;提供更高的预测准确性 因果方法匹配和固定效应减少回归估计中的偏差,更接近因果推断;为可能驱动相关性的特征提供更有效的控制 准实验利用数据背景中的固有随机性,允许对变量之间的因果推断 实验在良好控制的环境中构建正式实验,进行因果推断并研究特定的机制和干预措施
1. 经验规律和可推广的事实
科学中经验规律的发现在推动概念发展和未来研究方向方面起着关键作用。通过观察大规模的经验模式,研究人员揭示了塑造科学的核心事实,并呈现了科学进展和实践理论必须解释的核心特征。例如,考虑引用分布。德·索拉·普赖斯(de Solla Price)首次提出引用分布的尾部较重[39],表明少数论文具有极高的引用量,而大多数论文引用量相对较少甚至没有引用。普赖斯提出“引用分布是幂律”,而研究人员后来改进了这一观点,表明该分布呈现对数正态分布,这是一个几乎普遍存在的规律,适用于不同时间和领域[156,157]。引用分布的尾部较重及其在科学界的普遍性反过来引发了大量理论工作,旨在解释这一关键的经验规律[20,156,158,159]。
经验规律通常令人惊讶,并且可能挑战先前对科学工作方式的信念。例如,已经证明,不同领域中伟大成就的年龄分布在中年时期达到顶峰[107,121,160],这与通常认为年轻科学家推动科学突破的普遍信念相悖。对个体职业的更深入研究还揭示,各个人之间的生产力模式存在广泛差异[29]。此外,学者的高影响力论文在其整个工作历程中呈现的频率显著稳定 [30,31]。
2. 回归分析
3. 机制模型
4. 机器学习
图2 机器学习预测的一个例子。这个图示了word2vec skip-gram方法[52],目标是使用先前的科学文献预测材料的有用属性。a,word2vec skip-gram模型的架构和训练过程,三层全连接神经网络从文献中每个单词及其上下文的稀疏向量(输入层)中学习200维表示(隐藏层)。b,单词嵌入的前两个主成分。在二维空间中,具有相似特征的材料靠近,从而允许预测材料的属性。不同的目标单词以不同的颜色显示。
1. 迈向因果关系
2. 准实验
图3 准实验方法。a–c,该图展示了(a)双重差分法、(b)工具变量和(c)回归不连续性方法的示意图。b中的实线表示因果关系,虚线表示在工具变量方法产生因果推断时不允许的关系。
工具变量。另一种准实验方法使用“工具变量”。目标是通过使用第三个工具变量来确定某个特征X对某个结果Y的因果影响。这个工具变量是一种准随机事件,它引起X的变化,并且除了通过X对结果Y产生影响外,对其他方面没有其他影响(图3b)。例如,一项关于天文学的研究,旨在了解望远镜使用时间如何影响科学家职业发展[235]。在这里,不能简单地看望远镜使用时间和职业结果之间的相关性,因为许多混淆因素(如才能或毅力)可能同时影响望远镜使用时间和职业机会。现在考虑天气作为一个工具变量。多云天气将随机减少天文学家的观测时间。然而,特定夜晚的天气不太可能与科学家的固有品质相关。天气可以提供一个工具变量来揭示望远镜使用时间和职业结果之间的因果关系。工具变量已被用于科学学研究中的本地同伴效应[151],科学委员会中性别构成的影响[236],对未来创新的专利 [237]和对发明者流动的税收政策[238]。
3. 实验
