田野实验:社会科学研究新方法
我们通常所说的科学(包括自然科学和社会科学)可以分为两类:一类是以数学和逻辑为代表的,以分析方法为核心的科学,核心是从一系列公理系统出发演绎出一套命题;另一类是以物理学、经济学为代表的,以对经验事实的总结为基础、进而提出理论即因果关系的科学。我们称后者为实证科学或经验科学。一般来说,实证科学提出的任何命题都要进行实证性的验证。我们通常用实验的方法来做这种验证。
传统实验方法主要是人工可控实验和自然实验
在实证科学中,实验方法又可以分为人工可控实验和自然实验。前者的典型案例如著名的伽利略“两个铁球同时落地”实验,推翻了亚里斯多德“物体下落速度和重量成比例”的学说。就自然实验而言,科学史上最著名的案例可能是1919年5月29日的日食现象。这一天,爱因斯坦的广义相对论在非洲和巴西的日全食中得到了验证——爱因斯坦的理论预计光束的路径通过质量足够大的物体周边会被该物体引力弯曲,而星光绕太阳弯曲则能验证这点。日全食时,人们确实观测到太阳周边背景上恒星位置和平常观测到的位置不同,这就证实了其广义相对论的预测。在这里,平常恒星的位置是实验“控制组”,而日全食时恒星位置则是“对比组”。人们通过外来的因素“日食”找到了自然形成的控制组和对比组,进而验证了爱因斯坦的理论。
以上例子都来自自然科学,社会科学的情形既与此类似又有区别。在社会科学研究中,人们也广泛使用人工可控实验的方法,如社会心理学大量使用实验室实验,通过给受试不同的刺激物来观察某一刺激物与刺激后果间的因果关系。不过,人工可控实验在社会科学研究中也遇到一系列瓶颈,主要是研究的外部有效性问题:人们往往不能确信在实验室中发现的规律在多大程度上能够推广到真实世界中。
与此相比,自然实验的方法一般不存在外部有效性问题。这是因为,自然实验研究的是社会生活中自然形成的现象,这些现象恰好形成了类似于实验室实验的处理组和对比组。比如,研究者发现,淮河以北一纬度内的城市,其空气中可悬浮颗粒物比淮河以南一纬度的城市高70%,而北部城市人均寿命低于南部城市5.5年。由于南北城市在GDP、人口数量、产业布局等要素上同质性很强,研究者判断寿命的差异是由空气污染造成的。在这里,淮河沿线南北城市互相构成了对方的对比组,形成了一个很好的自然实验。实际上,自然实验是当代实证经济学上最被广泛接受的研究方法,又演化成为了如双重差分法、断点回归、工具变量等较为成熟的计量设计。
显然,自然实验方法有其应用上的限制:并不是所有我们关心的问题都恰好能对应由自然状态形成的实验,因而,研究的范围在很大程度上受限于可得的数据和信息。另外,在社会科学中,人们也很难像在实验室中那样自如地控制实际社会经济生活,这更加限定了自然实验方法的应用范围。
田野实验观察现实中的因果关系
那么,有没有一种研究方法,既能解决外部有效性问题,又能使研究者介入社会生活,通过改变刺激物来观察现实中的因果关系呢?近些年来,社会科学领域出现了一类新型研究方法——田野实验,实现了类似的功能。田野实验既不同于在实验室中进行的人工可控实验,它通常涉及对真实世界的介入和干预;也不同于由独立于研究目的的事件引发的自然实验。它在方法上既包含了对现实的干预,又超出了实验室之外,描述了真实世界的规律。
在一项发表在《美国国家科学院学报》的研究中,来自耶鲁大学生物学、心理学、管理学等多个专业的研究者希望测试科研机构培养科学家时是否存在性别歧视。他们制作了两份内容一样的简历,唯一的区别是简历人的姓名:一份简历写着典型的男性姓名,另一份写着典型的女性姓名。研究者将简历投给了美国数百家高校的科学实验室,应聘研究助理职位。结果是,即便简历内容一样,男性姓名简历得到了显著更高的评分以及更多的回复和面试机会。这验证了美国科学领域性别歧视的广泛存在。在一项类似的研究中,来自芝加哥大学布斯商学院的研究者玛丽安·伯特兰德(Marianne Bertrand)教授用同样的方法研究了劳动力市场上的性别歧视和种族歧视。她制作了相同的求职简历在西雅图和芝加哥等地的报纸上刊发,试图找到工作。结果是,姓名指代男性和白人的简历得到了显著更多的回复和面试机会。这证明了美国就业市场上歧视现象的存在。
另一项研究中,哈佛大学的拉杰·切蒂(Raj Chetty)与一家超级市场合作研究消费者行为。他们先观察超市商品价牌标价不含税时的销售量,再改变价牌标示方式,使其价格包含税金,进而观察同类商品销售量。研究者发现,虽然这两种标价方式下消费者支付的全款是相同的,但在价牌标价含税时,即消费者第一眼看到的价格更高时,商品的销售量显著降低。这一研究通过介入价格标示体系,展现了消费者决策中的非理性因素。
在美国经济学界,最著名的运用田野实验方法的研究者当属芝加哥大学经济学系的约翰·李斯特(John List),其著作《“为什么”向度:隐藏动机和未发现的日常生活经济学》(The Why Axis: Hidden Motives and theUndiscovered Economics of Everyday Life)也是一本经济学领域的名著。在这项研究中,李斯特在厦门万利达集团进行了为期6个月的实验。他将工人分为两组,其中一组获得的激励是“如果你们小组的平均生产效率超过每小时400件,你每周会获得80元的奖金”。另外一组获得的激励是“你们会获得一次性的奖金320元。但是,如果某个星期你们小组的平均生产效率低于每小时400件,你的工资会减少80元”。他发现相比奖励,惩罚对提高生产力更有效果。显然,害怕失去现有利益比增加预期收益对工人的激励更强——虽然这两者的经济实质是相同的。这巧妙地验证了行为经济学中著名的框架效应,即人们对损失的厌恶超过对同等收益的偏好。
以上的三个例子体现了田野实验的两个重要特点。第一,田野实验通过巧妙地介入实际社会经济生活而验证一定的命题,有着实验室实验人工可控、自由灵活的特点。第二,这种实验通常在实际生活中进行,其外部有效性或结论的可推广性,比一般的实验室实验更为可靠。显然,田野实验是一种结合了人工可控实验和自然实验两者优点的研究方法。事实上,它也在当今的社会科学,特别是经济学研究中崭露头角,甚至成为学界最为追捧的研究方法。
同时,这一方法也逐渐从经济学领域迁移到了其他社会科学领域。比如,在法学研究中,学者以田野实验的方式研究了以色列一家幼儿园如何惩罚放学时迟到接回儿童的家长。一开始,幼儿园将迟到的家长姓名公布;随后,幼儿园取消了这种声誉惩罚措施,而改成金钱惩罚。研究者发现,改为金钱惩罚后,迟到的家长明显增多。最后,幼儿园又恢复了声誉惩罚措施,但这时迟到家长数目并没有明显降低。这说明已有的声誉机制和社会规范一旦经资本化而瓦解后,很难重建和恢复。
田野实验的伦理边界亟待关注
当然,田野实验也面临着一些困难。第一是成本。并非所有田野实验都能以较低的成本实施,如上述李斯特教授的田野实验,就要耗费研究者本身和实验所在工厂较多的时间、精力和金钱,而工厂也要承受工人工作量波动带来的可能损失。第二是伦理上的限制。有些研究领域并不适宜开展田野实验,如以色列幼儿园的这项田野实验,实际上就使得原本温情的伦理惩罚机制彻底瓦解。因而,什么是田野实验的伦理边界,也成为学术界日益重视的问题。目前,在美国的大学和研究机构,研究者在开展介入实际生活的田野实验前都要经过相关伦理审核委员会的批准。
总的来看,田野实验弥补了一些社会科学研究方法的不足,展现了较强的生机和活力。它呼唤研究者走进和介入实际生活,不断用事实和证据验证命题和理论。
*文章来源:中国社会科学报
*侵权必删
学术前沿速递
学说观点
AIGC交流社区
未央网
毕宣
王凯
- 1
- 2
- 3