![](https://financial-search.oss-cn-beijing.aliyuncs.com/rtc/plan/f69e1705760c47fb81fb331bef45deaf.jpg?x-oss-process=image/resize,w_240/quality,q_90)
【计量经济学】基于合成控制法的双重差分(Synthetic DID)
![](https://financial-search.oss-cn-beijing.aliyuncs.com/financial/20220324/16262154817c39.jpg)
简介
在使用面板数据估计外部冲击或政策变化的影响时,目前常用的两种方法为:合成控制法(Synthetic Control,下称SC)与双重差分法(Difference in Differences,下称DID)。在实证中,若实验组拥有大量个体且数据满足平行趋势假设时,我们通常使用双向固定效应DID;若实验组仅含有一个个体(或非常少个体)、无法满足平行趋势假定时,我们则可以使用SC。虽然这两种方法的应用范围不同,但证明这两种方法的基本假设是密切相关的。于是Arkhangelsky et al.(2021)结合了这两种方法各自的优点,提出了一种新的方法——Synthetic Difference in Differences(SDID)。理论上,本文给出了估计量一致性和渐进正态性条件;实证上,该方法相较于DID与SC则更具有优势。
01 Horizontal and Vertical Regression
为了简化问题,我们假定一个含有 T 期、N 个个体的面板数据,记为个体 i = 1,...,N,时间 t = 1,..,T。个体 1~N-1 在整个样本期内均未受到政策冲击;个体 N 在第 T 期受到政策冲击。因此 1~T-1 期为pretreatment 期间,下称pre期,第 T 期则称为post期。
研究者可以观察到的结果变量数据表示为:
其中,下标 t 表示实验组,c 表示控制组;括号中 1 表示在该期受到政策冲击,0 表示在该期未受到政策冲击。因此矩阵Yt,post(1)表示实验组在post期受到政策冲击时的结果变量,矩阵Yc,post(0)表示控制组在post期未受到政策冲击时的结果变量。
但我们感兴趣的因果效应取决于Yt,post(1)和Yt,post(0)。Yt,post(0)表示若未受到政策冲击,实验组在 post 期的结果变量,是不可观测的。因此则需要通过对Yc,post(0)、Yc,pre(0) 和Yt,pre(0)进行建模并估计出反事实Yt,post(0)。估计方法主要分为“Horizontal Regression”和“Vertical Regression”,下面将分别介绍这两种估计方法的思路。
1、“Vertical Regression”:对Yc,pre(0)和Yt,pre(0)进行建模,并假设Yt,post(0)和Yc,post(0)之间的关系与之前一样,进而可以估计出反事实Yt,post(0)。该方法适用于T远远大于N的情况。
Doudchenko & Imbens(2016)指出SC中的个体权重可以视为Vertical Regression的估计参数:
![图片](https://financial-search.oss-cn-beijing.aliyuncs.com/financial/20220427/091029635bf56a.jpg)
![图片](https://financial-search.oss-cn-beijing.aliyuncs.com/financial/20220427/091029768c0687.jpg)
![图片](https://financial-search.oss-cn-beijing.aliyuncs.com/financial/20220427/0910298899b355.jpg)
![图片](https://financial-search.oss-cn-beijing.aliyuncs.com/financial/20220427/091029997de712.jpg)
2、“Horizontal Regression”:对Yc,post(0)和Yc,pre(0)进行建模,并假设Yt,post(0)和Yt,pre(0)之间存在一样的关系,进而估计出反事实Yt,post(0)。当 N远远大于T或结果变量存在自相关时,这种估计方法则更合理。Unconfoundedness type regression则体现了这种思想:
该回归中包含 T-1 个自变量和 N-1 个观测个体。 表示根据时间权重
与截距项
估计出的实验组反事实的结果变量。
总的来说,Vertical Regression关注的是个体之间在时间维度上的稳定的关系;Horizontal Regression关注的则是结果变量在时间路径上的相关性,也就是结果变量与其滞后期的关系。这两个方法要么仅关注时间维度(over time),要么仅关注个体纬度(across units)。而双向固定效应模型就是一个很好的综合方法,它可以捕捉时间和个体之间的差异。但双向固定效应did中个体权重均为控制组个体的倒数,时间权重均为pre期数的倒数,当政策不是随机分布时,平行趋势假设则可能无法得到满足。
以往,研究者往往需要从这三个方法中选出最合适的方法进行估计。而SDID则结合了这三种方法的优势,也可以使研究者不再纠结于方法的选择。
02 SDID估计方法、过程与应用
1、SDID估计方法与过程
在下文,我们对于包含 T 期和 N 个个体的面板数据的设定稍有改变。假定第1~Nco 个个体从未受到冲击;第 Nco+1~N 个个体在第 Tpre+1~T 期受到政策冲击。Nco+Ntr=N,Tpre+Tpost=T。哑变量Wit 表示是否遭受政策冲击。
如上文所述,SC可表示为仅包含时间固定效应的加权线性回归(加入截距项):
DID为包含个体固定效应和时间固定效应的未加权回归:
SDID则是包含时间固定效应和个体固定效应的加权回归:
其中,个体权重可以给与实验组更相似的控制组个体赋予更高的权重,其通过以下最优化问题得到:
相较于Abadia et al.(2010)的SC,2.1式在估计个体权重时不仅加了截距项,还加了惩罚项以解决过拟合问题,提高选择出的控制组的分散性。ζ 为正则化参数,计算方法如下:
时间权重可以给与post期更相似的pre期赋予更高的权重,其由以下最优化问题得到:
与个体权重不同的是,计算时间权重的最优化问题中没有加入惩罚项,这反映了该估计方法允许相同个体在不同时间的观测值具有很强的相关性。
综上,SDID的估计过程可以简述为以下四步:(1)由2.2式计算出正则化参数ζ;(2)由2.1式计算出个体权重;(3)由2.3式计算出时间权重;(4)由下式计算出SDID估计参数:
2、应用
将以上三种方法应用在估计加州禁烟法对人均香烟消费量影响的案例里(具体政策背景参考Abadia et al.(2010)或【论文推荐】合成控制法介绍及其应用),结果对比如下图所示:
红线表示加州人均香烟消费量的现实数据;蓝线在 DID 中表示控制组人均香烟消费量的平均数,在 SC 和 SDID 中表示控制组人均吸烟量的加权数。在下面的三幅图中,圆圈的大小则表明了控制组中不同洲的权重大小。可以看出 DID 控制组中不同个体的权重相等;SC 控制组中权重大于 0 的个体较少且正权重的数值差异较大;SDID 控制组中权重大于 0 的个体较多且个体之间的权重也具有一定的差异。
上面三幅图的底端表示 pre 期不同年份的时间权重大小。DID中各年份的时间权重相等;SC中各年份的时间权重为 0;SDID中,1986-1988年的时间权重为正,其余为0。
另外,下面三幅图的纵轴可以理解为将最终估计出的因果效应按照个体权重分配到每个控制组个体上的大小情况,具体表示在 post 期,经过调整后的state-by-state人均香烟消费量差异,计算方法如下:
从图中可以看出在SC和DID中,控制组中某些洲对估计结果影响较大(New Hampshire),而SDID加入时间权重后,则不存在这种情况。
本文作者在以下地址给出了R包和范例data:https://github.com/synth-inference/synthdid/tree/sdid-paper
03 安慰剂研究
Bertrand et al.(2004)通过随机分配一个控制组的子集作为安慰剂实验组,其余的作为控制组,以此来研究不同的 DID 估计量的表现,即估计参数对0的覆盖程度。结果发现当数据存在序列相关时,不考虑它的DID估计量会过度拒绝零假设。
本文在参考该方法的同时进行了改动。作者认为现实世界中,政策的颁布并不都是随机分布的,它在不同地区间、不同时间上实行的概率可能不尽相同。在做安慰剂检验时,设置的安慰剂实验组分布应该尽可能地与现实相符,而非仅仅随机分配。若政策在地区间的分布与地区间的系统性差异有关,那么不考虑这点的估计量将是有偏的,但基于随机分布规则的安慰剂研究得出的估计量表现却可能是良好的。
于是本文根据美国CPS数据库生成了一套数据进行安慰剂研究。数据生成过程较为复杂,这里不进行赘述。最终生成的数据具有以下特征:(1)数据生成的过程基于latent factor model(也被称为交互固定效应模型);(2)结果变量是基于现实数据计算出的平均工资;(3)政策在地区上的分布服从于伯努力分布,概率是由现实中的实际政策与个体固定效应和交互固定效应的关系决定的,比如最低工资政策、堕胎法与枪支法,用该方法模拟的安慰剂实验组分配情况可以反映各州的实际差异;(4)误差项的分布是通过将残差项进行AR(2)拟合得到的;(5)政策分布不取决于误差项,满足外生性。
安慰剂研究的结果如图所示:
由图可见,若安慰剂实验组是随机分配的,那三种方法估计出的参数都是无偏的,但SDID的均方根最小,即更精确。但若安慰剂实验组并非随机分配,而是基于最低工资政策,SDID在减小偏差和精确度方面的表现都是最好的。
04 小结
研究者常用SC与DID去评估外部冲击或政策变化的影响。虽然这两种方法的应用范围不同,但证明这两种方法的基本假设是密切相关的。于是本文结合了这两种方法各自的优点,提出了一种新的方法——Synthetic Difference in Difference(SDID)。
现实中的政策分布在地区之间与时间上往往不是随机的,SDID不仅通过个体权重找到与实验组相近的控制组个体并赋予其较大的个体权重,还通过时间权重找到与post期相似的pre期并赋予其相对较大的时间权重。实证应用上,该方法相较于DID与SC则更具有优势;理论上,本文还提出了该估计量一致性和渐进正态性的条件,本推送不做赘述,可参考原文。
Abstract
We present a new estimator for causal effects with panel data that builds on insights behind the widely used difference-in-differences and synthetic control methods. Relative to these methods we find, both theoretically and empirically, that this "synthetic difference-in-differences" estimator has desirable robustness properties, and that it performs well in settings where the conventional estimators are commonly used in practice. We study the asymptotic behavior of the estimator when the systematic part of the outcome model includes latent unit factors interacted with latent time factors, and we present conditions for consistency and asymptotic normality.
*文章来源:劳动经济学与社保研究
*侵权必删
![](https://financial-search.oss-cn-beijing.aliyuncs.com/financial/20220324/16262154817c39.jpg)
![](https://financial-search.oss-cn-beijing.aliyuncs.com/rtc/plan/d6da1e238d6e1b626666bd5c84dd5c8a.jpg?x-oss-process=image/resize,w_151/quality,q_90)
![](https://financial-search.oss-cn-beijing.aliyuncs.com/rtc/plan/24e9bb1a1f0a64542df9e99c76abcef5.jpg?x-oss-process=image/resize,w_151/quality,q_90)
![](https://financial-search.oss-cn-beijing.aliyuncs.com/rtc/plan/ef0f713a0bf3053701df5553404ec24e.jpg?x-oss-process=image/resize,w_151/quality,q_90)
![](https://financial-search.oss-cn-beijing.aliyuncs.com/rtc/plan/c619aa04be14f444debc8451a70a3722.jpg?x-oss-process=image/resize,w_151/quality,q_90)
![](https://financial-search.oss-cn-beijing.aliyuncs.com/rtc/plan/a2e4aaac528ebbf9b87317d0fe9e7466.jpg?x-oss-process=image/resize,w_151/quality,q_90)
![](https://financial-search.oss-cn-beijing.aliyuncs.com/rtc/plan/a304e09282f3df7a8e6ff9b6a75dc0e7.jpg?x-oss-process=image/resize,w_151/quality,q_90)
![](https://financial-search.oss-cn-beijing.aliyuncs.com/financial/20211214/181128764b1508.jpg?x-oss-process=image/resize,w_46/quality,q_90)
学术前沿速递
![](https://financial-search.oss-cn-beijing.aliyuncs.com/financial/20211214/180416774eb213.jpg?x-oss-process=image/resize,w_46/quality,q_90)
学说观点
![](https://financial-search.oss-cn-beijing.aliyuncs.com/financial/20230525/173824368bc13.jpg?x-oss-process=image/resize,w_46/quality,q_90)
AIGC交流社区
![](https://financial-search.oss-cn-beijing.aliyuncs.com/financial/20211213/163057416bdaeb.jpg?x-oss-process=image/resize,w_46/quality,q_90)
未央网
![](https://financial-search.oss-cn-beijing.aliyuncs.com/financial/20220124/1048288253d949.jpg?x-oss-process=image/resize,w_46/quality,q_90)
毕宣
![](https://financial-search.oss-cn-beijing.aliyuncs.com/financial/20220121/2314195035a67a.jpg?x-oss-process=image/resize,w_46/quality,q_90)
王凯
- 1
- 2
- 3