AER | 空气污染的死亡率和医疗费用:来自风向变化的证据
01 背景与问题
严重的空气污染会对人类健康产生负面影响,这引致许多国家对空气污染水平进行监管。准确量化污染减少对健康的边际影响对于制定最佳环境政策至关重要,特别是对于污染水平相对较低的富裕国家来讲,因其进一步减少污染所付出的代价更高而使得这一问题更具有研究性。
然而,有大量证据表明,估计污染对健康的因果效应常存在遗漏变量偏差,测量误差以及单独识别不同污染物的影响等问题。以往研究中使用貌似外源性污染变化源的准实验研究通常局限于狭窄的地理和时间尺度,从而引发外部有效性问题。此类研究也难以测度诸如死亡率这种样本量相对较小但又重要的指标的变化。特别在考虑哪些群体最容易受到污染等异质性时,这一问题显得更加严重。
本文对急性(短期)细颗粒物(PM2.5)暴露对老年人死亡率、医疗服务使用和医疗费用的影响进行了首次大规模、准实验性调查。通过将老年医疗保险受益人的总体管理数据与1999-2013年覆盖美国大部分地区的日常污染数据相结合,克服了前述问题。本文利用风向变化作为工具变量来估计PM2.5对健康的因果效应,还采用机器学习技术来估计急性污染暴露导致的寿命损失,并系统地量化了不同预期寿命人群之间个体处理效应的异质性。
02 数据和方法
文章主要包括空气污染、大气条件以及健康福利(死亡率、疾病状况和医疗费用)三方面的数据。其中,PM2.5、O3、CO、SO2 、NO2等空气污染数据来自美国环保局(EPA)空气质量系统数据库。风速、风向、温度以及降水等大气条件数据来自北美区域再分析(NARR)数据库。死亡率、疾病状况和医疗费用等健康福利数据来自医疗保险管理数据库,样本涵盖所有65至100岁的保险受益人,占美国老年人的97%以上。具体而言,受益人的死亡日期、年龄、性别和居住县数据来自医疗保险登记文件;医疗服务的使用和费用数据来自医疗保险提供者分析和审查文件,该文件报告了参加付费服务(FFS)医疗保险的任何受益人在医院或专业护理机构的每次住院信息,包括入院日期、住院时间和住院总费用以及门诊索赔记录等;27种慢性疾病(如心脏病、慢性阻塞性肺病、糖尿病和抑郁症) 的个体水平指标来自主受益人摘要文件的慢性疾病部分。
本文分别估计了空气污染对老年人死亡率、医疗服务使用情况以及寿命损失的影响。模型设定如下:
03 结论
第二,在估计寿命损失时,随着控制条件的逐步严格,预期寿命损失逐渐减少,从Cox基本模型的9.66(PM2.5每日增加1μg/m3,每百万保险受益人寿命损失9.66年),到在模型中加入年龄、性别、慢性病变量后的3.90,再到两种机器学习算法的3.05和2.99(见表3)。可以看出,通过使用机器学习算法和来自详细医疗保险数据的健康信息,本文对总寿命损失的估计不到仅考虑年龄和性别的估计量的一半,也不到仅基于平均医疗保险受益人预期寿命的估计量的三分之一。这一结果表明,如果不考虑死者的健康状况,就会夸大空气污染减少带来的死亡率下降的好处。同时,作者还进一步进行了死亡率价值的测算,结果显示,1999-2013年间,全国PM2.5的减少导致老年人死亡率降低所带来的收益约为每年240亿美元,医疗费用的减少大约每年15亿美元。
表3 基于工具变量估计的PM2.5
对老年人寿命损失的影响(根据不同生存模型)
第三,异质性分析显示,无论使用总死亡率风险、相对死亡率风险还是预期寿命损失数来衡量空气污染对健康影响的脆弱性,预期寿命水平低的个体均最为脆弱(见表4)。但污染的最大社会成本部分是由预期寿命为5-10年的人承担(样本的29.8%,承担寿命损失总成本的37.8%),其次为2-5年的人。CDDF机器学习方法也证实了异质性的存在,确定了大约25%的老年人容易受到急性污染的影响。
表4 基于工具变量估计的PM2.5
对老年人寿命损失的影响(根据预期寿命分组)
最后,本文做了一系列延伸性探究和稳健性检验来证明结果的可靠性,包括:控制其他污染物;扩大结果计量的时间窗口;证实工具变量的局部平均处理效应;证实污染变化主要通过风向来自非本地的传输;采用不同类型的固定效应和天气控制以及不同数量的工具变量滞后期;探究PM2.5对四类死因的影响;工具变量有效性的检验;使用未来PM2.5测量值进行安慰剂检验;剔除高风速的观测值;考虑污染监测器的进出等因素,所有结果均稳健。
04 创新点
第二,本文首次将Chernozhukov等人(2018)的关于异质处理效应的通用机器学习推理方法应用于准实验研究设计。
第三,本文的方法允许分别确定多种污染物对死亡率的因果影响。并发现PM2.5与死亡率的关系比其他污染物的关系更为密切。
第四,相对于以前利用风变化的准实验设计,本文的IV方法不需要了解一个区域的详细布局(例如,道路、河流和人口中心的位置)或识别空气污染源。因此能够在广泛的地理范围和较长的时间内利用PM2.5的变化,估计对罕见健康结果(如死亡率)的影响,并探索处理效应的异质性。
05 思考
本文用来估计死亡率成本和识别易受空气污染影响群体的方法可应用于其他情况。CDDF方法的灵活性合理地证明了机器学习方法通常出现的可解释性降低的现象。在本文中,预期寿命法和CDDF法揭示了相似的异质性结果,但如果易受影响的人群与总体健康不一致,那么这两种方法的结果可能会有所不同。
本文估计了空气污染对65岁以上老人的影响,其所用到的机器学习方法值得深入探讨,为更准确地探索空气污染对更广泛群体的影响提供了良好的工具。
*文章来源:3E经典论文
*侵权必删
学术前沿速递
学说观点
AIGC交流社区
未央网
毕宣
王凯
- 1
- 2
- 3