签到
EN

AER | 空气污染的死亡率和医疗费用:来自风向变化的证据

47浏览
2022/03/31 05:37发布
经典论文回顾
经典论文回顾
邀您一起回顾经典论文——AER|空气污染的死亡率和医疗费用:来自风向变化的证据

 

01 背景与问题

严重的空气污染会对人类健康产生负面影响,这引致许多国家对空气污染水平进行监管。准确量化污染减少对健康的边际影响对于制定最佳环境政策至关重要,特别是对于污染水平相对较低的富裕国家来讲,因其进一步减少污染所付出的代价更高而使得这一问题更具有研究性。

 

然而,有大量证据表明,估计污染对健康的因果效应常存在遗漏变量偏差,测量误差以及单独识别不同污染物的影响等问题。以往研究中使用貌似外源性污染变化源的准实验研究通常局限于狭窄的地理和时间尺度,从而引发外部有效性问题。此类研究也难以测度诸如死亡率这种样本量相对较小但又重要的指标的变化。特别在考虑哪些群体最容易受到污染等异质性时,这一问题显得更加严重。

 

本文对急性(短期)细颗粒物(PM2.5)暴露对老年人死亡率、医疗服务使用和医疗费用的影响进行了首次大规模、准实验性调查。通过将老年医疗保险受益人的总体管理数据与1999-2013年覆盖美国大部分地区的日常污染数据相结合,克服了前述问题。本文利用风向变化作为工具变量来估计PM2.5对健康的因果效应,还采用机器学习技术来估计急性污染暴露导致的寿命损失,并系统地量化了不同预期寿命人群之间个体处理效应的异质性。

 

 

02 数据和方法

文章主要包括空气污染、大气条件以及健康福利(死亡率、疾病状况和医疗费用)三方面的数据。其中,PM2.5O3COSO2 NO2等空气污染数据来自美国环保局(EPA)空气质量系统数据库。风速、风向、温度以及降水等大气条件数据来自北美区域再分析(NARR)数据库。死亡率、疾病状况和医疗费用等健康福利数据来自医疗保险管理数据库,样本涵盖所有65100岁的保险受益人,占美国老年人的97%以上。具体而言,受益人的死亡日期、年龄、性别和居住县数据来自医疗保险登记文件;医疗服务的使用和费用数据来自医疗保险提供者分析和审查文件,该文件报告了参加付费服务(FFS)医疗保险的任何受益人在医院或专业护理机构的每次住院信息,包括入院日期、住院时间和住院总费用以及门诊索赔记录等;27种慢性疾病(如心脏病、慢性阻塞性肺病、糖尿病和抑郁症的个体水平指标来自主受益人摘要文件的慢性疾病部分。

 

本文分别估计了空气污染对老年人死亡率、医疗服务使用情况以及寿命损失的影响。模型设定如下:

 

图片

 

 

Ycdmy是包括死亡率、医疗服务使用(住院患者入院率)、医疗支出以及寿命损失等指标在内的结果变量,采用包含d日及其后两日的三日总量计量相关指标;参数β为每日PM2.5的变化对被解释变量的影响系数;X'cdmy为包含温度、降水和风速以及与这些因素相关的变量指标;αc是县固定效应,即对该县健康和污染的地理差异进行控制;αsm是州-月固定效应,即对各州污染、风向和人口健康之间任何与季节相关的因素进行控制;αmy是月-年固定效应,即对样本期内可能由医疗保险或环境政策变化引起的冲击等因素进行控制。

 

本文对工具变量识别的假设是,在控制许多固定效应和气候变量后,一个县的日风向变化与该县死亡率或医疗保健使用的变化无关。且这一识别策略不需要了解一个区域的详细布局(例如,道路、河流和人口中心的位置)或识别空气污染源。这使得本文能够在广泛的地理范围和较长的时间内利用PM2.5的变化,来估计对样本量较小的健康结果变量(如死亡率)的影响,并探索不同预期寿命人群个体处理效应的异质性。因此,本文将风向作为PM2.5的工具变量。

 

对于结果变量Ycdmy,作者首先测度PM2.5对死亡率的影响,其他结果变量衡量医疗服务使用(住院患者入院率)和医疗支出,包括所有住院患者以及其中来自急诊的住院患者。作者还估计了PM2.5对每百万医保受益者总急诊就诊率的影响,包括未导致住院的就诊。在安慰剂试验中,作者考虑了非急诊(计划)入院率,因为其不会受到细颗粒物短期波动的影响。

 

进一步,本文使用寿命损失代替基本模型中的结果变量,并通过Cox模型和逐步Cox模型加入额外的人口、健康变量以及Cox-Lasso和随机生存森林两种机器学习方法对预期寿命进行了预测,进而计算寿命损失。

 

最后,本文通过两种方法分析了空气污染对不同预期寿命人群健康影响的异质性。首先,作者分别估计了各预期寿命人群由于PM2.5而带来的死亡率和预期寿命损失变化。其次,考虑预期寿命低的受益者更有可能死于空气污染,文章进一步使用机器学习方法CDDF来估计这种异质性

03 结论

首先,本文利用风向变化导致的每日PM2.5变化研究其对死亡率、住院率和医疗支出的平均处理效应(见表1、表2)。所有结果均使用OLS和工具变量法分别进行估计,工具变量法的估计结果显著高于OLS。根据工具变量法的估计结果显示,PM2.5每日增加1μg/m3,65岁以上老人中每百万医保受益人死亡人数增加0.69人,占平均死亡人数的17.8%;总住院支出每百万医保受益人增加19339美元,其中因急诊住院的支出增加16446美元;总住院率每百万医保受益人增加2.21人,其中因急诊住院人数增加2.06人;门诊率每百万医保受益人增加2.69人。同时,作者还将估计结果与其他文献进行了对比,结果均高于以往研究,说明以往研究可能系统性地低估了急性污染暴露对健康的影响。

 

基于OLS和工具变量估计的PM2.5
对老年人死亡率的影响(根据年龄分组)

图片

 

基于OLS和工具变量估计的PM2.5
对住院情况的影响

图片

 

第二,在估计寿命损失时,随着控制条件的逐步严格,预期寿命损失逐渐减少,从Cox基本模型的9.66PM2.5每日增加1μg/m3,每百万保险受益人寿命损失9.66年),到在模型中加入年龄、性别、慢性病变量后的3.90,再到两种机器学习算法的3.052.99(见表3)。可以看出,通过使用机器学习算法和来自详细医疗保险数据的健康信息,本文对总寿命损失的估计不到仅考虑年龄和性别的估计量的一半,也不到仅基于平均医疗保险受益人预期寿命的估计量的三分之一。这一结果表明,如果不考虑死者的健康状况,就会夸大空气污染减少带来的死亡率下降的好处。同时,作者还进一步进行了死亡率价值的测算,结果显示,1999-2013年间,全国PM2.5的减少导致老年人死亡率降低所带来的收益约为每年240亿美元,医疗费用的减少大约每年15亿美元。

 

基于工具变量估计的PM2.5

对老年人寿命损失的影响(根据不同生存模型)

图片

 

第三,异质性分析显示,无论使用总死亡率风险、相对死亡率风险还是预期寿命损失数来衡量空气污染对健康影响的脆弱性,预期寿命水平低的个体均最为脆弱(见表4)。但污染的最大社会成本部分是由预期寿命为5-10年的人承担(样本的29.8%,承担寿命损失总成本的37.8%),其次为2-5年的人。CDDF机器学习方法也证实了异质性的存在,确定了大约25%的老年人容易受到急性污染的影响。

 

基于工具变量估计的PM2.5

对老年人寿命损失的影响(根据预期寿命分组)

图片

 

最后,本文做了一系列延伸性探究和稳健性检验来证明结果的可靠性,包括:控制其他污染物;扩大结果计量的时间窗口;证实工具变量的局部平均处理效应;证实污染变化主要通过风向来自非本地的传输;采用不同类型的固定效应和天气控制以及不同数量的工具变量滞后期;探究PM2.5对四类死因的影响;工具变量有效性的检验;使用未来PM2.5测量值进行安慰剂检验;剔除高风速的观测值;考虑污染监测器的进出等因素,所有结果均稳健。

 

04 创新点

首先,本文通过开发和应用一种基于机器学习的新方法来估计与空气污染暴露相关的寿命损失,从而更准确地估计死亡率成本。在此之前,未发现有其他研究在计算寿命损失时纳入了年龄和性别以外的信息,也未发现有其他经济学论文使用机器学习来估计生存模型。

 

第二,本文首次将Chernozhukov等人(2018)的关于异质处理效应的通用机器学习推理方法应用于准实验研究设计。

 

第三,本文的方法允许分别确定多种污染物对死亡率的因果影响。并发现PM2.5与死亡率的关系比其他污染物的关系更为密切。

 

第四,相对于以前利用风变化的准实验设计,本文的IV方法不需要了解一个区域的详细布局(例如,道路、河流和人口中心的位置)或识别空气污染源。因此能够在广泛的地理范围和较长的时间内利用PM2.5的变化,估计对罕见健康结果(如死亡率)的影响,并探索处理效应的异质性。

 

 

05 思考

本文用来估计死亡率成本和识别易受空气污染影响群体的方法可应用于其他情况。CDDF方法的灵活性合理地证明了机器学习方法通常出现的可解释性降低的现象。在本文中,预期寿命法和CDDF法揭示了相似的异质性结果,但如果易受影响的人群与总体健康不一致,那么这两种方法的结果可能会有所不同。

 

本文估计了空气污染对65岁以上老人的影响,其所用到的机器学习方法值得深入探讨,为更准确地探索空气污染对更广泛群体的影响提供了良好的工具。

 

 

 

*文章来源:3E经典论文

*侵权必删

经典论文回顾
经典论文回顾
文章131
·
总浏览量11933
最新文章
更多
共读经典,启智未来——尚悦小夫子与《论语》之旅
杨展
3356
浏览
【千帆竞发占潮头 百舸争流破浪行】中国企业正扬帆启航向深蓝进发 | 2024全球出海数智创新高峰论坛邀您9月论道
杨展
3362
浏览
Campbell Harvey教授:Web3觉醒: 解密去中心化金融(DeFi)与Web3的未来
学术会议动态
31
浏览
Daniel Rabetti | 区块链取证:揭示加密货币的黑暗面
学术会议动态
18
浏览
修大成 | 金融机器学习: 崛起、突破与局限性
学术会议动态
40
浏览
李鲲鹏 | 单一因子降维方法:理论与金融应用
学术会议动态
19
浏览
热门用户
学术前沿速递
学术前沿速递
文章
300
学说观点
学说观点
文章
300
AIGC交流社区
学说官方
文章
239
未央网
未央网
文章
233
毕宣
中央财经大学
文章
185
王凯
T. Rowe Price
文章
181
热门文章
更多
经济学入门必读书籍有哪些值得推荐?
楚健
·
1246
浏览
绿色信贷能否提高商业银行的核心竞争力?基于中国的准自然实验
创新研究
·
1017
浏览
最新综述!AIGC到底是什么?都有哪些应用?一文尽览!
AIGC交流社区
·
1005
浏览
数电票的26个问题,税局统一回复!
张俊熙
·
1004
浏览
研究方法 | 文献资料分析方法大全!收藏
周舟
·
920
浏览
“特斯拉”打败了“星巴克”
张子瑞
·
917
浏览
银行纷纷入局数字藏品赛道,什么信号?
李杨杨
·
887
浏览
《中央企业基金业务管理暂行办法》已内部印发
楚健
·
869
浏览
研究方法:文献资料分析方法
周舟
·
790
浏览
如果经济学家连股都不炒,那他们都在干什么呢?
李博
·
710
浏览