RFS｜如何有效任命董事提高公司业绩？来自机器学习算法的证据-学说文章

RFS｜如何有效任命董事提高公司业绩？来自机器学习算法的证据

75浏览

2022/01/19 02:50发布

经典论文回顾

邀您一起回顾经典论文——RFS｜如何有效任命董事提高公司业绩？来自机器学习算法的证据

传统的计算机算法是“编程”所需要的程序，即对一个过程进行详细描述。比如，描述一个加法运算法则。

但是，这个程序有局限性。比如，我们如何用算法识别下图中猫的照片？如果按照传统算法，输入简单的指令，比如，有两只眼睛，黑棕色毛发。但这可能只能识别一部分特征，得出的照片可能只显示猫的一部分。

而通过机器算法，可以根据示例来学习自身的算法。比如，要识别上图中的猫，通过使用大量照片来训练系统，描绘相应标记的猫（监督学习）。通过这种方式，算法最终能够识别不熟悉图片上的猫。

机器学习方法与传统公司金融运用的计量方法在研究思路上存在很大差异：以往的公司金融文献大多运用解释性模型（explanatory model），侧重于解释变量间的因果关系（即因果推断），从理论假设出发，运用统计方法（如线性回归、结构方程模型等）检验假设。

而机器学习的模型是预测性模型（predictive model），其侧重于模型的预测能力，因此它能够发现解释性模型不曾假设的、更加复杂的关系，从而帮助我们发现新的关系、补充和发展现有理论。

目前的机器学习方法有以下两点优势：

1. 机器学习算法（如决策树、深度神经网络等）能够识别非线性的、交互的关系。

2. 机器学习的参数正则化、模型筛选等技术可以帮助我们在众多相关度高的变量中筛选出重要变量。

研究董事会特征与公司绩效时，机器学习方法可以帮助我们筛选出重要特征，比如，董事会特征与公司绩效的关系可能是非线性的、交互的，董事会规模与公司绩效可能呈倒 U 型关系。通过这一方式，机器学习方法的优点可以得到充分利用。

来自俄亥俄州立大学费希尔商学院的Isil Erel、Michael S. Weisbach，福斯特华盛顿大学商学院的Léa H. Stern和芝加哥大学的谭宸浩于2019年在金融学顶级期刊《The Review of Financial Studies》发表文章“Selecting Directors Using Machine Learning”。文章利用机器学习算法预测董事表现，帮助公司进行任命决策，并剖析公司决策逻辑与管理水平的关系。

文章于2018年3月投稿，2019年4月被接收，2021年4月正式刊发。

研究背景

一个公司的董事会对管理公司负有明确的责任。原则上董事会需要对股东报告公司经营情况并保证保护股东利益，但在现实社会的实践中，董事质量良莠不齐，也很难保证任命过程与后续行为符合股东利益。这些关于董事任命过程的问题就成为了公司管理领域最重要的课题之一。

鉴于董事任命过程中庞大的信息需要，以及信息之间复杂的非线性、交互关系，传统的数据分析工具可能不再适用于这个过程的研究。

因此，本文将目光投向了机器学习算法——一种无模型预设、允许非线性存在的数据分析工具。

文章通过机器学习的方法，建立了一套理解治理、评价董事的方法，主要通过以下三个方面来实现：

第一，评估了是否可能建立一套算法来精确预测某一个董事是否胜任某一家特定公司的董事职位。

第二，文章对比传统的计量经济学模型与机器算法在预测董事绩效方面的差异。

第三，文章通过算法所选择的结果作为基准，来说明哪些被实际选择的董事和哪些个人特质使他们成为了股东更加青睐的人。

数据处理&指标构造

研究的第一步，构建一个表征董事表现水平的指标，以供算法进行学习、预测。

作者在此依赖于股东对董事的支持进行指标构建。定义主要的解释变量为：Excess votes，该指标为某董事任职三年内的平均股东支持率减去当选时的股东支持率，以表征董事任职后的管理表现。

针对该指标，作者进一步阐述了合理性。有文献指出因为在大部分情况下，董事在投票时的支持率均高于95%，所以支持率在任期内的变动都非常小。但也有文献指出，这种细微变动能够捕捉市场反应，也就能够捕捉董事表现的变动。

除此之外，也有文献指出，支持率与CEO变动、董事会变动、管理层薪资水平都具有显著相关关系。而且尽管董事选举没有竞争性（前后变动不大），但选举行为本身仍然能够影响公司的实际行为。

在之后的研究中，文章继续构建了其他衡量表现的指标，研究结论保持一致，保证了结论的稳健性。

文章使用的支持率数据来源于美国机构股东服务公司ISS（Institutional Shareholder Services），样本选择为2000年-2014年内4887家公司董事会41015位董事的任免数据以及相应的公司层面、董事层面、行业层面数据。由于大部分股东会通过ISS的推荐进行投票，而大规模公司的股东会更加独立于ISS这种推荐机构的影响，所以文章在大规模公司股东上也进行了同样的分析，以消除机构推荐带来的影响，分析结果与全样本保持一致。

各种机器学习算法的表现

>>>>

模型设置

文章使用机器学习算法预测董事的表现，算法的输入特征包括了可观测的董事层面、公司层面、董事会层面以及其他相关层面的特征。

对于具体算法，文章选用了常用监督学习算法：Lasso，岭回归，神经网络，XGBoost。训练集选择2000-2011年的2407家公司18476条董事任命数据。训练完成的模型在2012年-2014年569家公司5578条董事任命数据上计算样本外预测能力，并以AIC准测选择变量的OLS模型作为基准对比模型。

>>>>

董事表现预测

在训练完成模型之后，作者通过考察董事实际表现与机器学习模型预测表现的关系来衡量预测效果。

上图从直观角度描绘了前述思想，图中的横轴为模型预测的董事表现（按10分位分为十组），纵轴为该组董事对应的真实平均超额支持率。如果模型的预测能力良好，预计我们得到的函数图像为一个近似的增函数（预测表现越好，实际表现也越好）。如图所示OLS方法作为对照方法并不能很好的预测董事表现（灰色虚线几乎水平），而Lasso与XGBoost方法图像直观上近似为一个增函数。

公司现实选择的董事是最优的吗？

根据数据模测算结果，机器学习预测表现较好的董事的确得到了更多的支持（表现好），预测表现较差的董事现实中得到较少支持（表现坏）。

这一结论表示，在某些时候，公司做出董事任命之前，是可以通过算法预测到表现差的董事，从而调整任命决定。也就是说，公司应该能够避免任命一些“能够预测”的表现差的董事。

预测到了表现差，但最终还是任命了，有可能是因为任命时没有比这位董事更优的选择了，如果雇佣其他董事，情况可能会更差。

对于这一假设是难以检验的，因为在机器学习文献中存在“选择性标签问题”。公司对于董事的选择，是“已完成的、不可回溯”的，从而根本无法得知其他的备选董事在目标公司的表现，也就无从得知现实中任命的董事是否为最优选择。这一障碍就阻拦了机器学习算法改善公司决策的能力。

然而，作者做出了一系列设定，避免了这个障碍。文章构建了一个目标公司内某位目标董事的“候选人集”，这个集合里的候选人是当选后一年内加入“临近”、“更小”公司的董事。

注：“临近”代表了候选人加入的公司与目标公司地理距离不超过100英里，“更小”的公司是因为董事薪资通常与公司规模挂钩，所以更小的公司代表更低的薪酬，从而在目标董事当选时，目标公司是能够负担候选人薪酬的，这两点确保了目标公司有条件考虑候选人集中的董事。

对于文章收集到的每一位现实当选董事，候选人集平均大小为147位。

得到候选人集后，如何得到这些候选人如果被任命之后的绩效呢？

的确，虽然作者没办法考察候选人被任命到目标公司的绩效，但是作者可以观测候选人在各自公司的绩效。在无法直接测量候选人在目标公司绩效的情况下，其在各自公司的绩效就可以当做是一种信息信号，文章将其定义为“准标签”。

将所有候选人的准标签整理成为分布，文章就使用这一分布近似所有候选人在目标公司上的表现分布。

对于所有目标董事的预测超额支持率，作者同样地按照十分位分组，估计目标董事实际超额支持率在准标签分布中的百分位排名中位数（比如对于预测为表现最好的前10%董事，作者计算该组各董事实际超额支持率在对应准标签分布中的排名，之后计算该组的排名中位数），之后作者通过考察这个排名中位数是否与预测表现相关，进而考察机器学习算法是否能够选出候选董事中的较优选择。

对此，作者提出了对应的原假设与备择假设：

H0：董事在准标签分布中的百分位排名与预测表现无关，则预测并不能对推断未来董事表现提供信息。则预测表现最差一组（10%以下）的董事在准标签中的排名中位数应当等于甚至大于预测表现最好一组（10%以上）的董事在准标签中的排名中位数。

H1：董事在准标签分布中的百分位排名与预测表现相关，则预测能对推断未来董事表现提供了信息。则预测表现最差一组（10%以下）的董事在准标签中的排名中位数应当小于预测表现最好一组（10%以上）的董事在准标签中的排名中位数，而且这个差距应该尽可能的大。

以上假设考察机器学习算法预测为表现好（差）的董事是否在各自的候选人集（准标签分布）中同样表现好（差）。

上图则从直观上对XGBoost算法进行考察，其中横轴为预测的董事表现（以10分位分组），纵轴为对应分组中各董事在候选人集中的表现排名（以均值和中位数计算）。

从图中可以看到，董事在候选人集中的表现几乎与算法预测表现正相关。这就表示机器学习算法（至少对于XGBoost在目前数据上的表现来说）是可以帮助公司做出较优选择，改进任命决策的。

董事表现的其他测度（稳健性检验）

文章的测算结果建立在超额支持率能够反映董事表现的基础上，但也有部分学者对此表示怀疑。这些学者认为董事的表现在于其对公司盈利能力的增长，而并非在于股东对其的看法。而且大部分投资者都会通过美国机构股东服务公司ISS （Institutional Shareholder Services）的推荐进行投票，比如2010年ISS就曾为了提升董事会中女性董事占比而实行明确的推荐方针。

所以，作者使用另外的董事表现测度进行同样的研究，以排除ISS机构影响与其他学者的质疑。

1）关于董事任命公告的异常累计收益

文章进一步分别计算之前预测为表现好和表现坏董事任命公告的CARs（异常累计收益）。

注：CARs是事件研究法中常用的指标，其旨在计算某时间发生的窗口期内股市对事件的反应，以分析事件带来的影响。文章使用前后1日共三天的窗口期进行计算。

如上图所示，通过XGBoost预测为表现差（底部10分位组）的董事组，平均任命公告的CARs为-1.94%，中位数为-0.64%，而预测为表现好的董事组（头部10分位组），平均任命公告CARs为0.75%，中位数为0.34%，均值差值的p值为0.0043，表示差异在0.01的显著性水平上显著。

这表示通过算法预测的表现好（差）董事任命时，市场反应同样会体现异常收益的正（负）。

2）预测对董事的强烈反对情绪

文章还考虑了另一种董事表现测度，即在对某董事的反对情绪足够强时，这种反对情绪可以反映董事的表现好坏。

据此，作者引入了一个虚拟变量，当股东反对票高于10%时取值为1，其他情况取值为0，这一虚拟变量就可作为表现差董事的测度。类似地，文章将这一虚拟变量视作解释变量，使用XGBoost进行训练并预测。

结果如上图所示，通过算法预测为反对情绪最小的董事组（横轴为1，指按预测反对情绪排序后的10分位组）实际平均受到1.3%的反对情绪，而预测为反对情绪最大的董事组（横轴为1，指按预测反对情绪排序后的90分位组）实际平均受到23%的反对情绪。这表明机器学习算法从反对情绪的角度也能成功检测董事的表现。

3）预测董事的解雇

除了以上指标外，如果一位董事在任命较短时间后即离任，有可能是因为董事与公司不太契合。所以作者使用XGBoost对董事是否在任命后两年内离任进行训练和预测。

如上图所示，各预测十分位组中的实际两年离任比例呈现增函数形式。而且最低和最高两个组的差距在数值上也较大。算法预测为最不可能两年离任的分组中仅有2%的董事实际在两年内离任，而这一比例在预测为最有可能两年离任的分组中高达43%，鉴于总数据样本中仅有11%的董事在两年内离任，算法有效地将两类董事进行分类。

在上述使用董事表现备选测度的研究中，结论与之前使用超额支持率的结论保持一致。无论作者使用何种测度，算法总能够预测到未来董事表现的分布情况。

哪些因素影响了对董事的选择？

机器学习算法虽然在预测、分类问题上成功的解决了“未来董事表现预测”，但是其与传统计量模型主要的差别就是它并没有提供一种推断自变量与因变量关系的方法。

为了理解机器学习算法最终是怎样做出精确预测的，机器学习领域的学者已经开始致力于发展一种增强模型可解释性的方法。

文章使用一种解释机器学习黑箱的方法，Lundberg and Lee（2017）提出的SHAP值，以此解释之前章节建立的模型是怎样预测未来董事表现的。模型中每个特征的SHAP值表征了该特征变化后模型预测发生的变化，也就是该特征在模型做出预测时的重要性。

1）影响董事质量预测的因子

SHAP值的计算是先建立在每一个观测点上的，比如A董事在B公司的某一次任命，被算法预测为表现好，则可以在每一特征上计算对应SHAP值，以改善该观测点上的“局部可解释性”。对于所有观测点，对所有特征取SHAP平均值，获得总体上各特征的SHAP值，以获得对模型的“全局可解释性”。

2）全局可解释性

作者对之前构建的三个模型（超额支持率，反对情绪，董事离任）计算了各自的全局值SHAP，结果整理为ABC三幅图，并以红色与蓝色表征正向和负向影响。

图A所示，对于超额支持率模型来说，如果一位董事是薪酬委员会（Compensation committee）中的一员，那么将会降低其0.22%的超额支持率。但如果是审计委员会（Audit committee）中的一员，则会升高其0.16%的超额支持。

图B是关于反对情绪模型的SHAP排序值，作者发现之前帮助超额支持率模型做出预测的特征，大部分也能帮助反对情绪模型做出预测。

至于预测“两年内董事离任”的模型来说，C图显示，能够增加董事两年内离职概率的特征大部分为个体董事层面的特征,比如：“目前任董事会主席”、“拥有企业家背景”、“毕业于藤校”。其中能够让董事长期任职的特征为“是否存在交错董事会”。

在这一节的结尾，作者强调SHAP并未建立因果关系，而仅仅是通过相关关系来表征特征的重要性，但是SHAP的确提供了一个理解机器学习算法预测机理的基础性方法。

3）局部可解释性

文章同样汇报了以观测作为目标的局部可解释性，作者从三个模型中各自随机抽取一个观测计算各SHAP值，并绘制成ABC三图。

图中base value表示解释变量在全样本上的平均值，表征了该值的无条件均值（正常水平）。

Model output value表示模型在该观测上的预测值，下方各特征组成的色块表示了对应特征对model output value的推动力，如A图中当某位董事在11家未上市公司的担任董事时（Total number of unlisted boards sat on = 11）将会向导致董事支持率下降，而董事列席在审计委员会并且不在薪酬委员会时，又会导致董事支持率上升。

有趣的是，作者发现某些特征在某个模型中正向推动model output value，在某个模型中又负向推动model output value。

这表明特征对于最终预测值的影响存在交互作用与非线性，也就是说并不存在一种对所有公司都“一试百灵”的预测方式。作者认为这正好成为了使用机器学习这种无模型形式规定、允许高度非线性交互项的分析工具进入预测董事质量课题的理由。

表现差的任命董事有哪些特征？

作者将考察范围缩小，对于那些预测为表现差但仍然获得任命，并且在之后的实际表现中的确表现差的董事，公司应该怎样分辨呢？

也就是说，作者希望分析在公司考虑新董事时有可能会过度高估的一些特征，从而导致雇佣到表现差的董事。为了分析这些特征，作者对比了预测为表现差但仍被雇佣的董事特征与算法所推荐的董事特征。这两组董事的特征差别反映了公司任命过程中有可能会高估的特征。

表六对比了两组董事的各特征，作者发现，不太受欢迎的董事更可能是男性、拥有更大的社交关系圈、以及更多董事任职经历的人。

正如之前学者的研究，董事任命有可能因为各种行为偏差（比如在职者为保护自身利益而任命较差的董事）而故意做出非优选择，从而雇佣那些不被算法推荐的董事。

为什么公司不避免雇佣预测为表现差的董事呢？

为了研究公司为什么会雇佣表现差的董事，作者使用公司雇佣表现差董事的概率对公司层面的特征进行回归分析，尤其重要的是，作者纳入了表征公司治理水平的测度（E-index，该指标与公司治理水平负相关），以考察公司治理水平与雇佣表现差董事概率的关系。

如表中所示，公司雇佣一个差董事的概率与E-index显著负相关，这表明公司治理水平越差，雇佣差董事的概率就越高。作者对这一结论解释为，这些公司仿佛在代表股东利益时还有其他目的。

除了E-index外，作者还是用另一指标表征管理质量（co-opted directors），这一指标衡量了CEO上任后立即任命的董事会董事比例。

之前的文献指出，co-opted directors的增加，表征了董事会对公司行为、CEO行为监控力度的下降，也就是董事会不再监督公司是否代表了股东利益。同样地，在表7中回归结果也表明雇佣差董事的概率与这一指标显著正相关。

最后文章还考虑了公司董事会中独立董事个数对雇佣差董事的影响，这一想法源于2002年发布的《萨班斯法案》，这一法案要求上市企业拥有足够多的独立董事以保证治理水平。表7的结果可以看到，雇佣坏董事的概率随着董事局中独立董事占比的增加而降低。

综上所述，表7支持了代理冲突影响了提名决策这一观点，并且解释了一部分公司为什么会任命差董事。

结论

文章使用机器学习算法来预测董事绩效，并表明该算法有助于公司为董事会选择董事。通过使用这些机器学习算法，文章至少从四个方面提供了理解公司治理的思路。

第一，文章证明了构建一个评估算法的可能性，该算法可以预测某个特定董事是否会在特定公司表现良好。

第二，文章比较了预测董事绩效的其他方法，特别是机器学习技术与OLS在预测董事绩效方面的比较。

第三，文章确定了与表现良好董事相关的特征。文章的算法证明，拥有更多元背景并且与管理层保持一定距离的董事将更有可能监督管理层的工作，而且这些人更有可能提供对公司绩效有所帮助的观点。

文章对董事绩效的主要衡量标准来自于一名董事相对于同一公司其他董事从股东那里获得的支持程度。这种基于投票的绩效衡量是一种个人层面的衡量，反映了董事个人从其所代表的股东那里获得的支持。

第四，文章使用算法中的特征重要程度作为基准，以了解算法实际上是通过什么过程来确定董事表现的。

文章的结果表明，通过算法预测的表现好（差）董事，不仅在数值上表现好（差），而且在横向候选人的对比中依然表现好（差）。这表示机器学习算法可以帮助公司选择较优的董事，除了保证其自身表现良好，而且与候选人集相比也是较优选择。

后续的实证研究进一步解释了公司明知道董事表现较差但仍然雇佣的原因——治理水平薄弱。

综上，文章使用机器学习方法证实了一个可以追溯到200多年前的观察：董事会的选择过程导致董事不一定是为股东利益服务的最佳选择。

然而，文章结论除了可以确认这一观察外，还提供改变这一观察结果的工具：通过使用机器学习算法对潜在候选人的绩效进行预测，可以对这些潜在董事进行评估，并识别具备成为成功董事所需特征的个人。

经典论文回顾

文章131

总浏览量10288

学术前沿速递

文章

300

学说观点

文章

300

AIGC交流社区

学说官方

文章

240

未央网

文章

233

毕宣

中央财经大学

文章

185

王凯

T. Rowe Price

文章

181

经济学入门必读书籍有哪些值得推荐？

楚健

1185

浏览

绿色信贷能否提高商业银行的核心竞争力？基于中国的准自然实验

创新研究

879

浏览

最新综述！AIGC到底是什么？都有哪些应用？一文尽览！

AIGC交流社区

766

浏览

研究方法 | 文献资料分析方法大全！收藏

周舟

762

浏览

数电票的26个问题，税局统一回复！

张俊熙

759

浏览

如果经济学家连股都不炒，那他们都在干什么呢?

李博

682

浏览

“特斯拉”打败了“星巴克”

张子瑞

670

浏览

研究方法：文献资料分析方法

周舟

660

浏览

银行纷纷入局数字藏品赛道，什么信号？

李杨杨

629

浏览

会议预告｜清华五道口绿色金融讲座第一期，邀您探讨“碳达峰碳中和——中国发展转型的机遇和挑战”

学术会议动态

3320

浏览