投稿问答最小化  关闭

万维书刊APP下载

网络中干预目标的设定

2023/2/6 13:41:36  阅读:185 发布者:

原文信息:Galeotti, A., Golub, B., & Goyal, S. (2020). Targeting Interventions in Networks. Econometrica, 88(6), 24452471. doi:10.3982/ecta16173

01

简介

本文研究嵌入在网络中的主体之间的博弈。每个主体的行动——例如,一定程度的投资或努力——直接影响到其他主体的一个子集,即该主体的邻居(neighbors)。这通过两个渠道实现:对他人激励的溢出效应(spillover effect),以及非策略外部性。一个资源有限的功利主义(utilitarian)计划者可以通过干预来改变个体采取行动的动机。我们的目标是了解计划者如何在考虑到网络和环境的其他基本因素的情况下最优地计划这些干预措施。本推文是一个简介,从模型设定与方法、主要结果和一个拓展即不完全信息的情况三方面进行介绍,其他方面如更多拓展、具体例子、定理证明等请阅读原文。

本文模型设定大致为:

个人参与同时行动(simultaneous-move)、连续动作(action)的博弈,

个体动作会产生独立于其他人的回报,但也会有溢出,溢出的程度由网络描述,两个个体链接(link)的强度反映了一个人的行动多大程度上影响了其他人的边际回报。这种影响可以是策略互补或者是策略替代。

网络上的邻居还有正或负的外部性。

博弈开始前,计划者可以针对一些个体采取措施,改变他们的独立的边际回报。

干预成本随改变幅度增加,并且在个体间可分,而计划者的目标是最大化均衡状态下,给定干预成本预算约束下的总体效用。

研究结果表征了最优干预政策,显示了它如何依赖于网络、溢出效应的性质、现状激励和预算。

本文方法的核心是一种特殊的组织溢出效应方式,利用了交互矩阵的主成分或说特征向量。独立边际收益向量的任何变化都可以在这些主成分的基(basis)上表示。这个基有三个特殊性质:(a)当独立边际收益外生地向一个主成分的方向改变时,其效果是在同一方向改变均衡行动;(b)影响的幅度是外生变化幅度的倍数,而乘数是由该主成分对应的网络的特征值决定的;(c)主成分是正交的,因此沿着各种主成分的影响可以单独处理。这三个特性使我们能够以一种便于对最佳干预进行简单描述的方式来表达干预对行动和福利的影响。

本文的主要结果,即定理1,根据最优干预与各种主成分的相似程度,或者换句话说,各种主成分在其中的代表性有多强,来表征最优干预。基于这一特征,推论1描述了策略互动(strategic interaction)的性质如何塑造在最优干预中最突出的主要成分。主成分可以根据其相关的特征值(从高到低)进行排序。

在策略互补博弈中,经过适当的标准化后,最优干预与第一个主成分最相似,即策略互动网络中个体特征向量中心度的向量。然后,它逐渐与具有较小特征值的主成分不太相似。在策略替代博弈中,顺序相反:最优干预与最后一个(特征值最低)主成分最相似。

“更高”的主成分捕捉了网络更全局的结构:这对利用策略互补下产生的一致反馈效应很重要。“较低”的主成分捕捉网络的局部结构:它们帮助计划者有针对性地进行干预,使其不会导致相邻邻居之间的挤出。当行动具有策略替代性时,这是一个重要的问题。

定理1对最优干预的描述,是在一个确定的环境中导出的,在这个环境中,计划者知道所有个人的现状和独立的边际回报。这个方法也可以用于研究不完全信息下的最优干预,假设计划者不知道这些回报,而只知道它们的分布。命题34描述了随机环境下的最优干预措施。这表明,本文的主要发现可以进行适当进行类比延伸:主成分的顺序与它们在最优干预措施中的表现程度相对应,从高到低。

02

模型

考虑

主体之间的同时行动博弈,个体i选择动作

,动作向量记作

。的回报取决于a,一个具有邻接矩阵(adjacency networkG的网络,以及其他参数,写作:

注意看,这里面第一个大括号里,系数

对应i的边际回报里独立于其他人行动的部分,而后面那项则是来自其他人的行动的影响,

则度量了ij之间互动的强度,假设

。如果

则是策略互补,

是策略替代。第二个大括号则反映了纯外部性,即不依赖于其他人行动的溢出效应。求一阶条件,我们可以得到i的最优反应:

以及纳什均衡行动

的条件,记作条件(2)

下面做两个假设:

假设1:邻接矩阵G对称。

假设2

的谱半径(spectral radius)小于1,并且G每个特征值都不一样。

这样一来条件(20)就是充要条件了,并且保证了纳什均衡的唯一性和稳定性,这样纳什均衡可以写作:

然后功利主义的均衡就可以定义为:

如果计划者可以调整激励,也就是i的效用里面的

,那么计划者的激励目标(incentive-targeting, IT)问题可以写作:

其中

是当下的边际回报,b是一个向量,C是计划者的预算,函数K是调整成本函数。

03

主成分

下面介绍一下独立边际回报空间的一个基,以及给定我们对G的假设,策略效应和计划者目标都能在其中采取一种简单形式的动作。

事实1:如果G满足假设1,那么

,其中:

(1)

n*n对角阵,

G的实特征值,并且从大到小排列;

(2) U是正交阵,其第 l

G的实特征向量,对应

,并且标准化为

对一般的G,上述分解唯一。对这一对角化的解释是分解为主成分。首先,考虑在误差平方意义上最接近G的对称、秩为一的矩阵,即向量u使得这个最小:

让它最小的向量就是特征向量

,现在考虑“残差”矩阵

,那么还是可以对它做类似的分解,并获得相应的秩为1的近似

。一直搞下去,就得到了一个构成正交基的向量序列。在每一步中,下一个向量生成一个秩为1的矩阵,该矩阵“最好地总结”了矩阵G中的剩余结构。

1是一个例子,展示了一个有14个节点的圆网络的一些特征向量/主成分,其中所有链接的权重都是1。对于每个特征向量,一个节点的颜色表示该特征向量中与该节点对应的条目(entry)的符号,绿的是正的,红的是负的,而一个节点的大小表示该条目的绝对值。一个一般的特征值得注意的是,顶部特征向量(值较小)的项在相邻节点之间是相似的,而底部特征向量(值较大)的项在相邻节点之间趋于负相关。

3.1 利用主成分分析博弈

对任意

,令

z投影到第l个主成分上面。代入

回到纳什均衡条件,我们有:

可得:

那么对任意

,有:

G的主成分构成了一个基,在这个基上,策略效应很容易描述。G的第个主成分上的均衡行动

是一个放大乘子(由

决定)和

的乘积。

同样,可以得到一个正交坐标下均衡动作的形式:

定义1:两个非0向量yz之间的余弦相似度

该定义将允许我们根据其与各种主成分相似性的标准度量来描述最优干预。

04

最优干预

先给一个假设,它排除了规划者的幸福点(也就是

)可以达到的情况,确保存在一个非平凡的优化问题。

假设3:要么

,要么w0。并且对任意l

IT问题的解,

为个人的独立边际收益在最优干预时的变化,再令

注意到

G的第l个主成分上的均衡行动。然后再定义网络博弈的一个性质,它也是很重要的假设:

性质A:对某些

,有

,其中

是纳什均衡下的行动向量。

下面是本文的主要结果:

定理1:在假设1-3下,若网络博弈满足性质A,则在最优干预下,

和主成分

的余弦相似度满足:

其中计划者的影子价格μ由下面这个的解唯一决定:

并且对任意l满足

,即分母都是正的。

定理1表明,当我们改变l时,相似比例

正比于

。由此可知,

越大的主成分l,其相似度绝对值越大。直觉上看,这些是最优干预相对于激励现状的最大变化的组成部分。

的排序与特征值的对应取决于策略溢出效应的性质:

推论1:给定假设1-3成立,网络博弈满足性质A。如果博弈有策略互补(

),则

l递减;如果策略替代,则是递增。

05

不完全信息

在基本模型中,我们假设计划者知道每个个体的独立边际收益。本节将分析扩展到计划者不知道这些参数的设置。和之前一样,我们关注的是满足属性A的网络博弈。

给定概率空间

,计划者的状态的概率分布由P给出,他们控制一个随机变量

,干预成本取决于B,即K(B)。该随机变量的实现记作b。当人们选择自己的行动时,这个实现是每个人的常识(common knowledge)。因此,个体参与的博弈是一个完全信息博弈,所以纳什均衡的写法没变。那么,不完全信息下的干预问题就变成:

对满足性质A的网络,可以写成:

注意第二步中从普通基到主成分基的变化。换言曰,福利是由已实现成分

的均值和方差决定的。这又由所选随机变量B的一阶矩和二阶矩决定。鉴于此,我们将考虑计划者可以对B的均值和协方差矩阵进行修改的干预问题,而干预的成本仅取决于这些修改。这一部分的后续就是围绕均值漂移(mean shift)和方差干预(variance intervention)两部分展开的。

06

结论

本文研究了一个计划者在网络博弈中寻求最优目标激励的问题。本文的框架考虑了邻居之间广泛的策略和非策略溢出效应。这篇论文的主要贡献在于方法上:它表明,交互网络的主成分为分析干预的效果提供了有用的基础。这种分解导致了本文的主要结果:博弈的策略属性(动作是策略互补还是替代)与不同主成分在最佳干预中获得的权重之间存在密切联系。

作者简要地提到了另外两个应用。在某些情况下,计划者寻求预算平衡的税收/补贴方案,以改善经济结果。例如,在寡头垄断市场中,计划者可以对一些供应商征税,从而增加他们的边际成本,然后利用税收收入补贴其他供应商。计划者将解决一个与这里研究的问题类似的问题,但重要的区别是,它将面临一个不同的约束,即预算平衡约束。在正在进行的工作中,Galeotti, Golub, Goyal, Talamàs and Tamuz(2020)表明,本文中使用的主成分方法在推导最优税收方案方面是有用的,进而在确定供应链中通过税收/补贴干预可以实现的福利收益方面是有用的。本文关注的是能够改变个体独立边际收益的干预措施。另一个有趣的问题是对改变互动矩阵的干预的研究。我们希望这篇论文能促进沿着这些方向进行的进一步工作。

Abstract

We study games in which a network mediates strategic spillovers and externalities among the players. How does a planner optimally target interventions that change individualsprivate returns to investment? We analyze this question by decomposing any intervention into orthogonal principal components, which are determined by the network and are ordered according to their associated eigenvalues. There is a close connection between the nature of spillovers and the representation of various principal components in the optimal intervention. In games of strategic complements (substitutes), interventions place more weight on the top (bottom) principal components, which reflect more global (local) network structure. For large budgets, optimal interventions are simplethey essentially involve only a single principal component.

推文作者评论

     ✦  ✦  ✦  ✦  ✦

本文亮点有二,一是考虑了网络博弈中的最优干预问题,二也是最大的两点在于方法上,将主成分方法引入网络博弈,使问题分析变得简单、清晰许多。除了原文作者提到的在供应链上的应用,推文作者认为本文的思路和方法,尤其是拓展中提到的不完全信息下计划者进行干预的部分,在更一般意义上的产业政策,以及银行网络、系统性金融风险的研究,特别是应对金融危机的干预政策中也可以有广泛的应用,特别是考虑到现实中计划者常常和参与者之间存在信息不对称的情况。但模型设定可能会更加复杂并且需要引入动态,因此还有待进一步探索。

转自:“香樟经济学术圈”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com