请输入搜索信息

暑期学校

2025年7月18日-19日,加拿大不列颠哥伦比亚大学Vadim Marmer教授为2025亚洲计量经济学与统计学暑期学校的学员带来了四节精彩的前沿计量经济学课程。

7月18日下午,Marmer教授首先围绕“为什么需要变量选择”展开了深入浅出的讲解。Marmer教授通过两个典型案例阐述了变量选择的重要性:一是当回归考虑了过多的控制变量时,感兴趣的结构参数估计量的方差会增加;二是在工具变量维度发散时,工具变量估计量会产生偏差。其次,Marmer教授指出传统指标或方法在变量选择的局限性:例如,R²会随着变量数量的增加而单调上升,无法有效衡量模型优劣;而基于假设检验的变量选择方法则在变量维度较高时,误选的概率会趋近于1。在介绍了变量选择的相合性(Consistency)与oracle性质的定义后,Marmer教授自然地过渡到基于信息准则(information criteria, IC)的变量选择方法,并着重论证了该框架下相合性的证明过程。基于上述理论框架,Marmer教授首先归纳了保证相合性的惩罚项所需要的条件,继而系统性地介绍了两种经典信息准则——贝叶斯信息准则(Bayesian Information Criterion, BIC)与Akaike信息准则(Akaike Information Criterion, AIC)的构造原理与理论性质。随后,Marmer教授重点阐述了post-BIC估计量,并逐步演示了其oracle性质的证明过程。

随着课程深入,Marmer教授指出基于BIC的变量选择方法存在两个局限性,分别是弱信号带来的选择偏误问题以及计算可行性问题。为了克服上述局限性,Marmer教授引入了一类基于惩罚回归的变量选择方法。他首先介绍了LASSO和岭(Ridge)回归方法,相比基于IC的方法,这两种方法具有更平滑的惩罚项。进而他引入p范数将基于IC的方法与这两种惩罚回归方法统一起来。随后,Marmer教授通过图示,向学员直观展示了LASSO与岭回归方法的本质区别,并着重阐释了LASSO方法能够实现变量选择的数学机理,以及岭回归在此方面的局限性。针对L1范数在零点不可微的特性,Marmer教授首先讲解了凸函数的基本性质,并定义了不可微函数的次梯度概念。进一步地,他通过严谨的数学证明,建立了最优解存在性与0次梯度存在性之间的等价关系。

7 月 19 日下午,Marmer 教授承接上节课内容,为学员们讲解了正交设计矩阵情形下 LASSO 方法的显式解,及其变量选择的相合性,并借助数学证明,阐述了惩罚参数的选择思路。随后,Marmer 教授进一步介绍了更广义情形下 LASSO 方法的相关理论性质,他明确指出,在这种情形下,LASSO 方法要实现变量选择的相合性,需满足零系数变量与非零系数变量之间不存在高相关性这一条件(Irrepresentability)。为了克服 LASSO 方法的这一局限性,Marmer 教授介绍了 Adaptive LASSO 方法。该方法通过对不同变量系数赋予差异化权重进行惩罚,无需考虑零系数变量与非零系数变量的相关性,即可实现变量选择的相合性。作为补充,Marmer 教授还介绍了在变量维数发散的高维情形下,为保证相合性所需的惩罚参数性质。随后,Marmer 教授讲解了 post-LASSO 的统计推断要点,并向学员演示了其 oracle 性质的证明过程。

尽管 LASSO 与 Adaptive LASSO 方法在维度增长时,能较好地解决变量选择的计算可行性问题,但仍未能克服弱信号带来的选择偏误问题。随后,Marmer 教授进一步介绍了 Double LASSO 方法来克服这一局限性。在明确弱信号的定义后,他详细阐述了该方法的算法思路,并通过与 LASSO 方法的对比,从数学层面演示了 Double LASSO 方法如何在该情形下实现去偏(De-biasing)。为帮助学员们更透彻地理解该算法的实现逻辑与应用场景,Marmer 教授结合一个“估计GDP 增长率”的实证案例,辅以代码演示,完整呈现了 Double LASSO 方法的应用流程。

课程尾声,Marmer 教授还介绍了工具变量回归中借助 LASSO 方法构建有效工具变量(Efficient IV)的思路。他依次讲解了三种情形下的构建逻辑:一是工具变量较多而控制变量较少,二是工具变量较少而控制变量较多,三是工具变量与控制变量均较多。为帮助学员深入理解,Marmer 教授先后展示了 “制度因素与 GDP 发展水平的关联性” 与 “征用权决策对非都市区房价的影响机制” 两个实证案例,并辅以代码演示,直观呈现了相关方法的应用过程。

经过四节课的系统讲解,Marmer 教授深入浅出地为同学们梳理了多种变量选择方法的理论机制与内在逻辑关联。他既清晰展现了不同方法的适用场景与优劣特征,又通过推导与实证案例的呼应,帮助学员构建起从理论到实践的完整知识框架,为后续研究与问题分析奠定了扎实基础。