请输入搜索信息

暑期学校

2023年7月21日和22日下午,世界计量经济学会“亚洲计量经济学和统计学暑期学校”由来自美国波士顿学院的肖志杰教授为学员授课。

肖志杰教授的研究包括时间序列分析、计量经济学、金融经济学等领域,曾获得计量经济理论Plura Scripsit奖,计量经济理论Multa Scripsit奖,并担任多个著名学术杂志编委/副主编。

7月21日下午,肖志杰教授带来题为“Functional Time Series Analysis (函数型时间序列分析)”的课程。课程开始,肖志杰教授介绍了函数型数据以及函数型数据的相依性广泛存在于医疗科学、行为科学、经济学、金融学等领域,并以计量经济学中的条件自回归在险值模型为出发点,总结了函数型数据和函数型时间序列模型的优势与特点,强调了无穷维的特征既带来了丰富的信息量,也增加了理论分析及计算的难度。鉴于函数型数据通常取值于希尔伯特空间,肖志杰教授从度量空间出发,循循善诱,逐步过渡到希尔伯特空间的定义和性质、基本的线性算子理论,以及均值函数、协方差算子(函数)的定义。随后,依据解释变量和被解散变量的取值类型,肖志杰教授类比常见的线性回归模型,为大家介绍了函数型数据中的三种常见的回归模型,并着重分析了函数型自回归模型的概率性质,解读了模型的含义。为了对模型进行估计,肖志杰教授从多元统计中的主成分分析 (PCA) 出发,介绍了适用于函数型数据的函数型主成分分析 (FPCA)方法,并对比了PCA 和 FPCA。最后,作为金融风险管理方面的一个应用,肖志杰教授介绍了团队关于函数型分位数自回归模型的最近工作,这为分位数自回归建模提供了新的经济学和统计学研究视角,体现了函数型时间序列分析的独特优势。

7月22日下午,肖志杰教授为学员们讲授Random Forest(随机森林)的有关内容。肖志杰教授首先表明,随机森林这一方法是基于决策树构建的,然后从Leo Breiman的经典论文Two Cultures入手,介绍了数据建模和算法建模的主要区别,并指出当数据相对复杂时,响应变量和解释变量之间的关系往往也十分复杂,因此算法建模更为适用。接下来,肖志杰教授简明扼要地介绍了统计学习中的一系列基础概念和方法,如监督学习、回归、分类、经验风险最小化、交叉验证等。在此基础上,肖志杰教授开始讲述决策树方法的历史发展脉络和基本思想,他借用“分组”这一概念清晰而又深刻地阐明了决策树方法的内在逻辑,并用美国职业棒球大联盟的数据为例讲述如何构建决策树,更直观地展示了该类方法的实用性。进一步地,肖志杰教授总结了决策树方法的优势和不足,并以该类方法方差普遍偏大这一不足作为逻辑支点,开始介绍集成方法。首先介绍了Bagging方法,同时展示对应的拟合图,使该方法的优点看起来一目了然,之后又指出了Bagging方法的不足,自然而然地引出基于Bagging进行改进的随机森林方法,并对其基本思想和具体算法一一进行介绍。课程最后,肖志杰教授给出了三个有关统计建模逻辑的评述,即“整合不同模型的信息”“不盲目追求简单模型”和“将高维度特征打散再整合”。

肖志杰教授授课逻辑缜密,为学员们带来了一场内容详实,同时兼具高度和广度的高质量课程。

(文/徐卫超 图/李依桐 方思然)