admin 管理员组

文章数量: 1086019


2024年4月15日发(作者:setinterval参数设置)

DOI:10.13546/.2021.06.013

理论探讨

基于Tlasso的大维协方差矩阵估计及其应用

袁欣,俞卫琴

(上海工程技术大学数理与统计学院,上海201620)

摘要:金融数据的大维度性、高度正相关性及非正态性给投资组合中协方差矩阵的估计带来了巨大挑

战。针对这一问题,文章提出了基于数据驱动的Tlasso投资组合模型。该模型假设资产收益率服从多元t分

布,并借助

l

1

惩罚项来获得大维逆协方差矩阵的稀疏估计。实证结果表明,相对于等权重模型、样本协方差模

型及Glasso模型,Tlasso模型能显著提高大维协方差矩阵的估计效率,并选出最佳的投资组合。

关键词:大维协方差矩阵;Graphicallasso;Tlasso;投资组合

中图分类号:

F224.7

文献标识码:A文章编号:1002-6487(2021)06-0060-04

制协方差矩阵的估计误差,特别是避免其对投资组合权重

0引言

随着信息技术的飞速发展,大维数据统计分析在现代

科学研究中变得愈发重要。例如在投资组合的构建中,常

常遇到资产数量相对于时间序列长度较大的情况。然而,

经典的统计方法通常建立在样本数量远大于变量维度的

假设下。利用传统方法处理大维度问题时会估计出病态

结果,这在投资组合的构建中尤为明显。

[1]

Markowitz(1952)提出的最小方差投资组合模型是投

系数的影响,近年来的研究大多集中于建立稳健的协方差

[2]

矩阵估计器。Laloux等(1999)引入的随机矩阵理论、En-

[3][4]

gle(2002)提出的DCC模型以及Ledoit和Wolf(2004)提

供的收缩估计方法均从不同方面提高了协方差矩阵的估

[5]

计效率。张保帅等(2019)将风险扩散效果引入到优化过

程中,提出了对投资组合配置更加有效的Mean-CoVaR模

型。另一方面的研究则集中在稀疏估计方法上。Fan等

[6]

(2012)对权重系数施加

l

1

惩罚项去构建投资组合。Goto和

[7]

Xu(2015)应用Graphicallasso(Glasso)统计技术对投资组合

资组合理论的基石,该模型最大的挑战是需要提供可靠的

协方差矩阵。但是在最小化方差的优化过程中,由于权重

系数的解析需要输入协方差矩阵的逆矩阵(逆协方差矩

阵),因此放大了协方差矩阵的估计问题。同时,当资产数

量相对于时间序列的长度较大时,传统估计方法常常导致

病态的协方差矩阵。此外,资产收益率之间存在的高度正

相关性也会对权重系数的估计产生影响。为了更好地控

中逆协方差矩阵进行了估计。Glasso模型在逆协方差矩阵

中引入了稀疏性,从而可以捕获不同资产之间的条件独立

性。实证结果表明通过Glasso构建的投资组合更加稳健。

在实际应用中,金融资产的收益率往往呈现出尖峰厚

尾的特征。正态性假设的偏差会对Glasso的估计产生显

著影响,而t分布假设可以在数据存在异常值的情况下提

供更加稳健的估计。因此,低自由度的多元t分布假设被

基金项目:国家自然科学基金资助项目(11602134;11772148);全国统计科学研究一般项目(2018LY16)

作者简介:袁欣(1993—),男,河北石家庄人,硕士研究生,研究方向:大维协方差矩阵估计。

俞卫琴(1982—),女,江苏南通人,博士,副教授,研究方向:非线性动力学系统。

ThreeDecisionCriteriainStatisticalHypothesisTest

WangJunhu

(LuoyangInstituteofTechnology,LuoyangHenan471023,China)

Abstract:Hypothesistestalorationofusing

intervalestimationmethodsforhypothesistestingcannotonlycompletethecomplexhypothesistestingwithrelativelysimpleesti-

mationmethods,butalsodeepentheunderstandin

paperisbasedonthecomparisonofcriticalvaluecriterionandp-valuecriteriontodiscussthecontentofintervalestimationcrite-

rion,andthenprovesthatitisthesameasthecriticalvaluecriterionandthep-valuecriterion,whicharethethreeequivalentde-

cisioncriteriainhypothesistest.

Keywords:hypothesistest;intervalestimationcriterion;criticalvaluecriterion;p-valuecriterion

60

统计与决策2021年第6期·总第570期

理论探讨

认为是投资组合模型更好的选择。Finegold和Drton

(2011)

[8]

将Glasso方法中的正态分布假设替换为t分布假

设从而引出了Tlasso方法。本文主要探讨将Tlasso技术应

用到大维协方差矩阵的估计中,通过对比等权重模型、样

本协方差模型、Glasso模型及Tlasso模型四种投资组合模

型的结果,检验Tlasso模型是否有助于提高协方差矩阵的

估计效率从而降低投资组合的风险。

1模型构建

1.1最小方差投资组合模型

自Markowitz的开创性著作以来,通过多元化投资来

分散风险的理念已成为现代投资理论的核心。最小方差

投资组合模型可以表示为一个简单的二次优化问题,如式

(1)所示:

min

w

w

Σw

s.t.1

w=1

(1)

其中,

Σ

n´n

维的协方差矩阵,

w

n´1

维的资

产权重向量。上述优化问题的解析解为:

w

*

=

Σ

-1

1

1

Σ

-1

1

(2)

其中,

w

*

是最小方差投资组合的最优权重向量。由

Σ

是未知的,本文利用

Σ

表示真实协方差矩阵的估计,

则最优权重向量的估计为:

w

*

=

Σ

-1

1

Σ

1

-1

1

(3)

在实际应用中,最小方差投资组合模型对

Σ

的估计误

差十分敏感,导致了不现实的极端权重以及较差的样本外

推性能。从式(2)可以发现,权重系数的精度与逆协方差

矩阵的精度密切相关。利用特征分解可以将真实协方差

矩阵表示为

Σ=VΛV

,其中,

V

Σ

的特征向量矩阵,

Λ=diag(λ

1

λ

n

)(λ

1

λ

n

)

Σ

的特征值矩阵。同理,

逆协方差矩阵也可以表示为

Σ

-1

=UDU

,其中

U

Σ

-1

特征向量矩阵,

D=diag(δ

1

δ

n

)(δ

1

δ

n

)

Σ

-1

的特

征值矩阵。则有下式:

Σ

-1

=(VΛV

)

-1

=(V

)

-1

Λ

-1

V

-1

=VΛ

-1

V

(4)

由此可见,

U=V

D=Λ

-1

i

=1/λ

i

)

,即逆协方差矩

阵的特征向量与协方差矩阵的特征向量相同,特征值是协

方差矩阵特征值的倒数。逆协方差矩阵的最大特征值对

应的特征向量是受噪声和估计误差影响最大的特征向量,

这就导致模型对

Σ

的估计误差十分敏感。

1.2Graphicallasso模型

图模型利用节点和边来描述一组变量的条件依赖结

构和无条件依赖结构,其中以高斯图模型(GGMs)最为流

行。最小方差投资组合模型依赖于资产收益的正态性假

设,因此GGMs也可以用于估计资产间的线性相依关系。

假设资产收益率是服从

p

元正态分布的随机变

量,即

XN

p

(μΣ)

,其中,

μ

为均值,

Σ

为协方差矩阵。那

么可以定义一个无向图

G(VE)

与随机变量

X

联系起来,

其中,顶点集

V

中的每个节点代表每项资产,边

E=

{

(ij)ÎV´V

|

r

ij

¹0

}

由每两组资产的非零偏相关系数组成。

Graphicallasso(Glasso)模型是指将

l

1

范数引入到最

大似然估计问题中进行惩罚,使得估计的逆协方差矩阵中

大多数非对角线元素为零,

具体表达式如下:

Σ

-1

glasso

=argmax

Σ

-1

æ

è

log

|

Σ

-1

|

-tr(Σ

-1

S)-ρ

-1

)

-

ö

1

ø

(5)

其中,

S

表示样本协方差矩阵,

ρ

是控制稀疏性的惩

罚参数(

ρ

越大,逆协方差矩阵零元素个数越多)。

-1

)

-

表示将

Σ

-1

的对角元素设为0、其他元素保持不变的对应

矩阵。Friedman等(2008)

[9]

针对该模型提供了一个有效的

求解算法并开发了相应的R软件包(glasso)。

1.3Tlasso模型

金融资产的收益率往往呈现出尖峰厚尾的特征。因

此,低自由度的多元t分布假设被认为是资产回报模型更

好的选择。Tlasso模型就是在假设资产收益率服从多元t

分布的前提下对逆协方差矩阵进行稀疏估计。设

X

为服

p

元t分布的随机向量,即

Xt

p

(μΨ

-1

v)

,其中,

μ

均值向量,

Ψ

-1

为离差矩阵,

v

为自由度。逆协方差矩阵

可以表示为:

Σ

-1

=

v-

v

2

Ψ

(6)

本文采用Finegold和Drton(2011)

[8]

提出的方法,将多

元t分布表示为多元正态分布与伽马分布的混合分布,然

后利用EM算法估计逆协方差矩阵。

WN

p

(0Ψ

-1

)

为服从多元正态分布的随机变量,

τ~Γ(v/2v/2)

为服从伽马分布的随机变量,则:

X=μ+

W

τ

~t

p

(

μΨ

-1

v

)

(7)

假设

X

1

X

n

X

中的

n

个样本,则EM算法可以

分为以下两步:

(1)根据

t

期的估计值

μ

(t)

Ψ

(t)

计算

t+1

期的

τ

(t+1)

i

公式如下:

τ

(t+1)

i

=

v+p

v+

(

(X

(t)

)

T

Ψ

(t)

(X

i=1n

(8)

i

i

(t)

)

)

计算

t+1

期的

μ

(t+1)

S

(t+1)

,公式如下:

μ

(t+1)

å

n

τ

(t+1)

i

X

=

i=1

i

(t+1)

(9)

å

n

τ

i=1

i

S

(t+1)

n

=

1

(t+1)

n

å

τ

i

é

ë

X

i

(t+1)

ù

û

é

X

(t+1)

ù

T

i

(10)

i=1

ëû

Ψ

(t+1)

通过求解以下优化问题得到:

Ψ

(t+1)

=argmax

æ

è

log

|

Ψ

|

-tr

(

ΨS

(t+1)

Ψ

)

Ψ

1

ö

ø

(11)

在估计逆协方差矩阵时,首先根据样本求得初始均值

向量与离差矩阵。其次,顺序迭代E步与M步直至两次

Ψ

(t)

的最大差值小于给定的阈值时停止。最后,利用式

6)计算逆协方差矩阵的估计值。本文假设自由度

v=4

统计与决策2021年第6期·总第570期

61

理论探讨

阈值为0.01。

2实证分析

2.1数据描述性统计

本文以上证180指数成分股为研究对象,选取的样本

期间为2016年2月1日至2019年8月30日,共874个交易

日。上海证券交易所每日会公布上证180指数成分股及

其权重的相关信息,由于成分股会经常变动,本文挑选出

样本期间内上证180指数成分股的交集,同时剔除了长时

间停盘(停盘时间大于10天)的股票,以最终剩余的78只

股票构建投资组合。在实际应用中,股票停盘往往会提高

投资组合的风险,因此构建投资组合股票池时不宜选取长

时间停盘的股票。本文数据来源于CSMAR,实证分析利

用R软件实现。

表1上证180及主要成份股描述性统计

股票简称

日收益率日收益率

均值标准差

偏度系数峰度系数JB统计量P值

中国平安0.00150.01700.29855.1851186.80950.0000

贵州茅台0.00230.01900.25805.3083203.76190.0000

招商银行0.00120.01620.34654.9750159.53230.0000

上证1800.00040.0110-0.10067.2826669.27390.0000

表1为上证180指数及主要成分股(成分股权重排名

前三位)的描述性统计分析。结果显示,各股票收益率的

峰度系数均大于3,JB统计检验均拒绝正态分布的假设,

表明各收益率序列均不服从正态分布。

本文将时间划分为样本内与样本外(见表2),采用滚

动时间窗口的方法分析样本外模型的表现效果。其中估

计协方差矩阵的窗口

t=100

,每5天通过计算固定大小窗

口上的最小方差组合来重新调整投资组合权重。表2中

n/t=0.78

表明估计的是大维协方差矩阵。

表2样本划分

股票数

n

样本数估计窗口

t

nt

时间

样本内781001000.782016/2/1—2016/6/30

样本外787741000.782016/7/1—2019/8/30

2.2惩罚参数

ρ

的确定

Glasso模型与Tlasso模型中逆协方差矩阵的估计值很

大程度上取决于惩罚参数

ρ

ρ

越大逆协方差矩阵越稀

疏,反之同理。特殊情况下,当

ρ=0

时模型得到的结果就

是样本协方差矩阵的逆。本文利用贝叶斯信息准则(BIC)

来优化

ρ

,公式如下:

BIC=-2log

(

Lik

ρ

i

)

+k

Σ

-1

´log(t)

(12)

其中,

Lik

ρ

i

为第

i

ρ

对应的似然函数值,

k

Σ

-1

为估

计的逆协方差矩阵中非零元素的个数,

t

为样本观测数。

图1展示了Glasso与Tlasso不同惩罚值对应的BIC。从图

中可以看出,两模型的BIC均随着

ρ

的增大出现先下降后

上升再下降的趋势。图中BIC后续下降是因为随着

ρ

增大,逆协方差矩阵发生过惩罚现象,导致估计的逆协方

差矩阵中除对角线元素外全为0,这并不是本文理想的结

62

统计与决策2021年第6期·总第570期

果。综合考虑,本文选择

ρ=0.085

来估计逆协方差矩

阵。特别地,在优化过程中为了使

ρ

的最优值出现在

(01)

这一范围之内,本文对数据进行了标准化处理。

20000

15000

Glasso

Tlasso

C

I

B

10000

5000

0.000.250.50

图1Glasso与Tlasso不同惩罚值对应的

ρ

0.751.00

BIC

2.3实证结果

本文构建了四种投资组合模型进行对比,分别是等权

重模型、样本协方差模型、Glasso模型及Tlasso模型。等权

重模型构建的投资组合中各资产权重均相等。样本协方

差模型通过样本协方差矩阵估计真实协方差矩阵,然后求

解优化问题得到权重系数。Glasso模型与Tlasso模型分别

通过Glasso与Tlasso方法求解逆协方差矩阵的估计值,然

后求解优化问题得到权重系数。

由于中国股票市场做空机制还不完善,所以本文在构

建投资组合中限制了权重必须大于等于0,即优化公式最

终为:

minw

w

Σw

s.t.1

w=1w

i

0(i=1n)

(13)

表3展现了四种投资组合模型的性能度量。在构建

最小方差投资组合时,标准差是最重要的性能度量指标。

除此之外,本文还计算了投资组合的平均回报率与夏普比

率,以分析经风险调整后的回报率。

表3四种模型性能对比

模型

标准差平均回报率夏普比率

样本内样本外样本内样本外样本内样本外

等权重0.01550.01120.00100.00020.05850.0091

样本协方差0.00990.01140.00080.00010.07620.0057

Glasso0.01020.01100.00080.00020.07760.0140

Tlasso0.01000.01020.00100.00030.09120.0228

注:夏普比率的计算中取无风险利率为我国一年期存款利率,即为1.75%。

从表3可以看出,样本协方差模型在样本内的标准差

仅为0.99%,是所有模型中最小的一个,而样本外的标准

差为1.14%,明显高于样本内标准差。这也就验证了在大

维协方差矩阵的估计中利用样本协方差估计的误差会对

投资组合产生极大的影响。Tlasso模型在最小化样本外

标准差与减少样本内外结果间的差距方面表现最好。同

时,与Glasso模型相比,Tlasso模型在样本内与样本外均取

得了较高的平均回报率与夏普比率。这是因为Tlasso模

型对异常值的敏感度降低,从而能够更好地处理资产收益

尖峰厚尾的特征。

方差齐性检验(F检验)可以判断两总体方差是否相

理论探讨

等,但是在被检验数据不服从正态分布的情况下,该检验

[10]

的稳健性会大幅下降。Ledoit和Wolf(2011)基于F检验

(2)Tlasso模型中多元t分布的假设使得该模型能够

更好地处理金融数据中尖峰厚尾的特征。Tlasso模型显

著提高了大维协方差矩阵的估计效率,该模型样本外的夏

普比率较Glasso模型提高了63%,投资绩效更优。

参考文献:

[1]lioSelection[J].TheJournalofFinance,1952,7(1).

CorrelationMatrices[J].PhysicalReviewLetters,1999,83(7).

[2]LalouxL,CizeauP,BouchaudJP,ressingofFinancial

[3]cConditionalCorrelation:ASimpleClassofMultivari⁃

els[J].JournalofBusiness&EconomicStatistics,2002,20(3).

TheJournalofPortfolioManagement,2004,30(4).

模型[J].统计与决策,2019,(11).

的缺陷提出了改进的检验方法——Bootstrap置信区间方

法。为了在有限样本上获得更好的性质,该方法在计算方

差差异时进行了对数变换,公式如下:

=log

σ

2

-log

σ

2

D

()

i

()

n

(14)

σ

i

σ

n

分别表示两总体方差的估计。其中,

本文利用Bootstrap置信区间方法检验Tlasso投资组

合模型与其他模型样本外标准差是否存在显著差异。结

果(见表4)表明,Tlasso模型的样本外标准差要显著低于

其他模型。

表4

D

ateGeneralizedAutoregressiveConditionalHeteroskedasticityMod⁃

Tlasso模型与其他模型的Bootstrap置信区间检验

等权重模型

-0.1922***

样本协方差模型

-0.2223***

Glasso模型

-0.1563***

[4]LedoitO,,IShrunktheSampleCovarianceMatrix[J].

[5]张保帅,姜婷,周孝华,等.投资组合优化的新方法:Mean-CoVaR

[6]FanJ,ZhangJ,rtfolioSelectionWithGross-exposure

107(498).

注:***表示在1%的显著性水平下显著。

3结论

协方差矩阵的估计是Markowitz最小化方差投资组合

Constraints[J].JournaloftheAmericanStatisticalAssociation,2012,

[7]GotoS,ingMeanVarianceOptimizationThroughSparse

sis,2015,50(6).

模型的基础,如何有效地估计大维协方差矩阵已受到学界

和业界的广泛关注。本文从资产收益率大多不服从正态

分布的角度出发,提出了基于数据驱动的Tlasso投资组合

模型,并以上证180指数成分股为研究对象,通过对比等

权重模型、样本协方差模型、Glasso模型以及Tlasso模型发

现:

(1)样本协方差模型的估计误差会对投资组合产生极

大影响,基于Tlasso的投资组合模型有效减少了大维协方

差矩阵的估计误差,从而获得了更高的样本外推性能。

HedgingRestrictions[J].JournalofFinancialandQuantitativeAnaly⁃

[8]FinegoldM,GraphicalModelingofGeneNetworks

pliedStatistics,2011,(5).

UsingClassicalandAlternativeT-distributions[J].TheAnnalsofAp⁃

[9]FriedmanJ,HastieT,InverseCovarianceEsti⁃

[10]LedoitO,PerformancesHypothesisTestingWith

theVariance[J].Wilmott,2011,(55).

mationWiththeGraphicalLasso[J].Biostatistics,2008,9(3).

(责任编辑/浩天)

Tlasso-basedLargeDimensionalCovarianceMatrixEstimationandItsApplication

YuanXin,YuWeiqin

(SchoolofMathematicsandStatistics,ShanghaiUniversityofEngineeringScience,Shanghai201620,China)

Abstract:Thelargedimensionality,highlypositivecorrelationandnon-normalityoffinancialdatabringgreatchallengesto

ethisproblem,thepaperproposesadata-drivenTlassoportfoliomodel.

Themodelassumesthatthereturnonassetsobeysmultivariatetdistribution,andobtainsthesparseestimationofthelargedimen-

sionalinversecovariancematrixbymeansof

l

1

iricalresultsshowthatcomparedwiththeequal-weight

model,samplecovariancemodelandGlassomodel,theTlassomodelsignificantlyimprovestheestimationefficiencyoflargedi-

mensionalcovariancematrix,andcanselectthebestportfolio.

Keywords:largedimensionalcovariancematrix;Graphicallasso;Tlasso;portfolio

统计与决策2021年第6期·总第570期

63


本文标签: 模型 协方差 矩阵 估计 投资