分类
加密貨幣去哪裡買

肥尾分布的统计效应

肥尾分布的统计效应

马克维茨的均值方差模型中,第一次运用波动率来定量地衡量金融资产的风险。随后,针对金融资产波动率的研究逐渐围绕着对波动率的均值回复现象和波动率的聚集现象的研究展开。金融资产收益率的波动存在着很多的特性,主要有厚尾分布(fat-tail)、非对称影响(Leverage)、波动率聚集(肥尾分布的统计效应 Volatility Clusters)、波动率的均值回复(Mean Reverse)、跳跃(肥尾分布的统计效应 Jump)等等;而通过对过去的研究的总结发现,无论是Garch模型簇还是SV模型簇,都没有很好的模型在一个模型中能够刻画厚尾特征和非对称效应,因此,在过去研究的基础上,提出了非对称的厚尾的随机波动模型,并且在此模型的基础上,加入了跳跃因子,得到了带跳和非对称效应的厚尾随机波动模型用来刻画金融资产的跳跃现象。本文中讨论的随机波动模型同时兼顾了股票市场的非对称效应、厚尾效应和跳跃特征,对新的模型的结构进行了统计分析,接着通过贝叶斯分析推导得到了参数的后验分布,并设计了模型参数估计的吉布斯算法;选择创业板指数作为研究对象,利用带跳和非对称效应的厚尾随机波动模型进行波动率预测,肥尾分布的统计效应 同时,运用MSE、QLICK损失函数对跳跃厚尾非对称的随机波动模型、厚尾随机波动模型以及标准随机波动模型的预测效果进行比较分析,并运用D-M统计量对模型的预测效果的优劣进行了显著性检验。研究结果表明:近几年来中国股市具有明显的波动持续性、非对称效应、厚尾现象和跳跃现象,中国股市的跳跃现象比美国股市更加明显。在对中国股市的波动率预测方面,带跳和非对称效应的厚尾SV的预测效果比非对称的厚尾SV模型和厚尾SV模型好,而非对称厚尾随机波动模型又要比标准随机波动模型好。

肥尾分布的统计效应

其中一个说:重尾意味着分布对于某个整数 j 有无限的 j 阶矩。 此外,帕累托 df 的吸引域中的所有 df 都是重尾的。 如果密度具有高中心峰和长尾,则峰度通常较大。 峰度大于 3 的 df 是肥尾或尖峰。 我仍然没有这两者之间的具体区别(重尾与肥尾)。 对相关文章的任何想法或指示将不胜感激。

我想说,应用概率论中的通常定义是 右重尾分布 是在 上具有无限矩生成函数的分布,也就是说, 如果 这与 Wikipedia 一致,它确实提到了其他使用的定义,例如您拥有的定义(某些时刻是无限的)。 还有一些重要的子类,例如 长尾分布次指数分布 。 根据上面的定义,所有矩都是有限的重尾分布的标准示例是对数正态分布。 ( 0 , ∞ ) X

很可能有些作者可以互换使用肥尾和重尾,而其他作者则区分肥尾和重尾。 我会说 肥尾 可以更模糊地用于表示 比正常 尾巴更胖,并且有时在你所指出的 leptokurtic (正峰度)的意义上使用。 根据上述定义, 这种分布 不是重尾分布的一个例子是逻辑分布。 但是,这 与例如 Wikipedia 不一致 后者限制性更强,并且要求(右)尾部具有 幂律衰减 . 维基百科的文章还表明,肥尾和重尾是等价的概念,尽管幂律衰减比上面给出的重尾定义强得多。

为避免混淆,我建议使用上面(右)重尾的定义,而不管肥尾是什么。 上述定义背后的主要原因是,在对罕见事件的分析中,在正区间上具有有限矩生成函数的分布与在 上具有无限矩生成函数的分布之间存在质的差异。 ( 0 , ∞ )

NN Taleb, 肥尾分布的统计效应 肥尾分布的统计效应 P Cirillo (2019) 在 分支认知不确定性和尾部厚度中 直接解决了这个问题,他们指出:

从极值统计的角度来看,Gamma 和对数正态分布都是重尾分布,这意味着它们的右尾变为零比指数函数慢,但不是“真正的”肥尾,即它们的尾下降得更快比幂律[31]。 从极值理论的角度来看,这两个分布都在广义极值分布 [9]、[14] 肥尾分布的统计效应 的 Gumbel 情况的最大吸引力域中,而不是 Fréchet 的最大吸引力域,即适当的肥尾分布案子。 因此,这些分布的矩总是有限的。

首先可以有左尾和右尾,然后是长尾和短尾。 短尾分布可以被认为具有有限范围,称为它的支持。 长尾在那个方向上有半无限的支持。 对于右尾重度,通常通过检查两个不同分布的比率的对数来比较生存函数 (RVs) 或互补累积密度函数 (1-CDF)。 一般来说,重尾意味着比指数分布更重,而轻尾意味着比指数分布更轻。 重尾分布的一个子集称为“肥尾”。 从历史的角度来看,肥尾的概念很可能与 I 型帕累托分布有关,即

其中, 是形状参数, 是尺度参数,β 是 单位阶跃函数,因此 延迟 ,并且是 时才用于制作非零乘积 。 α β θ ( ⋅ ) 肥尾分布的统计效应 θ ( t − β ) β t > β

来自 朱兰 ,“肥尾分布的统计效应 帕累托原则( 原文如此 ,80-20 规则)得名于意大利出生的经济学家维尔弗雷多·帕累托(Vilfredo Pareto,1848-1923),他观察到相对少数人拥有大部分财富(20%)——早在 1895 年。Pareto 开发了对数数学模型来描述这种财富的不均匀分布,数学家 MO Lorenz 开发了图表来说明它。

接下来,让我们考虑一下当时对财富的态度。 肥尾分布的统计效应 Renzaho 引用 Grivetti 的话说:“在 20 世纪之交,北美肥胖备受推崇;富有的消费者在腰间展示了他们的财富。肥胖的脸颊和充足的胃是个人健康的视觉线索,没有感染可怕的纤细肺结核。照片对 19 世纪末和 20 世纪初的美国高管的调查显示,富有绅士的饮食摄入量经常超过消耗的卡路里。”

那个时代的历史为这些话赋予了相当大的分量。 根据美国 1910 年的人口普查,肺结核,又称“消耗”,实际上是从内而外吞噬身体,几十年来一直流行,每年每 1,000 名居民中约有 15 人死亡,或者,如果您愿意,大约有 30 人死亡。 SARS-CoV-2 年死亡率的倍数。 因此,更现代的苗条健康概念似乎并不流行。

接下来,“肥猫”一词在大约 1920 年或更早的时候开始用来描述富有的政治捐助者,帕累托的作品在 1916 年首次被翻译成英文。 Wesolowski 等人。 在脚注中总结了那个时代的普遍态度,“具有讽刺意味的是,财富的肥尾分配激发了卡尔马克思的 [49] 以及贝尼托·墨索里尼的经济政策,它们对相同的统计数据 [50] 做出了截然相反和极端的反应。” 并属性 肥尾的含义 如下所示,“幂律的统计形式是帕累托分布 (PD),它与柯西分布一样,尾部非常重,它们赋予了不寻常的统计特性,并被命名为肥尾分布。幂律与尺度无关本质上是分形的。”

在那篇论文中,[49] 指 的是肥猫和肥尾:从金融危机到“新”概率马克思主义 ,[50] 指的是 由 Zanden 重新考虑的帕累托和法西斯主义 。 维尔弗雷多·帕累托将贝尼托·墨索里尼作为他最著名的学生不应该被任何人遗忘。

肥尾分布的统计效应

尾端風險/極端風險(Tail Risk)是指統計學上兩個極端值可能出現的風險,按照常態的鐘型分布(Bell Shape),兩端的分布機率是相當低的(Thin Tails);但是兩個極端值的分布亦有可能出現厚尾風險/肥尾(Fat Tails)風險,那就是距離中值(Mean),出現的機率提高。也就是原本不太可能出現的機率突然提高了,運用在金融市場上,那就是極端行情出現的可能性增加而且頻繁,這樣可能會造成市場行情的大幅震盪,造成的原因可能是市場上出現不尋常的事件。

肥尾分布的统计效应

r t 肥尾分布的统计效应 = μ + ε t 是一个资产收益率的时间序列,其中 μ 是期望收益率, ε t 一个均值为零的白噪声过程。尽管数列 ε t 是序列不相关的,此数列并不需要相互独立。例如此数列可以存在条件异方差。 Glosten-Jagannathan-Runkle GARCH ( GJR-GARCH ) 模型假设其条件异方差存在一个特定的参数形式。更具体地讲,我们称 ε t ~ GJR-GARCH 如果 ε t 能写成 ε t = σ t z t , 其中 z t 是一个标准正态分布变量,并且:

σ t 2 = ω + α + γ I t - 1 ε t - 1 2 + β σ t - 1 2

V-Lab利用最大对数似然法估计所有参数 μ ω α γ β 。假设 z t 是正态分布并不意味着收益率也服从正态分布。 即使他们的条件分布为正态分布,我们可以证明他们的无条件分布呈现超值峰度(厚尾分布)。事实上, 条件分布为正态分布的假设限制性并不强:即便真实分布并非正态分布,在相当宽松的条件下, 使用不正确的高斯似然函数而得到的最大似然估计仍是真实参数的一致估计,即“准最大似然估计”。

除了收益率的厚尾属性, GJR-GARCH 模型同 GARCH 模型一样,能够捕捉金融时间序列的其他特点,例如波动率聚类。即如果 t - 1 时的波动率很高, t 时的波动率也会很高。用另一个角度可以理解为, 肥尾分布的统计效应 t - 1 时刻的冲击也会影响到 t 时刻的波动率。然而,如果 α + γ 2 + β < 1 ,波动率本身是一个均值回归过程,并且在无条件方差的平方根 σ 附近上下波动:

σ 2 ≔ Var r t = ω 1 - α - γ 2 - β

其中 1 2 乘以 γ 是由于对 z t 做出的正态分布假设。更直观来讲,这个公式来源于假设收益率的条件分布是关于 μ 对称的.

通常对模型参数的限制条件包括 ω α γ β > 0 。 GARCH 实际上是满足限制条件 γ = 0 b的 GJR-GARCH 模型。

r t 是样本中的最后一个观测值,并且 ω ^ , α ^ , γ ^ 和 β 肥尾分布的统计效应 ^ 分别是参数 ω , α , γ 和 β 的最大似然估计值。在 GJR-GARCH 模型下, T + h 时刻的条件方差的预测值为:

σ ^ T + h 2 = ω ^ + α ^ + γ ^ 2 + β ^ σ ^ T + h - 1 2

因而,通过对上述公式迭代计算,我们能够对任意时间范围 h 内的条件方差进行预测。那么, T 肥尾分布的统计效应 + h 时刻的复合波动率的预测值为:

σ ^ T + 1 : T + h = ∑ i = 1 h σ ^ T + i 2

注意当 h 值很大时,复合波动率的预测值趋近于:

h ω ^ 1 - α ^ - γ ^ 2 - β ^

利用平方根法,根据时间范围调整相应比例,乘以 GJR-GARCH 模型计算得到的非条件波动率的估计值。同上文一样, 1 2 乘以 γ 是由于我们假设收益率的条件分布是对称的。

比较GJR-GARCH和GARCH模型

GJR-GARCH 能够捕捉到一个 GARCH 模型无法描述的一个实证现象,即 t − 1 时刻的负面冲击比正面冲击对 t 时刻的方差有更强烈的影响。人们一度认为负面冲击导致杠杆增加,从而导致风险增加, 因而把这一不对称现象称之为杠杆效应。不过现在我们知道单纯的杠杆效应微不足道,并不能完全解释实证数据中的不对称性。 描述这种负面冲击的有效系数为 α + γ 。在金融时间序列中,我们普遍发现 γ 是统计显著的。

GJR-GARCH(p,q)

上文所提到的模型可以包括更多滞后变量来描述条件方差。 GJR-GARCH p q 模型假设:

σ t 肥尾分布的统计效应 2 = ω + ∑ i = 1 p α i 肥尾分布的统计效应 + γ i I t 肥尾分布的统计效应 - i ε t - i 2 + ∑ j = 1 q β j σ t - j 2

我们可以通过贝叶斯信息准则BIC(亦成为施瓦茨信息准则SIC)或赤池信息准则AIC来选择最佳模型( p 和 q )。前者比后者更加简洁。 V-Lab采用 p = 1 和 q = 1 , 因为这通常是最适合金融时间序列的选项。