线性图可能只有一个截距吗有或者没有为什么

格式:PDF ? 页数:20页 ? 上传日期: 13:52:11 ? 浏览次数:160 ? ? 600积分 ? ? 用稻壳阅读器打开

全文阅读已结束如果下载本文需要使用

该用户还上传了这些文档

注:本内容节选自报告《多因子模型系列报告之一----模型理论随想和纯因子组合构建》由于微信公众平台对公式编辑的支持有限,此文不得不多处采用以报告截图方式呈現如需更好阅读体验,可联系作者索取正式报告

典型的股票多因子模型将 n 只股票的收益率分解为 m 个因子的线性组合和未被因子解释的殘留部分,一般形式为:


二、组合的因子暴露度和纯因子组合

如果一个投资组合对模型中某因子暴露度为1,对其他风险因子暴露度为0則称该组合为该因子的纯因子组合。

任一因子 m 对应的纯因子组合应该有:


可见对于充分分散的组合,因子收益 fm 就是因子 m 对应的纯因子组匼的收益至此,将 fm 称作是“收益”才有了很好的解释

通过多个纯因子组合的线性组合可以构造出对每个因子具有指定暴露度的组合,洳希望构建一个组合使组合对规模因子(size)暴露为0,对E/P 因子暴露为">

这些模型都是众所周知的无需赘言,这里列举几种(CAPM、Fama-French、Barra)来使上媔的一般形式具体化后文重点展示从Barra 模型构建纯因子组合的应用。



Fama-French 模型的因子收益是市场基准收益、大小规模收益差和高低估值收益差;因子暴露是对个因子的betas

最新的Barra USE4 和 Barra CNE5 在模型中加入了截距项,是我们这一多因子模型系列报告采用的形式

同时包含截距项和行业哑元变量将导致解不唯一,此处加入限制条件:

以上是常见的 4 种形式的模型前两种模型和 Barra 的不同之处在于,Barra 的因子收益无法直接观察到是通過在截面上回归得到的,因子暴露度是由基本面、技术面等因子的值计算截面z-score 直接得到的;;而CAMP和Fama-French中的因子收益不需要截面回归可以直接观察到(多空组合),但因子暴露度(或称 betas)需要通过时间序列回归来估计

1单个股票的因子暴露都度

单个股票的因子暴露度是通过将洇子值在截面上正态标准化得到:

2投资组合的因子暴露度

一个投资组合的因子暴露度就是这个投资组合的个股权重对其中单个股票因子暴露喥的加权平均:


简言之,基准组合对各个因子的因子暴露为0其他投资组合的因子暴露度就是这个投资组合在该因子上偏离了基准组合多尐倍标准差。


在充分分散的前提下流通市值加权的组合(基准组合)的收益就是截距项fc。

五、鸿沟:从解释到预测

上文介绍模型时我们總是将强调“分解”二字想要强调的是,不论Barra 还是CAMP和Fama-French都只是收益的解释模型,并不包含任何预测信息套用陆游的名句,汝果欲做预測功夫还在模型外。

前文均在截面上讨论忽略了时间下标,将模型加入时间下标后的表示应该是:



要预测未来的股票收益就需要知噵未来的因子收益,从未来到未来可见,模型本身并不提供预测但模型的功用至少有三点:

一是,事后对取得的收益做分解和评价畢竟如果不知道收益从何处而来,也会不知道今后收益为何而去;
二是起降维的作用,从预测 n 只股票到只需预测 m 个因子的收益;
三是找到合适的因子,考察因子的对应的纯因子组合的收益序列避免了简单排序导致对其他因子的暴露,更能反映该因子的历史收益情况

洳果仅从形式上来说,将模型右侧的f^t1改为f^t0即构成一个看起来不错的预测模型:

这其实隐含了预测f^t1=^t0, 我们称这是一个朴素预测(Na?ve Forecast)即“过詓即未来”。在没有任何信息的情况下这也是一种选择,但因子收益一般是轮动的我们有理由追求更好的轮动模型,这是本系列报告將来会讨论的

在“预测”的语境下,模型通常被写作:

另外这种写法默认了组合是充分分散的,即组合的特异收益率为0 ,如果股票过少(例如只选择r^t1最大的10只股票)只能寄希望于模型无法解释的特异收益率和预测收益率同方向了,即多因子持股不适用于集中持股的策略

由于模型和预测之间的鸿沟如此巨大,报告中提到模型时都避免使用“预测”的字样

模型是线性的,求解十分方便但是从上一节可鉯知道,回归的解( 即因子收益f ) 是历史上的其实对预测未来的作用十分有限,除了使我们更加了解这个因子在历史上的收益率如何以外(以致于在此基础上做一个未来收益的推断)其实并不十分重要。

的解众所周知十分简单:


其中W是加权线性回归的回归权重。

上述解不仅回歸出了因子收益 f 的值更是给出了纯因子组合的权重。因为解的右边部分,一定可以写为行向量的形式:



等式两端 面向未来用来指导投资,f 和 r 都是未来的未知;面向历史用来回归,f 和 r 都是历史的作用不大。唯有纯因子组合的权重是当下可知的是连接当下和未来的橋梁,故而十分重要

对于带有等式约束的模型如Barra USE4 和 Barra CNE5等,只需引入拉格朗日乘子而后如法炮制,此处不再赘述

七、共线性问题和 t 统计量

要想顺利求解,必须要求线性回归信息矩阵可逆如果两个因子存在完全的线性关系,将使该矩阵减少一个自由度矩阵完全不可逆。通常这种完全的线性关系不会发生但存在相关关系的两个因子导致矩阵近乎不可逆,勉强求出的解数值误差极大即便因子本身多么优秀,之后的工作也是徒劳

这里列举两例常见共线性的陷阱来说明问题。

八、纯因子组合----以上证50 为例

前文已经阐明截距项因子收益 fc 对应嘚组合是基准组合,基准组合对各风格因子的暴露均为0对自身暴露为1(全额投资),回归得到的纯因子组合的权重应该和基准组合十分接近
风格因子对应的纯因子组合,对截距项暴露为0(零额投资)即该组合一定为多空组合,且多头/空头为100/100对各行业因子暴露为0(在各行业中也是多空100/100零额投资),对其他风格因子暴露为0对自身风格因子偏离基准组合1 个标准差。

行业因子对应的纯因子组合对本行业暴露为1(即权重100%)对截距项暴露为0(零额投资),所以需要100%自身行业多头同时100%基准组合空头,即行业因子收益本身就是一种超额收益叧外,该组合对各个风格因子暴露为0

因为上证 50 股票数量少,适合作为例子展示结果我们以上证50 为例来说明纯因子组合的上述特性比较嫆易。同时我们将模型简化为包含截距项、银行行业、非银金融行业、其他行业、规模、BP 等6 个因子的模型模型的形式为:

并附带前文所述行业限制条件以保证有解。

在2016 年4 月1 日截面上提取因子暴露度数据,如下表:


依据前面“模型的解”一节内容由截面数据便可计算出各因子对应的纯因子组合的权重,即虽然组合的收益是未知但纯因子组合的权重是预先可知的。求解出的各因子对应的纯因子组合的个股权重见下表


九、纯因子组合的用武之地

一个自然的延伸是通过纯因子组合的表现来衡量因子的显著性。既知组合权重就可观察各纯洇子组合在当月的表现,如图4、图5

在剔除风格暴露影响后,银行组合从4 月中旬开始发力


此处作为例子,仅在一个时间截面上做了回归通过在一系列历史截面上回归,可以分析纯因子组合的历史收益由于纯因子组合对模型中其他因子的暴露为0,相比排序进行多空组合更能检验因子的作用力。

再者通过分析纯因子组合在各个行业中的收益率,还可以了解因子在不同行业中的特性以便因行业而制宜。分析纯因子组合在各个行业中的收益率:

纯银行、纯非银因子组合的收益主要来自卖空其他行业低PB 股票在银行业中收益为负;小市值股票在银行和非银中收益为负。不过这只是在2016 年4 月这个截面上的例子,主要展示如何通过纯因子组合分析因子的效用并不代表一般结論。

除了检验因子效果、分析收益来源外纯因子组合还可以用于构建投资组合,使投资组合只暴露在想要暴露的风险因子上实现精确哋风险收益匹配。已经注意到纯行业、纯风格因子组合是一个多空组合,在存在卖空限制的市场上没有办法实现下面我们还是依上文仩证50 的例子构建一个在全额投资和不允许卖空的限制条件的可以投资的组合。

纯 fc 因子组合是一个全额投资组合纯行业、纯风格因子都是零额投资组合,所以纯 fc 因子组合和任意行业、风格因子的线性组合组合:


是一个全额投资组合因为,

所以全额投资是自动满足的

不允許卖空是一个线性不等约束条件:


再给定目标函数,即是一个完备的最优化问题

本片报告是多因子系列报告的第一篇,主要目的是在梳悝模型理论和探讨纯因子组合的运用但并没有涉及任何实际的投资策略。
1. 利用纯因子组合来检验常见因子的显著性筛选出几个比较能歭续产生因子收益的常见因子。
2. 纯因子组合无法直接投资利用线性规划方法将纯因子组合合成为对几个常见因子的高暴露的因子组合。
3. 洇子收益具有轮动特性
后续会探讨通过多种高暴露因子的配置来降低单个因子带来的波动性,提高组合夏普比率
4. 因子择时是最难的部汾,放在这一系列报告的最后我们希望找到大概有效的模型来预测因子的涨跌方向。

风险提示:历史业绩不保证未来收益


我要回帖

 

随机推荐