国元证券

注册

 

发新话题 回复该主题

仓位冰山,基金重仓股变动的精细结构国 [复制链接]

1#

本文摘要

√公募规模激增,机构定价权提升

机构定价权的提升,是近年来A股的主旋律之一。增量资金涌入绩优基金,机构进一步加仓擅长的基本面投资风格,推动基本面向好的个股上涨,形成风格正反馈。参照海外经验,A股机构化程度的提升仍有较大空间,机构行为Alpha有望在较长时间内维持。

√基金持仓数据具有特殊的冰山结构

基金持仓数据拥有特殊的冰山结构,精细结构处理能有效提升因子表现。不同于传统数据,基金季报只披露个股占比最高的前十大,合计占比约48%,另有占比超过一半的持仓数据季报不予披露,持仓明细不可见,只有半年报/年报披露全部持仓。

√重仓股变动的精细结构探究

根据两期季报仓位,本文从持仓变动因子(Naive_weight_change)出发;我们采用了历史信息和现有持仓信息相结合,填充季报缺失持仓数据,同时剥离个股涨跌幅影响,引入主动仓持变动因子(Active_weight_change);采用二分法分出正向持仓变动与负向持仓变动,前者仓位变动刻画精确且冗余数据较少,信息含量更高,我们以3:1的权重将两者结合,构造不对称主动持仓变动因子(Asym_weight_change)。

√不对称主动持仓因子表现优异

最终设计得到的不对称主动持仓变动因子选股效果好,因子换手率不高,在沪深中效果突出,Alpha集中在多头。在基金重仓股样本内因子月度IC均值达到了4.25%,多空年化收益率为12.20%。沪深内IC均值达到4.57%,多空收益率13.06%。在年之后因子表现更好,其月度IC均值达到了5.53%,多空年化收益15.18%,其中多头年化超额为8.39%。

√风险提示

本报告均基于历史数据与模型进行测试,历史回测结果不代表未来收益,在未来市场环境变化时不排除模型失效的风险,本文仅供投资者参考。

报告正文

01

基金重仓股的冰山结构

本篇报告是“重仓股掘金”选股系列报告的开篇,系列报告致力于从机构行为中挖掘新Alpha。基于重仓股数据的冰山结构特性,我们引入了隐藏持仓填充、主动仓位提取、非对称增速计算等独家算法,有效提升了重仓股变动因子的选股效果,年至今因子IC提升至5.53%。

参照国际成熟市场的发展历程,A股机构化程度的提升是一个持续且必然的过程。随着近年来*策的支持鼓励、资管新规的落地、互联网代销机构的崛起、居民理财意识的提升,基金普及率在普通民众中经历了第一波快速增长,权益型公募基金的规模在年触底后节节攀升。

机构定价权的提升,是近年来A股的主旋律之一。市场机构化程度的提升,意味着边际增量的资金涌入专业投资机构,机构进一步加仓擅长的基本面投资风格,推动赛道景气度高、基本面向好的股票上涨,形成风格正反馈。

以公募基金为代表的产品近年来超额收益突出,一方面是Beta受益,行业配置风格匹配市场行情,公募偏好的消费、科技、医药三条赛道相继爆发;另一方面是Alpha受益,基金重仓股表现超越了行业的平均水平。这种另类Alpha具有衰减速率慢、Alpha较为独立、换手率较低,大市值中表现优异等特点。然而重仓股Alpha相对较为隐秘不易捕捉,简单的基金股票持仓占比、机构持仓占流通股比例等指标包含杂质过多,Alpha效果差强人意。

我们研究发现,基金持仓数据拥有特殊的冰山结构,加减仓信息含量不对称,精细化处理能有效提升因子表现。不同于传统数据,基金季报只披露个股占比最高的前十大,合计占比约48%,另有占比超过一半的持仓数据季报不予披露,持仓明细不可见,只有半年报/年报披露全部持仓。数据整体仿佛一座冰山,大量数据隐藏在水面之下,使持仓信息成为蕴藏着大量Alpha的宝藏。

02

公募规模激增,机构定价权提升

2.1公募基金行业发展提速

近几年来A股市场机构化进程不断加速,机构投资者作为A股市场上重要的参与群体,具有较为成熟的研究分析体系,深耕股票基本面研究,具有较强的一致性决策行为。公募基金作为A股市场最重要的机构投资者,最近5年以来受益于各类*策支持,在A股市场中的份额占比迎来一个快速发展的阶段。根据最新公告显示,截止今年第三季度末公募基金持有A股市值达到了历史新高5.72万亿,其在A股流通市值中的占比达到了8.31%也为近十年新高。随着基金在A股市场中的影响越来越大,如何从基金定期披露的持仓信息出发获取相关有效信息成为了当下的研究热点。

本篇报告主要从公募基金定期披露的重仓股持仓信息出发,从中挖掘相关的持仓因子,用来刻画基金经理本身的投资偏好逻辑,通过对公募基金持仓信息精细结构的分析,从多个维度对持仓因子进行了优化,最后基于优化后的因子来设计构建相关选股策略。

2.2以公募主动权益基金作为样本池

按照基金的具体投资范围,WIND将基金主要分为了股票型、混合型、债券型、货币市场型、QDII型等,其中股票型基金内又分类被动指数型基金和主动管理型基金。我们定义股票型基金中的普通股票型基金、混合型基金中的偏股混合型基金、灵活配置型基金(股票投资比例在80%以上)这三类基金为偏股主动型基金,并认为这三类基金的持仓信息能够较好反映基金经理的主观股票配置意愿,具有较大的参考价值。

2.3基金重仓股的数据特征选取了之前定义的偏股主动型基金中包含的普通股票型基金、偏股混合型基金、灵活配置型基金(股票投资比例80%以上)这三类基金作为我们的初始基金样本池。同时考虑到管理规模较小的基金其投资风格较不稳定且面临较大的清盘风险,因此我们只保留了基金规模大于1亿的基金样本;考虑到基金季度报持仓信息的完整性,最终只选择保留了成立时间在1年以上的基金。通过统计发现样本基金数在年之后迎来了一波快速增长,其中最近5年以来各期满足条件的基金个数平均在只左右。公募基金持仓信息披露的频率为季度,基金会在每个季度结束后的15个工作日内发布季度报,在季度报中基金会披露其前十大重仓股的持股明细情况。同时基金会在每半年结束后60个工作日内发布其半年报,在每年结束后90个工作日内发布其年报,在半年报和年报中基金会披露其全部的持仓明细情况。

考虑到基金持仓信息的时效性,本篇文章主要针对基金定期披露的前十大重仓股来进行研究。在进行具体持仓相关因子计算时均采用月度调仓的频率,在每个月底可以拿到的最新一期基金持仓报告如表1所示,在每年的3月底、8月底、9月底我们可以拿完整的年报和半年报持仓信息,其余月份只能拿到季度报的前十大重仓股信息。从过去10年各期样本基金重仓股个数的统计结果发现,最近几年每一期基金重仓股个数平均在只左右。

根据统计,长期来看基金重仓股的平均业绩可以战胜市场一些基准指数如沪深、中证,也从侧面反映出基金重仓股的研究对于投资具有一定的参考价值。受市值风格等因素影响,在年之前基金重仓股业绩走势相对于市场基准沪深、中证指数超额收益不显著,但在年之后基金重仓股每年相对于基准指数均有显著的超额收益。我们认为未来随着公募基金发展的专业化、规模化其对A股市场的影响也会越来越大,基金重仓股的参考价值也会越来越大。

03

基础持仓因子构建

3.1传统持仓因子

根据基金定期披露的前十大重仓股持股信息,我们从基金持有股票数量、频率、市值占比等基础持仓特征出发,构建了一系列传统持仓因子。其中因子定义方式如表2所示,在因子计算时我们利用了前一节样本基金内的全部重仓股数据。

我们对列表内的所有传统持仓因子都进行了测试,其中测试区间为年1月初到年9月初。股票池由所有样本基金定期披露的全部重仓股组成,其中剔除了涨跌停、ST、停牌、上市未满90天的股票,在具体计算时采用月度调仓的频率。各类传统持仓因子市值中性化后的IC测试结果以及多空组合收益波动情况如表3所示:

从因子测试结果来看,传统持仓因子在市值中性化后结果表现一般因子月度IC均值大部分落在1%-1.5%之间,年化ICIR在0.4-0.7之间。从具体因子表现来看其中Delta_value_ratio因子相对表现最好,中性化后IC达到了1.96%。除了Delta_value_ratio因子外,其他大部分因子在中性化后测试效果均不明显,因此这里我们不再对其进行详细结果的展开描述(对此部分数结果感兴趣的读者可以单独联系我们进行索取)。

Delta_value_ratio因子的IC测试、分组表现的测试结果如下面图表所示,从结果可以看出Delta_value_ratio因子在不同时间段内表现差别较大,其在年之前整体多空超额、IC序列均表现较为平庸,在年之后因子整体表现效果有了明显提高。

3.2持仓变动因子

通过对传统因子设计逻辑的观察可以发现Delta_value_ratio因子相比其他因子除了利用到了当期报告持仓信息外还包含了部分上一期的基金持仓信息(即引入了环比变动的概念),其相对较好的因子表现也能够佐证在基金上一期持仓报告内存在大量的有效信息可供我们做进一步的挖掘。

根据之前的测试结果发现,作为基金持仓最核心的数据之一股票持仓权重,由其设计出的一系列传统因子在中性化后表现效果相对一般,我们分析后认为个股持仓权重这一数据本身包含了太多不同层面的信息,如基金合同合规方面的限制、个股的一些天然属性(市值、行业、风格特征等)、基金公司的风控限制等。这些额外因素导致了股票持仓权重在不同股票之间存在天然的区分度,因此仅使用当期股票持仓权重的绝对数值会引入太多的信息噪声,使得相关因子表现较差。

在进行了一系列传统因子表现分析后,我们初步设想在股票持仓权重这一基础数据上引入环比变动的概念,来进行相关因子构造。这里我们选择了过去两期基金报告内重仓股持仓权重的变动比例这一指标,并将其具体定义为持仓变动因子Naive_weight_change。根据之前的分析结果在引入环比变动的概念可以使得我们能够挖掘利用到更多的上一期持仓有效信息,能在一定程度上提高因子的表现效果。此外持仓环比变动这一概念可以帮助我们剔除掉大部分基金、股票的信息噪声,方便我们更加直观的刻画出基金经理其本身的一些主观配置意愿。以股票池内具体某一只股票为例,其在两期基金报告内的持仓变动因子构建方式如下:

其中W_(i,t)表示基金i在第t期上对该股票的持仓权重,n代表持有该股票的基金个数。针对持仓变动这一因子的设计首先需要面对的就是因子在最近两期报告内的重仓股数据缺失问题,在下一节我们会针对这一问题进行具体分析,这里为了方便测试因子的有效性,我们仅选择了基金在两期季度报内的重合重仓股作为我们的股票池来进行因子测试。在过去10年内每两期基金季度报重仓股重合比例的均值在60%左右,对应重合重仓股的个数在只左右。

持仓变动因子Naive_weight_change的IC测试、分组表现的测试结果如下面图表所示,可以看到在中性化后持仓变动因子在重合重仓股内整体表现效果一般,但较Delta_value_ratio因子有所提高,其因子月度IC均值为2.54%,多空年化收益为9.19%。从具体因子分组超额收益来看,因子在不同分组内表现显著也说明了持仓变动因子在重合重仓股内具有一定的选股效果。同Delta_value_ratio因子一样,持仓变动因子在不同时间段内表现差别较大,其在年之后因子整体IC表现、多空超额情况都有了明显提高。

04

基金仓位变动的精细结构

4.1仓位精细结构探究一:持仓变动数据填充

在上一节中我们对持仓变动因子Naive_weight_change在基金重合重仓股内的表现进行了测试,但因子整体效果一般,我们认为基金重合重仓股数目太少且包含的有效信息量不足,在一定程度上削弱持仓变动因子的整体表现,而这也与我们最初考虑环比变动设计持仓变动因子的初衷相背。

因此为了更好的利用持仓变动因子,我们首先需要利用已有信息来对基金重仓股的持仓信息进行填充操作。针对最新一期的基金季度报告目前无法拿到更多的有效信息来进行填充,如使用上期报告内容进行填充则无法反应仓位变动态度。因此我们将重点的数据填充工作放在了上一期季度报的填充上。如果上一期季度报为半年报或者年报则直接使用其全部持仓数据,如果不是则在上一期季度报基础上利用其距离最近的半年报或年报来对基金持仓信息进行填充,具体填充方式如下:

1.  计算上一期季度报重仓股的持仓占比之和,假设为n%;

2.  将上一期季度报与最近半年报或年报中的重合重仓股部分进行剔除

3.  考虑到填充的两报告期内个股涨跌情况对持仓权重的影响,对剔除重合重仓股后半年报与年报的持仓权重进行修正,修正持仓权重定义为:

其中Adj_W(i)代表个股i修正后的持仓权重,Wi代表修正前个股i的持仓权重,ri代表个股i在填充的两报告期内的涨跌幅

4.  计算半年报与年报中个股修正后的持仓占比之和,假设为m%

5.  用个股修正后的权重来对上一期季度报的持仓信息进行填充补全,其中填补权重定义为:

其中Com_W(i)代表个股i的填补持仓权重,Adj_W(i)代表个股i的修正持仓权重,n%为上一期季度报重仓股的持仓占比之和,m%为个股修正后的持仓占比之和。按照我们设计的历史持仓信息填充方案,在每月底我们计算因子值用到的最新两期的持仓信息以及用到的填充补全信息如表6所示:

通过对上一期季度报进行半年报和年报补全操作后,我们重新计算了两期季度报重仓股的重合度以及重合重仓股个数,在计算重合度时对于在最新一期报告内出现的重仓股修改为从补全后的上期季报的全部持仓中去找寻。在利用历史持仓信息填充补全后,发现过去10年每两期基金季度报重仓股重合度从之前的平均60%提升到了75%左右,平均重仓股个数从之前的只提升到了只左右。

在利用历史信息填充之后,两期报告之间重仓股的平均重合度已经达到了75%,但仍有25%的持仓数据存在缺失,其中缺失数据可以分为两类:1.新进重仓股,最新一期季度报内出现,但上一期季度报内没有出现。2.掉出重仓股,上一期季度报内出现,但最新一期季度报内没有出现。对于这两类缺失数据我们分别采用了如下两种方式进行填充:

(1)对于新进重仓股,利用基金上一期季度报的第十大重仓股权重来对上一期缺失数据进行填充

(2)对于掉出重仓股,利用基金最新一期季度报的第十大重仓股权重来对当期缺失数据进行填充

备注:除了第十大重仓股填充外,另一种备选方法为0值填充,真实值介于0~第十大重仓股,外部投资人无法获取。测试结果表明,用第十大重仓股权重填充优于0值填充。

4.2仓位精细结构探究二:主动持仓变动因子

在对基金重仓股按照历史持仓信息和现有持仓信息填充补全后,我们保留了基金两期报告内的全部重仓股数据。因子数据缺失问题解决之后,我们基于持仓变动因子设计的另一出发点剔除持仓权重本身的信息噪声做了进一步分析。在引入持仓权重变动后,因子确实可以在一定程度上剔除掉个股、基金公司、基金合同等其它信息噪声对持仓权重数据的影响,但是因为引入了环比变动的概念所以在计算持仓权重变动时又重新引入了个股区间自身涨跌这一部分的信息噪声,因此我们在持仓变动因子的基础上又重新定义了主动持仓变动因子。

基金个股仓位提升可能有两个原因导致,一是股价上涨带来的仓位被动提升,二是基金经理主动加仓,后者的信息含量比前者更大,我们重点想捕捉基金经理主动调仓带来的个股仓位变动。主动持仓变动因子主要是在原始持仓变动因子的基础上结合基金两期季度报内持仓个股的涨幅情况对上期股票持仓权重进行了修正,具体的持仓权重修正方案如下:

其中Adj_W(i)代表个股i修正后的持仓权重,Wi代表修正前个股i的持仓权重,ri代表个股i在填充的两报告期内的涨跌幅。

最后将修正后上期股票持仓权重带入之前定义的持仓变动因子计算表达式内,以股票池内具体某一只股票i为例,其在两期基金内的主动持仓变动因子构建方式如下:

其中W_(i,t)表示基金i在第t期上对该股票的持仓权重,n代表持有该股票的基金个数,Adj_W(i,t-1)代表上一期报告个股调整后的持仓权重。

最后我们对因子数据填充补全后的主动持仓变动因子进行了因子测试,主动持仓变动因子的IC测试、分组表现的测试结果如下面图表所示。根据回测结果发现主动持仓变动因子效果较之前的持仓变动因子有了较大提高,我们认为这部分效果的提高一是来自于之前缺失信息的填补,二是针对持仓权重这一数据本身的修正。但是从因子分组收益来看,主动持仓变动因子在多头方面的分组区分度较为明显,但是在空头内的选股效果不佳。针对这一现象我们继续决定从因子值本身出发,对因子值进行更深一层的精细结构挖掘。

4.3仓位精细结构探究三:加减仓的不对称结构

通过对主动持仓变动因子的测试结果分析,我们发现该因子的选股效果主要集中在多头方面,其在空头内选股效果较差,两者的对称性显著较差。进一步分析仓位变动的精细结构,我们对因子值本身进行了二分法,以0为界将主动持仓变动因子拆分为加仓和减仓两部分,分别标记为正向持仓变动因子(Pos_weight_change)和负向持仓变动因子(Neg_weight_change)。我们分别对分离后的正向持仓变动因子与负向持仓变动因子分别进行了因子测试。

正向持仓变动因子测试结果如下图表所示:

通过测试结果发现正向持仓变动因子月度IC均值为2.2%,年化ICIR为1.04,我们认为是由于切割的原因使得样本股票池发生了较大变化,之前重仓股内负向持仓有效信息全部丢失,因此正向持仓变动因子整体表现弱于主动持仓变动因子表现。但是仅从正向持仓变动分组年化收益来看,正向持仓变动因子在加仓股票池内具有一定的选股效果,即基金加仓包含的有效信息是相对完整的。

负向持仓变动因子测试结果如下图表所示:

负向持仓变动因子的表现相对于正向持仓变动具有显著差别,其月度平均IC只有1.49%,从分组年化收益来看因子在空头内的选股能力明显弱于多头内的选股效果。

通过对主动持仓因子按因子值的正负进行切割之后我们发现正向持仓因子的测试效果要明显优于负向持仓因子,即主动持仓变动因子所包含的有效信息在因子值上并不是均匀分布的,基金加仓产生的有效信息量要大于基金减仓带来的有效信息量。针对这一现象我们又从持仓的精细结构做了进一步的分析,最后我们认为导致这一现象的原因有两点:

(1)减仓力度难以精准刻画

(2)减仓信息冗余,有效信息不足

对于原因1我们的观点是:在因子填补时我们发现,因子数据在每年的3月底、8月底、9月底这三个月份我们可以拿到最新一期的季度报为年报和半年报,即全部持仓信息,但在其余9个月份我们仅能拿到最新一期季度报前十大重仓股的信息。

相比最新一期季度报,我们对每一个上一期季度报都做了持仓补全填充,这就导致我们拥有的最新一期季度报相对于上一期的加仓信息是相对完整的,大幅加仓个股(上期非前十大,本期出现在前十大)的力度刻画相对精准,历史持仓提供了一个可以供参考的持仓锚点。而对于在上期季报出现在前十大,但在最新一期季度报掉出前十大的持仓股,我们均采用了最新一期的第十大重仓股持股权重进行填充,个股减仓均假设轻微减仓,大幅减仓的信息缺失,减仓力度难以精准刻画,本期仓位没有锚点进行参考。掉出前十大是掉到第十一,或是仓位直接清零难以通过本期公开数据进行描述,因子空头刻画不够精准。

基金持仓只披露前十大的冰山数据结构特性,导致了仓位变动的信息量出现了不对称,个股加仓的信息量大于减仓。

对于原因2我们的观点是:我们按照主动持仓变动因子的绝对正负统计了过去10年平均每两期间基金加仓和减仓的具体个股数量和全部基金整体数据量的情况,具体结果如图30所示,从图中可以看出减仓个股数量大约是加仓个股数的1.25倍左右,整体减仓数据量大约是加仓数据量的2倍左右。

减仓数据量大,但信息含量低,个股大幅减仓的力度刻画不清;加仓数据量小,但信息含量高,非前十大仓位有历史锚点进行参考,加仓的力度刻画相对较好。

05

不对称主动持仓变动因子的合成

5.1不对称主动持仓变动因子

在上一节我们将主动持仓变动因子进行了二分法研究,并针对切割后得到的正负向持仓变动因子分别进行了测试,测试结果发现主动持仓变动因子中的有效信息并不是均匀分布的。对这一现象我们从加减仓的力度以及单位数据包含的信息量,两个方面来对因子的选股效果做了一定的解释。

在之前主动持仓变动因子设计时对于一只股票如果在不同基金之间同时出现正向变动与负向变动是采用等权方式进行计算的,正向变动和负向变动的结合和加减仓的基金数量有关,目前来看这是不合理的。因为在进行因子二分法分离后,持仓变动所带来的有效信息含量是不一样的,直接等权求和在一定意义上会削弱整体的因子表现。因此在这里我们决定对正负向持仓变动因子定义一个新的加权系数来对主动持仓变动因子进行一个优化。定义新的不对称主动持仓变动因子为:

我们测试了在α不同取值下,正负向持仓变动因子组合的IC表现,得到结果如下/p>

可以看到按照传统的正负向持仓变动因子等权组合方式得到的IC结果并不是最优的,因为正负向持仓因子本身包含有效信息量不同根据统计的结果显示最优的组合权重在0.75左右。

最后我们选择统计得到的最优组合权重α=0.75对切割后的正负向持仓变动因子重新进行了组合并将其定义为不对称主动持仓变动因子,得到测试结果如下:

在最优组合权重α下正负向持仓变动因子的组合效果相比于之前的主动持仓权重变动因子效果有明显改进,最后中性化后的月度平均因子IC达到了4.25%,且多空年化超额达到了12.2%,整体因子表现稳定,分组收益较主动持仓因子也有了一定提高,但依旧存在部分空头分组收益区分不显著的情况,我们认为因子组合权重的引入只是一定程度上削弱了负向持仓变动在空头中的占比权重,但是对于负向持仓变动空头中缺失的有效信息,我们目前仍旧无法进行有效填补,这就天然的导致正向持仓变动所包含的有效信息多于负向持仓变动,即多头分组效果要优于空头部分。

5.2不同持仓变动因子结果对比

在之前的分析过程中我们首先从获取基金额外持仓信息与剔除基金持仓信息噪声这两个因子逻辑点出发,设计了持仓变动因子Naive_weight_change并在基金重合重仓股内进行了测试。在进行重仓股信息填充补全后,我们又考虑个股区间涨跌幅的情况对基金持仓权重进行了一个修正设计出了主动持仓变动因子Active_weight_change。再从因子值本身出发按照因子值的正负,将主动持仓变动因子分为了正向持仓变动因子与负向持仓变动因子两类,按照最优的组合权重对正负向因子进行合成,将最终的因子定义为不对称主动持仓变动因子Asym_weight_change。

这里我们将最终得到的不对称主动持仓变动因子与之前在重合重仓股内定义的持仓变动因子和进行数据填充、考虑涨跌幅修正的主动持仓变动因子的各项测试结果进行了一个对比,具体因子对比结果如下图表所示:

根据对比结果可以看到,在经过一系列持仓因子精细结构的优化后最终得到的不对称主动持仓变动因子相比于之前的原始持仓变动因子有了较大提高,其中月度IC均值从2.54%提高到了4.25%,多空收益从9.19%提升到了12.2%,对应回撤也有所减小。具体从分组收益来看因子的优化提高主要体现在多头收益部分,其中多头超额收益从之前原始因子的年化5.53%提升到了年化7.91%,但是空头超额收益部分提升不明显这也与我们之前对负向持仓变动因子的分析相一致。

5.3不对称主动持仓变动因子结果分析

从不对称主动持仓因子的测试结果来看可以发现因子在年之前IC序列、分组多空超额收益表现效果一般,但是在年之后因子整体表现效果更好且更加稳定。根据这一现象,我们对不对称主动持仓变动因子的测试时间段分为-年与-年,在两个时间段内分别测试因子表现情况。根据测试结果发现,不对称主动持仓变动因子在两个时间段内表现有较大区别。相比于-年,年之后因子的月度平均RankIC从2.83%提高到了5.62%,年化收益从8.89%提高到了15.18%。我们认为未来随着A股市场机构化进程与基金规模化的发展,基金的选股能力可能会进一步增强,因此基于基金持仓构造的相关选股因子的效果能够拥有较好的持续稳定性。

我们对不对称主动持仓变动因子在沪深与中证内的覆盖度进行了统计,统计发现不对称主动持仓变动因子在沪深中每期平均覆盖度在85%左右,在中证中每期平均覆盖度在55%左右。从每期覆盖度的波动情况来看,因子在沪深内整体的覆盖完整度和稳定性都要明显优于在中证内。

在沪深与中证内分别对修正持仓因子的收益表现情况进行了测试,根据不同样本内不对称主动持仓变动因子的测试结果显示,因子在沪深内的月度平均IC值为4.57%要优于在全部重仓股样本内,但在中证内IC值仅为3.82%表现要弱于在全部重仓股内。

对于这一现象我们认为在基金全部重仓股内沪深成分股的覆盖度更高、稳定性较好,并且沪深成分股在每一期样本基金内出现的频次和整体数据量相对更多,这就使得不对称主动持仓变动因子在沪深内的整体有效信息含量和稳定性要优于在全部基金重仓股样本内;相反因子在中证内的覆盖度较低、波动性大,这使得因子在中证内的整体有效信息含量不高且稳定性较低。但从整体效果来看,因子在沪深内和中证内均展现出了一定的选股能力。

5.4基于不对称主动持仓变动因子的选股策略

上一节我们对最终得到不对称主动持仓变动因子的测试结果进行了分时段、不同样本内的分析发现因子均表现出了一定的选股能力,这里我们利用不对称主动持仓变动因子来构建具体选股策略。在构建策略时我们在每月末选取每期不对称主动持仓变动因子值前10%的股票来构造等权投资组合,并将策略与全部重仓股、各类基准指数进行对比。回测时间段为年1月至年9月,具体策略结果如下图表所示:

根据统计结果可以看到根据不对称主动持仓因子top10%构建的股票组合能够持续跑赢基金重仓股的等权组合与基准指数,在年之后超额情况更加显著。从具体结果来看,基于不对称主动持仓变动因子前10%构造的等权投资组合年化收益达到了16.55%,夏普比率为0.74,其中相对于全重仓股年化超额达到了7.91%,相对于沪深与中证年化超额分别为12.34%与13.52%。

考虑到不对称主动持仓变动因子优化时具体的填充补全方式,我们分别测试了选股策略在不同样本内换手率的情况得到结果如下:

分月份来看,该策略集中在1、4、7、10四个月份基金公布最新季报后进行大调仓,其余月份调仓较少,策略整体换手率较低。换手率受到两部分数据影响,一是两期基金的持仓重合度不同,二是策略的主动调仓。在基金重仓股内平均年单边换手率在%左右,因子在沪深内的整体换手率明显低于全部重仓股与中证内。

以下显示了年11月底不对称主动持仓变动因子在沪深内排名前10%的股票组合列表:

06

总结

基金重仓股蕴藏Alpha,在A股机构占比长期持续提升的大环境下,我们推测这种Alpha不会快速衰减,仍有望延续。

公募基金季度披露前十大持仓,半年披露全部持仓,特殊的持仓披露机制导致数据具有冰山结构的特性。本篇报告以持仓变动因子为例,介绍了个股仓位填充、主动持仓提取的一般方法。

最后我们对主动持仓变动因子的不对称结构进行分析,二分法研究发现正向持仓变动因子表现效果要明显优于负向持仓变动因子,我们从加减仓力度、单位数据信息含量两个方面来对这一现象进行了解释。个股大幅加仓,仓位有历史锚点进行参考估计,力度刻画相对精准;个股大幅减仓则缺乏参考值,我们不得已以当期第十大持仓进行填充估算,大幅减仓数据缺失。基于信息含量的不对称性,我们设计了不对称主动持仓变动因子。

最终设计得到的不对称主动持仓变动因子选股效果好,因子换手率不高,在沪深中效果突出,Alpha集中在多头。在基金重仓股样本内因子月度IC均值达到了4.25%,多空年化收益率为12.20%。沪深内IC均值达到4.57%,多空收益率13.06%。在年之后因子表现更好,其月度IC均值达到了5.53%,多空年化收益15.18%,其中多头年化超额为8.39%。

07

风险提示

本报告均基于历史数据与模型进行测试,历史回测结果不代表未来收益,在未来市场环境变化时不排除模型失效的风险,本文仅供投资者参考。

备注:

1)感谢实习生朱涵枫对本文的贡献!

2)新兴团队,求贤若渴。我们团队仍有社招、校招、日常实习生缺口若干。如果你认同我们的研究理念,如果你想加入最具活力的卖方金工与产品团队,

分享 转发
TOP
发新话题 回复该主题