【宽客研报】国泰君安证券:多因子选股模型之因子分析...
多因子选股模型之因子分析与筛选 II:财务质量、价量和一致预期类指标——数量化研究系列之十八本报告导读:本报告为多因子选股研究系列的第二篇,通过多角度和更细致的测算,分析了财务质量、价量和一致预期类因子的有效性和稳健性,为建立多因子选股模型奠定基础。摘要:本报告通过多角度、更严格的测算方法分析了财务质量类、价量类和分析师预期类共 18 个因子指标的有效性,给出了最全面和细致的分析结果,为构建多因子选股模型和指导实际投资提供了很多有价值的信息。本文的创新之处:(1)专注于单因子分析。通过最全面和最细化的分析,挖掘出最有效和稳健的因子。
(2)提出了更严格和更全面的度量因子有效性的方法。我们从因子排序后的 TOP 20%与 BOTTOM 20%、TOP 40%与 BOTTOM 40%组合的表现差异及稳定性,以及因子排名与收益率排名的相关性 3 个方面来度量因子有效性。
(3)分析了不同股票池和不同市场环境下因子的有效性。为了提高各个因子在个股之间的可比性,我们分别在 HS300 和 ZZ500 成分股中分总体、周期类、非周期类共 6 个股票池中进行因子的有效性分析。。
(4)分析了财务类因子在财报公布后有效性的衰减规律。主要结果分析:
(1)HS300 中,首选有效因子有:权益乘数、评级调整;备选因子有:ROE(TTM),ROA(TTM),有息负债率。ZZ500 中,首选有效因子有:有息负债率,1 个月换手率,3 个月换手率;备选因子有:权益乘数, 1个月收益率(反转),6 个月收益率(反转)。另外,分周期与非周期测算的结果见表 24。
(2)财务质量类因子的整体有效性不是很高:毛利率(当期、TTM)、净利率(当期、TTM)等指标在各个股票池中的有效性都不明显。ROE(TTM)和 ROA(TTM)只在 HS300 股票池中的震荡市阶段明显有效。权益乘数在牛市中特别有效。有息负债率在 HS300 的牛市中正向有效,在震荡市中负向有效,而在 ZZ500 中主要表现为正向有效。
(3)价量类因子在不同股票池和不同市场阶段下的有效性差异大:1 个月收益率在 HS300 的牛市中有较明显的动量效应,在 ZZ500 中,1、3、6个月收益率都表现出反转效应。换手率表现出来的是负向有效性,且在ZZ500 中有效性明显高于 HS300,非周期股中明显高于周期股。
(4)分析师预期类因子有效性:HS300 高于 ZZ500,非周期好于周期。
(5)财务类因子有效性在财报公布后有明显的衰减现象:即离财报公布时间越远的月份因子有效性越差。
(6)因子有效性的汇总结果见表 25。目 录
[*]本报告的创新之处
1.1. 专注于挖掘有效因子
1.2. 提出了更严格和更全面的度量因子有效性的方法
1.3. 分析了不同股票池和不同市场环境下各因子的有效性
1.4. 更符合实际的数据处理方式
1.5. 分析了财务指标的有效性在财报公布后的衰减规律
[*]研究思路
2.1. 研究框架
2.2. 因子选取
2.2.1. 因子选取说明
2.2.2. 数据处理说明
2.3. 股票池的划分
2.3.1. 按市值特征
2.3.2. 按行业属性
2.4. 分析因子有效性
2.4.1. 因子有效性的度量
2.4.2. 按市场环境对因子有效性进行分析
2.5. 分析财务因子有效性的衰减
[*]主要结果和分析
3.1. 单因子有效性分析
3.1.1. ROE(TTM)
3.1.2. ROA(TTM)
3.1.3. 毛利率(当期)
3.1.4. 毛利率(TTM)
3.1.5. 净利润率(当期)
3.1.6. 净利润率(TTM)
3.1.7. 股本乘数 EM
3.1.8. 有息负债率
3.1.9. 单位净利润现金流含量
3.1.10. 税息折旧及摊销前利润率
3.1.11. 1 个月收益率动量(反转)
3.1.12. 3 个月收益率动量(反转)
3.1.13. 6 个月收益率动量(反转)
3.1.14. 1 个月换手率
3.1.15. 3 个月换手率
3.1.16. 6 个月换手率
3.1.17. 机构覆盖数
3.1.18. 评级调整次数
3.2. 财务因子有效性的衰减
3.2.1. 从“时滞”角度看有效性衰减
3.2.2. 从“质量”角度看有效性衰减
3.3. 因子有效性的汇总分析
3.3.1. 有效因子一览
3.3.2. 几点总结
3.3.3. 因子有效性的汇总结果
O.多因子选股系列研究多因子选股是量化研究中最热点的问题之一,已经有比较广泛的研究和应用。我们认为,检验和筛选出有效且稳健的因子是多因子选股模型取得良好效果的关键。我们将开展多因子选股系列研究,前两篇报告专注于单因子分析和测算,筛选出有效且稳健的因子。我们共分析了五大类指标:估值类(7个指标)、财务成长类(15 个指标)、财务质量类(10 个指标)、价量类(6 个指标)、分析师预期类(2 个指标)。为了篇幅适中,我们第一篇报告分析和测算估值类和财务成长类共 22 个指标,第二篇分析财务质量、价量和分析师预期三类共 18 个指标,并且在第二篇报告内分析了财务相关的因子有效性在财报公布后的衰减规律。在筛选出有效且稳健的因子的基础上,第三篇建立多因子综合打分的选股模型,依据不同因子的有效性和稳健性赋予不同的权重,然后根据综合得分构建股票组合,通过回溯历史,检验模型效果。1. 本报告的创新之处本篇报告作为多因子选股系列研究的第二篇,分析和测算了财务质量类、价量类和分析师预期类共 18 个指标的有效性和稳健性,有以下创新之处。1.1. 专注于挖掘有效因子本报告专注于单因子分析,通过多角度和更细致的分析和测算挖掘出最有效和稳健的因子。由于只做单因子分析,暂时不做因子间的比较和综合分析,不需考虑因子的同质性或共线性等,因此我们测算了各种意义相近的指标,如 ROE 和 ROA,毛利率和净利率的当期和 TTM 指标等,这样可以更好的挖掘出最具代表性和最有效的因子。1.2. 提出了更严格和更全面的度量因子有效性的方法通过多角度、更严格的方法度量因子有效性和稳健性,确保了分析结果不受数据的偶然巧合所影响。在做单因子分析时,我们将股票池按因子大小排序,分为五档,通过分析各档股票的表现差异以及各档的平均收益排名与因子排名的相关性来度量和分析因子的有效性。目前绝大多数的研究中,分析因子有效性时,都是比较因子排名靠前 X%与靠后 X%的差异,我们认为这样做有以下两点不足之处:首先,X 取多少存在较大的主观性,而且在确定 X 的最优取值时可能会产生过度数据挖掘的问题;其次,单凭最前和最后的 X%的表现差异,而忽略中间大部分个股表现的信息,由此选取的有效因子可能不够可靠和稳健。1.3. 分析了不同股票池和不同市场环境下各因子的有效性为了避免有些指标(如估值类)在大盘股与小盘股之间存在整体性的差异,可比性不高,我们分别在 HS300 成分股和 ZZ500 成分股中进行因子的有效性分析。进一步,为了提高各个指标的可比性,我们在 HS300和 ZZ500 成分股中分别按周期与非周期行业划分,由此分为了四个股票池,分别进行单因子分析。另外,考虑到因子的有效性可能跟所处的市场环境有关,我们统计和分析了不同市场阶段(牛市、熊市、震荡市)的因子有效性,为构建多因子选股模型和指导实际投资提供更全面的信息。1.4. 更符合实际的数据处理方式很多因子指标需要使用到财务数据,而上市公司财务报表的公布时间有一定的滞后和差异,在常见的数据库(如 wind)中,历史的财务数据是按报告期更新的,如二季报的财务数据都是在 6 月 30 日更新的,而其二季报公布的时间肯定在 6 月 30 日之后。因此,直接使用这些历史数据测算不够贴近实际,我们对数据进行了合理的处理,确保在历史的每个时点只使用当时可以得到的数据信息,并使指标值在个股间具有较好的可比性。1.5. 分析了财务指标的有效性在财报公布后的衰减规律考虑到财务指标在财报公布后到下一期财报公布前都取值不变,财务相关因子的有效性可能会在财报公布后随时间衰减,我们测算和分析了财务相关因子有效性的衰减规律。另外,我们还分析了不同质量的财报(一般认为年报质量高于半年报,高于季报)公布后财务因子有效性的差异。2. 研究思路2.1. 研究框架
2.png759x467 95.6 KB
2.2. 因子选取2.2.1. 因子选取说明我们选取了五大类因子:估值类(7 个指标)、财务成长类(15 个指标)、财务质量类(10 个指标)、价量类(6 个指标)、分析师预期类(2 个指标),本篇报告分析财务质量类、价量类和分析师预期类共 18 个。具体指标如表 1 所示:
3.png1130x712 168 KB
2.2.2. 数据处理说明测试区间为:HS300 股票池从 2005 年 1 月至 2011 年 6 月;ZZ500 股票池从 2007 年 1 月至 2011 年 6 月。由于 HS300 与 ZZ500 的成份股在每年1 月初和 7 月初进行定期调整,因此我们的股票池也每隔半年更新一次。在计算估值指标和财务指标时,考虑到在实际当中我们无法拿到每个时点的财务数据,因此使用的是已公布的最近期财务报告数据。具体而言,1 月、2 月、3 月用的是上年 3 季报及之前数据;4 月、5 月、6 月、7 月用的是本年 1 季报和上年年报及之前数据;8 月、9 月用的是本年半年报及之前数据;10 月、11 月和 12 月用的是本年 3 季报及之前数据。这样虽有一定时滞,但一方面与实际情况相符,具有可操作性,另一方面也使指标更具有可比性。另外,在分析估值类因子时,如遇指标为负值的个股,我们将其剔除。在计算财务成长类因子时,我们利用如下公式计算指标增长率:
增长率 = (本期指标-上期指标)/abs(上期指标)
这样能够解决上期为负、本期转正的指标的增长率计算问题。
数据全部取自 wind 数据库。2.3. 股票池的划分2.3.1. 按市值特征经典的 Fama-French 三因素模型早已表明市值对股票的收益率有显著的影响,各种主动型投资基金也常常按照投资标的的市值进行风格划分,而大、小市值股票的估值等指标存在整体性的水平差异,不具备可比性。因此我们按照市值大小对股票池进行划分。我们以沪深 300 指数(HS300)成分股做为大市值股票池,以中证 500指数(ZZ500)的成分股做为中、小市值股票池。这样既做到了以市值大小对股票进行大致划分,同时,由于这些指数在甄选成份股时不仅考虑到市值,也考虑到流动性、近期业绩等因素,遇到公司合并、重组停牌等事项时及时将相关股票剔除,并定期调整成份股。这就相当于我们的股票池已事先进行了一道清理程序,大大降低选到“黑天鹅”股票的概率,减小换股时产生的冲击成本,而且明确了我们投资组合收益的比较基准。2.3.2. 按行业属性不同行业的某些财务指标的整体差异性大,可比性不高,因此按行业属性进一步划分股票池也是有必要的。一般来说,周期类行业与非周期行业在很多财务指标上具有显著差异,因此我们按周期与非周期对股票池进行进一步划分。之所以没有把每个行业作为一个股票池是因为如果划分的过细,一方面可操作性会降低,另一方面容易造成样本数量急剧下降,统计结果可靠性会降低。在区分周期与非周期行业的问题上,我们参考了上证周期指数(000063)与上证非周期指数(000064)的划分方法,根据证监会行业板块,将“金融”、“金属”、“交通运输”、“采掘业、”“房地产”五大类行业放在周期性行业里,其他行业放在非周期性行业里。2.4. 分析因子有效性2.4.1. 因子有效性的度量(1)测算因子有效性的步骤
Step1 将股票池里的样本股票按待测因子按由高到低的顺序分成五档,各占 20%。分别
计算每一档的月平均收益率。Step2 计算两次月平均收益率差,分别是:
TOP 20%(第一档)- BOTTOM 20%(第五档),
TOP 40%(第一、二档)- BOTTOM 40%(第四、五档)。Step3 计算上述收益率差的平均值。如果平均值为正,则该因子的影响总体是正向的,即因子值越大收益趋于越大;如果平均值为负,则反之。Step4 计算每个因子的有效性。有效性的计算方法如下:
正向(负向)因子的有效性 =月均收益率差为正(负)的月份数/总月份数。Step5 根据每个月份五档的因子排名与对应的平均收益率排名,计算其相关系数以及显著性检验的 P 值。(2)度量因子有效性的标准
首先,看 TOP 20%组合与 BOTTOM 20%组合的月平均收益率差是否有显著差异,如果有显著差异,说明该因子具有一定的区分度。同时,有效性比较高,才能说明该因子效果的稳健性比较好,才能确保依据该因子选取的组合胜率比较高。其次,看 TOP 40%组合与 BOTTOM 40%组合的月平均收益率差是否显著且有效性是否较高。最后,观察五档组合的因子排名与其下期收益率排名的相关性是否显著,越显著说明因子对收益的影响越确定。这样从三个方面分析因子的有效性和稳健性,很大程度上确保了分析结果不受数据的偶然巧合所影响。2.4.2. 按市场环境对因子有效性进行分析考虑到不同的市场阶段和环境下,投资者的关注点或关注的指标有很大的不同,指标的有效性也可能会表现出较大的差异,因此我们统计和分析了不同市场阶段(牛市、熊市和震荡市三种)的因子有效性,为构建多因子选股模型和指导实际投资提供更全面的信息。05 年以来 HS300 的走势与 ZZ500 的走势并不完全同步,我们对市场阶段的划分如下:
HS300:
牛市:2006 年 4 月-2007 年 10 月,2008 年 11 月-2009 年 7 月
震荡:2005 年 1 月-2006 年 3 月,2009 年 8 月-2011 年 6 月
熊市:2007 年 11 月-2008 年 10 月ZZ500:
牛市:2007 年 1 月-2007 年 9 月,2008 年 11 月-2010 年 10 月
震荡:2010 年 11 月-2011 年 6 月
熊市:2007 年 10 月-2008 年 10 月2.5. 分析财务因子有效性的衰减由于我们是以月度收益率来考察因子的有效性,但财报公布的频率并非月度,因此不同月份所用的财务指标值离最新公布的财报日期的时滞并不一样,由此可能会产生因子有效性的差异。理论上来说,使用财务数据的时间离财报公布的时间间隔越长,财务指标的有效性会递减。根据我们使用财务数据的方法,我们在每期财务报告全部公布完时(即4 月底、8 月底和 10 月底)开始使用新一期的财报数据,因此,时滞最短的月份为 5 月,9 月和 11 月,时滞两个月的有 6 月、10 月和 12 月,其余的月份时滞在 3 个月及以上。我们将样本按时滞长短分为相应的三组,观察因子有效性的衰减规律。另一方面,从财务报表数据的质量来看,年报质量最高,其次是半年报,最次的为季报。由于财务报告质量越高,市场的重视程度越高,其有效性可能会越高,因此我们也根据财务报告质量对样本进行划分并分别检验财务因子的有效性。具体而言,5 月、6 月、7 月、8 月的财务因子取值是采用年报和 1 季报的,数据质量最高,9 月、10 月用的是半年报的数据,剩下的 6 个月用的是 3 季报的数据。3. 主要结果和分析3.1. 单因子有效性分析3.1.1. ROE(TTM)总体来看,HS300 股票池中,ROE(TTM)越高的组合表现越好,且最高的第一档明显跑赢市场指数和其他各档,但在 ZZ500 中各档表现几乎没有规律。具体来看:从市值特征看,ROE 增长率(TTM)在 HS300 中明显有效,而在 ZZ500 几乎无效;从行业属性看,HS300 的非周期类中的有效性明显好于周期类;从市场环境看,震荡市的因子有效性最高,熊市最低。
4.png1023x394 91.6 KB
5.png880x758 99.2 KB
3.1.2. ROA(TTM)总体来看,ROA(TTM)的有效性不明显,在 HS300 中有一定的区分度,但是五档累计收益的差异是在 2010 年以来的震荡市中才表现出来的;在 ZZ500 中完全无效。具体来看:ROA(TTM)只在 HS300 股票池中、震荡市场环境下明显有效,其余情况下几乎无效;分周期非周期测算也不能提高该因子的有效性。
6.png868x321 64.9 KB
7.png889x737 96.3 KB
3.1.3. 毛利率(当期)从五档累计收益图来看,HS300 中按收益率从高到低依次是 2、4、1、3、5 档, ZZ500 的排序则为 4、2、3、1、5 档,没有明显规律。具体来看,毛利率(当期)只在 HS300 股票池中、震荡市场环境下有一定的效果,但也不明显,其余情况下均无效。
8.png818x321 69.6 KB
9.png854x620 81.9 KB
10.png861x136 18.1 KB
3.1.4. 毛利率(TTM)从五档累计收益图来看,HS300 按收益率从高到低依次是 2、4、1、3、5 档, ZZ500 的排序则为 2、4、1、5、3 档,可见没有明显规律。具体来看,毛利率(TTM)只在 HS300 股票池中、震荡市场环境下有一定的有效性,但并不显著,其余情况下均无效。规律与毛利率(当期)一致。
11.png866x329 71.7 KB
12.png890x488 66.4 KB
13.png885x274 34.8 KB
3.1.5. 净利率(当期)在各个股票池中,当期净利率有效性均不明显。
14.png848x318 72.1 KB
15.png887x484 66.9 KB
16.png856x273 34.3 KB
3.1.6. 净利率(TTM)与当期净利率一样,在各个股票池中,净利率(TTM)有效性不明显。
17.png856x314 70.3 KB
18.png872x489 65.8 KB
19.png855x271 33.8 KB
3.1.7. 股本乘数 EM总体来看,HS300 股票池中,股本乘数较大的组合表现较好,但在 ZZ500中规律不明显。具体来看:从市值特征看,股本乘数在 HS300 中明显有效,而在 ZZ500有效性不明显;从行业属性看,股本乘数在周期与非周期中的表现没有明显差异;从市场环境看,股本乘数在牛市中最有效,而在熊市和震荡市中效果不明显。
20.png844x317 70.1 KB
21.png879x327 47.7 KB
22.png857x431 53.8 KB
3.1.8. 有息负债率总体来看,HS300 股票池中,五档累计收益表现没有明显规律,但在ZZ500 中排列很有序,但是区分度不是很高。具体来看:从市值特征看,有息负债率在 ZZ500 中有效性较高;从行业属性看,在周期股中的有效性更高;从市场环境看,有息负债率在 HS300中的震荡市阶段明显负向有效(即有息负债率越高,收益越低),而在ZZ500 中各个市场阶段均是正向有效。
23.png869x332 74 KB
24.png850x161 27.2 KB
25.png867x586 73.3 KB
3.1.9. 单位净利润现金流含量总体来看,无论是在 HS300 和 ZZ500 中,单位净利润现金流含量都没有明显的有效性。具体来看,只有在 ZZ500 非周期股中的震荡市阶段,单位净利润现金流含量比较有效,其余情况下都无效。
26.png847x325 78.5 KB
27.png873x740 102 KB
3.1.10. 税息折旧及摊销前利润率无论是从总体收益表现来看,还是从具体的有效性分析表来看,税息折旧及摊销前利润率都没有明显的有效性。
1.png842x320 76.8 KB
2.png845x752 102 KB
3.1.11. 1 个月收益率动量(反转)从五档累计收益图中可以看出,HS300 中第 1 档组合明显战胜市场指数和其他档,而在 ZZ500 中第 1 档跑输市场指数。可见,1 个月收益率在HS300 里表现为动量效应,而在 ZZ500 中则为反转效应,但都不是很明显。具体来看,1 个月收益率的有效性在周期与非周期股中没有明显差异,在熊市中有明显的负向有效性(即反转效应),在 HS300 的牛市中有正向有效性(即动量效应)。
3.png900x321 70.9 KB
4.png868x752 99.9 KB
3.1.12. 3 个月收益率动量(反转)总体来看,HS300 中,各档组合的收益表现没有明显规律,ZZ500 中五档累计收益的排序为 5、4、3、2、1 档,因子表现出了显著的负向有效性。具体来看,3 个月收益率在牛市和熊市都表现为负向有效(即反转效应),且在牛市的有效性显著,而在震荡市中表现为一定的动量效应,但并不显著。
5.png855x319 75.6 KB
6.png869x725 97.3 KB
3.1.13. 6 个月收益率动量(反转)总体来看,五档的累计收益表现没有很明显的规律,但在 ZZ500 中第一档明显跑输其他档,即有一定的反转效应。具体来看,与 3 个月收益率相似,6 个月收益率在牛市和熊市表现为反转效应,而在震荡市表现为动量效应。
7.png919x326 74.5 KB
8.png883x610 85 KB
9.png872x141 18.2 KB
3.1.14. 1 个月换手率从累计收益图中可以看出,HS300 中累计收益表现依次为 3、4、2、5、1 档,换手率适中的组合表现比较好;而在 ZZ500 中明显表现出了 1 个月换手率越低收益越高的规律。具体来看,1 个月换手率在 HS300 中有效性不高,只是在熊市中有比较明显的负向有效性;而在 ZZ500 中,各个市场阶段下都非常有效;另外,非周期股中的有效性相对更高。
10.png858x325 74.1 KB
11.png861x446 64.7 KB
12.png867x305 39.9 KB
3.1.15. 3 个月换手率3 个月换手率的五档累计收益图与 1 个月换手率的图比较相似,在 HS300中规律不明显,而在 ZZ500 中排列很有序。具体从有效性分析表来看,3 个月换手率在 ZZ500 中(尤其是非周期股中)反转效应非常明显,其他股票池中则不显著。
13.png860x322 71.8 KB
14.png896x348 51.4 KB
15.png888x402 49.7 KB
3.1.16. 6 个月换手率6 个月换手率的有效性规律与 3 个月换手率比较一致,只是有效性有所减弱。
16.png879x323 72 KB
17.png845x324 46.9 KB
18.png881x439 54.2 KB
3.1.17. 机构覆盖数从累计收益表现来看,HS300 中机构覆盖数较高的组合累计收益较高,而在 ZZ500 中区分度很小。具体来看,机构覆盖数的有效性并不高,在 HS300(主要是非周期股中)的震荡市中有一定的正向有效性,而在有些股票池中表现出了负向有效性。
1.png852x330 75.4 KB
2.png873x198 30.3 KB
3.png868x562 70.4 KB
**** Hidden Message *****
作者:国泰君安证券金工团队
页:
[1]