首页
宽客之家首页
站长自定义
零售前沿
智能科技
泛文娱
教育
大健康
新消费
区块链
资讯
交易百科
站长自定义
零售前沿
智能科技
泛文娱
教育
大健康
新消费
区块链
短讯
站长自定义
零售前沿
智能科技
泛文娱
教育
大健康
新消费
区块链
观点
站长自定义
零售前沿
智能科技
泛文娱
教育
大健康
新消费
区块链
宽客之家
宽客之家
站长自定义
零售前沿
智能科技
泛文娱
教育
大健康
新消费
区块链
百科
站长自定义
零售前沿
智能科技
泛文娱
教育
大健康
新消费
区块链
研习社
站长自定义
零售前沿
智能科技
泛文娱
教育
大健康
新消费
区块链
宽客财经
关注微信公众号"宽客财经",定时推送前沿、专业、深度的交易极客和量化投资资讯。
用户名
Email
自动登录
找回密码
密码
登录
免费注册
登录
注册
搜索
搜索
搜索
热搜
量化策略
MT4
Python
人工智能
研报
本版
文章
帖子
用户
本版
文章
帖子
用户
好友
收藏
道具
勋章
任务
淘帖
动态
日志
相册
分享
记录
留言板
广播
群组
门户
导读
排行榜
设置
我的收藏
退出
宽客财经---为交易极客和量化投资而生
›
宽客之家
›
宽客金工研报
›
研报复现初探—华泰金工人工智能选股系列之随机森林模型 ...
发布主题
返回列表
研报复现初探—华泰金工人工智能选股系列之随机森林模型
0
回复
5818
查看
[复制链接]
gysgold
当前离线
积分
252
gysgold
70
主题
2
回帖
252
积分
超级版主
积分
252
收听TA
发消息
来源:
2019-7-3 06:57:41
显示全部楼层
|
阅读模式
.数据采集
选择了2018年6月的中证500成分股作为股票池(考虑到初次复现,故简化考虑,与原文不同。故本文所有策略仍存在未来信息,但考虑到这部分未来信息对于模型训练影响应该不大,故暂时忽略不考虑,后续会进行完善。)
共采集了计算56个因子所需的数据(研报中共69个因子,有部分因子由于计算极其困难故略去)。
2.数据处理
2.1 数据对齐
由于wind数据库的财务报表类(1季报,中报,3季报,年报)的数据都是更新在季度末的最后一个自然日,而实际的财报披露日通常为4月(1季报) 7-8月(中报) 10月(3季报) 次年2-3月(年报) 。
部分的TTM数据都是按照报表公布时间更新的,其余的大部分财报数据需要根据财报披露日对基础数据进行时间的调整(避免未来信息),将季度末的数据更新至财报公布日所在的月末。
2.2因子的计算
华泰研报共计算了69个因子,包括估值、成长、财务质量、杠杆、市值、动量反转、波动率、股价、beta、换手率、情绪、股东、技术指标等各大类因子(这些因子已经在华泰多因子系列研报中被证明是有效的因子)。本文策略省略部分因子。
2.3因子的预处理
研报中在特种预处理 b)中对于确实的因子值使用中信一级行业均值代替,本文也简化处理为直接删除存在缺失值的样本。
3.模型训练和模型评价
3.1样本内训练集和交叉验证
研报中选取了72个月的数据进行了10折交叉验证调参。
调参的模型训练结果在accuracy、precision和recall上较研报中都略差。
3.2样本外训练
研报中选择的是年度的推进分析即用5年内的样本训练模型,测试集为下一年的观测值。个人认为这样的训练集时间周期过长,在面对市场风格转换时会有较大的滞后性,因此本文缩短了滚动训练集的长度和更新模型的时间。
4.回测
利用推进训练的模型对测试集进行预测,每月选择模型对win投票率最高的若干只股票等权配置,月初调仓。
5.1问题
目前仍存在的问题有:
1.研报选取全A作为股票池进行模型的训练,本文使用的是现期的中证500成分股(存在未来信息)
2.未考虑月初开盘涨停跌停不能买入卖出的情况。(由于回测的代码写的比较简单,这个后续会完善。)
5.2收获与总结
本次研报的复现工作的全过程皆有本人个人在两周内完成,中途遇到了很多困难,也犯了一些比较低级且严重的错误。
数据的对齐工作可谓极其繁琐,虽然使用代码完成的,但也耗费了相当的脑力和时间。在给样本打标签时我也犯了一些低级的错误,标签应该为截面时间的下月超额收益率,我在第一次的训练时把标签打成了当月的超额收益率。所以在训练模型时,发现准确率高达90%多,但回测结果很差,反复检查后才发现错误进行了改正。
在复现过程中越发觉得R语言在应用中存在很大的局限性,python的随机森林包可调参数非常多,而R中只有mrty可调。不过考虑到机器学习的特征才是决定模型的上限,调参只不过是让模型表现接近上限,也就暂且等到本次复现完善之后再来考虑转换编程语言的问题了。
回复
使用道具
举报
返回列表
发表新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
免费注册
Copyright @ 2019-2023
 ||
网络违法和不良信息举报
 ||
沪ICP备14010833号-2
关注微信