scikit-learn 简称 sklearn,是 Python 机器学习中使用最为广泛的包,用户界面友好,并且 对常用的算法实现进行了高度优化。sklearn 囊括了广义线性模型、支持向量机、朴素贝 叶斯、线性和二次判别分析、决策树、随机森林、神经网络、PCA、k 近邻等常见的机器 学习算法,此外还提供了数据预处理、交叉验证集划分、网格搜索、分类正确率计算等众 多工具。我们将在第三部分 Python 代码实战章节具体介绍 sklearn 的使用方法。sklearn 的官方网站给出了更详细使用指南:http://scikit-learn.org/stable/ 1 多因子选股机器学习模型问题描述 上一章节我们初步认识了 Python 语言的特性、安装方法和常用命令。那么,如何将 Python 这一利器应用于量化投资呢?纵观量化投资的各个领域,我们发现多因子选股问题最适合 转换为机器学习的框架。下面我们将多因子选股以机器学习的语言加以描述。 经典的多因子模型表达式为: 经典多因子模型的实质是线性回归模型。其中因子暴露 |