本系列内容摘要: 介绍 Python 安装方法、与机器学习相关的包以及常用命令 Python 语言是目前机器学习领域使用最广泛的编程语言之一,拥有众多优 秀的包和模块,并且相对简单易学。我们将简单介绍 Python 语言的特性, 常用命令,以及和机器学习相关的包,例如 NumPy,pandas,scikit-learn 等,希望帮助有一定编程基础的读者迅速上手 Python 语言。 机器学习选股框架与多因子选股框架类似,具有一定优越性 机器学习中最为主流的方法监督学习,其核心思想是挖掘自变量和因变量 之间的规律。我们将经典多因子模型稍加改造,以机器学习的语言描述。 在训练阶段,根据历史的因子值 X 和收益 r,训练监督学习模型 r=g(X, f), 得到模型自由参数的估计量 f。在测试阶段:根据最新的因子值 X、参数估 计量 f 和监督学习模型 g,预测下期收益 r。机器学习方法相较于线性回归 的优越之处在于:首先,机器学习可以挖掘数据中的非线性规律;其次, 正则化的引入能够筛选出最有效的自变量;再次,参数优化的过程能够遴 选出预测力最强的模型。 将机器学习选股代码拆分成十二个子模块进行详尽讲解 我们将机器学习选股代码拆分成十二个子模块,包括:模块导入、参数设 置、数据读入、数据标记、数据预处理、模型设置、模型训练、模型预测、 模型评价、策略构建、策略评价和结果保存。每个子模块我们将展示代码 并且逐句进行讲解。文中展示的代码是完备且成体系的,可以根据需要 进行整合,构建一套完整的机器学习选股模型。
|