|
量化投资模型的开发步骤一般是:数据处理、寻找因子、回测验证、实盘模拟、风险归因。
数据处理:去极值、标准化、中性化;
数据预处理。
寻找因子:寻找Alpha;
寻找收益波动比因子
风险归因:简单策略归因,整理出来,大家有时间可以慢慢研究。
其实,除模型开发之外,交易系统的构建、回测系统、风控和数据清理等每个部分都很关键。比如数据处理,你用的工具是Matlab还是R,或者c++以及python,如果是工具本身的格式速度会快很多,就像python的npy格式,或者c++的二进制格式。再有就是根据你的不同需求用什么数据,切片数据、分钟数据或者tick数据。每一块都可以是一个坑。
而量化的模型大致可分为:
1.趋势形、回复型,都依赖价格数据。
2.价值型/收益型、成长型和品质型,此类型策略都基于基本面数据。
3.技术情绪型,较少见,通常都只作为一个辅助因子。
趋势跟随策略
趋势跟随策略是基于以下的基本假定:市场在一定时间里通常朝着同一方向变化,据此对市场趋势做出判断,就可以作为制定交易策略的依据。定义趋势通常用移动平均线交叉来定义趋势。
MACD移动平均线示例
MACD(Moving Average Convergence and Divergence)是Geral Appel 于1979年提出的,利用收盘价的短期(常用为12日)指数移动平均线与长期(常用为26日)指数移动平均线之间的聚合与分离状况,对买进、卖出时机作出研判的技术指标。从双移动平均线发展而来的,由快的移动平均线减去慢的移动平均线。MACD的意义和双移动平均线基本相同。但阅读起来更方便。
指标应用法则:
1.DIF向上交叉MACD,买进;DIF向下交叉MACD,卖出。
2.DIF连续两次向下交叉MACD,将造成较大的跌幅。
3.DIF连续两次向上交叉MACD,将造成较大的涨幅。
4.DIF与股价形成背离时产生的信号,可信度较高。
5.MDA、MACD、TRIX三者构成一组指标群,互相验证。
当MACD从负数转向正数,是买的信号。当MACD从正数转向负数,是卖的信号。当MACD以大角度变化,表示快的移动平均线和慢的移动平均线的差距非常迅速的拉开,代表了一个市场大趋势的转变。MACD是Geral Appel 于1979年提出的,它是一项利用短期(常用为12日)移动平均线与长期(常用为26日)移动平均线之间的聚合与分离状况,对买进、卖出时机作出研判的技术指标。
公式算法:
短期EMA: 短期(例如12日)的收盘价指数移动平均值(Exponential Moving Average)
长期EMA: 长期(例如26日)的收盘价指数移动平均值(Exponential Moving Average)
DIF线: (Difference)短期EMA和长期EMA的离差值
DEA线: (Difference Exponential Average)DIF线的M日指数平滑移动平均线
MACD线: DIF线与DEA线的差
参数:
SHORT(短期)、LONG(长期)、M天数,一般为12、26、9。指数加权平滑系数为:
短期EMA平滑系数: 2/(SHORT+1)
长期EMA平滑系数: 2/(LONG+1)
DEA线平滑系数: 2/(M+1)
策略实现:
DIF从下而上穿过DEA,买进;
相反,如DIF从上往下穿过DEA,卖出。
- import quartz
- import quartz.backtest as qb
- import quartz.performance as qp
- from quartz.api import *
- import pandas as pd
- import numpy as np
- from datetime import datetime
- from matplotlib import pylab
- import talib
- start = datetime(2013, 1, 1)
- end = datetime(2015, 1, 22)
- benchmark = 'HS300'
- #universe = ['601398.XSHG', '600028.XSHG', '601988.XSHG', '600036.XSHG', '600030.XSHG',
- #'601318.XSHG', '600000.XSHG', '600019.XSHG', '600519.XSHG', '601166.XSHG']
- universe = set_universe('SH50')
- capital_base = 200000
- refresh_rate = 1
- window = 1
- initMACD = -10000.0
- histMACD = pd.DataFrame(initMACD, index = universe, columns = ['preShortEMA', 'preLongEMA', 'preDIF', 'preDEA'])
- shortWin = 26 # 短期EMA平滑天数
- longWin = 52 # 长期EMA平滑天数
- macdWin = 15 # DEA线平滑天数
- def initialize(account):
- account.amount = 10000
- account.universe = universe
- add_history('hist', window)
- account.days = 0
-
- def handle_data(account):
- account.days = account.days+1
-
- for stk in account.universe:
- prices = account.hist[stk]['closePrice']
- if prices is None:
- return
-
- preShortEMA = histMACD.at[stk, 'preShortEMA']
- preLongEMA = histMACD.at[stk, 'preLongEMA']
- preDIF = histMACD.at[stk, 'preDIF']
- preDEA = histMACD.at[stk, 'preDEA']
- if preShortEMA == initMACD or preLongEMA == initMACD:
- histMACD.at[stk, 'preShortEMA'] = prices[-1]
- histMACD.at[stk, 'preLongEMA'] = prices[-1]
- histMACD.at[stk, 'preDIF'] = 0
- histMACD.at[stk, 'preDEA'] = 0
- return
-
- shortEMA = preShortEMA*1.0*(shortWin-1)/(shortWin+1) + prices[-1]*2.0/(shortWin+1)
- longEMA = preLongEMA*1.0*(longWin-1)/(longWin+1) + prices[-1]*2.0/(longWin+1)
- DIF = shortEMA - longEMA
- DEA = preDEA*1.0*(macdWin-1)/(macdWin+1) + DIF*2.0/(macdWin+1)
-
- histMACD.at[stk, 'preShortEMA'] = shortEMA
- histMACD.at[stk, 'preLongEMA'] = longEMA
- histMACD.at[stk, 'preDIF'] = DIF
- histMACD.at[stk, 'preDEA'] = DEA
-
- if account.days > longWin and account.days%1 == 0:
- #if DIF > 0 and DEA > 0 and preDIF > preDEA and DIF < DEA:
- if preDIF > preDEA and DIF < DEA:
- order_to(stk, 0)
- #if DIF < 0 and DEA < 0 and preDIF < preDEA and DIF > DEA:
- if preDIF < preDEA and DIF > DEA:
- amount = account.amount/prices[-1]
- order_to(stk, amount)
复制代码

上证指数上的MACD线指标实例:
- from CAL.PyCAL import *
- # DataAPI.MktIdxdGet返回pandas.DataFrame格式
- sh_index = DataAPI.MktIdxdGet(indexID = "000001.ZICN", beginDate = "20140101", endDate = "20140731")
- # calculate DIF, DEA, and MACD
- initMACD = -1000.0
- sh_index['shortEMA'] = initMACD
- sh_index['longEMA'] = initMACD
- sh_index['DIF'] = initMACD
- sh_index['DEA'] = initMACD
- sh_index['MACD'] = initMACD
- shortWin = 12
- longWin = 26
- macdWin = 9
- index = sh_index.index
- for i in range(0, index.shape[0]):
- if i == 0:
- sh_index['shortEMA'].iloc[i] = sh_index['closeIndex'].iloc[i]
- sh_index['longEMA'].iloc[i] = sh_index['closeIndex'].iloc[i]
- sh_index['DIF'].iloc[i] = sh_index['shortEMA'].iloc[i] - sh_index['longEMA'].iloc[i]
- sh_index['DEA'].iloc[i] = sh_index['DIF'].iloc[i]
- sh_index['MACD'].iloc[i] = sh_index['DIF'].iloc[i] - sh_index['DEA'].iloc[i]
- else:
- sh_index['shortEMA'].iloc[i] = sh_index['closeIndex'].iloc[i]*2.0/(shortWin+1) + sh_index['shortEMA'].iloc[i-1]*(shortWin-1)/(shortWin+1)
- sh_index['longEMA'].iloc[i] = sh_index['closeIndex'].iloc[i]*2.0/(longWin+1) + sh_index['longEMA'].iloc[i-1]*(longWin-1)/(longWin+1)
- sh_index['DIF'].iloc[i] = sh_index['shortEMA'].iloc[i] - sh_index['longEMA'].iloc[i]
- sh_index['DEA'].iloc[i] = sh_index['DIF'].iloc[i]*2.0/(macdWin+1) + sh_index['DIF'].iloc[i-1]*(macdWin-1)/(macdWin+1)
- sh_index['MACD'].iloc[i] = sh_index['DIF'].iloc[i] - sh_index['DEA'].iloc[i]
-
- sh_index = sh_index.set_index('tradeDate')
- # plot data
- pylab.figure(figsize=(15,6))
- pylab.plot(sh_index.index, sh_index.closeIndex)
- pylab.plot(sh_index.index, sh_index.longEMA)
- pylab.plot(sh_index.index, sh_index.shortEMA)
- pylab.legend([u'ShangZheng Index', u'long period EMA', u'short period EMA'], loc = 'best', fontsize = 12)
- pylab.grid()
- pylab.figure(figsize=(15,6))
- pylab.plot(sh_index.index, sh_index.DIF)
- pylab.plot(sh_index.index, sh_index.DEA)
- pylab.plot(sh_index.index, sh_index.MACD)
- pylab.legend([u'DIF line', u'DEA line', u'MACD signal'], loc = 'best', fontsize = 12)
- pylab.grid()
复制代码


|
|