gyshssl 发表于 2019-7-18 06:40:25

量化投资模型策略深度研究(一)

   量化投资模型的开发步骤一般是:数据处理、寻找因子、回测验证、实盘模拟、风险归因。

    数据处理:去极值、标准化、中性化;
            
            数据预处理。

    寻找因子:寻找Alpha;

            寻找收益波动比因子

    风险归因:简单策略归因,整理出来,大家有时间可以慢慢研究。

    其实,除模型开发之外,交易系统的构建、回测系统、风控和数据清理等每个部分都很关键。比如数据处理,你用的工具是Matlab还是R,或者c++以及python,如果是工具本身的格式速度会快很多,就像python的npy格式,或者c++的二进制格式。再有就是根据你的不同需求用什么数据,切片数据、分钟数据或者tick数据。每一块都可以是一个坑。

    而量化的模型大致可分为:

    1.趋势形、回复型,都依赖价格数据。

    2.价值型/收益型、成长型和品质型,此类型策略都基于基本面数据。

    3.技术情绪型,较少见,通常都只作为一个辅助因子。

趋势跟随策略

    趋势跟随策略是基于以下的基本假定:市场在一定时间里通常朝着同一方向变化,据此对市场趋势做出判断,就可以作为制定交易策略的依据。定义趋势通常用移动平均线交叉来定义趋势。

MACD移动平均线示例

    MACD(Moving Average Convergence and Divergence)是Geral Appel 于1979年提出的,利用收盘价的短期(常用为12日)指数移动平均线与长期(常用为26日)指数移动平均线之间的聚合与分离状况,对买进、卖出时机作出研判的技术指标。从双移动平均线发展而来的,由快的移动平均线减去慢的移动平均线。MACD的意义和双移动平均线基本相同。但阅读起来更方便。

指标应用法则:

  1.DIF向上交叉MACD,买进;DIF向下交叉MACD,卖出。

  2.DIF连续两次向下交叉MACD,将造成较大的跌幅。

  3.DIF连续两次向上交叉MACD,将造成较大的涨幅。

  4.DIF与股价形成背离时产生的信号,可信度较高。

  5.MDA、MACD、TRIX三者构成一组指标群,互相验证。

  当MACD从负数转向正数,是买的信号。当MACD从正数转向负数,是卖的信号。当MACD以大角度变化,表示快的移动平均线和慢的移动平均线的差距非常迅速的拉开,代表了一个市场大趋势的转变。MACD是Geral Appel 于1979年提出的,它是一项利用短期(常用为12日)移动平均线与长期(常用为26日)移动平均线之间的聚合与分离状况,对买进、卖出时机作出研判的技术指标。

公式算法:
短期EMA: 短期(例如12日)的收盘价指数移动平均值(Exponential Moving Average)
长期EMA: 长期(例如26日)的收盘价指数移动平均值(Exponential Moving Average)
DIF线: (Difference)短期EMA和长期EMA的离差值
DEA线: (Difference Exponential Average)DIF线的M日指数平滑移动平均线
MACD线: DIF线与DEA线的差

参数:
SHORT(短期)、LONG(长期)、M天数,一般为12、26、9。指数加权平滑系数为:
短期EMA平滑系数: 2/(SHORT+1)
长期EMA平滑系数: 2/(LONG+1)
DEA线平滑系数: 2/(M+1)

策略实现:
DIF从下而上穿过DEA,买进;
相反,如DIF从上往下穿过DEA,卖出。

import quartz
import quartz.backtest    as qb
import quartz.performance as qp
from   quartz.api         import *

import pandas as pd
import numpyas np
from datetime   import datetime
from matplotlib import pylab

import talib



start = datetime(2013, 1, 1)
end = datetime(2015, 1, 22)
benchmark = 'HS300'
#universe = ['601398.XSHG', '600028.XSHG', '601988.XSHG', '600036.XSHG', '600030.XSHG',
            #'601318.XSHG', '600000.XSHG', '600019.XSHG', '600519.XSHG', '601166.XSHG']
universe = set_universe('SH50')
capital_base = 200000
refresh_rate = 1
window = 1

initMACD = -10000.0
histMACD = pd.DataFrame(initMACD, index = universe, columns = ['preShortEMA', 'preLongEMA', 'preDIF', 'preDEA'])
shortWin = 26    # 短期EMA平滑天数
longWin= 52    # 长期EMA平滑天数
macdWin= 15    # DEA线平滑天数

def initialize(account):
    account.amount = 10000
    account.universe = universe
    add_history('hist', window)
    account.days = 0
   
def handle_data(account):
    account.days = account.days+1
   
    for stk in account.universe:
      prices = account.hist['closePrice']
      if prices is None:
            return
      
      preShortEMA = histMACD.at
      preLongEMA = histMACD.at
      preDIF = histMACD.at
      preDEA = histMACD.at
      if preShortEMA == initMACD or preLongEMA == initMACD:
            histMACD.at = prices[-1]
            histMACD.at = prices[-1]
            histMACD.at = 0
            histMACD.at = 0
            return
            
      shortEMA = preShortEMA*1.0*(shortWin-1)/(shortWin+1) + prices[-1]*2.0/(shortWin+1)
      longEMA = preLongEMA*1.0*(longWin-1)/(longWin+1) + prices[-1]*2.0/(longWin+1)
      DIF = shortEMA - longEMA
      DEA = preDEA*1.0*(macdWin-1)/(macdWin+1) + DIF*2.0/(macdWin+1)
      
      histMACD.at = shortEMA
      histMACD.at = longEMA
      histMACD.at = DIF
      histMACD.at = DEA
            
      if account.days > longWin and account.days%1 == 0:
            #if DIF > 0 and DEA > 0 and preDIF > preDEA and DIF < DEA:
            if preDIF > preDEA and DIF < DEA:
                order_to(stk, 0)
            #if DIF < 0 and DEA < 0 and preDIF < preDEA and DIF > DEA:
            if preDIF < preDEA and DIF > DEA:
                amount = account.amount/prices[-1]
                order_to(stk, amount)

http://s16.sinaimg.cn/mw690/001uapR3zy759mv31uv3f&690


上证指数上的MACD线指标实例:
from CAL.PyCAL import *

# DataAPI.MktIdxdGet返回pandas.DataFrame格式
sh_index =DataAPI.MktIdxdGet(indexID = "000001.ZICN", beginDate = "20140101", endDate = "20140731")

# calculate DIF, DEA, and MACD
initMACD = -1000.0
sh_index['shortEMA'] = initMACD
sh_index['longEMA']= initMACD
sh_index['DIF']   = initMACD
sh_index['DEA']= initMACD
sh_index['MACD']   = initMACD

shortWin = 12
longWin= 26
macdWin= 9

index = sh_index.index

for i in range(0, index.shape):
    if i == 0:
      sh_index['shortEMA'].iloc = sh_index['closeIndex'].iloc
      sh_index['longEMA'].iloc= sh_index['closeIndex'].iloc
      sh_index['DIF'].iloc   = sh_index['shortEMA'].iloc - sh_index['longEMA'].iloc
      sh_index['DEA'].iloc= sh_index['DIF'].iloc
      sh_index['MACD'].iloc= sh_index['DIF'].iloc - sh_index['DEA'].iloc
    else:
      sh_index['shortEMA'].iloc = sh_index['closeIndex'].iloc*2.0/(shortWin+1) + sh_index['shortEMA'].iloc*(shortWin-1)/(shortWin+1)
      sh_index['longEMA'].iloc= sh_index['closeIndex'].iloc*2.0/(longWin+1) + sh_index['longEMA'].iloc*(longWin-1)/(longWin+1)
      sh_index['DIF'].iloc   = sh_index['shortEMA'].iloc - sh_index['longEMA'].iloc
      sh_index['DEA'].iloc= sh_index['DIF'].iloc*2.0/(macdWin+1) + sh_index['DIF'].iloc*(macdWin-1)/(macdWin+1)
      sh_index['MACD'].iloc= sh_index['DIF'].iloc - sh_index['DEA'].iloc
      
sh_index = sh_index.set_index('tradeDate')

# plot data
pylab.figure(figsize=(15,6))
pylab.plot(sh_index.index, sh_index.closeIndex)
pylab.plot(sh_index.index, sh_index.longEMA)
pylab.plot(sh_index.index, sh_index.shortEMA)
pylab.legend(, loc = 'best', fontsize = 12)
pylab.grid()

pylab.figure(figsize=(15,6))
pylab.plot(sh_index.index, sh_index.DIF)
pylab.plot(sh_index.index, sh_index.DEA)
pylab.plot(sh_index.index, sh_index.MACD)
pylab.legend(, loc = 'best', fontsize = 12)
pylab.grid()


http://s14.sinaimg.cn/mw690/001uapR3zy759mvXpjn2d&690

http://s9.sinaimg.cn/mw690/001uapR3zy759mvYVfia8&690







geek168 发表于 2019-7-18 18:14:30

:):):):):):):):)
页: [1]
查看完整版本: 量化投资模型策略深度研究(一)