跑步进场
最近股市大涨,不少人忙着跑步进场。作为保守型“投资者”,主投指数基金:沪深300。在这波行情 中,短短2个月,也有13%的账面收益。虽然知道指数类适合长期持有,但也好奇,这个点是否是高位了。为了解决这个疑虑。我们今天用算法模型套一套,看能否发现些什么。
时序预测的价值
时序问题的预测在生活中很常见。例如:游戏在线人数预测、消费情况预测、 O2O 的到店人数预测、交通流量预测,这些场景的精确预测,为资源的调配起到了重大的参考作用。从个体角度来说,得到的服务和体验也大大提升。
为此,Facebook 开源了一套工具 Prophet,专门用于时间学列预测。在这里,我们将用它,来一探股市究竟。
时序预测的原理
对于时间序列问题,常用的手法是时间序列的分解:这里有些类似于傅里叶变换的意味。将一个函数分解为多个规律函数的和积。时间序列的常见组成成分包括:季节项、趋势项以及噪声。在 Prophet 中,结合实际情况,他们又加入了节假日项目。之前在一次 kaggle 的比赛中,我们也发现节假日的数据波动,其实是类似于周末效应的。即:节假日的前后数据,类似于周六的前后数据。对数据进行修正后,评价指标会好很多。
废话不多说,咱们开干。
Prophet in 沪深300
工具包安装
pip install fbprophet
数据准备与清洗
import pandas as pd
import numpy as np
from fbprophet import Prophet
数据准备
- 数据来源为网易财经,沪深三百指数。
data = pd.read_csv('../data/000300.csv',encoding='GB2312')
data.head()
数据清洗
- 选取需要的数据,并对数据做 log / box-cox 变换,使数据更符合线性、正态分布,减少方差差异。经济系统和生态系统类似,都存在指数级增长现象,也存在饱和现象。我们这里采用 log 变换。
df = data[[u'日期',u'收盘价']]
df.columns = ['ds','y']
df['y'] = df['y'].apply(lambda x: np.log(int(x)))
模型拟合与预测
简单定义,然后拟合。
m = Prophet()
m.fit(df)
预测未来一年的行情
future = m.make_future_dataframe(periods=365)
forecast = m.predict(future)
详细看最后15天的数据
forecast[['ds', 'yhat', 'yhat_lower', 'yhat_upper']].tail(15)
future_predict['yhat'] = future_predict['yhat'].apply(lambda x:np.exp(x))
future_predict['yhat_lower'] = future_predict['yhat_lower'].apply(lambda x:np.exp(x))
future_predict['yhat_upper'] = future_predict['yhat_upper'].apply(lambda x:np.exp(x))
yhat 预测比较保守,20200307 相较于目前20190308 的大盘涨了100个点。预期最大收益:(6536-3658)/3658≈ 78%,预期最大亏损:(2158-3658)/3658≈-41%
模型看到了什么
Prophet 有个功能是成分拆分,咱们来看看国内股市的趋势以及季节性因素是什么。
fig1 = m.plot(forecast)
模型拟合情况
趋势项
总结
模型数据表明,沪深股市短期看可能有波动,长期看上扬可能性更大。短期对于我们这种投资方式的参考意义不大,长期来看,稳中向好,我也将持续沪深300。当然,话说回来,投资有风险,决策需谨慎。不要只看狼吃肉,不见狼挨打。去年最差的时候,本人累计亏损15%…
另外再强调一下,模型并非万能。这里使用的信息单一,但真实世界,可是有多种信息共同作用于市场。模型也还未经过充分调参,没有划分数据做验证,实际使用价值有限。
对此,你怎么看?欢迎在留言区写下你的看法。