使用机器学习预测股价
股票价格预测有助于确定未来几天或几周内股票的走势,或者至少显示趋势。股票价格取决于多种因素,例如:基本因素:收入,利润,市场份额,业务的潜在增长前景外部因素:大流行病,例如新冠,外汇汇率,石油价格,黄金价格,债券收益率,全球股票市场技术因素:价格走势,交易量,移动平均线,MACD(移动平均趋同差异),RSI(相对强度指数),MFI(资金流量指数),支点,衍生产品到期日,期权未平仓合约,期货价格不管
股票价格预测有助于确定未来几天或几周内股票的走势,或者至少显示趋势。股票价格取决于多种因素,例如:
基本因素:收入,利润,市场份额,业务的潜在增长前景
外部因素:大流行病,例如新冠,外汇汇率,石油价格,黄金价格,债券收益率,全球股票市场
技术因素:价格走势,交易量,移动平均线,MACD(移动平均趋同差异),RSI(相对强度指数),MFI(资金流量指数),支点,衍生产品到期日,期权未平仓合约,期货价格
不管有没有这些因素,
- 股票价格不是随机的,它们的确遵循过去的历史趋势
- 人为的决定是情感和理性的结合,倾向于查看过去的数据
- 市场永远是对的。他们只会惩罚错误的决定
- 贪婪,盲目打电话,高风险的食欲,谨慎行事可以根据时间奖励或惩罚投资者。
在本文中,我们将尝试使用Facebook的Prophet
预测
为了这个分析,我选择了CDSL(印度中央存托服务有限公司)的股票。数据可以从https://www.nseindia.com/get-quotes/equity?symbol=CDSL下载,并点击历史数据。考虑到2020年3月的市场崩盘是一个黑天鹅事件,我取了从2020年4月到2021年4月的一年数据。
import pandas as pd
cdsl = pd.read_csv(‘/Users/ravindraprasad/01-Elicherla/01-DataScience/CDSLApril.csv’
上面的代码是导入_pandas _并下载数据。请在代码中使用适当的文件夹。
CDSL在下面显示带有标题的数据。
列名有一个小问题。以免在列中列出
list(cdsl.columns)
如您所见,在列名的末尾有一个空格
我正在更改列名
df = cdsl.rename(columns = {‘Date ‘: ‘Date’, ‘series ‘: ‘series’, ‘OPEN ‘: ‘Open’ , ‘HIGH ‘: ‘High’, ‘LOW ‘: ‘Low’, ‘PREV. CLOSE ‘: ‘PREV. CLOSE’, ‘ltp ‘: ‘ltp’, ‘close ‘: ‘close’, ‘vwap ‘: ‘vwap’, ‘52W H ‘: ‘52W H’, ‘52W L ‘: ‘52W L’ , ‘VOLUME ‘: ‘VOLUME’, ‘No of trades ‘:’No of trades’ }, inplace = False)
现在,所有列名称都更改为相同的名称,但没有空格
要使用先知,日期是重要的变量。
cdsl ['Date']
看起来确实是正确的日期。但是,当我们进行排序时,就会遇到挑战。如您在下面看到的,它没有正确排序。这是因为日期格式不正确。
现在,让我们更改日期格式。
df[‘Date’] = pd.to_datetime(df.Date,format=’%d-%b-%Y’)
df.sort_values(by=[‘Date’], inplace=True, ascending=True)
df
现在日期已经整理好了。让我们使用matplotlib绘制数据
from matplotlib import pyplot as plt
import numpy as np
x = df[‘Date’]
y = df[‘ltp’]
plt.plot(x, y)
现在是时候为先知准备数据了。先知只需要两个变量。我们将使用Date和ltp(这是最后交易价格)
dfdata = df[[“Date”,”ltp”]]
dfdata.rename(columns={“Date”:”ds”}, inplace=True)
dfdata.rename(columns={“ltp”:”y”}, inplace=True)
对于先知,我们需要在上面将其重命名为" ds"和" y"两个变量。在进行预测之前,让我们快速查看数据
导入先知并使用数据创建模型。
from fbprophet import Prophet
m = Prophet()
m.fit(dfdata)
让我们预测接下来的300天。
future = m.make_future_dataframe(periods=300)
future.tail()
forecast = m.predict(future)
dfforecast= forecast[[“ds”, “yhat”, “yhat_lower”, “yhat_upper”]]
pd.set_option(‘display.max_rows’, dfforecast.shape[0]+1)
dfforecast
fig1 = m.plot(forecast)
fig2 = m.plot_components(预测)
让我们建立交互式图形。
from fbprophet.plot import plot_plotly
import plotly.offline as py
py.init_notebook_mode()
fig = plot_plotly(m, forecast) # This returns a plotly Figure
py.iplot(fig)
该模型预测CDSL达到Rs。2021在11月1日当周,而卢比的下限较低。859卢比以上。1164.让我们拭目以待!!!
最后友情提醒:股市有风险,入市需谨慎!
最近准备看一些机器学习、深度学习方面的论文为后面读研打基础!在学习过程中搜集了入门器学习、深度学习经典书籍,关注公众号[程序员石磊],回复“机器学习”即可免费获得!
更多推荐
所有评论(0)