
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
写在前面量化回测必不可少的就是历史数据了,一般要求数据精度比较高的方式就是从数据服务商处购买数据服务,它们一般会将历史数据进行整理,免去了我们需要数据清洗的过程,提供数据服务的机构有很多,如RQdata、Wind等。如果对数据的精度要求不高,周期也没有什么要求的话,可以通过一些免费的Api接口来获取,如tushare、yahoo以及新浪财经。由于之前用过新浪财经进行爬取历史数据,所以本文先整理和.
在对数据进行预处理时,有时会面临特征值是字符串类型的时候,这时候就需要对特征值进行编码处理,主要分为一下两类:各个特征值之间没有任何关联,如['red', 'green', 'blue']。各个特征值之间有关系,如['Excellent', 'Good', 'Normal', 'Bad']。下面分别说一下如何对以上两种类型数据进行编码处理:拿kaggle中的House Price数据...
在将数据进行分析或者跑机器学习算法时,缺失值处理是很重要的一步,下面将通过读取csv文件来举例说明。读取csv文件时常见的缺失值有如下类型。空数据0NA其他表示形式,如‘null’一、空数据和NA数据以及其他表示空的数据创建一个测试文件,从中可以看出,空数据或者是NA数据都会被默认为是NaN。并且在文件中只有是NA或者是空是才会被转换为NaN,而如果是null、None之...
从今年的九月份到现在,接触机器学习、深度学习再到现在的深度强化学习已经有三个月的时间了。从java web开发到人工智能的领域转变的过程中,学到了很多很杂的东西,感觉这才是我以后要研究的东西。然而,在这个转变的过程中,老是急于求成,虽然代码写过很多,论文看了不少,但是总是觉得基础不够牢固,所以想写下博客来沉淀一下。前提概念1、离散动作和连续动作根据动作的不同类型选择和构造的
从http://blog.csdn.net/kingmax54212008/article/details/51257067转载的很多面试题,虽然感觉很多还很难掌握,但是会尽快弄明白的。1.列出安装Hadoop流程步骤a) 创建hadoop账号b) 更改ipc) 安装Java 更改/etc/profile 配置环境变量d) 修改host文件域名e) 安装ssh 配置无密码
最近一直用到Python的matplotlib包,一些画简单的散点图和折线图的用法老是记不住,所以从最基础的地方开始,稍微总结了一下。一、散点图画散点图时主要用到的是scatter函数。随机产生两组length相同的数据。x = np.random.uniform(10, 20, 10)y = np.random.random_integers(10, 50, 10)通过plt.figure(
写在前面下面这篇文章的内容主要是来自发表于TechRxiv 的一篇Preprint文章《Order Flow, Technical Analysis And Neural Network: Predicting Short-term Direction Of Futures Contract》。这篇文章提出了一种针对期货数据的短期预测模型,其对一系列来自技术分析、订单流的...
写在前面下面这篇文章的内容主要是来自发表于Plos One的一篇文章《A deep learning framework for financial time series using ...
作者:Andrew Chung公众号:WealthQuant链接:https://www.zhihu.com/question/23525783/answer/956912446已获得作者...
论文 |Stock Market Prediction via Deep Learning Techniques: A Survey作者 |Jinan Zou, Qingying Zhao, Yang Jiao, Haiyao Cao, Yanxi Liu, Qingsen Yan, Ehsan Abbasnejad, Lingqiao Liu, Javen Qinfeng Shi一 本文摘要..







