
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
吃了写代码不规范的亏。。。明明记得之前写过某个功能,但是因为文件命名太随意,“123”,“111”,“a”,“test”等不知所谓的名称都被我用上了,以至于找代码时候焦头烂额,以后一定要养成规范命名的好习惯。不过如果已经这样写了,需要找某个函数时,可以用全局搜索的方式,通过找关键字,定位函数,定位文件。具体操作参看:pycharm如何全局进行查找一个关键词...
给定一个数据样本集,若想得到总体的概率分布,通常有两类方法:参数估计和非参数估计。参数估计需要先假定这个数据样本服从某种分布,再使用数据去拟合分布中的参数,含有较大的主观成分。而非参数估计,即核密度估计(Kernel Density Estimation,KDE),不需要预先假设,从数据本身出发,来估计未知的密度函数。一、估计过程1、以每个点的数据+带宽(邻域)作为参数,用核函数估计样本中每个数据
The number of FixedLocator locations (13), usually from a call to set_ticks, does not match the number of ticklabels (12).最近在使用matplotlib绘制雷达图时,出现了如上所述问题。我建立时序预测模型对风机的各项参数做了预测,最后想可视化这些参数各自的预测误差。解决方案:保
神经网络中常常用到归一化。归一化要注意的点及代码如下(以最大最小归一化为例):训练,测试数据分开归一化;X,y分开归一化。使用训练数据进行归一化,得到参数后,再用来归一化测试数据。X和y也要分开归一化,这样才好根据各自的参数对预测数据进行还原(inverse)。注意不要上来就对所有数据进行归一化,因为在实际使用中,我们并不知道预测数据的分布。x_scaler = preprocessing.Min
数据#使用pd读取数据data = pd.read_csv('E:\\2019data\\diff_turbine\\2019WT04990.csv', encoding='utf-8')print(data.head())data = data.sort_values(by = 'TO_CHAR')print(data.head())输出参考链接:pandas dataframe按日期排序
出现这个错误的原因是python代码是基于TensorFlow1.0的,而系统中的TensorFlow版本为2.0所以两种解决思路:把1.0的代码改为2.0把TensorFlow降为1.0我选择了第一种方法AttributeError: module 'tensorflow' has no attribute 'ConfigProto'出现报错的语句:config = tf....
在理解小波系数的维度的时候,被小波分解的尺度和层数搞迷糊了,看了几个博客和文档,整理了自己的理解。先看小波分解过程以及频率的划分尺度和分解层数不是一个概念,但是有如下的关系:尺度与分解频率成反比分解层数是对频率范围进行一定的划分因此,分解层数和尺度是一一对应的,有几个分解层数就有几个尺度。尺度就像是把尺子,每个分解层都是在用不同的尺子对原始信号进行度量。所以,有几个分解层数就有几把尺子。而分析频率
阿惠碎碎念:晕晕乎乎研究生阶段就已经过了大半年了,文献也没读多少。。。咸鱼呐!要改了。在有限的几次实验操作中,我发现用python对CSV文件执行操作还挺常用的。为了方便自己之后查阅,也方便大家参考,特来整理一下~整理的操作包括最基本的读取写入、选择、删除、去掉重复数据等。可能存在不足,欢迎批评指正!读取文件格式如下读取文件数据import pandas as pd#pathn...
在观察数据的大致分布时,分位数是个常用的统计值,下面介绍在hive sql中计算分位数的语法hive sql中计算分位数的函数:PERCENTILE_APPROX(适用于大数据量)使用格式:-- 以数组形式返回多个百分位近似计算结果。array<double> percentile_approx (double <colname>, array(<p1> [,
一直想写篇度量指标的文章,梳理一下这块的知识点,可能想了太多次,总以为自己已经写过了,今天看文章列表,竟然没有相关的内容,刚好最近在做多分类模型,借此机会整理一下。混淆矩阵(confusion matrix)在介绍各种指标前,先介绍混淆矩阵,基本所有的评价指标都是基于混淆矩阵计算得来的。混淆矩阵每一行代表数据的真实类别,每一列代表预测类别。以下是一个三分类问题的混淆矩阵:二分类和多分类都有混淆矩阵