logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

numpy中np.nan(pandas中NAN)

在处理数据时遇到NAN值的几率还是比较大的,有的时候需要对数据值是否为nan值做判断,但是如下处理时会出现一个很诡异的结果:import numpy as npnp.nan == np.nan#此时会输出为False对np.nan进行help查看,输出如下:Help on float object:class float(object)|float(x) -> floating point

#numpy#pandas
python检测空间储存剩余大小和指定文件夹内存占用

1、检测指定路径下所有文件所占用内存import osdef check_memory(path, style='M'):i = 0for dirpath, dirname, filename in os.walk(path):for ii in filename:i += os.path.getsize(os.path.join(di

#python
Postgresql (GreenPlum) psycopg2的批量数据插入

psycopg2 数据批量插入问题记录由于最近用到greenplum,需要进行一些数据库批量插入操作,由于其操作方式与postgresql相同,因此采用的是psycopg2(2.8.4) 做底层驱动。由于数据量较大,所以采用了批量插入操作,也就是其自带的executemany,从名字来看会给我们其真的是批量插入的错觉(搜了下,大部分搜索结果也是说批量插入使用该操作,坑~(⊙﹏⊙)),但是,实际..

准确率Accuracy,精确度Precision,召回率Recall,F1值

1.什么是分类准确率?评价分类器性能的指标一般是分类准确率(Accuracy),其定义是:对于给定的测试数据集,分类器正确分类的样本数和总样本数之比。对于二分类问题常见的评价指标是精确率(precision)与召回率(recall)。通常以关注的类为正类,其他类为负类,分类器在测试数据集上的预测或正确或不正确,四种情况出现的总数分别记作:TP ——将正类预测为正类数(True Posit

#机器学习
什么是高内聚、低耦合?

高内聚、低耦合内聚:每个模块尽可能独立完成自己的功能,不依赖于模块外部的代码。耦合:模块与模块之间接口的复杂程度。模块之间联系越复杂耦合度越高,牵一发而动全身。目的:使得模块的“可重用性”、“移植性“大大增强。通常程序结构中各模块的内聚程度越高,模块间的耦合程度就越低。模块粒度:【函数】高内聚:尽可能类的每个成员方法只完成一件事(最大限度的聚合)低耦合:减少类内部一个成员调用另...

sklearn中的交叉验证(Cross-Validation)

这个repo 用来记录一些python技巧、书籍、学习链接等,欢迎stargithub地址sklearn是利用python进行机器学习中一个非常全面和好用的第三方库,用过的都说好。今天主要记录一下sklearn中关于交叉验证的各种用法,主要是对sklearn官方文档 Cross-validation: evaluating estimator performance进行讲解,英文水平好...

python中运算过程中小数精度的控制

用python进行运算时,如果会出现浮点数,有时候会需要对小数精度进行控制,主要方法有以下几种:1、round()round()是python的内置方法, round()如果只有一个数作为参数,不指定位数的时候,返回的是一个整数,而且是最靠近的偶数整数(python2.7版本则是四舍五入,这个针对的是python3版本)。如果有两个参数则最多保留精度为第二个参数大小。In [1]: 4 - 3.6

#python
sklearn中的svm参数介绍

svm是sklearn中一个关于支持向量机的包,比较常用,在使用过程中若是不熟悉各个参数的意义,总以默认参数进行机器学习,则不能做到最优化使用SVM,这就是一个较为遗憾的事情了。为了加深理解和方便调用,根据现有理解,结合官方文档,对其中的参数做一些记录,方便自己时常温习,也给阅读者进行一些错粗浅的介绍,如果有理解错误的地方,希望阅读者能够指出。以svm中的支持向量分类SVC作为介绍,所有参数如下:

#机器学习#python
sklearn中的交叉验证(Cross-Validation)

这个repo 用来记录一些python技巧、书籍、学习链接等,欢迎stargithub地址sklearn是利用python进行机器学习中一个非常全面和好用的第三方库,用过的都说好。今天主要记录一下sklearn中关于交叉验证的各种用法,主要是对sklearn官方文档 Cross-validation: evaluating estimator performance进行讲解,英文水平好...

#python#机器学习#sklearn
分类-回归-聚类-异常检测

分类:支持向量机(SVM)可用于找到尽可能宽的分类的边界。当两个分类不能被清楚地分开时,该算法会找到其所能找到的最佳边界。其真正的亮点在于处理特征密集的数据,比如文本或者基因组(特征数量> 100)。在这些情况下,除了仅需要适量的记忆外,支持向量机(SVM)能够比其它大多数算法更快且更少过拟合地进行分类。人工神经网络是涵盖二分类、多分类和回归问题的脑启发式学习算法。它们有无限的种类,

#分类#回归#聚类
    共 11 条
  • 1
  • 2
  • 请选择