logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

使用Weka进行数据挖掘

使用Weka进行数据挖掘1.简介数据挖掘、机器学习这些字眼,在一些人看来,是门槛很高的东西。诚然,如果做算法实现甚至算法优化,确实需要很多背景知识。但事实是,绝大多数数据挖掘工程师,不需要去做算法层面的东西。他们的精力,集中在特征提取,算法选择和参数调优上。那么,一个可以方便地提供这些功能的工具,便是十分必要的了。而weka,便是数据挖掘工具中的佼佼者。Weka的全名是怀卡托智能分

#数据挖掘#数据可视化#机器学习 +1
机器学习算法-Apriori关联分析

引文: 学习一个算法,我们最关心的并不是算法本身,而是一个算法能够干什么,能应用到什么地方。很多的时候,我们都需要从大量数据中提取出有用的信息,从大规模数据中寻找物品间的隐含关系叫做关联分析(association analysis)或者关联规则学习(association rule learning)。比如在平时的购物中,那些商品一起捆绑购买销量会比较好,又比如购物商城中的那些推荐信息,都是根据

#机器学习
机器学习算法代码汇总(Python&R)

【机器学习算法代码汇总-Python&R】- PDF文件下载.原文链接:点击这里.

#python#机器学习#算法
CentOS下torque集群配置(一)-torque安装与配置

一、Centos7系统的安装及设置1、给两台电脑安装CentOS7.0,光盘启动路径修改为:/dev/cdrom修改主机名称# hostnamectl set-hostname2、设置ip地址# vi /etc/sysconfig/network-scripts/ifcfg-eth0添加下列属性值

#集群#centos#ssh
Python学习-安装pip和scikit-learn

服务器环境:centos7.0python2.7.5pip-6.1.1引文:由于之前配集群的时候比较仓促,很多东西都是简化版。python的库都没有安装,今天实验室一同学要用服务器跑程序,代码使用python写的,结果配python的环境又耗费了大半天,没有午休,眼睛还困困的,满满的都是泪啊~1pip的安装1.1 下载pippython很多的模板库都可以使用pip来安装

#pip#sklearn#python +2
数据库(第一范式,第二范式,第三范式)

数据库(第一范式,第二范式,第三范式)范式:英文名称是 Normal Form,它是英国人 E.F.Codd(关系数据库的老祖宗)在上个世纪70年代提出关系数据库模型后总结出来的,范式是关系数据库理论的基础,也是我们在设计数据库结构过程中所要遵循的规则和指导方法。目前有迹可寻的共有8种范式,依次是:1NF,2NF,3NF,BCNF,4NF,5NF,DKNF,6NF。通常所用到的只是前三个范式,

#数据库
机器学习算法-朴素贝叶斯Python实现

引文:前面提到的K最近邻算法和决策树算法,数据实例最终被明确的划分到某个分类中,下面介绍一种不能完全确定数据实例应该划分到哪个类别,或者说只能给数据实例属于给定分类的概率。基于贝叶斯决策理论的分类方法之朴素贝叶斯优点:在数据较少的情况下仍然有效,可以处理多类别问题缺点:对于输入数据的准备方式较为敏感适用数据类型:标称型数据。朴素贝叶斯的一般过程收集数据:可以使用任何方式准备数据:需要数

#python
机器学习—过拟合overfitting

今天在知乎上看到一个问题:人脑有海量的神经元(参数),为什么没有过拟合?面对各个网友的回答,突然发现自己对于过拟合的概念似乎理解的不是很透彻,或者说之前就没有完全理解透。其中有个人这么说“样本少feature多才overfitting”也有人提到看红框标注部分,也就是说样本多就不会发生过拟合么。先不管知乎这个问题了,为了搞清过拟合的概念,再次跑到wikipedia去搜寻答案。下面是wikipedi

#机器学习
机器学习数据集-MNIST

介绍在学习机器学习的时候,首当其冲的就是准备一份通用的数据集,方便与其他的算法进行比较。在这里,我写了一个用于加载MNIST数据集的方法,并将其进行封装,主要用于将MNIST数据集转换成numpy.array()格式的训练数据。直接下面看下面的代码吧(主要还是如何用python去读取binnary file)!MNIST数据集原网址:http://yann.lecun.com/exdb/mnist

#python#机器学习#算法
机器学习scikit-learn入门教程

原文链接:http://scikit-learn.github.io/dev/tutorial/basic/tutorial.html章节内容在这个章节中,我们主要介绍关于scikit-learn机器学习词库,并且将给出一个学习样例。机器学习:问题设置通常,一个学习问题是通过一系列的n个样本数据来学习然后尝试预测未知数据的属性。如果每一个样本超过一个单一的数值,例如多维输入(也叫做多维数据),那么

#sklearn#机器学习
    共 31 条
  • 1
  • 2
  • 3
  • 4
  • 请选择