logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

《数据挖掘》读书笔记2、3章节

第二章 输入:概念、实例和属性2.1 概念数据挖掘的应用有4种类型:分类学习(监督学习,训练集中数据有明确的类别)、关联学习(通常仅包含非数值的属性)、聚类(当样本不存在一个特定的类时)和数值预测。不管采用什么方式进行学习,被学习的东西成为概念,学习方案产生的输出就是概念描述。2.2 样本       每一个实例都是一个被用来学习的单一、独立的概念样本。一个有限关系(复杂、非独立)

#数据挖掘
网易商业智能研究员笔试——逻辑推理题

网易笔试已经过去好多天了,考完就放弃的,mei'xiang

阿里数据分析师面试准备二:对阿里数据分析师岗位的理解

为了准备面试,对阿里公司、技术做了大致了解,分析了下sh

2015届阿里巴巴数据分析师笔试题(实习)

题量10个选择,3个简答,2个问答题(大简答题)选择题涉及 概率论、智力题、Hive、数据挖掘的基础知识印象深刻的几个题为:准确率和召回率的概念;逻辑回归;有一堆松果,共100个。一只松鼠要把这些松果搬到100米远的家。每次最多拿50个。但是松鼠每走2米就要吃一个松果,请问最多能搬回家多少个?当置信度变小,其它条件不变,那么置信区间上限减去下限的值 如何变化?(

#数据分析
数据分析与数据挖掘的区别

这个问题貌似有点无聊,不过下面的chans先谈数据,其实很简单,就是观测值。例如测量数据。不过大家可能有个误区。认为,客户填写的表单就是数据。对编程序而言,是的。但是不是常规的数据。当然填写的内容,一旦落入的观测空间,则自然就成了数据。不谈数据,就无以谈数据分析和数据挖掘。由此,上面先说了数据。这里还要说下信息。信息,抽象的说,就是可信的数据。那么这里和数据最大的区别就在于,一个是

#数据分析#数据挖掘
网易商业智能研究员笔试——SQL

1. 有个师徒关系表,一个师傅可以找多个徒弟,一个徒弟可以有多个师傅,现在已知一个师傅ID,要找和他有相同徒弟群(即所有徒弟都一样)的所有师傅。写SQL语句

#sql
《数据挖掘》读书笔记5章

第五章 可信度:评估及其学习结果5.1 训练和测试         测试集数据不允许用于分类器的创建。5.2 预测性能       对于测试集获得的成功率,并不能绝对真实反映分类器的效果,还有个置信区间,运用统计学知识,可以推断出一个置信边界。5.3 交叉验证       将所有数据分为若干份,每次预留一份作为测试集,其它作为训练集,经验所得,一般分为10份,也叫10折交叉

#数据挖掘
《数据挖掘》读书笔记4章

第四章 算法:基本方法4.1 推断基本规则       选择一个属性作为最简单的分类规则,称为“1规则”(1-true),简称1R。对于每个属性         对于这个属性的每个属性值,建立如下的一条规则:                   计算每个类别出现的频率;                   找出出现最频繁的类别;         

#数据挖掘
    共 15 条
  • 1
  • 2
  • 请选择