logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【数据挖掘】最近邻和贝叶斯分类器

数据挖掘1. 最近邻分类器1.1 学习方法的演变积极学习方法消极学习方法rote分类器最近邻分类器1.2 基本思想如果它走路像鸭,叫得像鸭,那么它很可能是鸭。计算测试样例的k个最近的训练样例,根据k个最近邻的训练样例的类别来确定测试样例的类别。最近邻分类器的要素:训练样例距离度量k值的选取1.3 最近邻分类器的特征基于实例学习,不需要学习模型测试样例的开销很大,k值太小易受到噪声干扰,k值太大容易

#数据挖掘#分类#算法
【数据挖掘】第二章 认识数据

数据挖掘第二章 认识数据未来的世界是三元世界:物理空间;人类社会空间;信息空间2.1 数据的类型举例:交易数据文档数据网络数据基因序列环境数据什么是数据?数据是对象及其属性的集合,可以表示为矩阵。数据可以理解为高维空间的一个点属性类型分类的* 标称:男or女* 序数:本科,硕士,博士数值的* 区间:今天的温度为15~28度* 比率:今天A股大盘跌2.26%规范化、距离、角度规范化:对数据进行归一化

#数据挖掘
【数据挖掘】第四章 分类任务(决策树)

数据挖掘第四章 分类任务1.分类基本概念1.1 分类是什么分类任务就是通过学习得到一个目标函数f把每个属性集x映射到一个预先定义的类标号y目标函数f也称之为分类模型(classification model)给定一组记录(训练集)每条记录由一个元组(x,y)表示,其中x是属性集,y是类标签1.2 分类的目的预测性建模:分类模型可以用于预测未知记录的类标号描述性建模:分类模型可以作为解释性的工具,用

#数据挖掘
【机器学习】KL-divergence(KL散度)的理解

相对熵(relative entropy),又被称为Kullback-Leibler散度(Kullback-Leibler divergence)或信息散度(information divergence),是两个概率分布(probability distribution)间差异的非对称性度量。

#算法#人工智能#python
【linux】linux新建用户并分组,分配权限

1. 涉及到的命令useradd 选项 用户名usermod 选项 用户名userdel 选项 用户名passwd 选项 用户名groupadd 选项 用户组groupmod 选项 用户组groupdel 选项 用户组2.用户账号管理2.1 新建用户账号useradd help文档Usage: useradd [options] LOGINuseradd -Duseradd -D [options

#ubuntu#linux#服务器
【linux】linux shell脚本中的开头# /bin/bash的含义

对于linux上需要执行 的shell脚本,通常第一行的内容是#! /bin/bash当然有很多时候不规范的写法可以忽略掉这一句,执行起来好像也是ok,结果没什么不一样 。。这只是因为在我们常用 的linux系统上默认都是执行/bin/bash来执行我们的shell脚本,但是如果有些用户使用的是csh,那么缺少第一行的“#!/bin/bash的shell脚本执行结果就可能存在语法不兼容的问题,导致

#linux#服务器
    共 11 条
  • 1
  • 2
  • 请选择