logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

信息检索(IR)的评价指标介绍 - 准确率、召回率、F1、mAP、ROC、AUC

在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。准确率、召回率、F1信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(Precision Rate),召回率也叫查全率,准确率也叫查准率,概念公式:             召回率(Recall)      =  系统检索到的相关文件 /

#算法
结构风险最小和VC维理论的解释

基于libsvm的中文分类原型,虽然做了原型,但是概念还不是很清晰。“支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上”结构化风险结构化风险 = 经验风险 + 置信风险经验风险 =  分类器在给定样本上的误差置信风险 = 分类器在未知文本上分类的结果的误差置信风险因素:样本数量,给定的样本数量越大,学习结果越有可能正确,此时置信风险越小;分类函数的VC维,显然VC维越大,推

基于libsvm的中文文本分类原型

支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学习能力(即无错误地识别任

#matlab#python
数据挖掘十大经典算法

一、C4.5     C4.5,是机器学习算法中的一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。二、The k-means algorithm即K-Means算法    k-means

#数据挖掘#机器学习
压力测试衡量CPU的三个指标:CPU Utilization、Load Average和Context Switch Rate

上篇讲如何用LoadRunner监控Linux的性能指标 ,但是关于CPU的几个指标没有搞清楚,下面就详细说说。 CPU Utilization 好理解,就是CPU的利用率,75%以上就比较高了(也有说法是80%或者更高)。除了这个指标外,还要结合Load Average和Context Switch Rate来看,有可能CPU高是因为后两个指标高导致的。  Load Averag

#测试#linux#服务器 +1
C++太难用

    我一直使用C#来开发,我认为C#配合Visual Studio是最完美的开发方案。    我从去年7月份开始转向学习C++,发现真的是很难用,过于学院派了,而且,选择太多,标准库,boost库等,但是没有一个好用的,不是说单个的不好用,比如标准库的容器,确实比较好用,但是你在需要完成某些功能时,总是没有对应的库来处理。要是用了C#的微软提供的基础类库,你就会发现,其实std和boost加起

#c++#ide#c#
std list/vector sort 自定义类的排序就是这么简单

网上江湖郎中和蒙古大夫很多,因此,此类帖子也很多。关于排序,我还真没研究过,看了江湖郎中和蒙古大夫的帖子,搞了半天不行,所以,自己研究了一下,如下:三种方式都可以,如重写<,()和写比较函数compare_index。但是要注意对象和对象指针的排序区别。1、容器中是对象时,用操作符<或者比较函数,比较函数参数是引用。2、容器中是对象指针时,用()和比较函数排序都可以,比较函数参...

#list
MFC中如何利用ffmpeg和SDL2.0多线程多窗口播放摄像头的视频

我前一篇文章,《Window下用DirectShow查找摄像头(含分辨率)和麦克风》,详细介绍了如何查找摄像头和摄像头支持的分辨率信息,查找到摄像头和麦克风之后做什么呢?两个目的,第一个目的是播放,第二个目的是编码之后发送服务器流媒体数据,第三个目的就是存在本地硬盘上了,本文就是播放摄像头采集的数据。本人初次接触音视频相关的项目,研究了几天,从网上断断续续的找到不少摄像头播放的...

基于libsvm的中文文本分类原型

支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学习能力(即无错误地识别任

#matlab#python
CryptoKittes(加密猫,谜恋猫)智能合约结构和源码解析

  CryptoKittes(加密猫、谜恋猫,https://www.cryptokitties.co/)是运行在以太坊上的一个游戏。 谜恋猫是世界首款架构在区块链技术上的数字猫收集与繁殖游戏,同样的技术突破使得比特币和以太坊的运作的基础。  具体可以参考如下两篇参考资料:【CryptoKitties源码解析】养猫的正确姿势!教程 | 如何在Ethereum上编写自己的CryptoKitties风

到底了