logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

熵权法中计算的熵值与决策树的熵值完全不一样之谜

熵权法中的熵值计算公式如图所示:比如说某个评价的指标完全一样,1,1,1,1,1,1那么m=6,p1到p6的概率均等于1/6;这个时候的熵值是最大的;所以在计算指标权重时,用这种方法反而是数据越小越混乱;权重越大;所以计算权重时都需要将1-ent值;这里的本质是已经将类别分好的,这里的数值代表属于该类别的样本个数;而我在决策树算法中看到的熵值,m=2,p1=1(值为1的是一类)...

MinHash算法:为什么选择Min而不是Max

既然理论上Max和Min等价,为什么实践中几乎都用Min?在算法的世界里,实验和数学同样重要。MinHash的故事,就是一个完美的例子。“MinHash使用最小值是因为Max不work,Max会严重低估相似度。这与许多教科书和博客的说法完全不同。两个定理的证明是完全对称的。一旦确立了标准,整个社区就沿用了这个约定。让我们用严谨的数学和实验来探寻真相。而k-max需要反向排序,略显不自然。剧透:答案

#算法
Gmail用人工智能技术判定垃圾邮件

大约10年前,垃圾邮件几乎要毁了电子邮箱。一场拯救人们的邮箱的比赛随即打响,两大科技巨头也力争夺得垃圾邮件头号杀手的头衔。2012年2月,微软声称,它能够过滤掉Hotmail 97%的垃圾邮件。谷歌后来作出回应,称它的Gmail能够过滤掉大约99%的垃圾邮件,而且误判率(将没问题的邮件误判为垃圾邮件的比例)也只有1%。两家公司的成果表明,启发式检测技术——按照预设规则识别垃圾邮件——能奏效。不过,

mongo使用投影(projection)的作用

投影在MongoDB中是一个非常有用的功能,通过它你可以控制查询结果中返回的字段,从而减少数据传输量,提高查询效率,并简化数据处理逻辑。在使用mongo时大脑需要有这样的意识,即投影的存在;理论和使用方法都可以从GPT4获得;

文章图片
#开发语言#python
文本相似度量的非常好的ESIM算法

论文来源:TACL 2017论文链接:Enhanced LSTM for Natural Language Inference今年不知道怎么回事,以短文本匹配为赛题的数据挖掘比赛层出不穷,自从Quora Question Pairs | Kaggle开始,到天池CIKM AnalytiCup 2018 | 赛制介绍,再到ATEC蚂蚁开发者大赛,还有拍拍贷AI开发平台-第三届魔镜杯大赛。。。...

python真实环境与虚拟环境均配置jupyter的方法,虚拟开发环境增加到notebook选项中

第一步、在真实环境中安装jupyter,参考另一篇博客第二、在目录中kernel目录下,添加一个目录,并在该目录下添加kernel json文件,写好配置文件;本质原理是新的目录下的配置文件中指定当前kernel所用的python解释器路径;所以虚拟开发环境中也需要用到juypter,可以通过这个方法在juypter建立多个核;比如说虚拟环境的解释器路径为:/root/AIPipeline/e..

打开服务器端口的方法

【代码】打开服务器端口的方法。

文章图片
#服务器#linux#网络
transformer系列之空间复杂度

一、加载阶段二、推理阶段三、训练阶段

文章图片
#人工智能
    共 106 条
  • 1
  • 2
  • 3
  • 11
  • 请选择