logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习 数据量不足问题----1 做好特征工程 2 不要用太多的特征 3 做好交叉验证 使用线性svm...

来自:https://www.zhihu.com/question/35649122其实这里所说的数据量不足,可以换一种方式去理解:在维度高的情况下,数据相对少。举一个特例,比如只有一维,和1万个数据,那么这种情况下,我们可以认为数据量其实是足够的,因为数据密度相对来说很高。如果数据的维度有1000维,数据量仍然有1万,这种情况下,数据的密度就相当低了。引用wiki里的两句话...

#数据结构与算法#人工智能
如何解读「量子计算应对大数据挑战:中国科大首次实现量子机器学习算法」?——是KNN算法吗?...

作者:知乎用户链接:https://www.zhihu.com/question/29187952/answer/48519630我居然今天才看到这个问题,天……本专业,有幸听过他们这个实验的组会来解(che)答(dan)一下。之前在陆朝阳组内开组会的时候师兄正好在做这个,我本科是这个专业的,之前看到他们paper发了,还有新闻,还和室友吐槽了一番。不过实验本身还好...

#人工智能#大数据
搜索引擎——用户搜索意图的理解及其难点解析,本质是利用机器学习用户的意图分类...

用户搜索意图的理解及其难点解析搜索引擎涉及的技术非常的繁复,既有工程架构方面的,又有算法策略方面的。综合来讲,一个搜索引擎的技术构建主要包含三大部分:对 query 的理解对内容(文档)的理解对 query 和内容(文档)的匹配和排序(点击放大图像)我们今天主要探讨其中的 Query Understanding,即对 query 的理解。对 qu...

#人工智能#数据结构与算法#游戏
积神经网络的参数优化方法——调整网络结构是关键!!!你只需不停增加层,直到测试误差不再减少....

积神经网络(CNN)的参数优化方法from:http://blog.csdn.net/u010900574/article/details/51992156著名: 本文是从 Michael Nielsen的电子书Neural Network and Deep Learning的深度学习那一章的卷积神经网络的参数优化方法的一些总结和摘录,并不是我自己的结论和做实...

#人工智能#数据库
卷积神经网络——本质上是在利用卷积做特征压缩,然后再全连接

原文:https://www.zybuluo.com/hanbingtao/note/485480 写得非常好,可以细读全连接网络 VS 卷积网络全连接神经网络之所以不太适合图像识别任务,主要有以下几个方面的问题:参数数量太多考虑一个输入1000*1000像素的图片(一百万像素,现在已经不能算大图了),输入层有1000*1000=100万节点。假设第一个隐藏层有100个...

#人工智能
大数据平台安全标准设计

从应用角度看,需大数据平台提供如下4项安全功能:图1 大数据平台安全功能1、边界——限制只有合法用户身份的用户访问大数据平台集群(1) 用户身份认证:关注于控制外部用户或者第三方服务对集群的访问过程中的身份鉴别,这是实施大数据平台安全架构的基础;用户在访问启用了安全认证的集群时,必须能通过服务所需要的安全认证方式。(2)网络隔离:大数据平台集群支持通过网...

#大数据#php#数据库
Cuckoo hash算法分析——其根本思想和bloom filter一致 增加hash函数来解决碰撞 节省了空间但代价是查找次数增加...

基本思想:cuckoo hash是一种解决hash冲突的方法,其目的是使用简单的hash 函数来提高hash table的利用率,同时保证O(1)的查询时间基本思想是使用2个hash函数来处理碰撞,从而每个key都对应到2个位置。插入操作如下:1. 对key值hash,生成两个hash key值,hashk1和 hashk2, 如果对应的两个位置上有一个为空,那...

机器学习 数据量不足问题----1 做好特征工程 2 不要用太多的特征 3 做好交叉验证 使用线性svm...

来自:https://www.zhihu.com/question/35649122其实这里所说的数据量不足,可以换一种方式去理解:在维度高的情况下,数据相对少。举一个特例,比如只有一维,和1万个数据,那么这种情况下,我们可以认为数据量其实是足够的,因为数据密度相对来说很高。如果数据的维度有1000维,数据量仍然有1万,这种情况下,数据的密度就相当低了。引用wiki里的两句话...

#数据结构与算法#人工智能
机器学习算法选择——特征提取

第4步:特征工程或许比选择算法更重要的是正确选择表示数据的特征。从上面的列表中选择合适的算法是相对简单直接的,然而特征工程却更像是一门艺术。主要问题在于我们试图分类的数据在特征空间的描述极少。利如,用像素的灰度值来预测图片通常是不佳的选择;相反,我们需要找到能提高信噪比的数据变换。如果没有这些数据转换,我们的任务可能无法解决。利如,在方向梯度直方图(HOG)出现之前,复杂的视觉任...

#人工智能#数据结构与算法
167. Two Sum II - Input array is sorted

Given an array of integers that is already sorted in ascending order, find two numbers such that they add up to a specific target number.The function twoSum should return indices of the two...

#面试
    共 45 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择