
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
一、半监督学习1-1、什么是半监督学习让学习器不依赖外界交互、自动地利用未标记样本来提升学习性能,就是半监督学习(semi-supervised learning)。要利用未标记样本,必然要做一些将未标记样本所揭示的数据分布信息与类别标记相联系的假设。假设的本质是“相似的样本拥有相似的输出”。半监督学习可进一步划分为纯(pure)半监督学习和直推学习(transductive le...
程序报错:servlet cannot be resolved to a type 尝试:(1) 把tomcat的servlet-api.jar拷贝到\Java\jdk1.8.0_111\jre\lib\ext目录下——失败(2) 新建环境变量classpath,添加%CATALINA_HOME%\lib;%CATALINA_HOME%\lib\servlet-api.jar;%C
【作者结论】-- > 把文本列中的所有英文逗号替换为中文逗号-- > 更改文本格式为utf-8 BOM编码--> 用WPS打开,成功(亲测可行)1. 如果是码农,建议直接用notepad++查看,简单便捷,省去无数麻烦。2. 如果是给其他人员看,那么需要借助excel或者WPS:(1)Excel的缺点:需要先把csv文件从utf-8转码为ANSI,打开后中...
今天分享大数据与人工智能的伦理挑战。(1)中立性算法表面中立,在学习中却可能形成隐形的歧视,甚至放大这些鸿沟。算法角度是合理的,但是社会往前发展,不能仅建立在数字化的优化上,而是要考虑很多人文的东西。例如高级职位推荐,女性占比8%-15%,系统开始偏向男性推荐,加剧性别差异。同理的还有秘书推荐给女性,卡车司机推荐给男性。随着系统对人购买力的打分,会有价格歧视。美国低矮桥,在设计的时候,就有把穷人挡
(1)读取网络def load_graph(file_path):with open(file_path, "r") as fd:data = fd.readlines()# 分离出标题和数据行,如果没有标题,用#号注释掉下面这两行)title = data[0]data = data[1:]# 从数据中提取边,建立一个空的有向图Gedges = [it.strip().strip(",").sp
需求:假设有一个4G的Id数据,和一个800M的Id数据,要互相遍历,时间开销很大。解决:采用比特图,能成功将4G数据压缩到1-5k左右。内存问题:如果一条数据的存放地址用32 比特(bit)来表示 ,等于4 字节(byte)内存;那么一亿条数据,要占用一亿个地址,等于占用4亿字节的内存,等于381MB (1MB=1024KB=1024*1024B)。——可接受如果一条数据的存放地址用64 比特(
机器学习之类别不平衡问题 (1) —— 各种评估指标机器学习之类别不平衡问题 (2) —— ROC和PR曲线机器学习之类别不平衡问题 (3) —— 采样方法完整代码前两篇主要谈类别不平衡问题的评估方法,重心放在各类评估指标以及ROC和PR曲线上,只有在明确了这些后,我们才能据此选择具体的处理类别不平衡问题的方法。本篇介绍的采样方法是其中比较常用的方法,其主要目的是通过改变原...
今天分享大数据与人工智能的伦理挑战。(1)中立性算法表面中立,在学习中却可能形成隐形的歧视,甚至放大这些鸿沟。算法角度是合理的,但是社会往前发展,不能仅建立在数字化的优化上,而是要考虑很多人文的东西。例如高级职位推荐,女性占比8%-15%,系统开始偏向男性推荐,加剧性别差异。同理的还有秘书推荐给女性,卡车司机推荐给男性。随着系统对人购买力的打分,会有价格歧视。美国低矮桥,在设计的时候,就有把穷人挡
最近安装一个python插件\python-Levenshtein-0.12.0,提示报错:error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools意思是







