
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
二、数据提取在发送请求获取响应之后,可能存在多种不同类型的响应内容;而且很多时候,我们只需要响应内容中的一部分数据。1 响应分类结构化的响应内容json字符串(高频出现)可以使用re、json等模块来提取特定数据xml字符串(低频出现)可以使用re、lxml等模块来提取特定数据非结构化的响应内容html字符串可以使用re、lxml等模块来提取特定数据...
二、距离向量1)欧氏距离欧式距离是最容易值观理解的距离度量方法。2)曼哈顿距离在曼哈顿街区要从一个十字路口开车到另一个十字路口,驾驶距离显然不是两点之前的直线距离。这个实际的驾驶距离就是"曼哈顿距离"。曼哈顿距离也称“城市街区距离”。3)切比雪夫距离国际象棋中,国王可以直行、横行、斜行,所以国王走一步可以移动到相邻8个方格中的任意一个。国王从格子(x1,y1)走到格子(x2,y2...
三、K值的选择K值选择问题,李航博士的一书「统计学习方法」上所说:选择较小的K值,就相当于用较小的领域中的训练实例进行预测,“学习”近似误差会减小,只有与输入实例较近或相似的训练实例才会对预测结果起作用,与此同时带来的问题是“学习”的估计误差会增大,换句话说,K值的减小就意味着整体模型变得复杂,容易发生过拟合;选择较大的K值,就相当于用较大领域中的训练实例进行预测,其优点是可以减少学...
9.决策树算法APIclass sklearn.tree.DecisionTreeClassifier(criterion=’gini’, max_depth=None,random_state=None)criterion特征选择标准“gini"或者"entropy”,前者代表基尼系数,后者代表信息增益。一默认"gini",即CART算法。min_samples_split...
1.3 DNS处理模块dnspythondnspython(http://www.dnspython.org/)是Python实现的一个DNS工具包,它支持几乎所有的记录类型,可以用于查询、传输并动态更新ZONE信息,同时支持TSIG(事务签名)验证消息和EDNS0(扩展DNS)。在系统管理方面,我们可以利用其查询功能来实现DNS服务监控以及解析结果的校验,可以替代nslookup及dig等..
机器学习一、人工智能1)人工智能应用场景就与现在的社会发展趋势而言,人工智能已经体现在了大家生活中的很多方面,如交通路况查询,电商网站的推荐系统,手机的人脸识别等。2)人工智能发展必备的三要素:数据算法计算力CPU、GPU、TPUCPU和GPU的简单对比:CPU主要适合I/O密集型的任务GPU主要适合计算密集型的任务那么什么样的程序适合在GPU上运行呢?1...
8.特征提取1 定义将任意数据(如文本或图像)转换为可用于机器学习的数字特征注:特征值化是为了计算机更好的去理解数据特征提取分类:字典特征提取(特征离散化)文本特征提取图像特征提取(深度学习将介绍)2 特征提取APIsklearn.feature_extraction3 字典特征提取作用:对字典数据进行特征值化sklearn.feature_extrac...
2.1 文件内容差异对比方法difflib作为Python的标准库模块,无需安装,作用是对比文本之间的差异,且支持输出可读性较强的html文档,与Linux下的diff命令相似。我们可以使用difflb对比代码、配置文件的差别,在版本控制方面是非常有用。2.1.1 两个字符串的差异对比#!/usr/bin/pythonimport difflib# 定义字符串text1 = ''...
一、聚类算法1.概念:聚类算法是一种典型的无监督学习算法,主要用于将相似的样本自动归到一个类别中。在聚类算法中根据样本之间的相似性,将样本划分到不同的类别中,对于不同的相似度计算方法,会产生不同的聚类结果,常用的相似度计算方法有欧式距离。2.聚类算法与分类算法最大的区别:聚类算法是无监督学习,而分类算法是监督的学习算法。3.聚类算法的分类粗聚类细聚类4.聚类算法的API...