logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

知识图谱入门学习之路(三)----图算法PageRank

进入到图算法很多人最先接触的算法就是PageRank,PageRank是谷歌最开始创造并应用的,当初主要是为了用来评估构成网络中的每一个节点的重要性。在正式结束PageRank算法之前,我们先了解下有网络图(The web graph)。网络图的特征就是:有向图,存在强连通区。在网络图中,网页作为图中的节点,超链接作为图中的边。In(V)={w| w can re...

#图论
利用itertuples对DataFrame进行遍历

最近在做推荐系统实践的时候需要生成物品同现矩阵和用户物品矩阵,发现了对DataFrame对象进行遍历很方便的函数itertuples与此相关的有如下:iterrows() : 将DataFrame迭代成(index ,series)iteritems(): 将DataFrame迭代成(列名,series)itertuples(): 将DataFrame迭代成元组示例如下:...

#pandas
机器学习模型评估混淆矩阵、ROC曲线和AUC以及PR曲线

       在机器学习中,当我们基于某个业务建立模型并训练后,接下来我们需要评判模型好坏的时候需要基于混淆矩阵,ROC和AUC等来进行辅助判断。混淆矩阵也叫精度矩阵,是用来表示精度评价,为N *N的矩阵,用来判别分类好坏的指标。混淆矩阵中有以下几个概念:TP(True Positive): 被判定为正样本,实际也为正样本FN(False Negative):伪阴性 ,被判定为负样...

python利用joblib保存训练模型

在机器学习中我们训练模型后,需要把模型保存到本地,这里我们采用joblib来保存from sklearn.externals import joblib#保存模型def Save_Model(self, model, filepath):joblib.dump(model, filename=filepath)def Decision_Tree_classifier(se...

到底了