
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在之前的博文中介绍了三种方法给用户推荐物品。1)UserCF:给用户推荐和他们兴趣爱好相似的其他用户喜欢的物品。2)ItemCF:给用户推荐与他喜欢过的物品相似的物品。3)LFM:通过一些特征来联系用户和物品,给用户推荐那些具有用户喜欢的特征的物品。具体可以看我之前的博文。本文我将自己实现两个算法,如有不对的地方还望指正。本节咱们将讨论一种重要的特征表现形式–标签
从这篇博文开始,我将介绍机器学习,深度学习在金融风控这个行业上的应用。其实机器学习,深度学习在一些相关场景上的应用,其解决方法都是大同小异,差不多都是固定的解决套路,但是需要结合这个场景这个行业领域的相关知识来解决。这篇博文将开始介绍客户流失预警模型,而本篇博文将主要侧重介绍金融数据分析,预处理。客户流失预警模型的业务意义严格地讲,客户流失指的是客户在该行所有业务终止,并销号。但是具体业务部门
数据预处理的好坏,很大程度上决定了模型分析结果的好坏。其中,异常值(outliers)检测是整个数据预处理过程中,十分重要的一环。方法也是多种多样。由于异常值检验,和去重、缺失值处理不同,它带有一定的主观性。在实际业务场景中,我们要根据具体的业务逻辑来判别哪些样本是离群点,下面我总结几个比较常用,通用的异常值检测方法。可视化的方法画出样本集某一个特征而言,可以直接画出这个样本集在这个特征上值的分
本篇博文将大概的总结下深度学习框架pytorch的使用。张量的说明标量(Scalar)是只有大小,没有方向的量,如1,2,3等向量(Vector)是有大小和方向的量,其实就是一串数字,如(1,2)矩阵(Matrix)是好几个向量拍成一排合并而成的一堆数字,如[1,2;3,4]标量,向量,矩阵它们三个也是张量,标量是零维的张量,向量是一维的张量,矩阵是二维的张量。除此之外,张量还可以是四维的、五维等
本篇博文主要总结贝叶斯网络相关知识。复习之前的知识点相对熵相对熵,又称互熵,交叉熵,鉴别信息,KullbackKullback熵,Kullback−LeibleKullback-Leible 散度等 。设p(x)、q(x)p(x)、q(x) 是XX 中取值的两个概率分布,则pp 对qq 的相对熵是 :D(p||q)=∑xp(x)logp(x)q(x)=Ep(x)logp(x)q(x)D(p|
我们之前讨论推荐系统的UserCF算法和ItemCF等算法都是以拥有大量用户行为数据为先决条件,并以此对物品或者用户进行自动聚类。但是对于一个刚刚开始运行推荐系统的应用的网站来说,如何在没有大量用户行为数据的情况下设计个性化推荐系统并且让用户对推荐系统满意,从而愿意使用推荐系统,这就是冷启动问题。对于冷启动问题,一般分为三类:一)用户冷启动:如何对新用户做个性化推荐。二)物品冷启动:如何将新
这篇博文将详细介绍人工神经网络内部原理及其纯底层代码的详细实现。首先来聊聊什么是神经网络?神经网络结构大致如下:它的最底层可以看成从逻辑回归到神经元的[感知机]上面得出的a是介于0到1之内的值,可以作为预测值的概率值,也可以给定一个阈值,来判定得出的是正样本还是负样本。然后添加少量隐藏层=>浅层神经网络增加中间层==>深度神经网络(DNN)在分类问题上,传统的分类方法例如
在学习机器学习,推荐系统等上的众多算法思想时,以及在数学公式推到上面,避免不了许多统计学方面的知识,其中以贝叶斯,最大似然估计,最大后验估计为最常遇见,必须深刻掌握了解。首先讲讲贝叶斯估计(对比传统频率学来讲)在我们传统的频率学来说,需要推断的参数theta是固定未知的,是个确定的值,而样本是随机的,所以频率派重点研究样本空间,大部分的概率计算都是针对样本X 的分布;例如:有一个袋子,里面装
本篇博文主要总结一下机器学习里面特征降维的方法,以及各种方法之间的联系和区别。机器学习中我个人认为有两种途径可以来对特征进行降维,一种是特征抽取,其代表性的方法是PCA,SVD降维等,另外一个途径就是特征选择。特征抽取先详细讲下PCA降维的原理对于n个特征的m个样本,将每个样本写成行向量,得到矩阵A寻找样本的主方向u:将m个样本值投影到某个直线L上,得到m个位于直线L上的点,计算m个投影点的方差
上一篇我们详细讲解了人工神经网络以及DNN的原理。CNN主要应用在图像处理方面。这一讲我们将详细讲解卷积神经网络CNN的原理以及在深度学习框架pytorch上的实现。在讲CNN之前我们需要了解这么几个问题?①人工神经网络能用到计算机视觉上吗?答:能②那么为什么还需要卷积神经网络?答:上一讲我们讲到人工神经网络中,每一层都是全连接,就是相邻的层之间,神经元必须两两之间彼此连接,而图像数







