
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
推荐是信息系统中一种普遍的和关键的服务。为了向用户提供个性化的建议,行业参与者采用了机器学习,更具体地说,是基于点击行为数据构建预测模型。这被称为点击率(CTR)预测,它已经成为建立个性化推荐服务的黄金标准。然而,我们认为点击量和用户满意度之间存在着很大的差距——用户通常会被诱人的标题/封面“欺骗”。如果用户发现所点击的项的实际内容令人失望,这将严重损害用户对系统的信任。更糟糕的是,在这些有缺陷的
个性化在增加了推荐系统的实用性的同时,也带来了过滤气泡的问题。这里的filter bubbles也就是信息茧房,在这里就是指推荐系统过于个性化,一直给用户推荐他喜欢的物品,这样就会使用户接受到的信息有限,并且长期下来会使用户感到厌烦。这是提出信息茧房的作者说的一句话这篇文章就是提出了一种模型来解决信息茧房问题。2.提出的模型作者认为信息茧房和过度暴露效应有关,并且将用户的满意度建模为用户的内在兴趣
过拟合,欠拟合,L1L2正则正则化可以理解为规则化,规则就等同于一种限制。在损失函数中加入正则化项可以限制他们的拟合能力,正则化就是为了防止过拟合,那么什么是过拟合?图1假如我们要构建的模型是能够区分图中的红色与蓝色部分,看图1的三种模型对训练集的拟合状态:第1种模型:欠拟合,此模型不能很好的区分图中的红色与蓝色部分。第2种模型:拟合状态刚好,虽然有个别红色部分未被区分但考虑到实际测试集中会有噪声
协同过滤是推荐系统的重要思想之一,推荐系统是用来向用户推荐物品的。协同过滤分为三种:1.基于用户的协同过滤。2. 基于物品的协同过滤。3.基于模型的协同过滤(这里不再赘述)。无论是基于用户还是基于物品都是为了找到和用户可能喜欢的物品相似的物品把它给过滤出来,推荐给用户。1.基于用户的协同过滤思想:找到和该用户兴趣相似的用户,推荐该兴趣相似用户使用过但该用户没见过的物品。用户物品ABC
BPR全称Bayesian Personalized Ranking,他是一种排序算法,并且使用隐式反馈(如点击,收藏等),通过对问题进行贝叶斯分析得到的最大后验概率来对item进行排序,进而产生推荐。传统的矩阵分解使用显示反馈通过对用户-物品的评分矩阵进行分解从而预测到用户对于未评分物品的得分,根据这个得分进行推荐。在实际中显示反馈有着较高的准确率,但它往往难以收集,我们有时候只能使用隐式反馈,