
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
一、算法说明PageRank即网页排名,也称佩奇排名(社会)。一些基本概念:1、网页入链:即投票,网页中对其他网页的超链接作为其他网页的入链,相当于对其他网页投一票;2、入链数量:如果一个网页获得其他网页的入链数量(投票)越多,说明该网页越重要;3、入链质量:即投票权值,入链的质量由投票的网页决定,初始化值所有网页都一样,可以设置为1。网页的超链接越多,投票的权值越低。4、阻尼系数d:也是佩奇定义
一、算法说明好友关系如图:1、直接相连的表示两个人是直接好友关系;2、两个人有相同的好友表示两个人是间接好友(当然可能两个人同时也是直接好友,如图hello和hive)。3、好友推荐列表就是按照两个用户的共同好友数量排名二、MapReduce分析1、分两步MapReduce计算完成;2、第一步先得到用户的间接好友关系数目,注意有直接好友关系的用户需要过滤掉;3、第二步根...
一、算法说明1、词频TF:是指给定词语在给定文件中出现的次数,一般会做归一化,即除以文件的总词数(注意是分词数,不是字数)。TF=词在文章出现次数 / 文章的总词数2、逆向文件频率IDF:普遍重要性度量,由文件总数除以包含该词的文件的数目,再对商取对数。IDF=log(文件总数 / 包含目标词的文件个...
一、实现基础1、用户对物品的推荐列表(用户为列,物品为行) = 用户对物品的评分矩阵 × 物品同现矩阵2、用户对物品的评分矩阵:用户对物品的点击、收藏、加购物车和购买等行为都是对物品的不同评分,矩阵如下:并且,矩阵可以进行行列转换3、物品同现矩阵:两个物品出现在同一个用户的次数,即item1和item2都出现在user1和user3,所以item1:item2的同现值为2,当然item2:item
一、实现基础1、用户对物品的推荐列表(用户为列,物品为行) = 用户对物品的评分矩阵 × 物品同现矩阵2、用户对物品的评分矩阵:用户对物品的点击、收藏、加购物车和购买等行为都是对物品的不同评分,矩阵如下:并且,矩阵可以进行行列转换3、物品同现矩阵:两个物品出现在同一个用户的次数,即item1和item2都出现在user1和user3,所以item1:item2的同现值为2,当然item2:item
基本概念OLTP:On-Line Transaction Processing,联机事务处理,例如MySQL和PostgreSQL的数据存储,适合频繁的数据插入和修改。OLAP:On-Line Transaction Processing,联机分析处理,采用关系模型进行数据存储,例如ADB MySQL,适合海量数据的计算分析。OLAP(联机事务处理)系统分为MOLAP(多维OLAP)、ROLAP(
Spring Cloud包含多个子项目,Spring Cloud Config(可扩展配置服务)、Spring Cloud Netflix、Spring Cloud CloudFoundry(开源PaaS云平台)、Spring Cloud AWS(亚马逊云服务平台)、Spring Cloud Security、Spring Cloud Commons、pring Cloud Zook...
基本概念产品服务数据集成数据开发数据地图数据质量数据服务计算和存储引擎服务离线计算MaxCompute开源大数据引擎E-MapReduce实时计算(基于Flink)机器学习PAI图计算服务Graph Compute交互式分析服务工作空间:DataWorks管理任务、成员,分配角色和权限的基本单元。解决方案:可以包括多个业务流程,以复用相同的业务流程。组件:组件是带有多个输入参数和输出参数的SQL代