logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习:Mahout协同过滤算法

1、推荐系统1.1、什么是推荐系统为了解决信息过载和用户无明确需求的问题,找到用户感兴趣的物品,才有了个性化推荐系统。1.2、推荐系统业务流程推荐系统广泛存在于各类网站中,作为一个应用为用户提供个性化的推荐。它需要一些用户的历史数据,一般由三个部分组成:基础数据、推荐算法系统、前台展示。基础数据包括很多维度,包括用户的访问、浏览、下单、收藏,用户的历史订单信息,评...

#推荐算法
Python(17):Numpy之array数组的排序

lexsort方法定义( def lexsort(keys, axis=None) ):多级排序方法,为对给定的 keys 中的最后一个 key 排序,每一个 key 都被认为是列向量,其他 keys 用来辅助最后一个 key 进行排序。使用lexsort方法时,会返回一个 numpy.ndarray 对象(即进行多级排序后的脚标数组),当需要对原数组进行该多级排序时,可以使用原数组调用该 lex

#numpy
数据湖之Hudi(9):使用Spark向Hudi中插入数据

目录0. 相关文章链接1. 开发说明2. 环境构建2.1. 构建服务器环境2.2. 构建Maven项目3. Maven依赖4. 核心代码0. 相关文章链接大数据基础知识点 文章汇总1. 开发说明Apache Hudi最初是由Uber开发的,旨在以高效率实现低延迟的数据库访问。Hudi 提供了Hudi 表的概念,这些表支持CRUD操作,基于Spark框架使用Hudi API 进行读写操作。2. 环境

#spark#大数据#big data
数据湖之Hudi(16):Apache Hudi 中数据写操作流程

目录0. 相关文章链接1. 概述2. upsert写流程3. insert写流程0. 相关文章链接大数据基础知识点 文章汇总1. 概述在Hudi数据湖框架中支持三种方式写入数据:UPSERT(插入更新)、INSERT(插入)和BULK INSERT(写排序)UPSERT:默认行为,数据先通过 index 打标(INSERT/UPDATE),有一些启发式算法决定消息的组织以优化文件的大小INSERT

#大数据
MPP数据库之Doris(4):Doris安装部署之集群部署

目录0. 相关文章链接1. 安装包准备和上传2. FE部署3. BE部署3.1. 示例一:3.2. 示例二:3.3. 其他事项3.4. 启动BE3.5. 查看BE状态3.6. 配置命令4. 启动和查看Doris5. 使用Doris5.1. 登录并加载BE5.2. 建库建表并查询5.3. 通过navicat远程工具访问5.4. 通过web页面访问6. Doris一键启动停止脚本0. 相关文章链接大数

#数据库#大数据
数据湖之Hudi(3):Apache Hudi 基本介绍

目录0. 相关文章链接1. 什么是Hudi2. Hudi在大数据中的位置3. Hudi的特性4. Hudi各版本发布时间0. 相关文章链接大数据基础知识点 文章汇总1. 什么是HudiApache Hudi(发音“hoodie”)是下一代流数据湖平台。Apache Hudi将核心仓库和数据库功能直接带到数据湖中。Hudi提供了表,事务,高效upserts /删除,高级索引,流式摄取服务,数据群集/

#大数据
用户画像标签数据开发之标签相似度计算

目录0. 相关文章链接1. 什么是标签相似度计算2. 案例场景3. 数据开发注:此博文为根据 赵宏田 老师的 用户画像·方法论与工程化解决方案 一书读后笔记而来,仅供学习使用0. 相关文章链接用户画像文章汇总1. 什么是标签相似度计算根据标签之间的相关关系进行聚类也是画像开发中经常遇到的一 类问题。如何结合业务背景对标签进行有效聚类,不同的公司或业务背景有不同的处理方式。这篇博文通过一个案例来介绍

机器学习:特征选择之ChiSqSelector(SparkMLlib中的ChiSqSelector)

目录0. 相关文章链接1. 概述2. 实例3. 代码演示0. 相关文章链接算法文章汇总1. 概述ChiSqSelector代表Chi-Squared特性选择。 它对具有分类特征的标记数据进行操作。 ChiSqSelector使用独立的卡方检验来决定选择哪些特性。 它支持五种选择方法:numTopFeatures, percentile, fpr, fdr, fwe:numTopFeatures:根

#机器学习#算法
机器学习:Mahout协同过滤算法

1、推荐系统1.1、什么是推荐系统为了解决信息过载和用户无明确需求的问题,找到用户感兴趣的物品,才有了个性化推荐系统。1.2、推荐系统业务流程推荐系统广泛存在于各类网站中,作为一个应用为用户提供个性化的推荐。它需要一些用户的历史数据,一般由三个部分组成:基础数据、推荐算法系统、前台展示。基础数据包括很多维度,包括用户的访问、浏览、下单、收藏,用户的历史订单信息,评...

#推荐算法
推荐系统(8):推荐算法之混合推荐

目录0. 相关文章链接1. 什么是混合推荐2. 混合推荐+分区推荐0. 相关文章链接推荐系统文章汇总1. 什么是混合推荐推荐算法有很多种,比如基于内容的推荐、基于模型的实时推荐以及协同过滤推荐。这种组合式的应用推荐就叫组合推荐(Hybrid Recommendation)。研究和应用最多的是内容推荐和协同过滤推荐的组合。最简单的做法就是分别用基于内容的方法和协同过滤推荐方法去产生一个推荐预测结果,

    共 48 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择