logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【数据挖掘01】相似度算法大全(万字讲解)

本文介绍了相似度算法:Levenshtein距离(计算字符串转换所需最少编辑操作)、Damerau-Levenshtein距离(增加相邻字符交换操作)和汉明距离(比较等长字符串对应位置差异)。这些算法适用于拼写纠错、搜索建议、数据清洗等场景,通过计算字符层面的相似度来解决问题。文章详细说明了每种算法的定义、计算方法和适用场景,并指出它们不适用于语义相似度判断或长文本比较。核心思想都是通过量化字符串

文章图片
#数据挖掘#算法#代理模式
基于大数据挖掘与机器学习的家政行业整体素质提升因素分析

2021 年(第七届)全国大学生统计建模大赛《拖地带娃擦玻璃,卷王竟在我家里?——基于大数据挖掘与机器学习的家政行业整体素质提升因素分析》学习笔记(缺少789部分)

文章图片
#数据挖掘#机器学习#人工智能 +1
基于大数据挖掘与机器学习的家政行业整体素质提升因素分析

2021 年(第七届)全国大学生统计建模大赛《拖地带娃擦玻璃,卷王竟在我家里?——基于大数据挖掘与机器学习的家政行业整体素质提升因素分析》学习笔记(缺少789部分)

文章图片
#数据挖掘#机器学习#人工智能 +1
基于大数据挖掘与机器学习的家政行业整体素质提升因素分析

2021 年(第七届)全国大学生统计建模大赛《拖地带娃擦玻璃,卷王竟在我家里?——基于大数据挖掘与机器学习的家政行业整体素质提升因素分析》学习笔记(缺少789部分)

文章图片
#数据挖掘#机器学习#人工智能 +1
基于大数据挖掘与机器学习的家政行业整体素质提升因素分析

2021 年(第七届)全国大学生统计建模大赛《拖地带娃擦玻璃,卷王竟在我家里?——基于大数据挖掘与机器学习的家政行业整体素质提升因素分析》学习笔记(缺少789部分)

文章图片
#数据挖掘#机器学习#人工智能 +1
到底了