登录社区云,与社区用户共同成长
邀请您加入社区
年份核心范式跃迁代表模型/技术准确率(GLUE/中文分类)/实时性主要能力/应用中国贡献/里程碑2015手工特征+浅层分类BoW + SVM / TextCNN初探~85–90% / 离线关键词分类TextCNN论文,中国跟进BoW+SVM2017CNN/RNN+注意力初探~90–92% / 准实时上下文初步华为/阿里初代TextCNN,中国情感分类产业化起步2019预训练大模型爆发~93–95%
摘要: 2015-2025年,K-means从经典聚类算法(手工Lloyd迭代+欧氏距离)逐步被深度聚类、自监督学习和多模态大模型动态聚类取代。2015年其在小规模静态数据中占主导(精度70-80%),2019年后深度聚类(DEC/SwAV)实现更高精度(>90%)和实时性。2023年起,多模态大模型(如CLIP Cluster)推动意图级动态聚类(精度>99%),中国厂商(华为、阿里
表示,全球正处于AIGC的爆发期,如果说AIGC是科技企业开启第二轮成绩增加曲线的“流量入口”,那么算力即是科技厂商开启AI争夺战的“入场券”,现在我国相关AI应用现在已有雏形,我国正处于智算中心建设的加快期,因此相关AI算力产品有望成为本轮科技浪潮下的先行目标,其间包含算力服务器、光模块、交换机等产品。算力概念21日盘中强势拉升,到发稿,亚康股份“20cm”涨停,首都在线、汇金股份涨逾11%,鸿
白鹭群优化算法(Egret Swarm Optimization Algorithm, ESOA)是一种模拟自然界白鹭群体行为的优化算法,它通过模仿白鹭在觅食过程中所展现的群体协作与个体智能的相互作用,来寻求问题的全局最优解。在传统的群体智能算法中,每个个体在寻优过程中都有一定的行为模式,白鹭群优化算法通过集体行为和个体行为的相互配合,优化了寻找全局最优解的过程。全局最优解是根据所有个体的适应度值
摘要: 基于SpringBoot的个人物品管理系统解决了传统物品管理中的存放混乱、查找困难、保修遗漏等问题。系统核心功能包括物品信息录入、分类标签管理、多条件检索及智能提醒服务,实现物品全生命周期管理。采用SpringBoot+MySQL+Vue技术栈,具备轻量易部署、高效检索和安全防护特性。实施后物品查找效率提升90%,年均减少重复支出30%,显著优化生活体验。未来计划引入AI识别和家庭共享功能
本文介绍了一个基于Kotlin Multiplatform和OpenHarmony框架的智能电影推荐系统。该系统通过分析用户观影历史、评分偏好、观看时长等多维度数据,建立用户偏好模型,并运用先进算法实现个性化电影推荐。系统采用多层架构设计,包含Kotlin后端处理、JavaScript数据转换和ArkTS前端展示。核心功能包括用户偏好分析、电影特征提取、个性化推荐、推荐多样性优化及效果评估。通过该
K-means是一种基于距离的划分聚类方法,通过迭代将数据划分为K个簇。核心思想是使簇内样本的平方误差最小化。算法流程包括初始化聚类中心、分配样本到最近中心、重新计算中心位置,直到收敛。
本项目构建了一个基于深度学习的电影推荐系统,整合了LSTM时序建模、协同过滤推荐算法、Scrapy爬虫和NLP情感分析等技术。系统通过爬取豆瓣电影数据,运用LSTM捕捉用户行为序列特征,结合UserCF和ItemCF双推荐算法实现个性化推荐。同时采用PaddleNLP对用户评论进行情感分析,并通过可视化界面展示电影数据统计和情感倾向。项目包含完整源码、详细文档和万字论文,实现了从数据采集、情感分析
检索增强生成(RAG)是一种强大的技术,但其检索模块往往受限于传统相似度排序的单调性,导致结果缺乏多样性或无法精准匹配用户意图。本文提出了一种基于 K-means 聚类的解决方案,通过对文本数据进行无监督分组,优化 RAG 的检索过程。我们将首先介绍 K-means 算法的基本原理及其数学目标,然后展示如何结合 BGE-M3 嵌入模型对文本进行向量化与聚类分析,最后通过两个 RAG 实战案例(多样
K-means聚类算法是一种常用的文本数据分析技术,通过对微博内容进行聚类,可以将相似主题或内容的微博归为同一类别,从而为用户提供更加个性化的新闻推荐服务。K-means聚类算法是一种无监督学习算法,其主要目标是将数据集中的样本划分为K个不同的簇,使得同一簇内的样本彼此相似度较高,而不同簇之间的样本相似度较低。在微博舆情分析系统中,我们可以将微博内容视作数据集中的样本,通过K-means算法将微博
K-Means通过不断“找中心-分配点-调中心”的迭代舞蹈,将无标签数据自动分组,让机器学会发现数据中隐藏的自然结构。学习AI就像探索一个巨大的迷宫,K-Means是你拿到的第一张简单地图。它可能不展示所有细节,但能帮你建立方向感。记住不要被数学公式吓倒,核心思想往往很直观多动手实践,代码跑起来比读十篇文章更有用理解一个算法的局限和它的能力一样重要AI本质上是工具,思考“用它解决什么问题”比“它多
本文针对钢材表面缺陷检测效率低、精度差的问题,提出基于改进YOLOv5的解决方案。通过引入SENet注意力机制强化缺陷特征提取,并结合K-Means优化锚框匹配,使模型在NEU-DET数据集上mAP达73.3%,相比原YOLOv5提升4.3%,检测速度35.7FPS。实验表明,改进模型优于SSD、YOLOv3等算法,能有效检测0.1mm细裂纹和各类钢材缺陷,满足工业生产线实时检测需求。系统采用Py
于matlab的鸟类图像处理gui,包含76张鸟类图像,可以实现对图像的:中值滤波k-means分割闭运算灰度化傅里叶变换腐蚀操作Canny边缘检测直方图均衡化自适应阈值分割膨胀操作Sobel边缘检测高斯滤波区域生长分割开运算Prewitt边缘检测可以更换自己的图像,可供学习和参考!
计算机毕业设计Python+大模型小说推荐系统 图书推荐系统 K-means聚类推荐算法 深度学习 Kears 小说数据分析 可视化 Scrapy爬虫 协同过滤
计算机毕业设计Python+Tensorflow小说推荐系统 K-means聚类推荐算法 深度学习 Kears 小说数据分析 小说可视化 Scrapy爬虫 协同过滤推荐算法 机器学习
(2)基于密度权重的改进Canopy算法 针对传统Canopy算法在确定最佳阈值T1和T2时的困难,以及这些阈值对聚类结果的影响,本研究提出了一种基于密度权重的改进Canopy算法。改进的Canopy算法能够更准确地识别出数据中的密集区域,为K-means算法提供了更好的初始聚类中心,从而提高了聚类效果,解决了人为确定k值和随机选取初始聚类中心的问题。(3)融合深度学习与改进K-means的文本聚
本文介绍了一个基于Kotlin Multiplatform和OpenHarmony框架的智能电影票房预测系统。该系统通过分析导演名气、演员阵容、题材热度、宣传力度和上映档期等多维度因素,运用多因素模型预测电影票房表现。系统采用Kotlin后端处理核心算法,结合JavaScript数据转换层和ArkTS前端展示层,实现跨平台协作。核心功能包括电影属性分析、市场环境评估、票房潜力预测及风险评估,为电影
本文实现了一个回文检测器,支持数字和字符串两种输入类型,采用双指针法和反转比较法进行检测。代码包含输入解析、类型判断、规范化处理、核心算法实现及详细字符对比分析功能。双指针法通过两端向中间移动比较字符,空间效率高;反转比较法则通过字符串反转实现,代码简洁。检测结果附有详细的字符对比过程,并支持回文子串搜索功能,适用于算法验证、教学演示等多种场景。
K-means聚类不是什么神秘的AI黑科技,而是一个简单但强大的工具,能帮助你从数据中提取有价值的信息。在C#中实现K-means,不仅能让你快速处理数据,还能无缝集成到你的应用程序中。记住,K-means的成功不在于算法本身,而在于如何准备数据、如何选择特征、以及如何解释结果。就像我之前在金融项目中做的那样,K-means不是终点,而是洞察的起点。
分组内遍历原数组的每个元素与聚类中心的每个元素的距离(差值的绝对值),将最小距离的聚类中心数组下标缓存的临时变量临时变量数组A中(长度=原数组),对分组后的数组计算中间值存入缓存聚类中心数组,比较缓存剧烈数组和聚类数组,是否位置一样,值一样,如果一样跳出死循环,分类结束,然后初始化一个K长度的数组,值随机(尽量分布在原数组的更大的区间以便计算),用于和源数组进行比对计算。遍历临时变量数组A,使用A
【机器学习与实战】分类与聚类算法:KNN-K近邻分类算法
K-means是一种简单高效的无监督聚类算法,通过迭代优化簇心实现数据自动分组。文章通过生活化例子(如分水果)和具体坐标数据演示了算法核心流程:随机选K个初始簇心→计算距离划分簇→重新计算簇心→迭代至稳定。同时指出了K值选择、初始簇心敏感性和数据标准化等注意事项。最后用Python代码实战复现了二维数据的聚类过程,展示了算法在用户分群、商品聚类等场景的应用价值。全文注重实践性,所有计算步骤均可手动
摘要:本文介绍了如何使用scikit-learn库实现K-Means聚类算法。文章首先概述了K-Means聚类的基本概念,随后详细讲解了其关键点,包括聚类数K的选择方法(如肘部法则、轮廓系数法)、初始质心选择(默认为k-means++算法)、距离度量方式(默认为欧几里得距离)以及收敛条件。同时,文章强调了数据预处理(标准化或归一化)、局部最优解的规避(多次运行算法)和异常值处理等注意事项。
**基于LRFMC+KMeans航空大数据客户价值分析**(客户是公司存在的意义根本,如何找出价值客户, 针对性提供更个性化的服务?公司资源是有限的,如何把有限的资源用在高价值的客户上?怎么才算有价值?产品面要大,客户人群才广,同时分类营销,分类服务)所以客户分类是企业数据分析的核心任务。。吸引一般客户–培养一般客户–价值客户–vip客户LRFMC模型:航空领域做价值分...
在Python中,可以使用多种库来执行K-means聚类,例如`scikit-learn`,以及用于可视化的库,例如`matplotlib`和`seaborn`。以下是一个简单的例子,展示了如何使用Python进行K-means聚类并对其结果进行可视化。请注意,这个例子使用了默认的K-means参数,但在实际应用中,你可能需要调整这些参数,例如`init`、`n_init`和`max_iter`,
本项目基于Django+Vue2开发“校园美食推荐系统”,通过Python爬虫自动采集校内餐厅评分、价格、销量数据,经Hadoop离线清洗后存入MySQL;后端用k-means对三维特征聚类,实时生成高性价、爆款、小众等标签并预测新菜名,前端Echarts可视化首页排行榜与个人收藏,学生一刷即得个性化推荐,管理后台一键更新菜品与资讯,上线后平均选餐时间缩短一半。
通过本次数据挖掘的K-means聚类算法实验,了解了k-means算法的实现过程及基本方法。k-means算法的优点为原理易懂、易于实现,当簇间的区别较明显时,聚类效果较好。缺点为当样本集规模大时,收敛速度会变慢;对孤立点数据敏感,少量噪声就会对平均值造成较大影响;k的取值十分关键,对不同数据集,k选择没有参考性,需要大量实验。
📊 金融数据分析与建模专家 金融科研助手 | 论文指导 | 模型构建✨ 专业领域:金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用💡 擅长工具:Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导📚 内容:金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅✅ 感
基于Python的猫眼电影数据分析可视化与电影推荐系统的开发能够自动化地从猫眼电影网采集和处理大量的电影数据,解决了手工数据收集的繁琐问题,提高了数据获取的效率和准确性。系统通过大屏可视化和数据分析功能,能够直观地展示电影的评分分布、票房走势、评论数量等信息,帮助用户更好地了解电影市场的现状和趋势。特别是通过k-means算法对满意度进行统计分析,可以为电影制片方和发行商提供宝贵的市场反馈,从而优
一、简介本人数据分析小白,最近接触到了Streamlit这个组件,发现真的很好用!尤其是它提供的交互功能,可以让很多数据分析的结果清晰直观地展现在页面上,比起手动修改参数,一遍一遍rerun,真的舒服了不少~~因此这篇文章将以K-Means模型为例,采用iris数据集,介绍如何使用streamlit进行数据交互可视化。1.1 成品图1.2 相关库与版本需要使用的第三方库,以及我的版本如下:库名称版
kmeans,数据分析,机器学习,数据挖掘,无监督学习
原文链接:http://tecdat.cn/?p=24198简介《世界幸福报告》是可持续发展解决方案网络的年度报告,该报告使用盖洛普世界民意调查的调查结果研究了150多个国家/地区的生活质量。报告的重点是幸福的社交环境。在本项目中,我将使用世界幸福报告中的数据来探索亚洲22个国家或地区,并通过查看每个国家的阶梯得分,社会支持,健康的期望寿命,自由选择生活,慷慨,对腐败的看法以及人均GDP,来探索亚
通过聚类分析,可以帮助用户理解文本数据的结构和相似性,发现潜在的文本主题和群组,为进一步的文本分类、信息检索和内容推荐提供有益的参考。通过主题分析,可以更好地了解不同主题下的关键词分布及权重,帮助识别用户需求、行业趋势和内容热点,为项目的内容策划、营销推广等提供重要参考,有助于精准定位目标受众和内容方向,提升用户体验和内容吸引力。接下来,进行正则清洗的步骤。数据清洗是数据分析的前提和基础,通过去重
👉博__主👈:米码收割机👉技__能👈:C++/Python语言👉公众号👈:测试开发自动化【获取源码+商业合作】👉荣__誉👈:阿里云博客专家博主、51CTO技术博主👉专__注👈:专注主流机器人、人工智能等相关领域的开发、测试技术。
大数据背景下基于Python的旅游数据可视化分析与推荐系统的设计内容涵盖了从数据采集到最终呈现的完整链条,系统将通过网络爬虫技术,从主流旅游评论平台收集海量的用户评价、景点信息等原始数据。针对收集到的数据进行清洗和预处理,确保数据的质量和一致性。在数据分析阶段,系统将运用先进的大数据处理技术,对旅游数据进行多维度的挖掘和分析,包括景点评分分布、价格趋势、热门评论主题等。
基于Python的高校数据采集分析与推荐系统系统的设计内容涵盖了从数据采集到最终分析和展示的全流程。系统通过Scrapy爬虫框架从软科大学排名网站中提取相关高校数据,这些数据包括学校的基本信息、排名、评价分数等。爬取的数据经过清洗和处理后,被存储到MySQL数据库中,确保数据的整洁性和结构化系统利用大屏可视化技术,通过Echarts展示省市分布、高校水平、大学排名和大学类型等多维度分析结果,提供丰
摘要:工业互联网(IIoT)与大数据的深度融合正在推动制造业智能化转型。本文探讨了大数据在工业互联网中的关键作用,包括预测性维护、生产优化、智能供应链管理和产品生命周期管理等应用场景。大数据分析可提高生产效率、降低运营成本、改善产品质量,并支持智能决策。然而,数据质量、安全隐私、技术集成和人才短缺等挑战仍需解决。未来,AI融合、边缘计算、实时分析和数据共享将成为重要趋势,推动制造业向高效智能化发展
kmeans
——kmeans
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net