登录社区云,与社区用户共同成长
邀请您加入社区
本毕业设计构建了一个智能化数据分析与可视化综合平台,采用B/S架构和微服务设计。系统集成大数据处理框架与机器学习算法,支持从数据采集到分析展示的全流程处理。核心功能包括多维可视化展示(12+种基础图表)、交互式仪表板定制和智能分析工具(预测/聚类/异常检测)。技术栈涵盖React、FastAPI、TensorFlow等主流框架,支持结构化/非结构化数据处理。主要应用于商业智能、智慧城市等场景,具备
🧑 博主简介:曾任某智慧城市类企业算法总监,目前在美国市场的物流公司从事高级算法工程师一职,深耕人工智能领域,精通python数据挖掘、可视化、机器学习等,发表过AI相关的专利并多次在AI类比赛中获奖。💬 博主粉丝群介绍:① 群内初中生、高中生、本科生、研究生、博士生遍布,可互相学习,交流困惑。② 热榜top10的常客也在群里,也有数不清的万粉大佬,可以交流写作技巧,上榜经验,涨粉秘籍。③ 群
我们需要提示词实现什么目标?“如何定义这个目标的成功标准?提示注入攻击:用户输入"忽略之前指令,执行以下操作…"敏感信息泄露:提示中包含未脱敏的内部数据有害内容生成:在开放场景中生成不当内容应对策略:在测试阶段加入专门的安全测试用例,监控阶段部署内容安全过滤API。在AI驱动的新生产力革命中,提示词已成为企业的核心资产之一,而提示工程质量保证体系,则是守护这一资产的基石。从需求分析到持续优化的四个
好了,以上就是目前所总结的 Agent 九大设计模式,其实 Agent 中。
大模型除了Chat外还能做什么用?当我们将大型模型视为“核心调度器“时,它就变成了我们的Agent。借助任务规划、记忆及外部工具等能力,大型模型能够识别出应该执行的任务以及执行方式,从而实现自主决策。并非单纯地“执行任务的工具”,Agent更具备一种类似于具有主观能动性的人的“仿主体性”。这种拟主体性即指Agent以模仿人类的方式,实现从“计划”,“组织”,“执行”,“学习”等过程直至完成一个任务
摘要:Kaggle数学误解识别竞赛由范德堡大学主办,旨在开发AI模型自动分析学生数学解释文本中的误解。竞赛面临数学符号处理(LaTeX)、语言不规范等挑战,需采用NLP、集成学习等技术方案。任务分为召回和排序两阶段,需处理73种误解类型的分类问题。竞赛数据包含问题、答案、解释等字段,具有符号密集、类别不平衡等特点。该竞赛为"AI+教育"实践提供平台,对教育数据挖掘和NLP技术应
大模型技术正从实验室走向产业应用,本文围绕大模型落地的四大核心方向提供技术方案:1)大模型微调,对比不同方案并通过LoRA微调实例展示金融情感分析实现;2)提示词工程,提供文本分类、信息提取等场景的Prompt模板;3)多模态应用;4)企业级解决方案。重点演示了基于Llama2的LoRA微调全过程,包括数据预处理、模型训练、推理验证,并建立微调效果评估体系,为企业实现大模型价值转化提供实用指南。
大模型的数据准备工作不只是一次性的清洗和特征构造,而是一个贯穿模型全生命周期、涵盖采集、解析、合成、增强、评估、反馈的复杂工程体系。本文将对大模型数据准备的基本内容及其与传统数据准备的差异进行介绍。
2026毕设选题防踩雷!计算机专业这些题目千万别选,附40个替代方案 毕业设计/选题推荐/深度学习/数据分析/数据挖掘/机器学习/随机森林/数据可视化/大屏/预测/爬虫/推荐算法
从 “能用” 到 “好用”:企业如何让 AI 真正懂业务逻辑?大模型助力行业智能化转型
在数字化营销时代,SCRM系统成为企业内容管理的核心工具。其多媒体素材库功能可集中存储、分类和调用营销素材,解决内容分散、复用率低等问题;内容日历则能统筹全渠道发布计划,实现营销节奏可视化。通过规范入库、审核机制和数据关联,企业可建立高效内容管理体系。针对资源不足、发布效率低等痛点,建议重构历史内容、使用批量调度功能,并匹配客户旅程推送适配内容。SCRM系统与AI技术的结合将进一步提升内容营销自动
在数字化营销中,SCRM系统的素材库和内容日历功能是提升营销效率的关键。素材库可集中管理多媒体内容,避免资源分散,支持标签分类和复用,确保品牌一致性。内容日历则帮助规划发布节奏,实现多渠道自动化排期,并根据数据反馈动态优化。通过匹配客户旅程、强化内部协作和定期复盘,企业能以低成本实现高效内容营销。未来,AI技术的应用将进一步提升SCRM系统的智能化水平。
法律研究数据挖掘(Legal Research Data Mining)是用数据挖掘和AI技术处理法律文本数据,提取有价值信息的过程。数据结构化:将非结构化的裁判文书(比如“本院认为”部分)转为结构化数据(如“争议焦点:房屋交付延迟;适用法条:《民法典》第585条;判决结果:开发商支付违约金”);关联分析:找出“法条与案例”“案例与案例”“法条与法条”之间的隐藏关系(比如“《民法典》第144条(无
本文提出了一种基于形态学处理和GRNN神经网络的人员密度检测方法。系统将人群密度分为三个等级:绿色(稀疏)、黄色(较拥挤)和红色(非常拥挤)。方法首先通过形态学开闭运算进行图像预处理,去除噪声并填充空洞;然后提取面积、周长等形态学特征及纹理特征;最后利用GRNN网络进行训练和预测。实验部分展示了动态背景提取、检测区域定位等关键步骤的代码实现,并通过纹理分析和区域像素统计实现密度分级。测试结果表明,
Acellera的`acellera-generative`包是一个专注于分子动力学和计算生物学的生成式AI工具包,主要用于生成和优化分子结构、预测分子性质,在药物发现、材料科学等领域有重要应用。
Acellera的`kdeeptrainer`是一个用于分子动力学(MD)模拟和生物分子建模的深度学习训练工具包,主要用于加速和优化分子动力学相关的深度学习模型训练,特别适用于蛋白质结构预测、分子对接和自由能计算等生物信息学领域。
数据产品:以数据为核心生产要素,通过数据采集、存储、分析、可视化等能力,帮助用户(个人/企业)解决问题、创造价值的产品。类型定义典型案例用户角色数据中台类统一数据存储、计算、治理的基础设施阿里DataWorks、美团数据中台数据开发、分析师BI工具类数据可视化与自助分析平台Tableau、Power BI、自研BI系统业务分析师、管理者数据API服务类提供标准化数据接口供外部/内部系统调用高德地图
技术小白如何变身AI产品经理?薪资、门槛与成长路径全指南(必收藏)
【摘要】家具行业ERP系统通过集成生产、库存、销售等核心环节,有效解决行业特有的定制化生产复杂、原材料管理繁琐等痛点。关键模块包括柔性生产排程、智能供应链管理及实时库存监控,可降低运营成本20%以上。选型需关注行业适配性、系统扩展性及用户体验,实施时建议分阶段推进并加强员工培训。国内外成功案例显示,ERP系统能缩短订单周期30%,未来将结合AI预测与IoT技术向智能化发展。企业应优先选择支持多工艺
【必学收藏】AI Agent完全指南:从定义、核心组件到推理模式全解析
微软AI首批自研大模型来了!今天,微软旗下的AI研究机构微软AI(Mircosoft AI,简称MAI)推出了首批两款全自研AI模型,分别为MAI首款端到端训练的基础模型MAI-1-preview和首款语音生成模型MAI-Voice-1。MAI-Voice-1的发布时机十分凑巧,“铁盟友”OpenAI也在今天发布了一款语音模型。MAI-Voice-1可提供高保真、富有表现力的音频,已经在Copil
本文介绍了如何利用MCP服务构建一个本地数据分析助手,可读取Excel/CSV文件并生成可视化报告。文章首先解释了FunctionCall和MCP协议的概念,重点介绍了MCP作为标准化接口连接AI模型与外部数据源的优势。随后详细演示了通过CherryStudio配置MCP服务环境的步骤,包括安装依赖、设置文件系统服务和图表生成服务。最后展示了如何通过对话指令自动读取数据、创建可视化图表并生成HTM
同时课程详细介绍了。
本文介绍了使用Python中的pandas库进行数据分组和聚合操作的方法。通过一个销售数据示例,演示了如何按地区和产品类型分组,并计算销售额和订单量的各种统计指标(总和、均值、最大值、标准差等)。文章详细解释了groupby()函数的使用逻辑,包括如何查看分组结果、进行多级聚合计算,以及count和sum函数的区别。同时提供了错误反馈渠道和附加资源链接,包括免费爬虫工具和Python学习智能体。最
Agent 入门必看:1 分钟搞明白定义,四大核心能力一文读懂
`abuseipdb-mcp` 是一个用于与 AbuseIPDB API 交互的 Python 客户端库。AbuseIPDB 是一个知名的 IP 地址滥用报告数据库,允许用户查询 IP 地址的滥用历史、提交滥用报告等,广泛用于网络安全、日志分析和恶意行为检测场景。
2023-2024年,它在三四线城市开了4200家店,占了新增门店的63%,这些地方贡献的收入从18%涨到了35%,以前靠一线城市吃饭,现在下沉市场也成了摇钱树。烘焙咖啡豆也是,在福建、四川、天津建了三个大基地,能算出未来7天要烤多少豆子,比如节假日销量涨30%,就多开夜班烤豆子,原料浪费率只有3%,比行业平均水平低一半。要是你也想学着用数据解决问题,比如搞用户分析、算销量,其实可以看看CDA数据
AI技术范式正经历从被动执行到主动参与的深刻变革。企业级需求已超越传统自动化工具的局限,转向追求具备前瞻决策能力、动态环境适应性和自主目标达成的智能系统。这一转型直接推动了智能体驱动型工作流的技术演进与产业落地。
类别名称:["cordana","healthy","pestalotiopsis","sigatoka"]特别声明:本数据集不对训练的模型或者权重文件精度作任何保证,数据集只提供准确且合理分类存放。数据集格式:仅仅包含jpg图片,每个类别文件夹下面存放着对应图片。数据集类型:图像分类用,不可用于目标检测无标注文件。pestalotiopsis 图片数:173。图片数量(jpg文件个数):937。
**一 | 大数据的四大阵营是什么?**· OLTP(在线事务、交易处理):RDBMS、NoSQL、NewSQL· OLAP(在线分析处理):MapReduce、Hadoop、Spark等·MPP(大规模并行处理):Greenplum、Teradata Aster等· 流数据管理:CEP/Esper、Storm、Spark、Stream、Flume等二 | OLTP阵营OLTP阵营可以分为:·传统
1.背景介绍医学图像分类是一种重要的计算机视觉技术,它涉及到对医学图像进行分类、识别和检测等任务。随着医学图像的数量不断增加,传统的图像处理方法已经不能满足现实中的需求。因此,需要寻找更高效、准确的图像分类方法。矩阵分解是一种常用的数值分析方法,它可以用于处理高维数据和复杂模型。在这篇文章中,我们将讨论矩阵分解在医学图像分类中的应用,并详细介绍其核心概念、算法原理、具体操作步骤以及数学模型公式..
作者:LORENZ KUHN编译:ronghuaiyang导读简要介绍在PyTorch中加速深度学习模型训练的一些最小改动、影响最大的方法。我既喜欢效率又喜欢ML,所以我想我也可以把它写下...
importtorchimport torchvision#包含一些数据集,像如mnistimport torch.utils.data as Dataimport torch.nn as nnimport matplotlib.pyplot as plt#超参数EPOCH=1BATCH_SIZE=50LR=0.01DOWNLOAD_MNIST=True#是否下载数据集...
图像分类时,如果某个类别或者某些类别的数量远大于其他类别的话,模型在计算的时候,更倾向于拟合数量更多的类别;因此,观察类别数量以及对数据量多的类别进行截断是很有必要的。
检索结果需经过多维度验证与去重处理。横向对比不同来源的信息一致性,提取重复出现的核心观点作为高可信度内容;纵向挖掘数据的深度细节,例如时间线、案例或参数说明。对矛盾信息标注可能原因(如版本差异、地域区别),并通过附加条件(如“2023年数据”“适用于Windows 11”)明确适用范围。
echarts+vue 前端项目展示
【干货收藏】大模型全解析:从技术原理到实战应用,小白也能看懂的底层逻辑
本文介绍了一个基于Dify工作流制作的思维导图生成工具。该工作流整合了开源项目mind-map-mcp-server,通过5个核心节点(开始、LLM、Agent、代码执行、直接回复)实现自动生成思维导图功能。文章详细说明了工作流配置过程,包括MCP服务部署、Agent策略插件使用、模型选择等关键步骤,并展示了以"国庆北京旅游计划"为例的测试结果。同时提供了AI大模型学习路线和免
本文探讨了AI代理(AI Agents)如何改变传统运维工作方式。通过组建由多个专门化AI代理(日志代理、代码代理、数据库代理等)协同工作的"AI团队",系统能够自动处理复杂的运维问题。这种模块化设计采用大语言模型驱动,通过编排器统一调度,实现了7×24小时不间断的智能运维。文章展示了实际应用案例和技术实现方案(如SemanticKernel+Azure),并指出这种AI团队协作模式将逐步成为企业
本文提出了一种基于粒子群优化算法(PSO)优化的堆叠去噪自编码器(SDAE)模型用于多输入单输出的回归预测问题。该模型利用SDAE强大的特征提取能力,并结合PSO算法对SDAE的关键参数进行优化,以提高模型的预测精度和泛化能力。实验结果表明,该模型在多个数据集上的预测性能优于传统的回归模型,且具有较好的鲁棒性和稳定性。文中通过多指标评估和多图展示,详细分析了模型的性能表现及其优势。粒子群优化;堆叠
1.背景介绍在现代数据科学和人工智能领域,处理和分析高维数据已经成为一项重要的技能。高维数据是指具有多个特征或维度的数据,这些特征可以是连续的(如年龄、体重)或离散的(如性别、职业)。随着数据的增长和复杂性,高维数据的处理和可视化变得越来越挑战性。这篇文章将探讨如何使用特征向量和数据可视化技术来探索高维数据的结构,以便更好地理解和利用这些数据。在本文中,我们将讨论以下主题:背景介绍...
深度学习中的分类任务看似简单,但涉及到许多核心的数学原理和优化技巧。分类和回归的关系使我们能够从回归任务中借鉴经验,而softmax函数和交叉熵损失的应用则为我们提供了高效处理分类问题的方法。在实际应用中,理解这些理论基础能够帮助我们设计更加高效和准确的深度学习模型,解决各种复杂的分类任务。
在 Pandas 中,你可以使用 drop_duplicates 方法来根据某一列去重,语法如下:df.drop_duplicates(subset='column_name', keep='first', inplace=True)
西储大学轴承数据集是故障诊断领域广泛使用的标准数据集之一。该数据集由美国凯斯西储大学(Case Western Reserve University)工程学院机械工程实验室开发,包含了正常工况和多种故障工况下的振动信号数据。数据采集速率为12kHz或更高,通过加速度传感器采集得到。数据集涵盖了轴承内圈、外圈和滚动体(球)损坏等多种故障类型,每种故障情况还区分了不同的故障尺寸(如直径0.007英寸、
最近在做数据分析,所以用了一些pandas,但是在用的过程中,深感基础不扎实,不能达到灵活运用的程度,于是想着深入学一下pandas. 那么就先从series开始。Series是pandas里最基础的一个数据结构,虽然DateFrame常常用得更多,但series仍然是pandas里基础的基础,DateFrame中的列也都是一个series.series是一种一维的数组型对象,有点类似于pytho
摘要 本课程介绍了随机森林模型及其应用,主要内容包括: 随机森林原理:通过多棵决策树投票提高预测准确性,降低单棵树偏差,采用Bootstrap抽样和特征随机性增强多样性。 模型优势:准确性高、抗过拟合、可并行处理大数据、自动评估特征重要性、对缺失数据鲁棒性强。 实战案例: 生成2000条用户行为模拟数据 构建包含年龄、使用时长、消费金额等20+特征的数据集 基于多维度规则创建"下月活跃&
大数据可视化技术是指利用图形、图像、动画等视觉元素,将大规模、复杂、抽象的数据以直观、易于理解的方式呈现出来的技术。它通过将数据映射到视觉元素(如点、线、面、颜色、大小等)上,使用户能够迅速捕捉数据间的关联、趋势和异常,从而发现隐藏在数据背后的规律和价值。
Redis 集群是一个可以在多个 Redis 节点之间进行数据共享的设施(installation)。Redis 集群通过分区(partition)来提供一定程度的可用性(availability): 即使集群中有一部分节点失效或者无法进行通讯, 集群也可以继续处理命令请求。这篇文章我们开始详细介绍Redis集群(三主三从)系统的部署(主从容错切换迁移+主从扩容+主从缩容 )
数据挖掘
——数据挖掘
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net