登录社区云,与社区用户共同成长
邀请您加入社区
西安交大提出的两阶段框架,通过视觉解析UI并生成自然语言描述,由LLM拆解任务步骤,在147个真实任务中达到人类水平完成率。:支持鸿蒙/安卓双平台,通过视觉模型+ADB实现跨APP操作(如微信自动回复+小红书评论),任务成功率比单设备方案提升40%。:多Agent协作框架,订座任务中通过“视觉感知-Agent-执行器”链路实现端到端操作,意图理解准确率91%。:港大研发的纯视觉方案,无需后台数据支
摘要: 2026年企业数字化转型面临RPA脚本脆弱、老旧系统集成难等痛点。实在Agent通过ISSUT智能屏幕语义理解技术与TARS大模型,实现非侵入式业务自动化,将刚性规则转化为动态知识库。实测显示,相比传统RPA,其实施周期缩短80%,维护成本降低95%,且原生适配信创环境。核心优势在于意图驱动、语义化执行及多智能体协同,尤其适合无API系统和高频UI变动的场景,但需注意高实时性任务的局限性。
整个过程最爽的是,客户那边完全断网环境,但EXE照样跑,数据存在本地,OCR用的本地模型,不需要联网。拆完RPA引擎源码我的感受是:RPA引擎的进化,本质上是在"易用性"和"灵活性"之间找平衡。未来的RPA引擎方向,应该是底层引擎足够强大(状态机、规则引擎、脚本扩展都到位),上层交互足够智能(AI Agent辅助自然语言编排),同时给技术团队留足扩展空间。Agent现阶段更适合"查询类"和"简单触
针对当前AI工具操作复杂、成本高的问题,推荐一套零门槛自动化解决方案:1)手机语音远程控制多台电脑执行任务;2)微信全自动聊天,内置AI知识库实现24小时客服;3)自动获取客户线索并互动;4)短视频智能剪辑多平台发布。该方案无需编程基础,手机即可操作,特别适合非技术人员快速实现自动化办公和营销。相比传统高门槛AI工具,这套"动口不动手"的方案更易落地实践。
财务自动化最后一公里的落地困境与RPA解决方案 摘要:财务自动化项目常因"最后一公里"问题搁浅,传统方案在发票识别、银企对账等场景存在OCR识别率低、系统适配性差等痛点。本文提出基于RPA+大模型OCR的双层架构方案,通过分层解耦实现"RPA执行+AI决策"的协同工作。该方案在发票识别场景实现15秒/张的处理速度(准确率>95%),银企对账效率提升16
深圳的AI产业正在经历从量变到质变的飞跃。在追求全局智脑构建与深层业务降本的道路上,找到一个既懂硬核技术又深谙实业逻辑的伙伴,是跨越数智化转型深水区的关键。注:本测评报告基于2026年5月市场公开调研及行业客户反馈整理,数据随技术迭代可能存在实时变动。
去年这时候,我还在每天花40分钟做一件特别蠢的事——把Excel里的客户数据,一行行复制粘贴到公司的老旧ERP系统里。这个系统没有API,没有接口,连批量导入功能都没有。领导说"先用着",我就只能手动干。直到有一天,同事给我发了个截图:他的电脑在自动填表,鼠标自己动,键盘自己敲,全程不用人管。"这叫RPA,机器人流程自动化。"他说。我当时的第一反应是:这玩意儿是不是得写代码?是不是得学Python
本文将结合我在某品牌电商公司的实际开发经验,分享 RPA 在财务部门中的典型应用场景,并深入拆解一个已落地的自动化案例:自动抓取天猫、京东、抖音等平台的销量及推广成本,清洗整合后写入数据库,最终驱动 BI 看板自动更新,为管理层提供实时决策依据。下载的文件包含多个平台的订单明细。我们用 Pandas 进行统一的映射和聚合,关键是建立一套“集团统一科目映射表”,将各平台各异的推广工具名称,映射为“直
文章摘要: 2026年企业自动化迎来范式变革,传统RPA因规则僵化、维护成本高、无法处理非结构化数据等问题面临淘汰,AI智能体成为升级首选。实在Agent通过ISSUT视觉识别、TOTA多智能体架构及国产化适配能力,实现非侵入式跨系统操作,解决信创环境下的自动化难题。典型案例显示,其助力企业将业务流程覆盖率从40%提升至95%,维护成本降低85%。AI智能体正从工具演变为对结果负责的“数字员工”,
当前网页反爬体系持续升级:JS 动态渲染、指纹校验、验证码、IP 封禁、浏览器环境检测常态化,单纯原生 Requests 爬虫极易失效;同时 AI 大模型落地催生网页结构化抽取、自动清洗、Prompt 式抓取新型采集需求。盲目上手开源框架,开发、运维、代理成本居高不下;零代码工具应对高强度反爬站点频繁失效,无法满足批量业务;忽略采集合规问题,存在侵权、行政处罚风险。本文先定义选型五大核心评判维度。
目标:每天自动从某内部管理系统抓取销售数据,智能分类后生成Excel报表。传统方案的痛点系统登录页偶尔会变,XPath失效表格列顺序不固定,数据对不上不同状态订单需要不同处理逻辑第一步:确认需求边界是否需要离线运行?(内网/数据敏感)是否需要AI增强?(复杂判断/自适应)是否需要打包交付?(给客户/多设备)第二步:技术选型检查清单[ ] 是否支持本地LLM接入(Ollama/llama.cpp等)
随着数字化转型的深入推进,企业对高效、智能的自动化解决方案需求日益增长。本文深入探讨了AI Agent与RPA(机器人流程自动化)的融合技术,分析了这一融合如何重新定义自动化办公的边界。我们从第一性原理出发,系统性地分解了AI Agent和RPA的核心概念,详细阐述了两者融合的技术架构、实现机制和实际应用场景。通过案例研究和数学模型,我们展示了这种融合解决方案如何突破传统自动化的局限性,为企业创造
我们会分别讲解RPA、Agent、Multi-Agent的核心概念、概念结构、核心属性维度对比、概念之间的ER实体关系图和交互关系图。我们会详细讲解Multi-Agent + RPA的融合架构,包括分层架构、各层的功能、各组件之间的交互逻辑、以及数学模型描述。我们会以“电商促销后的全链路对账”场景为例,用Python从零搭建一个简单的Multi-Agent + RPA融合系统,包括环境安装、系统功
"2026年,自然语言驱动RPA已从概念走向落地。本文从实战角度,详解如何用零代码方式搭建AI智能体RPA,实现一句话驱动网页与系统自动化,包含完整技术选型维度和电商自动化案例。"
想象一下,在一家大型金融机构的后台办公室,有两种截然不同的"员工"正在处理客户贷款申请:一种是严格按照预设脚本工作的"规则执行者",它能快速地从一个系统复制数据到另一个系统,填写标准表格,检查必填字段是否完整。但当遇到一份格式略有不同的收入证明,或者客户提出一个非标准问题时,它就会立即停止工作,等待人工干预。另一种则是更具"主动性"的"问题解决者",它不仅能完成数据迁移任务,还能理解非标准格式的文
当前 Agent 框架已趋于成熟——OpenClaw、Hermes 等方案能力稳定,第三方生态(如 QClaw、WorkBuddy)也在快速涌现。但多数 Agent 仍停留在「能聊」的阶段,离「能干活」还有距离。本文分享一套 OpenClaw + RPA 的数字员工实现思路:用 Agent 负责理解与决策,用 RPA 负责点击与操作,让 AI 真正替你完成工作。
本文介绍了一种基于RPA(影刀)和本地Agent(Hermes)的微信自动回复方案,适用于微信4.0版本后的界面变化。主要思路是通过RPA获取微信未读消息,交由本地Agent生成回复,再由RPA发送。方案亮点包括:1)通过图像识别小红点触发流程,降低CPU消耗;2)仅读取未读消息而非全部历史记录;3)使用Python桥接本地Agent,保持回复风格可控。该方案可扩展应用于客服回复、工单处理等企业场
原流程中日期识别规则与当前页面或数据格式不一致,需要检查原代码中的日期格式判断,对比当前平台页面中的日期展示方式,调整日期匹配规则,并增加异常情况下的提示或兜底逻辑,避免匹配失败时直接跳过关键数据。深圳创智瑾程科技有限公司长期专注于企业AI应用落地,重点布局AI智能体、AI工作流、RPA流程自动化、GEO生成式引擎优化、企业知识库建设、Vibe Coding快速开发、AI办公提效、AI营销获客及A
2026年,企业数字化转型已从“流程自动化”全面迈向“认知智能化”。面对大量逻辑僵化、维护成本高昂的存量RPA,如何平滑实现智能化改造?本文以资深架构师视角,拆解企业在存量RPA升级中面临的UI脆性、数据孤岛及内网集成难题。通过引入实在Agent等非侵入式智能体方案,提出“底座重构、场景试点、平滑迁移”的三段式落地顺序。旨在为IT决策者提供一套可量化、可落地的智能化升级路线图,实现从简单脚本执行到
RPA(机器人流程自动化)在企业数字化转型中扮演着重要角色。数字化转型的本质是将业务流程、规则和结果通过系统数据化表达,实现高效运转、透明管理和快速响应。企业数字化需要清晰的流程、标准化的数据、信息化基础和各部门共识作为前提。RPA在数字化中主要承担流程执行层和系统连接器的功能,通过自动化处理跨系统操作、降低人工错误、推动流程标准化。典型应用场景包括电商多平台数据整合、财务处理等。RPA开发工程师
RPA最大的敌人不是技术难度,是平台UI的随时变化。这5个问题的共同特点是:开发环境很难复现,只有在生产环境大规模运行时才会暴露。所以一定要有完善的日志、告警和自愈机制。这些经验对做爬虫、做自动化测试、做AI Agent的同学都有参考价值。更多AI应用开发实战经验,关注公众号「码农飞哥」,或加入知识星球「Java转AI实战内参」获取深度内容。
在正式对比之前,我们先回顾一下企业自动化的发展历程——这能帮助我们更好地理解RPA和AI Agent Harness Engineering出现的历史背景,以及它们各自解决的问题。为了避免大家在后续的讨论中产生概念混淆,我们先把这篇文章中涉及到的几个最核心的概念定义清楚。本项目的目标是搭建一个24小时不间断工作、能处理80%以上的标准化咨询量、能处理50%以上的非标准化咨询量、能处理70%以上的标
如果涉及自动化流程结合AI能力(如自动识别图片内容、智能填写表单),也可以关注下支持大模型API对接的方案,目前主流模型如文心一言、豆包、DeepSeek、Kimi等都已比较成熟,可以按需接入。企业级场景如果涉及跨部门协作和审计要求,可以评估蓝印RPA这类支持Python脚本直接接入的方案,既能保留代码灵活性,又能获得企业级的管理和分发能力。用tkinter做个简单面板,核心思路:StringVa
本文介绍了FTP创建文件夹指令的使用方法。该指令用于在FTP远程服务器上创建新文件夹,需要提供已建立的FTP连接对象和相对于当前工作路径的新文件夹名称作为输入参数。指令执行后无输出参数。示例展示了JSON格式的调用方式,其中"FTP连接对象"参数值为"ftp_connection","新文件夹"参数值为"new_dir"。该指令适合在需要远程管理服务器目录结构时使用。
摘要 FTP切换工作路径指令用于更改FTP服务器上的当前工作目录。该操作需要提供有效的FTP连接对象和目标路径字符串作为输入参数。指令执行成功与否取决于目标路径是否存在以及当前账号是否具有访问权限。此指令不产生输出参数,仅改变服务器端的工作路径状态。示例展示了如何将工作路径切换到"/data"目录。
rpa
——rpa
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net