登录社区云,与社区用户共同成长
邀请您加入社区
本文提出了一种AI Agent项目文档治理方法,强调文档职责划分与流向管理。核心是将文档分为两个流向:1)Agent读取流向,采用渐进式披露结构,从入口文档(CLAUDE.md/AGENTS.md)到公共规范(docs/**)再到具体需求(spec.md);2)规则回流流向,将任务经验经筛选后沉淀到对应层级的规范文档。通过明确文档边界(入口文档不膨胀、规范文档不混执行细节、feature文档不承载
摘要: 龙芯 3A6000 国产架构面临软件生态适配不足的困境,通用工具在信创环境下性能低下。芯语 CAP 通过全栈 Rust 重构,实现原生优化,解决部署痛点:冷启动时间从数天缩短至 0.8 秒,内存占用降低至 50MB(Electron 应用为 300MB+)。其核心应用矩阵包含 8 款工具,通过 MCP 协议实现智能体自动发现,配合 Firejail 沙箱保障数据安全。典型案例展示本地 Gi
摘要: 芯语CAP(Xinyu-CAP)是针对龙芯LoongArch64架构设计的原生应用商店,旨在解决信创生态部署效率低下的核心痛点。不同于传统应用商店,它通过硬编码应用清单(8款工具,5款原创)、Firejail沙箱隔离和MCP协议互联,构建轻量化、高可控的本地AI工具链。采用Rust+iced框架实现原生编译,内存占用仅50MB,冷启动0.8秒,显著优于Electron方案。项目整合了知识库
输入:2 路 I2S/SPDIF;支持 4K@120Hz(RGB 8bpc,减小编码空白)、4K@144Hz(YCbCr4:2:2 8bpc)、8K@30Hz(RGB 8bpc,减小编码空白)功能:SSC(扩频时钟)、ASSR(eDP 自适应刷新率)、HDCP 1.3/2.3(支持中继)、SST 模式(单流传输)、Adaptive-Sync(自适应同步)、水平消隐扩展。角色支持:数据角色 UFP(
部分手机比较智能,在插入OpenFi的时候,手机就会识别到是否需要共享网络,选是即可,不需要再做设置。连接到OpenFi的后台: 192.168.21.1 可以检查到网络的连接状态。等待10~20秒左右,OpenFi的中间网络灯常亮表示共享网络正常了。等待10~20秒左右,OpenFi的中间网络灯常亮表示共享网络正常了。下面来看一下手机上怎么快速打开USB共享的步骤。手机上弹出窗口提示是否信任设备
当用户想要撰写商业计划书时,只需在电脑上打开小艺深度研究智能体向小艺提出 “我准备创办一个户外运动服装品牌,请帮我出一份详细的创业计划书”,小艺即可模拟专家思维,自动执行多步检索与信息解析,整合数千在线资源、本机知识及权威数据库, 给出专业创新的思考、建议和可执行落地的解决方案。目前,基于鸿蒙智能体框架,首批80+鸿蒙应用智能体已上线,京东、携程、华泰、喜马拉雅、深航等也在陆续上架小艺智能体广场,
会将LLM返回的所有工具调用视为一个类似于事务的整体,如果所有工具都不需要审批,那么它会采用直接调用这些工具。如果其中有任何一个工具需要审批,它会任务所有工具调用都需要审批。这是一个简单的只涉及单次迭代的ReAct循环,实际的ReAct循环可能会涉及多次迭代,模型在每次迭代中都会根据新的上下文来分析下一步该做什么。方法的时候传入了一个工具函数,所以在执行过程中会触发ReAct循环,模型会先分析当前
本文提出了企业级AI数字员工技术选型的四维框架:任务闭环能力(Agent架构支持多步骤任务拆解与执行)、数据安全与部署(内网推理与细粒度权限控制)、零代码可用性(自然语言跨系统操作能力)和可扩展性(模块化架构与开放API)。文章指出当前AI落地的主要问题是产品形态与业务需求的结构性错配,强调真正的数字员工应具备感知-规划-执行-反馈的完整闭环能力,而非仅作为对话接口。最后提供了一份可直接用于技术评
系统是一款基于虚幻引擎 5与大语言模型技术的 PC 桌面端医患沟通模拟实训软件。系统旨在为医学生提供低成本、高保真、可重复、标准化的临床问诊实训平台。医生(用户)通过麦克风输入与 AI 驱动的数字人患者(以 49 岁突发胸痛的“王大爷”为典型案例)进行多轮语音对话。系统在后端对学生的沟通表现和病史采集逻辑进行记录,并提供客观的反馈,为医学教育提供标准化的训练工具。
Token(词元)是AI大模型处理文本时的最小语义单元。它不是我们日常理解的"一个汉字"或"一个英文单词",而是模型将原始文本经过**分词(Tokenization)**后得到的基本单位。你可以把 Token 理解为模型"阅读"和"思考"时的基本粒度。就像人类阅读时以"词"为单位理解句子,模型以 Token 为单位处理文本。Token 是 AI 大模型理解世界的"原子"。它既是文本的数字化表示,也
摘要:LangGraph框架通过结构化机制实现高效人机协作,主要特点包括:1)智能中断触发机制,在关键决策点(置信度低/异常检测)自动请求人工介入;2)多模态交互接口支持文本/语音/标注等多种输入方式;3)双向状态同步确保流程可控性。典型应用场景涵盖客服对话、内容审核等需要动态决策的领域,相比传统方法具有可视化开发、模块化复用等优势。技术实现上通过中断恢复节点、状态管理器和命令控制机制,使系统能在
多点触控技术通过电容、电阻或光学传感,实现了用户与数字界面的直观交互,其核心原理在于对多个触控点的实时识别与定位。这项技术极大地提升了人机交互的自然性和效率,从智能手机、平板电脑到大型交互白板,已成为现代计算设备的标配。随着空间计算和无屏交互趋势的发展,交互界面正从固定屏幕向物理世界延伸。可穿戴多点触控投影仪正是这一趋势下的前沿探索,它将微型投影与计算机视觉结合,将任何表面转化为交互屏幕。该技术涉
本文分享了团队如何利用ChatDev框架在3天内自动化开发内部数据看板工具的全过程。通过AI Agent的角色分工和自主调试能力,实现了从需求定义到交付的效率飞跃,成本节省高达93%。案例展示了LLM技术在新场景下的落地实践,为人机交互开发模式提供了可行范本。
提示工程正从静态文本指令转向动态行为驱动的意图表达。大语言模型(LLM)的真正能力释放,依赖于人如何在推理过程中实时干预与校准——这正是低代码(Low-Code)与人机交互(Human-LLM Interactions)融合的核心价值。通过将鼠标点击、文本划选、拖拽排序等操作编码为语义向量,系统可实现‘所见即所得’的靶向重生成,显著提升非结构化文本处理的准确率与业务适配性。该范式已在合同审查、病历
每个 Token 都必须承载决策价值——要么是信息,要么是结构,要么是约束。删除一切装饰性、重复性、可推断的内容。优化不是让提示词变"丑",而是让信息密度最大化。好的提示词像好的代码:简洁、无冗余、意图明确。
空间计算是人机交互领域的重要演进方向,其核心在于打破二维屏幕的局限,将数字内容融入三维物理空间。其技术原理主要依托计算机视觉进行环境感知与手势追踪,结合投影或头显技术实现视觉融合。这项技术的价值在于创造更自然、直观的交互体验,极大提升了信息呈现与操作的维度与效率。在工程实践中,它广泛应用于增强现实原型开发、下一代用户界面设计以及工业仿真与可视化等场景。本文以HoloDesk这一典型的交互式空间计算
文章摘要 本文系统介绍了Human-in-the-Loop(HIL)人机交互系统的核心原理与实现方法。主要内容包括: 应用场景:重点分析了信息缺失补全、高风险审批和质量兜底三类典型HIL场景,展示了78%的智能客服系统需要人工介入的行业现状。 核心原理:详细解析了interrupt()函数的暂停→持久化→恢复机制,对比了传统input()与HIL的本质区别,强调checkpointer的必要性。
人机交互(HCI)的核心目标是让用户与数字系统之间的信息交换更自然高效。传统交互设计多为静态适配,难以应对用户因环境变化(如强光、移动、嘈杂)导致的临时操作困难,即‘情境性障碍’。随着大语言模型(LLM)在多模态理解和推理能力上的突破,为动态感知和适应这些障碍提供了新的技术路径。LLM能够综合分析视觉、音频、运动传感器等多源数据,像‘虚拟观察员’一样推断用户所处的交互困境,其价值在于将交互范式从‘
在人工智能技术快速发展的今天,用户体验设计已成为决定AI产品成败的关键因素。从技术原理层面看,AI系统基于机器学习模型和算法实现智能决策,其核心价值在于提升效率、解决复杂问题。然而,当这些先进技术应用于实际产品时,常常面临交互设计的挑战。优秀的AI用户体验需要将技术能力与用户需求无缝衔接,特别是在处理不确定性、延迟响应和错误处理等场景时。在实际应用场景中,AI产品应遵循渐进式呈现原则,将复杂参数设
本文探讨了LangGraph中checkpoint机制的重要性及其生产环境应用。
本文详细介绍了如何使用AutoGen和LangChain框架搭建AI Agent,实现天气查询和新闻摘要功能。通过Python代码示例和保姆级教程,帮助开发者从简单的API调用进阶到构建自主决策的智能体系统,探索AI Agent在人机交互中的新场景应用。
在人工智能技术,特别是自然语言处理和大型语言模型(LLM)快速发展的背景下,传统的用户体验设计方法正面临根本性挑战。传统设计基于“直接操纵”范式,关注静态界面与确定性交互,而AI驱动的系统则遵循“意图传达”范式,其核心交互是抽象、动态且具有概率性的。这种转变要求设计范式从创造完美工具转向设计人机协作关系,核心价值在于管理不确定性、构建用户信任并实现高效协同。应用场景已从早期的推荐算法扩展到智能客服
本文介绍了LangGraph持久化实现的三大核心应用能力:记忆管理、人机交互和时间旅行。首先,记忆功能分为短期记忆(单次会话)和长期记忆(跨会话),支持消息修剪、删除和总结等管理操作。其次,人机交互通过中断机制实现流程暂停和人工干预,适用于审批、编辑、验证等场景,并强调了中断使用的四大黄金规则。最后,时间旅行功能允许回溯和修改历史状态,用于调试分析和探索替代路径。这些能力共同构成了LangGrap
大语言模型(LLM)的核心价值不在于参数规模,而在于能否被真实用户无障碍调用。其技术原理依赖于上下文理解与概率生成,但对非技术用户而言,真正的障碍并非算力或算法,而是提示词模糊、术语密集、反馈不可操作等认知负荷问题。通过意图锚定、术语蒸馏、行动脚手架三层过滤机制,可将模型输出转化为符合日常语言习惯、结构清晰、指令明确的可用结果。该方法已在社区教育、老年数字适配、基层办公等场景验证有效,适用于所有希
2026年7月将举办多场国际学术会议,涵盖人工智能、通信、能源、材料科学等多个领域。会议地点遍布国内外,包括法国、成都、北京、广州等。主要会议包括无线通信与智能电网(ICWCSG2026)、具身智能与大模型(EILM2026)、光电信息与通信技术(ICOCT2026)等。更多详情可咨询学术顾问获取主题匹配和投稿信息。
2026年8月将举办多场国际学术会议,涵盖人工智能、计算机科学、电子信息、能源技术等多个前沿领域。会议地点遍布中国桂林、上海、广州等城市及新加坡、曼谷等地。其中,ICDLA2026、AIDIP2026等聚焦深度学习与AI技术;ICETMS2026、PGES2026关注能源与材料科学;CCSB2026、ICAITA2026探讨区块链与智能应用。部分会议如ICQCT2026、AIC2026涉及量子计算
在深入探讨交互界面设计之前,我们首先需要明确什么是AI Agent。AI Agent(智能体)是指能够感知环境、做出决策并采取行动以实现特定目标的人工智能系统。这个概念最早由著名计算机科学家艾伦·图灵在20世纪50年代提出,经过几十年的发展,已经成为人工智能领域的核心概念之一。感知模块:负责收集和处理来自环境的信息,如文本、图像、语音等。推理/决策模块:基于感知到的信息和内部知识,进行推理和决策。
cursor的context和@作用
本文介绍了如何在星图GPU平台自动化部署GLM-ASR-Nano-2512镜像,实现高效语音识别。该镜像专门针对复杂场景设计,能够准确识别小声讲话、带口音普通话及中英文混合语音,可广泛应用于企业会议记录、客服质量检查和跨语言技术讨论等实际场景,提升语音转写效率与准确性。
本文介绍了如何利用星图GPU平台,自动化部署【ComfyUI】Qwen-Image-Edit-F2P人脸生成图像镜像,并将其与Matlab仿真系统联动。该方案的核心在于,通过Python脚本桥接,将AI生成的高度可控、多样化的人脸表情图像,自动化地作为视觉刺激素材输入到心理学或人机交互仿真实验中,从而极大提升研究效率和素材质量。
每一份签署的合同,都像一次飞行记录——记录了承诺、风险与未来的履约轨迹。谁的价格越来越没优势?当这些信息被系统化提取、分析、可视化,法务部门不再是“拦路虎”,而是能给业务提供决策支持的数据参谋。企业最值钱的资产往往不在仓库里,而藏在合同的字里行间。可惜,99%的企业从未真正读懂过自己的合同。市面上谈合同管理的,大多在讲“审得有多快”“查得有多准”。当DeepSeek的大模型能力注入合同管理,我们做
本文介绍了如何在星图GPU平台上自动化部署GLM-TTS智谱开源的AI文本转语音模型(构建by科哥),实现高效语音克隆与合成。该模型支持方言、情感和音色控制,典型应用于个性化语音助手开发,仅需3-10秒参考音频即可克隆目标声音,显著提升人机交互体验。
人机交互
——人机交互
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net