logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

[具身智能-296]:什么是语音识别,其输入、处理、输出

语音识别(Automatic Speech Recognition, ASR),也称为语音转文本(Speech-to-Text),是一种将人类的语音信号转换为相应文本或指令的技术。其核心目标是让机器能够“听懂”人类语言,实现更自然的人机交互。整个语音识别过程可以清晰地分为输入、处理、输出三个阶段。

#语音识别#人工智能
[智能体-421]:Coze是如何通过技能扩展自身的能力范围的?通过Skill统一封装可调用资源:工具插件、知识库RAG、数据库记忆、内存记忆。

Coze(扣子)通过作为统一封装层,把四类能力打包成可复用单元,让大模型从“聊天”升级为“能调用工具、查私有知识、记长期用户信息”的智能体。外部专业老用户接上文。

#数据库#人工智能#架构
[智能体-416]:Coze平台开发的智能体应用,发布到第三方平台的载体是什么?最终的代码是运行第三发平台,如手机端,还是最终运行在Coze平台上,只不过是提供的远程服务?

本质:相当于在你的网页里开了一个 Coze 的浏览器窗口,所有逻辑还是跑在 Coze 云端,你的网页只是一个容器。本质:第三方平台做消息转发的壳,所有逻辑在 Coze 云端,和你给公众号接一个第三方客服机器人逻辑完全一致。本质:官方端也只是一个专属的消息展示客户端,所有智能体逻辑还是跑在 Coze 云端,不是本地运行。不管发布到哪个渠道,智能体的全链路逻辑都在 Coze 云端执行,第三方平台只做。

#架构#人工智能
[AI应用与提效-170] - AI龙虾智能体平台OpenClaw详解,包括内部架构和技术实现

OpenClaw(AI 龙虾智能体平台)核心是分层式微服务架构,以「AI 决策层」为核心,实现「感知 - 决策 - 执行 - 学习」的智能体闭环;技术实现上,融合了计算机视觉(点云 / 分割)、深度强化学习(PPO)、大模型(知识检索)、运动控制(MPC/MoveIt)等关键技术;区别于传统机械爪框架,其核心优势是「自主决策能力」—— 通过 AI 智能体适配未知场景、复杂物体,而非单纯执行预设指令

#人工智能
[具身智能-16]:AI智能体的技术栈

我给你整理一套的 AI Agent 技术栈,按讲清楚,你直接能用来做选型、搭系统、写方案。

#人工智能
[具身智能-335]:mcp server代码示例

将函数暴露给 AI。AI 可以决定调用它,并传入参数。: 暴露数据源。AI 可以读取这些数据作为上下文(Context),但通常不会修改它。: (示例中未展示) 用于预定义提示词模板,帮助 AI 更好地完成特定任务。这两个示例涵盖了 MCP 开发中 90% 的需求。你可以从修改开始,尝试接入你自己的业务逻辑。

#python#github#开发语言
[具身智能-344]:MCP Server的消息翻译与处理流程

将 AI 的“意图”(非结构化/半结构化 JSON)映射为计算机的“动作”(函数调用),再将“结果”(结构化数据)翻译回 AI 的“认知”。输入:AI 说“我要算税”处理:Server 翻译为。输出:Server 翻译回“结果是 10 元”(Text Content)。这个闭环,就是 AI 能够操作物理世界和数字世界的基石。客户端请求 → 服务端响应→Server 读取请求(Read)→JSON

#人工智能#开发语言
[具身智能-484]:OpenAI API:在 OpenAI 的生态中,所谓的“智能体 API”并不是指某一个单一的接口,而是指构建 AI 智能体所需的一整套技术栈。

如果把构建一个智能体比作拍电影Agents SDK是导演和剧本:它规定了剧情的走向,安排了不同的角色(智能体),并管理整个拍摄流程。是片场指挥中心:它接收导演的指令,协调各个部门,确保演员(模型)知道该做什么,并确保道具(工具)就位。大模型是演员:它负责根据剧本(提示词)进行表演(生成内容)。沙箱/工具是特效团队和道具组演员做不到的动作(如飞天遁地/运行代码),由它们来完成,并把结果呈现给演员。对

#人工智能
[具身智能-510]:为了支持MCP协议,大模型需要重新训练吗?

只要你使用的是具备基础工具调用能力的现代大模型,接入 MCP 只需要在应用开发层面遵循协议标准即可,完全不需要耗费巨资去重新训练大模型。

#人工智能#深度学习#机器学习
    共 850 条
  • 1
  • 2
  • 3
  • 85
  • 请选择