2月28日,阿里云桌面Agent工具CoPaw面向全球开发者正式开源,用户可基于CoPaw进行二次开发,自由接入本地模型、编写Skills和接入专属消息应用,满足更定制化的场景需求。

什么是CoPaw,官网(https://copaw.agentscope.io/)给出的答案是:CoPaw 既是「你的搭档小爪子」(co-paw),也寓意 Co Personal Agent Workstation(协同个人智能体工作台)。

CoPaw原生支持钉钉、飞书、QQ、Discord、iMessage等聊天软件和平台,内置了多种Skills,用户可一键本地部署也可通过阿里云计算巢和魔搭社区创空间实现一键云端部署,并调用千问系列等主流模型,是业界部署门槛最低的Agent工具之一。

开源地址

GitHub: https://github.com/agentscope-ai/CoPaw

官网与文档: https://copaw.agentscope.io/


以下内容为在个人Windows 10工作电脑上进行pip安装

一、运行安装命令

pip install copaw

要求Python环境要求版本号>=3.10,<3.14

下载等待的时间稍长,需要耐心。

中途litellm-1.82.0这个包下载会超时失败,不过它会自动重下,顺带了解一下这个包:

LiteLLM是一个开源的 Python 库,核心作用是统一所有大模型(LLM)的调用接口,让你用一套代码就能调用 OpenAI、Anthropic、百度文心一言、阿里通义千问、讯飞星火等几乎所有主流大模型,无需适配不同厂商的 SDK 和接口格式,可以把它理解成大模型的「翻译官」或「统一遥控器」。下面是其最典型的示例,你会发现无论调用 OpenAI 还是百度文心一言,代码结构完全一样:

# 安装 litellm(1.82.0 版本)
# pip install litellm==1.82.0

import litellm

# 1. 调用 OpenAI 的 gpt-3.5-turbo
response = litellm.completion(
    model="gpt-3.5-turbo",
    api_key="你的 OpenAI API 密钥",
    messages=[{"role": "user", "content": "你好"}]
)
print(response.choices[0].message.content)

# 2. 调用百度文心一言(只需改 model 和 api_key)
response = litellm.completion(
    model="ernie-3.5-8k",  # 文心一言的模型名
    api_key="你的百度 API 密钥",
    api_base="https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions_pro",
    messages=[{"role": "user", "content": "你好"}]
)
print(response.choices[0].message.content)

# 3. 调用 Anthropic 的 Claude
response = litellm.completion(
    model="claude-3-sonnet-20240229",
    api_key="你的 Anthropic API 密钥",
    messages=[{"role": "user", "content": "你好"}]
)
print(response.choices[0].message.content)

到这边基本就是安装成功了

二、启动

copaw init --defaults
copaw app

执行init会出现安全提示,核心是告知用户其权限与风险边界

翻译过来看一下

安全警告 — 请仔细阅读

CoPaw 是一款运行在你自有环境中的个人助理。它可连接至各类通讯渠道(钉钉、飞书、QQ、Discord、iMessage 等),并执行读取文件、运行命令、调用外部 API 等技能。默认情况下,它是单操作者边界:仅信任一位用户。若启用了工具功能,恶意提示或混淆性指令可能会引导助理执行不安全操作。

若多人可向同一启用了工具的 CoPaw 实例发送消息,他们将共享相同的委托权限(包括助理可访问的文件、命令与密钥等敏感信息)。

若你对访问控制与系统加固不熟悉,请勿在启用工具的状态下运行 CoPaw,也不要将其暴露给不受信任的用户。在启用高权限技能或将机器人暴露至公网前,请向有经验的人士寻求帮助。

推荐基线安全配置:

  • 限制可触发助理的渠道与用户,尽可能使用白名单机制
  • 多用户或共享收件箱场景:为每个信任边界使用独立的配置 / 凭证,理想情况下使用独立的操作系统用户或主机
  • 以最小权限原则运行技能,尽可能进行沙箱隔离
  • 将密钥等敏感信息存放在助理工作目录与技能可访问路径之外
  • 当助理启用了工具或需处理不受信任的输入时,请使用能力可靠的模型

定期审查你的配置与技能,将工具的作用范围限制在实际所需。

同意后即可完成初始化

执行以上命令启动CoPaw,即可在浏览器打开 http://127.0.0.1:8088/ 进入CoPaw控制台

三、操作体验

浏览器打开 http://127.0.0.1:8088/

配置大模型

今日要闻

更多能力正在开发中。

四、附录

最后附上CoPaw依赖的核心工具包合集,看看它都整合了哪些能力

包名 核心定义 核心用途
copaw 多端 AI 机器人集成框架 核心主包,整合多平台机器人、AI 能力、自动化操作等功能
agentscope==1.0.16.dev0 多智能体协作开发框架 为 copaw 提供智能体编排、多模型协作能力,支持 AI Agent 的生命周期管理
agentscope-runtime==1.1.0 Agentscope 的运行时环境包 提供智能体运行所需的服务端、任务调度、容器 / 集群适配能力
httpx>=0.27.0 异步 HTTP 客户端库 替代 requests,为 copaw 提供高性能异步 HTTP 请求能力(调用 API / 第三方服务)
discord-py>=2.3 Discord 机器人开发库 为 copaw 提供 Discord 平台的消息收发、机器人交互能力
dingtalk-stream>=0.24.3 钉钉开放平台流式 SDK 为 copaw 提供钉钉机器人、消息推送、事件监听能力
uvicorn>=0.40.0 ASGI 服务器 为 copaw 的 Web 服务 / API 接口提供高性能异步运行环境
apscheduler<4,>=3.11.2 定时任务调度框架 为 copaw 提供定时触发任务(如定时推送、定时执行自动化)的能力
playwright>=1.49.0 跨浏览器自动化库 为 copaw 提供网页自动化、截图、模拟用户操作等能力
questionary>=2.1.1 交互式命令行输入库 为 copaw 的 CLI 界面提供友好的用户交互(如选择、输入确认)
mss>=9.0.0 高性能屏幕截图库 为 copaw 提供跨平台、无依赖的屏幕截图能力
reme-ai==0.3.0.5 AI 能力集成库 为 copaw 封装大模型调用、向量数据库、检索增强(RAG)等核心 AI 能力
transformers>=4.30.0 HuggingFace 大模型推理库 为 copaw 提供本地大模型加载、tokenizer、推理能力
python-dotenv>=1.0.0 环境变量管理库 加载.env文件,管理 copaw 的密钥、配置(如机器人 Token、API 密钥)
python-socks>=2.5.3 SOCKS 代理封装库 为 copaw 提供代理访问能力(适配 Telegram / 海外 API)
onnxruntime<1.24 ONNX 模型推理引擎 为 copaw 提供轻量化本地模型推理能力(如 CV/NLP 小模型)
lark-oapi>=1.5.3 飞书开放平台 SDK 为 copaw 提供飞书机器人、消息、审批等接口调用能力
python-telegram-bot>=20.0 Telegram 机器人开发库 为 copaw 提供 Telegram 平台的消息收发、机器人交互能力
twilio>=9.10.2 Twilio 通信平台 SDK 为 copaw 提供短信、语音通话、WhatsApp 消息等通信能力
pywebview>=4.0 轻量级桌面 Web 界面库 为 copaw 提供本地 Web 界面(无需浏览器),实现可视化操作
aioitertools 异步迭代器工具库 为 agentscope 提供异步场景下的迭代、遍历工具
anthropic Anthropic Claude API 封装库 为 copaw 提供 Claude 大模型的调用能力
dashscope 阿里云百炼大模型 SDK 为 copaw 提供国内大模型(通义千问)的调用能力
openai OpenAI API 官方封装库 为 copaw 提供 GPT 系列大模型的调用能力
tiktoken OpenAI 官方 Token 计数库 计算大模型输入输出的 Token 数,控制上下文长度
fastapi>=0.104.0 高性能异步 Web 框架 为 agentscope-runtime 提供 API 接口开发能力
pydantic>=2.11.7 数据校验 / 序列化库 为 copaw 提供配置校验、数据模型定义、JSON 序列化能力
docker>=7.1.0 Docker API 封装库 为 agentscope-runtime 提供容器化部署、容器管理能力
redis>=6.0.0 Redis 客户端库 为 copaw 提供缓存、消息队列、分布式锁能力
oss2>=2.19.1 阿里云 OSS 存储 SDK 为 copaw 提供文件存储、对象存储能力
celery>=5.3.1 分布式任务队列 为 agentscope-runtime 提供异步任务分发、集群执行能力
litellm>=1.80.0 大模型统一调用库 为 reme-ai 封装多厂商大模型(OpenAI/Anthropic/ 百度等)统一接口
loguru>=0.7.3 日志增强库 为 copaw 提供简洁、美观的日志输出和管理能力
chromadb>=1.3.5 轻量级向量数据库 为 reme-ai 提供本地向量存储、检索能力(RAG 核心)
qdrant-client>=1.16.0 Qdrant 向量数据库客户端 为 reme-ai 提供分布式向量检索能力
pandas>=2.3.3 数据分析库 为 copaw 提供数据处理、表格分析、结果格式化能力
tavily-python>=0.7.13 Tavily 搜索引擎 API 封装 为 copaw 提供 AI 增强的网页检索能力(RAG 的数据源)
starlette>=0.46.0 异步 Web 框架核心 FastAPI 的底层依赖,为 copaw 提供 Web 请求处理能力
jinja2 模板引擎 为 copaw 提供文本 / HTML 模板渲染能力(如生成回复内容)
rich>=13.0.0 终端富文本输出库 为 copaw 的 CLI 界面提供彩色、格式化的输出(如日志、进度条)
sqlalchemy ORM 框架 为 copaw 提供数据库交互能力(存储配置、会话、任务记录)
websockets>=11.0.2 异步 WebSocket 库 为 dingtalk-stream/telegram-bot 提供长连接消息推送能力
pycryptodome 加密算法库 为 lark-oapi / 钉钉 SDK 提供加解密能力(接口签名 / 数据加密)
prompt_toolkit>=3.0.52 命令行交互增强库 为 questionary 提供底层交互能力(如自动补全、历史记录)
watchfiles>=1.1.1 文件监听库 为 copaw 提供配置文件 / 脚本变更的热更新能力
  1. 核心框架层copaw 为主包,agentscope/agentscope-runtime 提供 AI 智能体能力,fastapi/uvicorn 提供 Web 服务支撑;
  2. 多端交互层python-telegram-bot/discord-py/dingtalk-stream 等适配各平台机器人,twilio 提供通信能力;
  3. AI 能力层litellm/openai/anthropic 统一调用大模型,chromadb/qdrant-client 提供向量检索,transformers 提供本地模型推理;
  4. 工具层playwright 做网页自动化,apscheduler 做定时任务,pydantic 做数据校验,redis 做缓存 / 队列。

这些包共同构成了 copaw 的核心能力:多平台机器人集成 + 多厂商大模型调用 + 自动化操作 + 分布式任务管理

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐