logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Nacos 3.0 正式发布:MCP Registry、安全零信任、链接更多生态

Nacos MCP Router 的 MCP 信息搜索能力,是基于向量数据库进行语义匹配,在海量 MCP Server 配置以及搜索的实时性上取得平衡,并且过程中,还尽可能利用 AI Agent 智能性,帮助进行筛选确定 MCP Server 的选择,在确保减少 AI Agent 的总 Tokens 消耗的同时,又大大的扩展了 AI Agent 能使用 MCP Server 的上限;在之前的 Na

#安全
首发,Higress AI 网关率先支持 QwQ-32B,推理成本可再降 90%

今天凌晨,通义千文发布最新推理模型 QwQ-32B。在各类基准测试中,拥有 320 亿参数的 QwQ 模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。这意味着:个人用户可以在更小的移动设备上、本地就能运行。企业用户推理大模型 API 的调用成本,可再降 90%。???? 价格对比:如果是通过调用官方 API 的方式:???? DeepSeek R1

#人工智能
Qoder 负责人揭秘:Qoder 产品背后的思考与未来发展

我们有一个理念叫无处不在的智能编程,可以看到有了沙箱和云端智能体,就可以把智能体透出到任何开发者需要的地方,比如说 IDE、命令行、浏览器、手机端,包括很多的平台,GitHub、GitLab 等各种协同研发的平台,还有各种办公软件包括 Zoom、钉钉等,都可以在任何一个地方唤成智能体完成任务和研发工作,跟文档上下文打通,因为文档也是很重要的上下文,所以这个时候就可以做到多触点、多场景覆盖,触达了更

#人工智能#大数据
半小时开发小程序!我和 AI 程序员结对编程初体验

有时候我突发奇想要做个小工具,但是碍于不会编程,没办法进行下去。但是学习编程要花很长时间,而且以我的水平,还不一定学得懂。我就在想,能不能通过 AI 生成一个网页、小程序或者 App 呢?经过实战手搓,发现真的可以!01DeepSeek 满血版“AI 程序员”正好我看见了通义灵码的“AI 程序员”接入了 DeepSeek V3 和 R1 满血版,最重要的是免费不限量使用!就在昨晚,通义灵码支持..

#小程序#人工智能#结对编程
Higress 开源 Remote MCP Server 托管方案,并将上线 MCP 市场

近期,两大关键事件标志着MCP已从事实标准迈向行业标准:一方面,OpenAI 正式宣布跟进 Anthropic 的 MCP 协议,另一方面,Anthropic 发布了新版本 MCP 协议,在 Remote MCP Server 场景下实现了显著改进。导读:MCP Server 的实施存在着诸多挑战,特别是在认证授权、服务可靠性和可观测性方面,Higress 作为 AI 原生的 API 网关,提供了

#开源
如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践

此外,MCP Server 的安全性问题也日益凸显。为此,Router 提供了关键的代理与协议转换能力:支持将基于 stdio 的 MCP Server 一键转换为更安全、更可控的 SSE 或 streamable HTTP 协议,并结合 Docker 容器化部署,实现服务的隔离运行。Router 是一个遵循 MCP 协议的标准 MCP Server,其核心能力是根据用户任务的语义描述和关键词,智

#人工智能
Java 开发玩转 MCP:从 Claude 自动化到 Spring AI Alibaba 生态整合

从图上可以看到,通过创建仓库 test-mcp 这样的提示词,Claude 的大模型自行判断需要使用 mcp 中提供的 create_repository 能力,从而完成了仓库的创建,接下来我们打开 Github 也确实发现了这个已经创建的仓库。整体的工作流程是这样的:AI 应用中集成 MCP 客户端,通过 MCP 协议向 MCP 服务端发起请求,MCP 服务端可以连接本地/远程的数据源,或者通过

#java#自动化#spring +2
本地玩转 DeepSeek 和 Qwen 最新开源版本(入门+进阶)

今年的春节注定不寻常,开源大模型领域的“国货之光”们接连发布新版本,多项指标对标 OpenAI 的正式版(收费服务)。1月20日,DeepSeek R1 发布,在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。1月27日,Qwen2.5-1M:支持 100万 Token 上下文,其中 14B 的杯型在短文本任务上实现了和 GPT-4o-mini 相近的性能,同时上下文长度是

#开源
Apache RocketMQ × AI:面向 Multi-Agent 的事件驱动架构

每一个 Agent 可以通过订阅某个能描述自身能力的 Topic 来实现绑定关系,具备注册和被发现的能力,上层 Agent(如 Supervisor Agent)可通过能力关键词(如“数据分析”“内容生成”)动态发现并使用合适的 Topic 来异步驱动下游的 Agent,在任务编排过程中,Supervisor Agent 能够像调用函数一样选择 Topic,实现基于语义理解的动态路由决策。然而,在

#rocketmq#人工智能#架构
阿里云发布《AI 原生应用架构白皮书》

更关键的是,过长的提示词信息也会加剧 Token 的消耗速度,尤其是在多轮对话中,工具列表被重复传递,造成 Token 资源的浪费,拉高调用成本。在 AI 原生应用架构下,其目标是在满足可扩展、可观测、安全合规的同时,最大化释放大模型的智能潜力。大模型的可能输出从训练数据中继承偏见或有害内容,也很有可能产生幻觉,导致输出的内容完全不符合预期,可观测通过提供评估等工具,针对采集的 AI 应用执行过程

#阿里云#人工智能#架构 +1
    共 79 条
  • 1
  • 2
  • 3
  • 8
  • 请选择