logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

尽管模型触手可及,但其复杂的部署和使用流程却让人望而却步。针对这一现象,在大型语言模型(LLM)领域,vLLM(访问官网了解更多) 应运而生。通过便捷的模型接入方式,vLLM 让用户能够轻松地向模型发起推理请求,从而大大缩短了从模型到应用的距离。

文章图片
#云原生
活动邀请 | 阿里云AI原生应用开发实战营—Serverless AI 专场(北京站)开启报名!

阿里云AI原生应用开发实战营—Serverless AI 专场将于北京开讲。本次实践营将以 Serverless AI 为主题,对于 AI 应用落地面对的难题,Serverless 架构正成为其破局的关键。通过“无服务器化”实现自动扩缩容、按需付费和免运维,让开发者聚焦创新而非基础设施,本次实践营将深入解析 Serverless+Al 的融合实践!如何以 Serverless 之力,高效解决 AI

#人工智能#阿里云
魔搭+ 函数计算: 一键部署,缩短大模型选型到生产的距离

面对魔搭 ModelScope 社区提供的海量模型,用户希望快速进行选型并生产使用起来,但在此之前,却一定会面临算力管理难、模型部署难等一系列问题,那么能否实现快速把选定的模型部署在云端功能强大的 GPU 上,由云端负责服务,扩展,保护和监控模型服务,同时免于运维和管理云上算力等基础设施呢?魔搭ModelScope +函数计算 FC 给了这样一种方案。

文章图片
#云原生#阿里云#serverless +1
0代码!2种方式,一键部署DeepSeek

**依托于阿里云 函数计算 FC 算力,Serverless+ AI 开发平台 Cap 现已提供模型服务、应用模版两种部署方式辅助您部署 DeepSeek R1 系列模型**。完成模型部署后,您即可与模型进行对话体验;或以 API 形式进行调用,接入 AI 应用中。欢迎您立即体验。

文章图片
#云原生
30秒出服装设计稿,森马用Serverless+AIGC 整“新活”!

创新项目如何去赋能我们的业务,这件事情在森马很重要。阿里云函数计算帮我们屏蔽掉了想把AI落地到实际业务场景中 GPU 算力资源储备、采购成本、技术门槛等很多难题,从而迅速做出决策,快人一步站在正确的起点,体验新技术对整个服装爆款设计、营销链路带来的改变。—— 林建霞 森马数字中心创新业务研发负责人2023 年被很多人称为 AIGC 元年,众多 AI 大模型向人们展示了他们惊人的创造力,千行百业对于

文章图片
替换一个节点,ComfyUI 瞬间起飞

VisionPlaid 通过序列并行加速、原生生态兼容和智能显存管理等创新技术,为用户带来了性能与易用性的完美结合。无论是需要实时交互的应用场景,还是对生成质量有高要求的长流程任务,FunArt 结合 VisionPlaid 都提供了最优的解决方案。用户无需进行复杂的配置或优化,仅需几次点击就能启动一个高性能的 AI 生成服务,充分体现了 FunArt 的"开箱即用"。

文章图片
#人工智能
探秘 AgentRun丨动态下发+权限隔离,重构 AI Agent 安全体系

函数计算 AgentRun 是一个以高代码为核心的一站式 Agentic AI 基础设施平台。秉持生态开放和灵活组装的理念,为企业级 Agent 应用提供从开发、部署到运维的全生命周期管理。函数计算 AgentRun 架构图AgentRun 运行时基于阿里云函数计算 FC 构建,继承了 Serverless 计算极致弹性、按量付费、零运维的核心优势。通过深度集成 AgentScope、LangCh

#重构#人工智能#安全
打通智能体孤岛:用 AgentRun 构建生产级 A2A 多 Agent 管理协作系统

A2A 协议中,每个智能体都通过一份 AgentCard 对外声明自己的身份和能力。是谁:Agent 的名称、描述、版本、提供方能做什么:技能列表(Skills),每个技能有 ID、名称、描述和示例问法怎么访问:服务地址(URL)、支持的传输协议(JSON-RPC / gRPC)有什么限制:认证方式(OAuth2、API Key 等)、是否支持流式响应按照 A2A 标准,AgentCard 默认托

#网络#服务器#linux
让 AI Agent 安全“跑”在云端:基于函数计算打造 Agent 代码沙箱

底层安全隔离:主流云厂商的函数计算服务普遍采用 MicroVM 或强化容器技术作为执行单元。每个函数实例运行在一个轻量级、启动迅速的 MicroVM 中,具备完整的内核隔离。这种架构从进程、内存、文件系统等多维度实现安全保障。极致的弹性伸缩:Agent 的请求模式具有高度不确定性。函数计算的毫秒级扩缩容能力,让开发者无需担心容量规划,轻松应对从零到万级并发的波动。按量付费的经济性:传统常驻服务无论

#人工智能#安全
快速上手:LangChain + AgentRun 浏览器沙箱极简集成指南

在 Agentic AI 时代,智能体需要与真实世界交互,而浏览器是连接虚拟世界与现实世界的重要桥梁。AgentRun Browser Sandbox 为智能体提供了安全、高性能、免运维的浏览器执行环境,让 AI Agent 真正具备"上网"的能力——从网页抓取、信息提取到表单填写、自动化操作,一切皆可实现。Browser Sandbox 是 AgentRun 平台提供的云原生无头浏览器沙箱服务,

    共 81 条
  • 1
  • 2
  • 3
  • 9
  • 请选择