logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

切片快剪如何基于PPIO Severless GPU,实现潮汐流量的弹性伸缩?|最佳实践

比如,以某闭源模型的官方价格为例,生成每百万 tokens 的文本需要 0.8元,而生成一段 5 秒的 1080p 视频需要 3.67 元。在这一背景下,国内知名的短视频制作平台「切片快剪」,基于 PPIO 的 GPU Serverless 弹性算力,将其自研的 AI 多模态引擎实现亿级视频帧毫秒级分割,效能领跑行业。每天白天是用户的使用高峰期,而一到深夜和凌晨,用户骤降,高峰期的用户并发量可能是

文章图片
#人工智能
一文看懂NVIDIA H100 :架构解析+性能对比

在AI军备竞赛的当下,高性能显卡成了兵家必争之地。但是,搭建算力集群造价不菲,对于正在成长中的企业而言,是一笔不小的资金压力。GPU云服务成为解决这一问题的关键。企业无需投入巨资自建数据中心,即可通过按需付费的方式,灵活地获取和使用全球最顶级的AI算力。PPIO GPU容器实例提供免运维 GPU 算力,用户可以开箱即用,无需复杂配置。单卡H100租用仅为12.9元/小时,计费透明,让更多中小企业及

文章图片
#人工智能#gru
PPIO上线Qwen3-Next,专为极长上下文和超大规模参数性能优化

并且,经过长期实践,PPIO 已经实现大模型推理的 10 倍+ 降本,实现推理效率与资源使用的动态平衡。Qwen3-Next 系列采用了“混合注意力机制”——引入业内前沿的“线性注意力机制”,与经典的“全注意力机制”混搭使用,该架构专为极长上下文和超大规模参数性能而优化。基于这一架构,Qwen 训练并开源了 Qwen3-Next-80B-A3B——总参数 800 亿,但仅 30 亿处于激活状态,实

文章图片
#人工智能
PPIO上线Qwen3-Next,专为极长上下文和超大规模参数性能优化

并且,经过长期实践,PPIO 已经实现大模型推理的 10 倍+ 降本,实现推理效率与资源使用的动态平衡。Qwen3-Next 系列采用了“混合注意力机制”——引入业内前沿的“线性注意力机制”,与经典的“全注意力机制”混搭使用,该架构专为极长上下文和超大规模参数性能而优化。基于这一架构,Qwen 训练并开源了 Qwen3-Next-80B-A3B——总参数 800 亿,但仅 30 亿处于激活状态,实

文章图片
#人工智能
@开发者们:首发!PPIO上线百度文心4.5系列开源模型

今天,PPIO首发上线百度文心4.5系列开源模型。文心4.5系列开源模型共10款,涵盖了激活参数规模分别为47B和3B的混合专家(MoE)模型(最大的模型总参数量为424B),以及0.3B的稠密参数模型。实验结果显示,该系列模型在多个文本和多模态基准测试中达到SOTA水平,在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果尤为突出。如果你是 PPIO 新用户,前往官网填写邀请码JMZ5F8注

文章图片
#百度#人工智能#开源
PPIO × Refly:构建智能工作流,打通AI创作“最后一公里”

Refly 是一个基于「自由画布」理念构建的 AI 原生内容创作平台,用户可以在平台上轻松设计、构建和复用智能工作流,实现高效创作。但是在复杂任务处理中,往往存在着“构思—计划—执行—发布”等多个环节,大模型只解决了“构思”这一步,其他环节仍需用户手动在多个工具间切换,效率低下。在PPIO提供的高性能模型API服务驱动下,用户更可获得如超级引擎般稳定而强大的推理动力,极大地压缩从“想法”到“成品”

文章图片
#人工智能
PPIO × Refly:构建智能工作流,打通AI创作“最后一公里”

Refly 是一个基于「自由画布」理念构建的 AI 原生内容创作平台,用户可以在平台上轻松设计、构建和复用智能工作流,实现高效创作。但是在复杂任务处理中,往往存在着“构思—计划—执行—发布”等多个环节,大模型只解决了“构思”这一步,其他环节仍需用户手动在多个工具间切换,效率低下。在PPIO提供的高性能模型API服务驱动下,用户更可获得如超级引擎般稳定而强大的推理动力,极大地压缩从“想法”到“成品”

文章图片
#人工智能
RAG、记忆、工具与多智能体:一文看懂上下文工程的技术框架

提示工程与上下文生成:通过精心设计的提示词来引导LLMs的行为,包括零样本(zero-shot)和少样本(few-shot)学习方法,以及通过链式思考(Chain-of-Thought)和树状思考(Tree-of-Thought)等技术来分解复杂问题,提高模型的推理能力。上下文工程的三大核心组件应对大语言模型中信息管理的核心挑战,并构建出一个完整框架——每个组件既针对上下文工程流程的不同环节发挥作

文章图片
#人工智能#大数据#机器学习
从套壳生态到上下文工程:一文看懂2025年Agent六大最新趋势

2025年通用Agent元年:六大趋势解析 2025年被视为通用Agent(智能体)爆发之年,OpenAI定义的AGI路径中,Agent已处于L3阶段。行业最新趋势包括:1. Agent“套壳”价值被低估,其技术框架包含规划、工具、记忆、动作四大组件,框架层推动Agent从实验迈向系统工程;2. 广义Agent面向企业级(预定义工作流),狭义Agent面向消费级(自主动态系统);3. 代码模型成为

文章图片
#人工智能#机器学习#大数据
拎包入住搭建 Browser Use Agent:基于PPIO Model API +Agent 沙箱的一体化构建

Agent 系列开发工具为LLM装上了“手”和“脚”,拓宽了大模型的应用边界。而PPIO推出的Agentic AI基础设施平台,让开发者可以更轻松、更安全、更经济地投身于Agent的应用创新浪潮中。随着技术的不断成熟和生态的日益完善,我们有理由相信,一 个由AI Agent驱动的、更加智能和自动化的互联网时代正加速到来。

文章图片
#人工智能
    共 53 条
  • 1
  • 2
  • 3
  • 6
  • 请选择