实用AI 个人主页

@lky255046lky

实用AI

2026-04-20 14:26:07 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek-V4+昇腾——国产AI基础设施的破局之战

摘要： DeepSeek-V4的发布标志着国产大模型进入全球第一梯队，参数规模达1.6万亿，支持100万Token上下文，编程能力开源第一，并首次适配华为昇腾芯片，实现国产算力突破。其API价格仅为GPT-5.5 Pro的1/700，大幅降低AI应用成本。昇腾生态通过硬件性能追近、软件生态补全和应用场景打磨，逐步缩小与英伟达的差距。斯坦福2026 AI指数显示中国AI能力与全球领先水平差距缩小至2

#人工智能

从GPU到Token（番外篇）：当DeepSeek V4接入生产环境，效率提升3倍背后的技术拆解

摘要：Seek V4在AI编程平台灵珠的生产环境中实现了3倍效率提升，其技术架构采用MoE（混合专家）设计，支持百万Token上下文，显著降低计算成本。灵珠团队通过模型升级与深度适配优化需求分析流程，结合V4的长上下文处理能力与成本优势，精准服务零技术背景用户的长尾需求。案例表明，国产大模型商业化已从参数竞赛转向效率竞争，开源生态与场景适配成为关键。2026年数据显示，中国模型在全球调用量占比超6

#人工智能 #重构

DeepSeek官宣永久降价75%：万亿参数MoE架构的技术跃迁与产业变局

摘要：DeepSeek大模型永久降价75%引发行业震动 2026年5月，国产大模型企业DeepSeek宣布旗舰产品V4-Pro API接口服务永久降价75%，将万亿参数级大模型成本降至大众可承受范围。调价后，百万Token处理成本低至0.025元（缓存命中场景），较国际同类产品（如GPT-5.5、Claude Opus 4.7）便宜数倍至数十倍，而性能保持同等水平（SWE-bench修复率79.2

#架构

DeepSeek-V4+昇腾——国产AI基础设施的破局之战

#人工智能

Token计量的经济逻辑：算力如何变成“水电“

摘要： 2026年，Token（词元）成为算力标准计量单位，中国日均调用量达140万亿，两年增长千倍。Token经济包含训练（生产）、推理（传输）和应用（消费）三环节，其中推理算力占比超70%。"算力银行"通过归集闲置算力提升利用率至85%，降低成本60%。中国凭借绿电优势实现Token出海成本仅为GPT-5.5的1/450。预计2030年建成全国一体化算力网，使算力成为普惠生产资料，推动AI生态

#人工智能 #重构

从GPU到Token：AI基础设施竞争逻辑重构的深度解析

AI基础设施正经历三重变革：架构从云原生转向Agent原生，推理成本从奢侈品降至日用品水平，竞争焦点从算力堆叠转向智能精炼效率。商汤大装置等平台通过KV缓存优化、异构混训等技术，将GPU利用率提升至80%以上。DeepSeek V4采用混合注意力机制，将百万Token成本降至0.2元人民币，较主流产品降低数百倍。这一变革推动算力供应商转型为智能精炼服务商，同时为应用层开发者创造了Agent开发黄金

#人工智能 #重构 #运维

DeepSeek-V4+昇腾——国产AI基础设施的破局之战

#人工智能

AI Agent记忆系统深度解析

本文深入解析AI Agent记忆系统，从技术架构到工程实践。首先分析AI Agent"健忘"问题的本质源于上下文窗口限制，提出扩展窗口、分块加载等解决方案。接着借鉴认知科学理论，将记忆分为工作记忆、情景记忆、语义记忆和程序记忆四个层次，并对比向量数据库和图数据库的存储方案。技术实施需关注记忆编码、检索优化和隐私保护，最终通过降低对话轮次、训练成本等指标评估业务价值。

#人工智能

腾讯云效率智能体工具集技术架构全景拆解：个人层→职场层→企业层的三层Agent落地实践

腾讯效率智能体工具集的发布，是2026年AI智能体规模化落地浪潮中最具标志性的事件之一。其三层架构设计（个人层→职场层→企业层）覆盖了从个人提效到企业级AgentOps的全链条，Co-Design战略确保模型能力与产品需求始终保持对齐。但在肯定其架构完整性的同时，也需要看到潜在挑战：工具集在企业端能否真正跑通业务、深度集成带来的安全悖论、庞大产品矩阵的统一体验——这些都是腾讯在后续迭代中需要回答的

#腾讯云 #架构 #云计算

腾讯云效率智能体工具集技术架构全景拆解：个人层→职场层→企业层的三层Agent落地实践

#腾讯云 #架构 #云计算

共 23 条

请选择