logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek-V4+昇腾——国产AI基础设施的破局之战

摘要: DeepSeek-V4的发布标志着国产大模型进入全球第一梯队,参数规模达1.6万亿,支持100万Token上下文,编程能力开源第一,并首次适配华为昇腾芯片,实现国产算力突破。其API价格仅为GPT-5.5 Pro的1/700,大幅降低AI应用成本。昇腾生态通过硬件性能追近、软件生态补全和应用场景打磨,逐步缩小与英伟达的差距。斯坦福2026 AI指数显示中国AI能力与全球领先水平差距缩小至2

#人工智能
从GPU到Token(番外篇):当DeepSeek V4接入生产环境,效率提升3倍背后的技术拆解

摘要:Seek V4在AI编程平台灵珠的生产环境中实现了3倍效率提升,其技术架构采用MoE(混合专家)设计,支持百万Token上下文,显著降低计算成本。灵珠团队通过模型升级与深度适配优化需求分析流程,结合V4的长上下文处理能力与成本优势,精准服务零技术背景用户的长尾需求。案例表明,国产大模型商业化已从参数竞赛转向效率竞争,开源生态与场景适配成为关键。2026年数据显示,中国模型在全球调用量占比超6

#人工智能#重构
DeepSeek官宣永久降价75%:万亿参数MoE架构的技术跃迁与产业变局

摘要:DeepSeek大模型永久降价75%引发行业震动 2026年5月,国产大模型企业DeepSeek宣布旗舰产品V4-Pro API接口服务永久降价75%,将万亿参数级大模型成本降至大众可承受范围。调价后,百万Token处理成本低至0.025元(缓存命中场景),较国际同类产品(如GPT-5.5、Claude Opus 4.7)便宜数倍至数十倍,而性能保持同等水平(SWE-bench修复率79.2

#架构
DeepSeek-V4+昇腾——国产AI基础设施的破局之战

摘要: DeepSeek-V4的发布标志着国产大模型进入全球第一梯队,参数规模达1.6万亿,支持100万Token上下文,编程能力开源第一,并首次适配华为昇腾芯片,实现国产算力突破。其API价格仅为GPT-5.5 Pro的1/700,大幅降低AI应用成本。昇腾生态通过硬件性能追近、软件生态补全和应用场景打磨,逐步缩小与英伟达的差距。斯坦福2026 AI指数显示中国AI能力与全球领先水平差距缩小至2

#人工智能
Token计量的经济逻辑:算力如何变成“水电“

摘要: 2026年,Token(词元)成为算力标准计量单位,中国日均调用量达140万亿,两年增长千倍。Token经济包含训练(生产)、推理(传输)和应用(消费)三环节,其中推理算力占比超70%。"算力银行"通过归集闲置算力提升利用率至85%,降低成本60%。中国凭借绿电优势实现Token出海成本仅为GPT-5.5的1/450。预计2030年建成全国一体化算力网,使算力成为普惠生产资料,推动AI生态

#人工智能#重构
从GPU到Token:AI基础设施竞争逻辑重构的深度解析

AI基础设施正经历三重变革:架构从云原生转向Agent原生,推理成本从奢侈品降至日用品水平,竞争焦点从算力堆叠转向智能精炼效率。商汤大装置等平台通过KV缓存优化、异构混训等技术,将GPU利用率提升至80%以上。DeepSeek V4采用混合注意力机制,将百万Token成本降至0.2元人民币,较主流产品降低数百倍。这一变革推动算力供应商转型为智能精炼服务商,同时为应用层开发者创造了Agent开发黄金

#人工智能#重构#运维
DeepSeek-V4+昇腾——国产AI基础设施的破局之战

摘要: DeepSeek-V4的发布标志着国产大模型进入全球第一梯队,参数规模达1.6万亿,支持100万Token上下文,编程能力开源第一,并首次适配华为昇腾芯片,实现国产算力突破。其API价格仅为GPT-5.5 Pro的1/700,大幅降低AI应用成本。昇腾生态通过硬件性能追近、软件生态补全和应用场景打磨,逐步缩小与英伟达的差距。斯坦福2026 AI指数显示中国AI能力与全球领先水平差距缩小至2

#人工智能
AI Agent记忆系统深度解析

本文深入解析AI Agent记忆系统,从技术架构到工程实践。首先分析AI Agent"健忘"问题的本质源于上下文窗口限制,提出扩展窗口、分块加载等解决方案。接着借鉴认知科学理论,将记忆分为工作记忆、情景记忆、语义记忆和程序记忆四个层次,并对比向量数据库和图数据库的存储方案。技术实施需关注记忆编码、检索优化和隐私保护,最终通过降低对话轮次、训练成本等指标评估业务价值。

#人工智能
腾讯云效率智能体工具集技术架构全景拆解:个人层→职场层→企业层的三层Agent落地实践

腾讯效率智能体工具集的发布,是2026年AI智能体规模化落地浪潮中最具标志性的事件之一。其三层架构设计(个人层→职场层→企业层)覆盖了从个人提效到企业级AgentOps的全链条,Co-Design战略确保模型能力与产品需求始终保持对齐。但在肯定其架构完整性的同时,也需要看到潜在挑战:工具集在企业端能否真正跑通业务、深度集成带来的安全悖论、庞大产品矩阵的统一体验——这些都是腾讯在后续迭代中需要回答的

#腾讯云#架构#云计算
腾讯云效率智能体工具集技术架构全景拆解:个人层→职场层→企业层的三层Agent落地实践

腾讯效率智能体工具集的发布,是2026年AI智能体规模化落地浪潮中最具标志性的事件之一。其三层架构设计(个人层→职场层→企业层)覆盖了从个人提效到企业级AgentOps的全链条,Co-Design战略确保模型能力与产品需求始终保持对齐。但在肯定其架构完整性的同时,也需要看到潜在挑战:工具集在企业端能否真正跑通业务、深度集成带来的安全悖论、庞大产品矩阵的统一体验——这些都是腾讯在后续迭代中需要回答的

#腾讯云#架构#云计算
    共 23 条
  • 1
  • 2
  • 3
  • 请选择