logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大厂算力调研:CPU/GPU算力使用及迁移情况

在明年预计支持三四十万亿token需求时,总体需要约二十六七万张卡,其中50%-60%为训练卡,40%-50%为推理卡,包括L20和580系列。在未来,为优化成本及提升效率,将逐步将部分CPU任务迁移至GPU,但整体增加量预计仅为10%-20%,不会出现大规模扩容。而豆包平台作为一个AI对话系统,其日均query量达到4.2亿次,对应DAU约6,000多万,每天消耗5.5万亿至6万亿token,因

文章图片
大厂算力调研:CPU/GPU算力使用及迁移情况

在明年预计支持三四十万亿token需求时,总体需要约二十六七万张卡,其中50%-60%为训练卡,40%-50%为推理卡,包括L20和580系列。在未来,为优化成本及提升效率,将逐步将部分CPU任务迁移至GPU,但整体增加量预计仅为10%-20%,不会出现大规模扩容。而豆包平台作为一个AI对话系统,其日均query量达到4.2亿次,对应DAU约6,000多万,每天消耗5.5万亿至6万亿token,因

文章图片
YOLO的算力要求?各类AI研究需要关注

若为嵌入式 / 边缘场景:优先选择 YOLOv8n/v11-S,搭配 INT8 量化 + 320x320 分辨率,算力需求控制在 2 TOPS 以内;初步实施可使用线上云服务器:如“智算云扉https://waas.aigate.cc/productService、算吧 https://www.suanba.cc/index”等租赁平台,支持按量计费。若为桌面 / 云端场景:选择 YOLOv8m/

文章图片
#人工智能
随着技术的发展,AI数字人生成的算力需求会如何变化?

随着技术的持续演进,AI 数字人生成的算力需求将呈现多维度动态平衡的趋势:硬件性能指数级提升与算法效率突破形成对冲,场景复杂度攀升与算力优化技术相互博弈,最终在普惠化、实时化、绿色化的驱动下,实现算力需求的 “螺旋式上升” 与 “结构性优化” 并存。以下从六大核心趋势展开分析

文章图片
#人工智能
一文了解:MCP标准化和RAG技术是如何协同工作的?

随着大型语言模型(LLM)技术的成熟,检索增强生成(RAG)应用正逐渐成为连接企业知识与AI能力的重要桥梁。MCP 标准化拓展 RAG 技术应用场景的具体案例,覆盖企业服务、金融、医疗、工业等领域。

文章图片
#人工智能#网络#设计模式 +1
一文了解:MCP标准化和RAG技术是如何协同工作的?

随着大型语言模型(LLM)技术的成熟,检索增强生成(RAG)应用正逐渐成为连接企业知识与AI能力的重要桥梁。MCP 标准化拓展 RAG 技术应用场景的具体案例,覆盖企业服务、金融、医疗、工业等领域。

文章图片
#人工智能#网络#设计模式 +1
三分钟了解:MCP的标准化对RAG技术有哪些影响?

今天要深入剖析的 MCP(Model Context Protocol)驱动的智能体化RAG系统,正是为了根治这一痛点而生。它的革命性不在于增加了多少新工具,而在于赋予了AI一个“工具选择大脑”。这个系统让AI助手第一次拥有了“情境感知”能力,能够像一位经验丰富的专家一样,根据问题的性质,自动、智能地选择最合适的工具链。接下来,让我们一起看看它是如何实现的。

#microsoft
三分钟了解:MCP的标准化对RAG技术有哪些影响?

今天要深入剖析的 MCP(Model Context Protocol)驱动的智能体化RAG系统,正是为了根治这一痛点而生。它的革命性不在于增加了多少新工具,而在于赋予了AI一个“工具选择大脑”。这个系统让AI助手第一次拥有了“情境感知”能力,能够像一位经验丰富的专家一样,根据问题的性质,自动、智能地选择最合适的工具链。接下来,让我们一起看看它是如何实现的。

#microsoft
一文了解:MCP和其他大语言模型工具调用流程有什么不同?

MCP与其他大语言模型工具调用流程的核心不同在于:MCP是一个标准化协议层,而传统工具调用是模型与宿主应用的直接交互机制。传统工具调用像是直接操作自家打印机,而MCP则像是通过统一标准的外卖平台订购服务,省去了为每个工具单独开发适配器的复杂性。

文章图片
#语言模型#microsoft#人工智能
一文了解:MCP和其他大语言模型工具调用流程有什么不同?

MCP与其他大语言模型工具调用流程的核心不同在于:MCP是一个标准化协议层,而传统工具调用是模型与宿主应用的直接交互机制。传统工具调用像是直接操作自家打印机,而MCP则像是通过统一标准的外卖平台订购服务,省去了为每个工具单独开发适配器的复杂性。

文章图片
#语言模型#microsoft#人工智能
    共 93 条
  • 1
  • 2
  • 3
  • 10
  • 请选择