logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型推理优化技术详解:从Roofline到系统优化,一篇全掌握

本文系统介绍了大模型推理优化技术,从Roofline模型评估硬件效率,到模型层面的剪枝、量化和蒸馏等优化方法,再到快速解码算法如早停、MOE和并行解码,最后详述系统层面的算子融合、批处理优化和内存管理等技术。这些方法共同构成了提升大模型推理效率的综合技术体系,为不同场景下的模型部署提供了全方位优化思路。

文章图片
#人工智能
AI Agent从Demo到生产:企业级基础设施平台AgentRun全攻略

阿里云函数计算AgentRun是面向企业级AI Agent的一站式基础设施平台,旨在解决从原型到产品的"生产化鸿沟"。它提供极致弹性扩展、企业级安全沙箱、模型工具统一治理、全链路可观测及生态开放支持,帮助企业跨越环境复杂运维难、依赖不稳定成本高、运行过程黑盒化三大痛点,让开发者专注业务创新,实现AI Agent从Demo到生产的平滑过渡。

文章图片
#人工智能
8个技术要点,帮助企业更好落地大模型知识库

架构分为三层,最下面一层是算力调度层,把企业现有的例如 CPU 资源、GPU 资源、NV的卡,或者昇腾优秀的国产 GPU 卡,都管理和调度编排起来。中间是大模型的执行层,做 RAG 整体的流程,以及如何将大模型的推理与 RAG 流程结合起来。这个过程将企业现有数据变成大模型可认识的知识,进而跑通知识库的整个 RAG 流程。再往上是面向知识库场景建设,知识库看上去是统称的场景,但在企业落地时会有不同

文章图片
#人工智能#大数据#数据库 +1
大模型真相揭秘:三驾马车引领AI新时代

文章解析大模型本质为"被压缩的互联网大脑",发展依赖算法、数据、算力三驾马车,ChatGPT是AI的"iPhone时刻"。未来趋势包括模型专业化、多模态化和智能体化。产品经理需从功能设计转向能力边界设计,掌握数据敏锐度,避免成为只会调用API的"调包侠",而应掌握核心技术创造价值。

文章图片
#人工智能#RAG#算力
2024年医疗大模型如何发展?私有化部署是重要方向

导读一方面,大模型在医疗场景应用需兼顾安全性与专业性,可通过数据清洗、标注和验证等控制数据质量;另一方面,大模型的计算需要大量的算力作为支撑,轻量化、本地化部署的大模型将成为重要发展方向。2023年被很多人称为“医疗大模型的元年”,国内外均有大量厂家将大语言模型应用于医疗健康领域。据统计,截至2023年10月,我国累计公开的大模型数量已经达到238个,垂直类大模型达到103个。而2-9月,我国发布

文章图片
#人工智能#面试#职场和发展 +1
从大模型到多模态,图文混排Agent彻底起飞~

上周是智谱的多模态开源周,从GLM 4.6v到Autoglm...看到官方的博客,第一眼比较吸引我的,不是模型本身,是他们给的一个使用场景 - **图文并排**。上传一份 PDF 论文,它能生成一篇图文混排的解读文章,而且效果非常好。图片位置精准,上下文衔接自然,完全不像是机械拼接的。过去我们想做图文混排,都是预定义一些图片,让多模态大模型生成描述,再让LLM在写文章时结合图片描述,选择合适的图片

文章图片
#人工智能
AI大模型之争:通用性与垂直性,哪个更具优势?

AI大模型在人工智能领域展现出巨大潜力,主要分为通用大模型和垂直大模型。通用大模型如GPT、BERT等,具有广泛的适用性和强大的泛化能力,适用于多种任务;而垂直大模型则专注于特定领域,如医疗、金融,提供更精准的解决方案。两者各有优势,通用大模型在技术引领和灵活性上表现突出,垂直大模型则在专业性和定制化服务上更具竞争力。实际应用中,两者可以互补,通用大模型作为基础平台,垂直大模型进行二次开发,满足特

文章图片
#人工智能#easyui#前端 +3
考验大模型赚钱能力的时候到了

大模型的新一轮军备竞赛要开始了。通俗地讲,Scalinglaw就是通过更大规模的数据量和更高的算力,再加上更大参数的模型,让大模型能够处理更复杂的任务。最终,各家基础大模型公司的竞争方向就是砸钱堆算力。但这似乎是个无底洞,一些公司选择了更正确的方式,开始通过积极寻求大模型商业化来应对这场持久战,并以实际应用的反馈来提升大模型的能力,百度便是其中之一。最新发布的2023年Q4和全年财报显示,2023

文章图片
#金融#人工智能#AIGC +2
人工智能、ChatGPT等火爆的当下 AI大模型爆发

此外,相对于传统的小模型生成模式,AI大模式能够大幅缩减特定模型训练所需要的算力和数据量,缩短模型的开发周期,还能得到更好的模型训练效果。可以说,AI大模型的真正意义在于改变了模型的开发模式,将模型的生产由“小作坊”升级为工业化的“流水线”,而模型开发模式的转变,将使得AI技术能够更广泛地下沉到一些长尾场景。Al大模型的预训练过程与其他神经网络语言模型类似,但其规模之大和训练算法的优化使得它可以取

文章图片
#人工智能#学习#搜索引擎 +2
人工智能、ChatGPT等火爆的当下 AI大模型爆发

此外,相对于传统的小模型生成模式,AI大模式能够大幅缩减特定模型训练所需要的算力和数据量,缩短模型的开发周期,还能得到更好的模型训练效果。可以说,AI大模型的真正意义在于改变了模型的开发模式,将模型的生产由“小作坊”升级为工业化的“流水线”,而模型开发模式的转变,将使得AI技术能够更广泛地下沉到一些长尾场景。Al大模型的预训练过程与其他神经网络语言模型类似,但其规模之大和训练算法的优化使得它可以取

文章图片
#人工智能#学习#搜索引擎 +2
    共 546 条
  • 1
  • 2
  • 3
  • 55
  • 请选择