logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【干货收藏】从智算底座到应用层:企业大模型平台完整架构指南

文章详细解析企业级大模型平台的三层架构:智算底座解决算力、存储、网络等基础设施;模型层实现模型统一管理、调优和推理服务;应用层通过开发平台将AI能力落地到业务场景。强调企业应从底层开始构建,避免模型管理混乱、算力使用低效等问题,并提供从试点到统一平台的落地建议,助力企业真正实现大模型价值转化。

文章图片
#人工智能
智能体反思模式深度解析:从“机械执行“到“自我进化“的质变之路(建议收藏)

摘要: 智能体的反思模式通过“执行-评估-优化”闭环实现自我纠错,提升输出质量。其核心是让智能体主动评估初始输出(如事实准确性、逻辑连贯性),并通过迭代优化改进结果。采用“生产者-批评者”双智能体模型能增强评估客观性,生产者负责生成内容,批评者专司审查。反思模式适用于复杂任务(如报告撰写、代码生成),可减少人工修正成本,实现智能体“自我进化”。开发者需注意明确评估标准、设定终止条件及平衡效率与质量

文章图片
#java#android#人工智能 +1
【收藏必备】大模型微调入门到精通:原理、优势与PEFT技术详解

大模型微调是在预训练模型基础上使用特定领域数据进行二次训练,以提升特定任务表现的技术方法。其核心优势包括提高任务准确性、防止过拟合、降低训练成本和增强领域适应性。技术路线主要分为全参微调(FPFT)和参数高效微调(PEFT),以及监督微调(SFT)和人类反馈强化学习(RLHF)两种训练流程。其中PEFT通过新增参数、选择参数或参数重构等方式实现高效调参,典型方法包括LoRA、Prefix Tuni

文章图片
#深度学习#人工智能#语言模型
OpenAI的o1模型与Transformer的无限潜力:数学证明推理算力无上限

近期,斯隆奖得主马腾宇和Google Brain推理团队创始人Denny Zhou合作,提出了一项引人注目的数学证明:只要思维链(CoT)足够长,Transformer就有能力解决各种复杂问题。这一发现引发了广泛关注,因为它为Transformer模型在推理算力方面的Scaling Law揭示了巨大的潜能

文章图片
#transformer#深度学习#人工智能 +1
【必藏】大模型分布式推理完全指南:vLLM单节点与多节点部署实战

本文详细介绍了vLLM大模型在三种分布式推理场景下的部署方法:单GPU、单节点多GPU张量并行以及多节点多GPU结合张量并行与流水线并行。文章提供了具体部署命令示例,包括单节点2/4 GPU配置和多节点环境下使用multiprocessing/Ray两种运行时的配置方法。通过实例演示了参数设置和节点配置,为开发者高效部署大模型推理服务提供了实用指导。最后还提供了AI大模型学习资源获取方式。

文章图片
#分布式#人工智能#产品经理 +1
【必藏】大模型分布式推理完全指南:vLLM单节点与多节点部署实战

本文详细介绍了vLLM大模型在三种分布式推理场景下的部署方法:单GPU、单节点多GPU张量并行以及多节点多GPU结合张量并行与流水线并行。文章提供了具体部署命令示例,包括单节点2/4 GPU配置和多节点环境下使用multiprocessing/Ray两种运行时的配置方法。通过实例演示了参数设置和节点配置,为开发者高效部署大模型推理服务提供了实用指导。最后还提供了AI大模型学习资源获取方式。

文章图片
#分布式#人工智能#产品经理 +1
华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

大模型,如今堪称AI界的「吞金巨兽」。从写诗到解题,从对话到编程,它们几乎无所不能,但动辄千亿甚至万亿参数的规模,让部署成本高得离谱。以FP16精度部署的DeepSeek-R1 671B为例,推理时大概需要1342GB的显存,如果是32GB 5090显卡,需要整整42张!为了降低成本,天才工程师们想出了后训练量化(Post-training Quantization,PTQ)的方法, 它能够在有限

文章图片
#人工智能
DeepSeek大模型一体机:本地私有化部署完全解析,建议收藏!!!

“DeepSeek大模型一体机行业深度:驱动因素、行业现状、产业链及相关公司深度梳理”。私有化部署凭借物理隔离、数据闭环、自主管控、定制服务等特征,正成为政企部署 AI 大模型的主流选择。DeepSeek 的技术创新显著降低了私有化部署的模型和算力门槛,有望解决政企落地 AI 应用的部分痛点难点问题,进一步推动政企私有化部署需求提升。

文章图片
#人工智能#DeepSeek
从零开始学大模型知识蒸馏:黑盒白盒技术详解,一篇全掌握!

这篇文章系统调研了大模型知识蒸馏技术,将其分为黑盒(仅访问教师模型的输入输出)和白盒(可访问中间状态)两类。介绍了代表性文献,包括综述研究和具体实现方法,如DeepSeek-R1的黑盒蒸馏和DistilQwen2.5的黑白盒结合方法。还讨论了蒸馏效果的量化评估方法,内容全面覆盖知识蒸馏的理论基础、技术分类、实践案例和评估方法,适合研究者和开发者学习参考。

文章图片
#人工智能#机器学习#深度学习 +3
【Deepseek】全网最全DeepSeek使用手册!学会了效率提高90%【建议收藏】

打不过就加入,英伟达官宣:DeepSeek R1现已正式上线英伟达NIM平台,成为英伟达人工智能企业软件平台的一部分。说什么不重要,重要的是行动够快。DeepSeek打破了英伟达的算力神话,引起整个AI圈的轰动。然后,今天就给大家介绍一下DeepSeek到底该如何使用,让大家更快的掌握DeekSeek使用方法。

文章图片
#人工智能#DeepSeek
    共 1080 条
  • 1
  • 2
  • 3
  • 108
  • 请选择