logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深入浅出完整解析LoRA(Low-Rank Adaptation)模型核心基础知识

LoRA(低秩适应)是一种高效的大模型微调方法,通过在预训练模型旁添加可训练的降维-升维矩阵(A和B),仅微调少量参数即可适配下游任务。其优势在于显著降低计算成本(相比全参数微调减少3倍显存)、保持推理效率(W=W0+BA)及模块化部署。该方法已广泛应用于Transformer的QKV注意力层,成为资源有限场景下微调大模型的主流技术,为AI应用落地提供了经济高效的解决方案。

文章图片
#人工智能#java#学习
Multi-LoRA技术全解析:大模型部署的省钱秘籍,参数高效微调必看指南

本文介绍了Multi-LoRA技术在大模型部署中的应用,通过低秩分解降低微调参数和计算成本。文章对比了多种参数高效迁移学习方法,重点阐述了LoRA原理:冻结原模型参数,仅微调低秩扩展矩阵。通过MNIST手写数字识别案例,展示了LoRA的训练和推理过程,证明其能有效提升特定任务识别能力,同时显著减少训练资源消耗。Multi-LoRA技术为大模型多任务部署提供了高效解决方案。

文章图片
#人工智能
一文详解!模型压缩四剑客:量化、剪枝、蒸馏、二值化

随着深度学习的飞速发展,模型的规模和复杂度也在不断攀升。以 GPT-175B 为例,它拥有 1750 亿参数,至少需要 320GB 的半精度(FP16)格式存储空间,推理时至少需要五个 A100 GPU,每个 GPU 配备 80GB 内存。如此庞大的模型虽然性能强大,但对硬件资源的要求极高,极大地限制了其在实际场景中的应用。例如,在嵌入式设备、移动设备等资源受限的环境中,这些设备的算力和内存有限,

文章图片
#剪枝#算法#机器学习 +3
【珍藏必看】一张图拆解AI Agent:从Prompt到Action的五大核心架构

AI Agent五层架构解析:从用户输入到任务执行的完整闭环 摘要:本文系统阐述了AI Agent的工作原理,提出其核心由五层架构组成:1)Prompt提示词解析用户需求;2)LLM大模型理解意图并决策;3)Memory知识库提供上下文支持;4)Planning模块拆解复杂任务;5)Action执行层调用外部工具。五大模块协同形成"输入-决策-执行-反馈"的闭环机制,使Agen

文章图片
#人工智能#架构#java +1
OSKGC开源重磅发布:构建知识图谱新基准,解决大模型本体约束难题,必藏!

本文提出OSKGC基准数据集,解决知识图谱构建中本体模式简单、数据对齐差等问题。该数据集基于WebNLG构建,通过查询DBpedia本体并结合维基百科进行人工细粒度标注,形成包含207种实体类型和382种关系的层次化本体模式。关键创新包括:(1)细粒度实体类型标注(如区分"总统"与"市长");(2)完整的层次结构构建(如"总统→政治家→人&quot

文章图片
#知识图谱#人工智能#深度学习 +2
收藏!AI取代岗位焦虑?大模型9大新兴岗位+转型指南,程序员/小白必看

客服岗会不会被AI取代?”“数据分析师的出路在哪?”“30+程序员还能跟上技术浪潮吗?”近来,这类职业焦虑在技术社区和职场讨论中反复刷屏。但历史早已证明,每一次技术革命都不是简单的“岗位替代”,而是重构职业生态——旧岗位迭代升级的同时,更具价值、更适配时代的新角色正在加速诞生。IDC最新白皮书《智能世界的ICT岗位与技能》给出了明确答案:到2030年,全球ICT岗位需求将激增3600万,总量突破9

文章图片
#人工智能#前端
收藏!AI取代岗位焦虑?大模型9大新兴岗位+转型指南,程序员/小白必看

客服岗会不会被AI取代?”“数据分析师的出路在哪?”“30+程序员还能跟上技术浪潮吗?”近来,这类职业焦虑在技术社区和职场讨论中反复刷屏。但历史早已证明,每一次技术革命都不是简单的“岗位替代”,而是重构职业生态——旧岗位迭代升级的同时,更具价值、更适配时代的新角色正在加速诞生。IDC最新白皮书《智能世界的ICT岗位与技能》给出了明确答案:到2030年,全球ICT岗位需求将激增3600万,总量突破9

文章图片
#人工智能#前端
收藏!程序员转行AI大模型全攻略:从入门到求职的实操手册

AI大模型的爆发,让“技术转型”成为程序员圈子的年度热词。越来越多的传统程序员开始思考:要不要抓住这个风口,转行大模型?但多数人都陷入纠结:我没学过AI,能转成功吗?该从哪里开始学?学完怎么找到合适的工作?这篇专为程序员打造的转行全攻略,延续实战导向风格,从转型动因、核心优势、学习路径、避坑指南到求职技巧,全方位拆解大模型转行的关键环节,小白也能直接照做。

文章图片
#人工智能#架构#java
收藏!程序员转行AI大模型全攻略:从入门到求职的实操手册

AI大模型的爆发,让“技术转型”成为程序员圈子的年度热词。越来越多的传统程序员开始思考:要不要抓住这个风口,转行大模型?但多数人都陷入纠结:我没学过AI,能转成功吗?该从哪里开始学?学完怎么找到合适的工作?这篇专为程序员打造的转行全攻略,延续实战导向风格,从转型动因、核心优势、学习路径、避坑指南到求职技巧,全方位拆解大模型转行的关键环节,小白也能直接照做。

文章图片
#人工智能#架构#java
收藏!智能体核心推理范式:ReAct(Reasoning+Acting)全解析

从技术层面看,ReAct 是专为大语言模型设计的交互式认知架构✅ 推理与行动交替进行:不一次性规划所有步骤,边思考边执行,灵活应对变化✅ 依赖外部工具增强能力:通过调用工具获取模型本身没有的实时信息、计算能力等✅ 基于观察结果动态调整:每一步行动的结果都会作为下一轮思考的依据,形成反馈✅ 全流程可追溯可优化:思考和行动过程都有明确记录,方便排查问题、迭代策略最后,我们梳理 ReAct 的核心要点,

文章图片
#react.js#人工智能
    共 1436 条
  • 1
  • 2
  • 3
  • 144
  • 请选择