logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

多模态大模型学习笔记(十八)——基于 DeepSeek-7B 的 LoRA 微调训练实战教程

LoRA 原理:通过低秩矩阵实现参数高效微调4bit 量化:大幅降低显存需求,消费级 GPU 可训练指令微调:使用三元组数据教会模型回答格式数据处理:格式化 + Tokenize + Labels 准备。

文章图片
#学习#人工智能
电商智能客服智能体——基于 ReAct 范式的 Agent 架构设计与代码实现(一)

多源信息整合:需要同时查询商品数据库、优惠政策文档等多源数据数值计算需求:涉及折扣计算、满减规则等数学运算上下文依赖:多轮对话中需要保持上下文连贯性安全性要求:计算过程需防止代码注入等安全风险因此,本文设计并实现了一套基于 ReAct 范式的电商智能客服 Agent 系统,旨在解决上述挑战。本文设计并实现了一套基于 ReAct 范式的电商智能客服 Agent 系统。该系统通过显式的推理-行动-观察

文章图片
#自然语言处理
电商智能客服智能体——基于LangChain的电商智能客服 Agent 架构设计与实现(二)

多源信息联合推理:需要联合商品数据库与优惠文本规则进行回答。显式工具调用需求:模型自身并不直接掌握实时商品与库存信息,必须借助外部工具。数值计算安全要求:价格、折扣与满减逻辑必须通过受控计算模块执行。多轮上下文依赖:后续问题经常省略商品名称,需要依赖对话记忆完成补全。业务规则约束性强:如“满 300 元半价”等规则若被语言模型误解,会直接导致答复错误。因此,v2 版本的核心目标不是简单“接入 La

文章图片
#数据库#microsoft
多模态大模型学习笔记(四十)——从“看字”到“懂结构”:版面分析与表格解析技术全解

版面分析与表格结构解析技术,让AI真正具备了理解文档的能力。从传统的投影分割到基于Transformer的深度学习方法,技术的进步使得文档处理的准确率和效率得到了质的飞跃。目前,表格解析技术已经在金融、法律、医疗、教育等多个行业得到了广泛应用,例如自动提取财务报表数据、解析合同条款、处理医疗病历等。但我们也要看到,对于极度复杂的文档(如手写表格、倾斜严重的扫描件、包含大量嵌套结构的报表),现有技术

文章图片
#学习
多模态大模型学习笔记(四十)——从“看字”到“懂结构”:版面分析与表格解析技术全解

版面分析与表格结构解析技术,让AI真正具备了理解文档的能力。从传统的投影分割到基于Transformer的深度学习方法,技术的进步使得文档处理的准确率和效率得到了质的飞跃。目前,表格解析技术已经在金融、法律、医疗、教育等多个行业得到了广泛应用,例如自动提取财务报表数据、解析合同条款、处理医疗病历等。但我们也要看到,对于极度复杂的文档(如手写表格、倾斜严重的扫描件、包含大量嵌套结构的报表),现有技术

文章图片
#学习
多模态大模型学习笔记(四十)——从“看字”到“懂结构”:版面分析与表格解析技术全解

版面分析与表格结构解析技术,让AI真正具备了理解文档的能力。从传统的投影分割到基于Transformer的深度学习方法,技术的进步使得文档处理的准确率和效率得到了质的飞跃。目前,表格解析技术已经在金融、法律、医疗、教育等多个行业得到了广泛应用,例如自动提取财务报表数据、解析合同条款、处理医疗病历等。但我们也要看到,对于极度复杂的文档(如手写表格、倾斜严重的扫描件、包含大量嵌套结构的报表),现有技术

文章图片
#学习
多模态大模型学习笔记(三十九)——生成式与Transformer式OCR:从“像素抄录“到“文档智能“的完整演进

从1920年代的专用字体模板匹配,到1970年代的通用字体模式识别,再到2010年代的深度学习两阶段架构,OCR技术已经走过了近百年的发展历程。而生成式与Transformer式OCR的出现,标志着OCR技术进入了一个全新的时代——文档智能时代。在这个时代,OCR不再是简单的"像素转文字"工具,而是成为了连接现实世界与数字世界的智能接口。它不仅能"看清"文字,还能"看懂"文档的内容、布局和逻辑;不

文章图片
#学习#transformer
多模态大模型学习笔记(三十九)——生成式与Transformer式OCR:从“像素抄录“到“文档智能“的完整演进

从1920年代的专用字体模板匹配,到1970年代的通用字体模式识别,再到2010年代的深度学习两阶段架构,OCR技术已经走过了近百年的发展历程。而生成式与Transformer式OCR的出现,标志着OCR技术进入了一个全新的时代——文档智能时代。在这个时代,OCR不再是简单的"像素转文字"工具,而是成为了连接现实世界与数字世界的智能接口。它不仅能"看清"文字,还能"看懂"文档的内容、布局和逻辑;不

文章图片
#学习#transformer
transformer模型详细配置——大语言模型 LLMBook 学习(三)

激活函数(Activation Function)是神经网络中的非线性变换函数,它的主要作用是。

文章图片
#transformer#语言模型#学习
多模态大模型学习笔记(十)——基于卷积神经网络的图像分类实战

这篇文章围绕一套可直接运行的 CNN 代码展开,便于对照实现与输出结果。

文章图片
#cnn#神经网络#人工智能
    共 340 条
  • 1
  • 2
  • 3
  • 34
  • 请选择