logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【LLM大模型】大模型高效微调-LoRA原理详解和训练过程深入分析

LoRA与训练目标是解耦的,但本文设定就是语言模型建模。以下将给出语言建模(可自然推广到序列建模)的基本符号定义,即最大化给定提示的条件概率(本质是极大似然估计)。给定一个参数为ΦΦ预训练的自回归语言模型PΦ(y|x)PΦ(y|x)。xx为输入,yy为输出note: 为与原文符号一致,下文ΦΦ、ΘΘ、WW均表示模型参数全参数微调每次full fine-tuning训练,学一个 ΔΦΔΦ,|ΔΦ||

文章图片
#AIGC#学习#人工智能
<大模型应用开发 动手做AI Agent> (附PDF)第一本给程序员看的 AI Agent 图书上市了!

自从 ChatGPT 诞生以来,大模型技术在业界可谓炙手可热,人们从最初的惊叹到现在广泛应用,而人工智能的下一个引爆点很有可能就是 AI Agent。《大模型应用开发:动手做 AI Agent》从零基础出发,介绍了 Agent 的定义、特性与技术架构,还对构建 Agent 的 AI 技术工具进行了详细讲解,最后以 7 个实战项目展示了 Agent 开发的方法。本书的一大特点是。

文章图片
#人工智能#自然语言处理#语言模型 +1
【AI大模型面试】LoRA和全量微调有何不同?被问了不下5遍

本文旨在了解两种微调大型语言模型方法之间的差异:完全微调和低秩自适应 (LoRA)。这两种方法都用于将预训练模型适应特定的下游任务,但它们却有所不同。微调(Fine-tuning)是将经过预训练的大语言模型应用于下游任务的关键范例。最近,低秩自适应 (LoRA) 等方法已被证明可以在各种任务上达到完全微调模型的性能,同时可训练参数的数量却大大减少。这就提出一个问题,即它们学到的解决方案真的等效吗?

文章图片
#人工智能#深度学习#机器学习 +2
【人工智能】未来已来,国内10家AI大模型盘点

阿里达摩院推出的大模型,拥有千亿参数,可用于智能问答、知识检索、文案创作等场景。

文章图片
#人工智能#自然语言处理#语言模型 +1
AIGC绘画设计基础——十分钟读懂Stable Diffusion

随着AIGC的爆火,各种应用开始不断出现,AI绘画便是其中的一个典型案例。目前最火的AI绘画模型当属Stable Diffusion,但是目前有关Stable Diffusion的文章并不多,主要偏向应用介绍,对于如何处理输入文字以及去噪过程的具体细节,这方面的文章还是比较少,写这篇文章的目的就是希望能把Stable Diffusion讲清楚,让更多人的了解。AIGC(AI Generated C

文章图片
#AIGC#区块链#人工智能
【大模型部署】本地部署FastGPT使用在线大语言模型

FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力,它背后依赖OneApi开源项目来访问各种大语言模型提供的能力。各大语言模型提供的访问接口规范不尽相同,为此OneApi项目提供了统一的API接口去对接各种大语言模型。FastGPT的部署架构如图所示:本文章将介绍如何部署OneApi和FastGPT,以及两种在线大语言模型(和)的配置方法。

文章图片
#语言模型#人工智能#自然语言处理 +2
AI 绘画模型推荐

就像人类画家有不同的画风,AI作画的风格也多种多样,各有千秋。同样的画面,用不同的模型表现出来,就像换了不同的滤镜,效果截然不同。对大部分的大模型而言,生成人物肖像、尤其是女性肖像时,默认情况都是偏欧美风的,这样其实并不符合我们的审美。**2.5D 侠客:**介于两者之间,既有真实感又有立体感,像是从 3D 游戏或动画里蹦出来的。下面推荐一些江湖上响当当的名号,供大家按需索骥(切记,模型无优劣,全

文章图片
#人工智能
“AI训练师”是个啥职业?为你揭秘!

你听说过“AI训练师”吗?今年2月,“AI训练师”正式成为新职业并纳入国家职业分类目录。这到底是个啥职业?有何发展前景?夸克搜索AI训练师小寇与我们分享了他的故事。小寇成为一名AI训练师完全是机缘巧合。在上一家公司内部架构调整后,他从传统互联网产品经理摇身一变成为AI训练师。从进入完全陌生的AI业务到现在,已有3年时间。“我们发现很多用户在识图搜索时,出于好奇会自拍人脸。于是,我们赋予AI对颜值进

文章图片
#人工智能#AIGC#自然语言处理 +1
【大模型】RAG效果优化:高质量文档解析详解

基于PDFPlumber将pdf中的文字部分提取出来,得到words集合,并基于words位置关系检测文本行(lines)。

文章图片
#知识图谱#学习#AIGC +1
【人工智能】未来已来,国内10家AI大模型盘点

阿里达摩院推出的大模型,拥有千亿参数,可用于智能问答、知识检索、文案创作等场景。

文章图片
#人工智能#自然语言处理#语言模型 +1
    共 20 条
  • 1
  • 2
  • 请选择