logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

萱仔大模型学习记录4-BERT_lora实战

Lora通过添加低秩的矩阵,使得只需要微调少量参数,而不是整个模型。这样就可以用比较小的代价去处理我自己的任务,虽然bert本身不算一个特别巨大的模型,但是作为实践,还是可以尝试吧lora引入进去当作一个实践,从简单到困难需要循序渐进嘛。由于我已经理顺了一次lora的原理,对于个人简单来说就是外接一个新的A和B矩阵,来训练新的小小矩阵去×原本的大大模型,这样只训练小矩阵的成本就能大大降低,而且由于

文章图片
#学习#bert#算法
PEFT库和transformers库在NLP大模型中的使用和常用方法详解

原理:通过在预训练模型的权重矩阵中添加低秩矩阵,LoRA将大模型的微调问题转化为对小矩阵的优化。优点:显著减少训练时所需的参数,降低计算复杂度。使用场景:适合在计算资源有限的情况下进行快速微调。# 加载预训练模型和分词器# 配置LoRAr=8, # 低秩适配的秩# 应用LoRA# 训练代码(略)Adapter原理:在预训练模型的不同层之间插入小型的“适配器”网络,只微调适配器参数,保留主模型的权重

文章图片
#人工智能#机器学习
Agent智能体

Agent(智能体)是一个能够感知环境并采取行动的自主实体,通常被设计用于在特定的环境中执行任务。智能体可以通过学习、推理等方式来决策,目标是最大化某种效用或实现某个预定的目标。它们广泛应用于自动化系统、游戏AI、机器人、自然语言处理、推荐系统等领域。

文章图片
#人工智能
主流的大数据框架Hadoop/spark

处理大数据: 如果你有成千上万的文件、日志数据,或者每天需要处理几百 GB 的数据量,Spark 是一个理想的工具。在需要反复计算的数据任务中,如迭代式的机器学习算法,它有很大的优势。1、高速处理: Spark 能够将数据加载到内存中进行计算,相比于传统的 Hadoop MapReduce,它的迭代计算速度要快很多,特别是在处理需要多次操作的数据集时(例如机器学习任务)。分布式和容错性: Spar

文章图片
#大数据
PEFT库和transformers库在NLP大模型中的使用和常用方法详解

原理:通过在预训练模型的权重矩阵中添加低秩矩阵,LoRA将大模型的微调问题转化为对小矩阵的优化。优点:显著减少训练时所需的参数,降低计算复杂度。使用场景:适合在计算资源有限的情况下进行快速微调。# 加载预训练模型和分词器# 配置LoRAr=8, # 低秩适配的秩# 应用LoRA# 训练代码(略)Adapter原理:在预训练模型的不同层之间插入小型的“适配器”网络,只微调适配器参数,保留主模型的权重

文章图片
#人工智能#机器学习
kaggle项目:ISIC 2024 - Skin Cancer Detection with 3D-TBP

在这场比赛中,将开发基于图像的算法,从3D全身照片(TBP)中识别组织学确诊的具有单病变作物的皮肤癌症病例。图像质量类似于特写智能手机照片,这些照片通常用于远程医疗目的。预测的二元分类算法可以在没有专业护理的情况下使用,并改进早期皮肤癌症检测的分类。该数据集由带有额外元数据的诊断标记图像组成。这些图像是JPEG格式的。相关的.csv文件包含一个二进制诊断标签(目标)、潜在的输入变量(例如age_a

文章图片
#3d#python#cnn +4
PEFT库和transformers库在NLP大模型中的使用和常用方法详解

原理:通过在预训练模型的权重矩阵中添加低秩矩阵,LoRA将大模型的微调问题转化为对小矩阵的优化。优点:显著减少训练时所需的参数,降低计算复杂度。使用场景:适合在计算资源有限的情况下进行快速微调。# 加载预训练模型和分词器# 配置LoRAr=8, # 低秩适配的秩# 应用LoRA# 训练代码(略)Adapter原理:在预训练模型的不同层之间插入小型的“适配器”网络,只微调适配器参数,保留主模型的权重

文章图片
#人工智能#机器学习
常用大语言模型简单介绍

LLaMA是 Meta 开发的开源大型语言模型,用于执行多种 NLP 任务。Ollama是一个工具或平台,允许用户在本地运行和管理多个语言模型,包括 LLaMA。它简化了 LLM 的运行流程,使用户可以通过命令行轻松调用和实验模型。因此,LLaMA 是一个模型本身,而Ollama 是一个工具,用于运行包括 LLaMA 在内的多种大语言模型。

#nlp#人工智能#python +1
机器学习常用的评价指标原理和代码

最近面试的时候,很多面试官问道了我项目中的一些评价指标的算法和原理,我觉得这确实也是一个很重要的内容,所以趁这个机会综合起来一块复习一下,在刷力扣的时候也不能忘记项目最常用的内容嘛。它们都表示模型在所有实际为正类的样本中,正确预测为正类的比例。:计算误差的绝对值与真实值的比率的平均值,反映相对误差。:实际为正类的样本中,正确预测为正类的比例。:预测为正类的样本中,真正为正类的比例。

文章图片
#机器学习#人工智能
萱仔大模型学习记录——6.1RAG入门理论学习+奠基论文学习

RAG是一种将检索和生成相结合的技术,擅长生成基于真实信息的答案。Agent是一个自主行动的系统,能够根据任务需求做出决策。RAG+Agent的组合让系统既有知识深度,又能自主决策,形成强大的智能化解决方案。

文章图片
#算法#学习#人工智能
    共 16 条
  • 1
  • 2
  • 请选择