logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LoRA微调模型结构可训参数和配置详解

1、构建一个简单的两层线性网络,加relu激活函数,在第一层Linear中使用LoRA策略,打印看下模型结构。复习Lora在第一层Lnear网络的结构,即在第一层旁增加lora策略。2、打印原始网络结构中可训练的参数和LoRA策略下的参数量。3、LoraConfig类的一些参数解释

#python#深度学习#神经网络 +1
jinaai/jina-embeddings-v2-base-zh向量模型报错解决

解决jinaai/jina-embeddings-v2-base-zh模型报错 We couldn't connect to 'https://huggingface.co' to load this file... configuration_bert.py.

文章图片
#jina
分类模型常用的评估指标

准确度 考虑所有样本,预测对的除以总的样本数,比较直接。精确度 允许模型犯点错误,针对某一类别预测对的除以总的预测数。召回率 严格模型尽量不犯错,针对某一类别预测对的除以该类别总测试数。F1 精确度和召回率调和平均值,两者都高的情况下F1才会高。混淆矩阵 分类组成的方阵 行是召回率分析,列是精确率分析。遗留混淆矩阵中的macro avg和weighted avg参数分析和PR曲线、ROC曲线,未完

文章图片
#分类#机器学习#人工智能
RMSNorm规范化

RMSNorm 的数学公式计算均方根(RMS)。归一化输入。缩放归一化后的输出。RMSNorm 相对于传统的 Layer Normalization 更加稳定,尤其是在长序列处理中表现更优。

#深度学习
Python 合并两张图片

使用Python合并两张图片

文章图片
#python#服务器
到底了