samoyan 个人主页

@baoyan2015

samoyan

2022-09-16 18:05:24 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

解释LoRA参数

LoRA是一种参数效率的模型调整技术，它通过在预训练模型的权重矩阵上添加低秩矩阵来实现。这种方法允许模型在微调阶段保持大部分参数不变，从而节省存储空间和计算资源，同时允许模型适应新的任务。这意味着在训练过程中，将使用LoRA技术对模型进行适应，其中秩为128，学习率缩放因子为256。: LoRA代表"Low-Rank Adaptation"，是一种模型参数化技术，用于在不显著增加参数数量的情况下调

#机器学习

LLM 面试- python 和pytorch手动实现 self attention的计算过程

Self-Attention机制的核心思想是通过计算输入序列中每个元素与其他元素的相关性来生成一个加权和。Self-Attention机制的核心思想是通过计算输入序列中每个元素与其他元素的相关性来生成一个加权和。### Self-Attention机制的原理。个元素，通常是一个向量。个元素，通常是一个向量。是可训练的权重矩阵。是可训练的权重矩阵。

#python #pytorch #开发语言

条件随机场 (CRF) 的损失函数以及faiss 的原理介绍

这里，T 是序列的长度，fk 是特征函数，λk 是对应的权重，求和是对所有可能的标记序列y′进行。分子是当前标记序列y的得分，而分母是所有可能标记序列的得分之和，也称为配分函数（partition function），用于确保概率之和为1。其中，N 是训练样本的数量，x(i) 是第i个样本的输入序列，y(i) 是对应的真实标记序列，θ 是模型参数，p(y∣x;在训练CRF模型时，目标是最小化损

#机器学习 #深度学习 #人工智能

nvidia-smi 可以显示gpu占用量和使用率，但不显示PID等详细进程信息的解决方法

使用fuser命令可以查看哪些进程正在使用指定的文件或目录。在Linux系统中，GPU设备通常被映射到/dev/nvidia*文件中，因此可以使用fuser命令来查看哪些进程正在使用GPU设备。在上述示例中，可以看到/dev/nvidia0设备正在被PID为1234的python进程使用，/dev/nvidia1设备正在被PID为5678的tensorflow进程使用。执行上述命令后，会列出所有正

#linux #运维 #服务器

多模态大模型intern-vl 1.5 论文解读：How Far Are We to GPT-4V?

大语言模型（LLMs）在推动通用人工智能（AGI）系统方面发挥了重要作用，展现了在处理开放世界语言任务中的非凡能力。借助LLMs的进步，多模态大语言模型（MLLMs）[5, 18, 23, 62, 63, 84, 92, 116, 142]取得了显著进展，促进了复杂的视觉语言对话和交互，弥合了文本信息和视觉信息之间的差距。尽管取得了这些成就，开源模型与专有商业模型之间仍然存在明显的能力差距，例如G

#人工智能

Ovis原理解读: 多模态大语言模型的结构嵌入对齐

它提出了一种新颖的多模态大语言模型 (MLLM) 架构，称为 “Ovis”。该架构吸收了大语言模型 (LLMs) 的洞见，从而建立视觉输入的结构化嵌入。如图1所示，Ovis 引入了一个额外的可学习视觉嵌入查找表，用以转换连续的视觉tokens，从而与文本嵌入的结构完整性相呼应。图2展示了在各种基准测试中，Ovis 在相同参数范围内优于开源 MLLMs，而 Ovis-14B 在整体表现上也超越了高资

docker部署，启动失败 OCI runtime create failed: container_linux.go:348:

docker run hello-world出现一下问题，docker: Error response from daemon: OCI runtime create failed: container_linux.go:348:starting container process caused "process_linux.go:297:copying bootstrap data to pip

#docker #linux

pip 安装faiss 不能用，使用conda安装并使用faiss成功

pip 安装faiss 安装过程没有报错，import时候必报错！！！1.安装cpu版本faisspip --default-time=1000 install -i https://pypi.tuna.tsinghua.edu.cn/simple faiss2、报错 ModuleNotFoundError: No module named '_swigfaiss'File "/usr/loca

#python

LLM的评价指标

模型的准确性是通过比较模型的预测结果和实际结果来衡量的，通常使用精确度（precision）、召回率（recall）、F1分数等指标。SuperGLUE是继GLUE之后的一个更为复杂和挑战性的基准测试，它引入了更难的任务和更复杂的数据集，用以推动语言理解模型的发展。泛化能力是衡量模型在未见数据上表现的能力。评价一个模型的可解释性涉及到理解模型的决策是如何做出的，以及模型的预测是否为人类所能理解和接

#人工智能

T5与BART的区别

BART也采用了encoder-decoder结构，但与T5不同的是，BART在预训练阶段使用了类似于BERT的双向Transformer作为encoder，使用了类似于GPT的单向Transformer作为decoder。扰动的方式包括了词序打乱、词缺失、词替换等。总的来说，T5和BART在模型结构、预训练任务和生成方式上都有所不同，但都是将NLP任务视为序列到序列的转换问题，都采用了自回归的生

#人工智能

共 40 条

请选择