logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于人类反馈的强化学习(RLHF)

例如,在InstructGPT项目中,使用PPO算法训练LM时,会计算LM当前输出与初始输出之间的KL散度作为惩罚项。例如,InstructGPT项目中,标注人员会创造性地编写输入提示(比如,“给出五个重燃职业激情的建议”)和对应的输出,覆盖了开放式问答、创意思考、对话和文本重写等多种创造性任务。值得注意的是,在某些情况下,这一步骤可能不是必需的。以InstructGPT为例,标注人员会将模型生成

文章图片
#人工智能
大模型用model.generate 直接产生文本的id以及获得模型生成文本概率的方法

方法直接产生文本时,通常返回的是文本的 token ID 序列。为了获得每个 token 的生成概率,你需要使用模型的。是模型在softmax层之前的输出,表示模型对每个可能的下一个 token 的置信度。应用softmax函数,我们可以得到每个 token 的生成概率。当使用大型语言模型(如 GPT-2、GPT-3、BERT 等)的。应用softmax函数,可以得到概率分布。使得模型返回生成每个

文章图片
#人工智能#机器学习#深度学习
deepseek里使用的多头潜在注意力MLA技术浅解

多头潜在注意力(Multi-head Latent Attention, MLA)是一种改进的注意力机制,旨在解决传统多头注意力(Multi-head Attention)在计算效率和内存占用上的瓶颈。,具体的需要看技术报告了。为了降低训练过程中的激活内存activation memory,还对queries进行低秩压缩(虽然这并不能降低KV Cache),其对Q的压缩方式和K、V一致,依然是先降

文章图片
#人工智能
大模型中的位置编码ALiBi,RoPE的总结和实现

return m这个函数计算了每个头部的斜率。首先,它计算了n,这是最接近n_heads的2的幂。然后,它计算了一个基础斜率m_0,并使用这个基础斜率生成了一个斜率数组m。如果n小于n_heads,则生成另一个斜率数组m_hat并将其添加到m中。结果是一个长度为n_heads的斜率数组。return m这个函数计算了ALiBi的偏置。首先,它获取了斜率数组m,然后计算了一个距离矩阵distance

文章图片
#人工智能#算法#机器学习
python下运行import sklearn.model_selection 出错ImportError: No module named model_selection解决方法

from sklearn import datasets, svmfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import confusion_matrixiris = datasets.load_iris()X = iris.data[:, :2]y = iris.target

#python
python3版本UnicodeDecodeError: ascii codec can t decode byte 0xe2 in position 0 ordinal not in rang

当用python3读取文件时withopen(input_file)asf:for line in f:File "/usr/lib/python3.5/encodings/ascii.py", line 26, in decodereturn codecs.ascii_decode(input, self.errors)[0]UnicodeDecodeError: 'ascii' codec c

#python
Ovis原理解读: 多模态大语言模型的结构嵌入对齐

它提出了一种新颖的多模态大语言模型 (MLLM) 架构,称为 “Ovis”。该架构吸收了大语言模型 (LLMs) 的洞见,从而建立视觉输入的结构化嵌入。如图1所示,Ovis 引入了一个额外的可学习视觉嵌入查找表,用以转换连续的视觉tokens,从而与文本嵌入的结构完整性相呼应。图2展示了在各种基准测试中,Ovis 在相同参数范围内优于开源 MLLMs,而 Ovis-14B 在整体表现上也超越了高资

文章图片
gpt4中用到的红队评估(red teaming)

红队评估是一种安全评估活动,其中模拟攻击者(即红队)尝试攻击组织的网络、应用程序、设备、物理安全措施或人员,以评估组织的防御能力。红队评估的目的是发现和强化组织的安全漏洞,提高组织对真实世界攻击的抵抗能力。

文章图片
#安全#人工智能
pip 安装faiss 不能用,使用conda安装并使用faiss成功

pip 安装faiss 安装过程没有报错,import时候必报错!!!1.安装cpu版本faisspip --default-time=1000 install -i https://pypi.tuna.tsinghua.edu.cn/simple faiss2、 报错 ModuleNotFoundError: No module named '_swigfaiss'File "/usr/loca

#python
多模态大模型综述整理

论文:MM-LLMs: Recent Advances in MultiModal Large Language Models。

文章图片
#人工智能
    共 127 条
  • 1
  • 2
  • 3
  • 13
  • 请选择