不当菜鸡的程序媛个人主页

@vivi_cin

不当菜鸡的程序媛

2023-01-10 23:29:08 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Gpt,gpt2,gpt3,bert,roberta,t5模型区别分析

Roberta：相比bert主要是在训练参数上做了调整：batch size，adam参数，训练数据、nsp loss、epoch数，词表大小。原文链接：https://blog.csdn.net/qq_41111734/article/details/125538102。encoder的hidden层输出用avgpooling，而不是像bert一样用的cls-token。GPT2:仍然仅使用上文

#gpt-3 #bert

Policy model

1. Policy model（策略模型）：RL里专门用来输出动作（LLM里就是生成文本）的模型，是RL流程里的决策主体。RLHF里，SFT微调后的基座backbone，包装成policy model来做文本生成；2. Backbone（骨干/基座）：模型底层基础权重，是policy model的载体。• 大模型RLHF里，policy model就是主大模型，用来生成回答。• 输入当前状态，输出

#深度学习

Post-training（后训练）极简解释

模型预训练（pre-training）做完基础学习后，再额外做一轮针对性微调训练，就叫 post-training。一句话总结：大模型基础预训练完，后续所有优化训练流程统称 post-training。2. RLHF 人类反馈强化学习：用人类打分再优化，让回答更贴合人的偏好。1. SFT 监督微调：用人写好的问答样本教模型听懂指令；Post-training（后训练）极简解释。

#深度学习

Imagenet-A，Imagenet-C和ImageNet-O

ImageNet-O 包含来自在 ImageNet-1k 数据集中未发现的类别的图像。对ImageNet 1K添加了一些常见的图像损坏（如模糊和噪声），以评估分类器在面对这些损坏时的性能。这样的评估可以帮助研究人员更全面地了解模型的鲁棒性和泛化能力。该数据集包含 7,500 张经过对抗性过滤的图像，很容易导致机器学习模型的性能显著下降。mCE：用于评估模型在面对不同类型的图像扭曲、噪声或其他损坏时

#人工智能

Cursor/VS Code 中，左侧资源管理器字体放大

在 Cursor/VS Code 中，左侧资源管理器（文件树）的字体大小没有单独的设置项，它跟随整体界面缩放级别。

#vscode

github中获得Personal Access Token

访问 GitHub → Settings → Developer settings → Personal access tokens → Tokens (classic)点击 "Generate new token" → "Generate new token (classic)"设置权限（至少需要 repo 权限）生成并复制token。

#github

vscode分布式训练debug

转载：vscode分布式训练debug_分布式ai vscode-CSDN博客

#深度学习

通过loss曲线诊断神经网络模型

看loss曲线，如果train loss和val loss都还有下降空间，就继续加大epoch，如果基本平了，加大epoch用处也不大了，如果train loss降val loss降着降着上升了，这说明，模型在val loss由降转升的转折点就收敛了。

#神经网络 #深度学习 #机器学习

BCELoss，BCEWithLogitsLoss和CrossEntropyLoss

等价于：nn.CrossEntropyLoss = nn.NLLLoss(nn.LogSoftmax)输出：一个标量（这个minibatch的mean/sum的loss）两个损失：BCELoss，BCEWithLogitsLoss。输入：（[B,C], [B,C]）输入：（[B,C], [B,C]）输入：（[B,C], [B]）

#深度学习 #python #pytorch

理解1D、2D、3D卷积神经网络的概念

1D, 2D，3D卷积神经网络

#深度学习 #神经网络 #人工智能

共 68 条

请选择