懒惰才能让科技进步个人主页

@red_guy

懒惰才能让科技进步

2023-05-29 09:49:13 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从零学习大模型（十）-----剪枝基本概念

Transformer层剪枝的核心思想是评估每个层、注意力头或权重对模型性能的重要性，然后根据评估结果去掉那些对模型性能贡献较小的部分。Transformer层剪枝是一种针对Transformer模型（如BERT、GPT等）中的自注意力模块和前馈网络进行剪枝的方法，旨在减少模型的参数量和计算开销。在这种方法中，模型的剪枝对象通常是具有特定结构的部分，例如卷积神经网络中的整个滤波器或通道，而不是单个

#学习 #剪枝 #gpt-3 +3

从零学习大模型（十四）-----量化（一）

量化（Quantization）是一种在计算机科学和深度学习中广泛应用的技术，其基本目标是通过减少模型中数值表示的位宽来降低计算和存储成本。简单来说，量化就是将高精度（通常是浮点数）转换为低精度（通常是定点数）表示，同时尽量保持模型的性能和准确性。量化通常用于深度学习模型（尤其是大模型）中，以减小模型的存储空间和提高推理速度。量化不仅可以减少模型的内存占用，还能提高硬件的计算效率，尤其是在低功耗设

#人工智能 #深度学习 #transformer

人工智能顶会ECCV2022《Watermark Vaccine: Adversarial Attacks to Prevent Watermark Removal》论文解读

#人工智能 #深度学习 #神经网络 +1

从零学习大模型（六）-----LoRA（上）

在大规模语言模型的实际应用中，微调需要耗费巨大的计算资源和内存，因为要微调整个模型的参数（通常有数十亿甚至数千亿个参数）。**LoRA通过只训练新增的低秩矩阵，使得训练过程变得更加轻量**，同时减少了存储需求。这在许多硬件资源受限的场景中尤为有用。

#gpt-3 #人工智能 #深度学习 +1

从零学习大模型（九）-----P-Tuning（下）

P-Tuning是一种参数高效的微调方法，旨在通过引入可学习的提示（Prompt）来改进预训练语言模型在特定任务中的表现。与传统的全参数微调相比，P-Tuning 只需要微调少量的额外参数，使得模型在执行任务时更加高效，并且能够适应多种下游任务。在 P-Tuning 中，提示（Prompt）是一些附加到输入上的可学习向量，这些向量作为模型的输入，帮助调整模型的行为。通过对这些可学习提示进行训练，模

#学习 #深度学习 #人工智能 +1

从零学习大模型（七）-----LoRA（下）

LoRA（Low-Rank Adaptation）是一种参数高效的微调技术，旨在降低微调大规模预训练模型的存储和计算成本。**其核心思想是通过对模型的特定参数进行低秩分解，仅对少量附加参数进行训练，从而完成任务适应，而无需更新整个模型的权重。**这种方法通过引入额外的低秩矩阵来适应新的任务，保持了预训练模型的核心知识，使其更具灵活性和高效性。

#学习 #人工智能 #transformer +2

LLAMA2入门（三）-----微调

在 Llama 2 的监督微调（Supervised Fine-Tuning, SFT）阶段，研究团队对模型进行了进一步的调优，以提升其生成对话和其他任务的表现。以下是 SFT 过程的详细讲解：

#人工智能 #深度学习 #神经网络 +3

人工智能顶会CVPR2022《革新AI预训练：探索KDEP及其在知识蒸馏中的破局之道》论文解读

KDEP（Knowledge Distillation as Efficient Pre-training）在论文 “Knowledge Distillation as Efficient Pre-training” 中提出，主要聚焦于通过知识蒸馏实现高效的模型预训练。

#人工智能 #深度学习 #机器学习 +2

从零学习大模型（八）-----P-Tuning（上）

#学习 #人工智能 #深度学习 +4

从零学习大模型（十四）-----量化（一）

#人工智能 #深度学习 #transformer

共 24 条

请选择