logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

VIT剪枝调研

剪枝作为压缩深度神经网络的方法,在卷积网络、Transformer 和大规模语言模型中得到了广泛研究。本文系统梳理了用户提供的剪枝方案,包括非结构化权重剪枝、结构化剪枝(滤波器、通道、神经元等)、注意力头剪枝、Token 和层级剪枝等方法。我们介绍每种方法的核心思想和类型,讨论其在大模型/Transformer(如GPT、BERT、LLaMA、ViT)中的适配性与创新点,包括是否需要重训练、是否依

文章图片
#剪枝#算法#机器学习
Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding翻译

我们提出了Imagen,这是一个具有前所未有的逼真度和深度语言理解能力的文本生成图像扩散模型。Imagen基于大型Transformer语言模型的文本理解能力,并结合了扩散模型在高保真图像生成中的优势。我们的关键发现是,使用预训练的仅包含文本的大型语言模型(如T5)在图像合成中出乎意料地有效:增大语言模型的规模比扩展图像扩散模型的规模更能提升样本的保真度和文本对齐度。

文章图片
#人工智能
Conda环境封装成docker镜像

conda环境如何封装给其他人用

#conda#docker#linux
长尾形分布论文速览三十篇【60-89】

这些研究展示了LLMs在长尾数据分布、持续学习、异常检测、联邦学习、对比学习、知识图谱、推荐系统、多目标跟踪、标签修复、对象检测、医疗生物医学以及其他应用中的广泛应用。通过优化和创新,LLMs在这些领域展现了卓越的性能,并为解决长尾问题提供了有效的工具和方法。

文章图片
#人工智能
长尾形分布论文三十篇速览1【0-29】

这三十篇论文主要围绕长尾分布问题展开,涉及多个不同领域的具体应用和方法,可以大致分为以下五类:长尾学习方法创新、多模态与自监督技术应用、知识蒸馏与适配、长尾场景下特定领域的应用、以及数据增强与网络优化。

文章图片
#人工智能
Conda环境封装成docker镜像

conda环境如何封装给其他人用

#conda#docker#linux
到底了