logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

自称超越Transformer的新一代大模型RWKV是什么

自 Vaswani 等人于 2017 年首次提出 Attention Is All You Need 之后,基于 transformer 的强大的模型一直在不断地涌现,它们在 NLP 相关任务上的表现远远超过基于 RNN (Recurrent Neural Networks, 递归神经网络) 的 SoTA 模型,甚至多数认为 RNN 已死。而本文将介绍一个集 RNN 和 transformer 两

文章图片
#transformer#深度学习#人工智能 +2
无声视频自动配音效,开源模型thinksound 和mmaudio复现

最近ASMR 的视频蛮火的,就是切开任何东西会发出声音,但我看教程都是走到app 的自动生成音效感觉无趣,还是自己复现

文章图片
#深度学习#算法#计算机视觉 +2
无声视频自动配音效,开源模型thinksound 和mmaudio复现

最近ASMR 的视频蛮火的,就是切开任何东西会发出声音,但我看教程都是走到app 的自动生成音效感觉无趣,还是自己复现

文章图片
#深度学习#算法#计算机视觉 +2
u2net 和u2netp 的具体区别

U2Net和U2NetP是两种基于深度学习的图像分割模型,它们都使用了编码器-解码器架构和跳跃连接来提高分割的精度。然而,它们在网络结构和参数配置上存在一些差异。这些差别反映了U2NetP是U2Net的一个轻量级版本,通过减少参数和简化网络结构来提高运行效率,可能以牺牲一些精度为代价。

文章图片
#人工智能#计算机视觉#神经网络 +1
读论文 《Multi-Behavior Sequential Recommendation with Temporal Graph Transformer》

​目前大多数框架都是为单一的行为类型设计的。在实践中,根据不同的上下文,用户-项目交互的意图可以随着时间的推移而改变。​因此,用户与论文的交互往往具有时间依赖性和行为多样性。为了向用户推荐相关知识,不仅要了解他/她以前下载过什么,而且要了解这个用户以前看过什么论文,或者把它们标记为他/她喜欢的论文。​为实现目标,存在两个挑战:​1)跨类别行为项目依赖 不同类型的交互之间存在依赖关系,如果分散的将行

#transformer#深度学习#人工智能
到底了