logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

图像-文本预训练模型

刚才王苏给大家表演了一个图像-文本预训练模型四连鞭(果然功力还是不及马保国大师),不知大家尽兴了没有~当下多模态领域正得到越来越多的关注,而预训练模型的效果也得到了学术界+工业界的广泛认可。虽然从研究角度上讲搞预训练模型的计算开销不是一般人负担得起的,但我们聪明的大脑是不受算力限制的!我们可以从预训练模型的设计和取得的效果中逐步发现在跨模态任务中与NLP语言模型地位相当的任务,进而了解真正实现多种

#transformer#深度学习#人工智能 +2
深度学习中的正则化技术--L1&L2-norm,Dropout,Max-norm

规范化技术一般用于解决模型的过拟合问题,本文将深入浅出的介绍几种常见的正则化技术

#机器学习#人工智能#深度学习
一文通透想颠覆Transformer的Mamba:从SSM、S4到mamba、线性transformer(含RWKV解析)(转)

一文通透想颠覆Transformer的Mamba:从SSM、S4到mamba、线性transformer(含RWKV解析)

文章图片
#transformer#深度学习#人工智能
【大模型机遇与风险】

斯坦福大学的 Percy Liang、Rishi Bommasani(Percy Liang 的学生) 、李飞飞等 100 多位研究者联名发布了一篇系统探讨此问题的论文。在论文中,他们给这种大模型取了一个名字——「基础模型(foundation model)」,并系统探讨了基础模型的机遇与风险。「基础」代表至关重要,但并不完备。......

#人工智能#自然语言处理#深度学习 +1
MMdetection3d学习

在 轻松掌握 MMDetection 整体构建流程(一) 文中,重点分析了 MMDetection 框架中 Model 整体构建流程,但仅对 Model 算法组件方面进行深入分析,并未涉及整个框架训练和测试流程。本文核心内容是按照抽象到具体方式,从多个层次进行训练和测试流程深入解析,从最抽象层讲起,到最后核心代码实现,希望帮助大家更容易理解 MMDetection 开源框架整体构建细节。

文章图片
#学习
ViLT:最简单的多模态Transformer

清楚的归纳了各种多模态算法,提出了一种非常简单的多模态Transformer方法ViLT。先阐述一下4种不同类型的Vision-and-Language Pretraining(VLP),然后归纳2种模态相互作用方式和3种visual embedding方式,最后讲一下ViLT的设计思路。...

#transformer#深度学习#人工智能
常见目标跟踪数据集下载链接整理(更新中)

搜罗一下,感觉没人把常见的目标跟踪下载链接汇总整理的,这里就整理一下,因为有些网址很难打开,这里也是想方便之后大家获取,来看看吧!我就从大佬图中来找几个吧!因为不是全接触过,有些链接不是很好,有小伙伴有更好的建议,欢迎评论!

文章图片
#目标跟踪#人工智能#计算机视觉
Stanford CoreNLP 入门指南

最近一直在写毕业论文,因为是一个基于语料库分析的题目,所以牵扯到了词性标注、句法分析等等内容。在一番查找之后,决定用 Stanford CoreNLP 来进行处理,一方面是因为这个工具本身功能齐全,另一方面也是因为这个工具比较容易上手使用。在使用过程中慢慢发现目前这一工具的中文教程或者说明还比较不完善,大多数教程都是复制来复制去的几张图,很多需要注意的地方都没有涉及,所以决定写一篇文章来总结一下这

文章图片
#python#开发语言
一文通透想颠覆Transformer的Mamba:从SSM、S4到mamba、线性transformer(含RWKV解析)(转)

一文通透想颠覆Transformer的Mamba:从SSM、S4到mamba、线性transformer(含RWKV解析)

文章图片
#transformer#深度学习#人工智能
到底了