
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
浅谈RNN被Transformer 取代的必然性
本文系统解析了Transformer架构及其革新意义。首先指出各类网络的核心目标均为特征提取,但方式各异:CNN采用局部窗口提取特征,存在"视野局限";而Transformer通过自注意力机制实现全局特征交互,能动态捕捉长距离关联。回顾发展历程,2017年前NLP领域受限于RNN的三大缺陷:计算低效、长序列处理差和语境适应弱。Transformer的诞生解决了这些问题,其并行计
llava简述
围绕llava视觉大模型展开深度技术分享,从核心模型选择、数据构建逻辑、多阶段训练策略到特征融合方式,结合案例类比与实操细节,系统拆解了视觉大模型实现多模态理解的关键环节,同时解答了技术落地中的常见疑问,为后续源码学习与工程实践奠定基础。
到底了







