logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从“逐字朗读”到“一眼看穿”:Transformer 如何重塑了我们身边的 AI?

不再机械记忆顺序,而是主动寻找关联。RNN 的时代像是:“死记硬背。Transformer 的时代更像:“理解上下文。而这,正是今天大模型真正聪明的原因。写代码生成图片做翻译理解视频与人自然聊天别忘了那个改变世界的瞬间:人震撼的,其实不是公式。而是那个大胆的想法:“既然循环这么麻烦,为什么不干脆扔掉它?于是 Vaswani 和他的团队做了一件看似疯狂的事,他们删掉了整个 RNN。只留下Attent

#人工智能#transformer#深度学习
踩坑实录:ResNet18 训练 CIFAR 准确率卡在 80%?显存还总爆炸?

从 80% 到 95%,差的不是算力,而是对数据和模型底层逻辑的理解。显存管理:永远不要一次性把大量数据塞进 GPU,善用 DataLoader。尺寸适配:不要盲目 Resize。对于小尺寸图片,保持原尺寸并配合数据增强,往往比强行拉伸到 224×224 效果更好。希望这篇踩坑实录能帮你避开这些弯路,祝你的模型训练 Loss 狂降,准确率飙升!

#pytorch#人工智能#python
到底了