登录社区云,与社区用户共同成长
邀请您加入社区
本文介绍了深度学习的基本概念和应用方法。首先阐明深度学习是机器学习的子集,通过多层神经网络自动提取特征,具有端到端学习能力。核心部分讲解了神经网络的结构(输入层、隐藏层、输出层)和计算过程(前向传播、反向传播、参数更新)。随后以PyTorch框架为例,演示了构建神经网络模型的具体步骤,包括模型定义、损失函数设置、优化器选择等关键组件。通过示例代码展示了完整的训练流程和推理过程,帮助读者快速掌握深度
参考:pytorch深度学习实践(刘二大人)课堂代码&作业——循环神经网络基础篇_pytorch深度学习实践 作业-CSDN博客
之前我们是用one-hot编码来表示单词的:假设一个单词在词汇表里的序号是t,词汇表大小是T,则这个单词的编码是一个长度为T的向量,向量只有第t维是1,其他维是0。我们用来表示这个单词的one-hot编码。如下图:这种表示法能区分每个词,但是,它有一个缺陷:one-hot向量两两之间的乘积为0,不能通过向量的相似度推理出单词的相似度。因此,在NLP中,一个重要的任务就是找到一个合理的词表示方法,使
最近在 B站 刘二大人 学习PyTorch ,上传一些学习用的代码,仅供参考和交流。
如果回顾过去十几年的发展,会发现每一次架构升级,其实都是为了突破一个工程瓶颈。传统神经网络│▼RNN(解决上下文)│▼LSTM(解决长期依赖)│▼Transformer(解决并行计算)│▼GPT(解决规模扩展)│▼MoE(解决推理成本)│▼Agent(解决任务执行)换句话说,AI 架构的发展从来不是简单的技术迭代,而是一场围绕记忆、计算、扩展、成本和执行能力展开的持续演进。谁的模型更大。谁的智能系
title: 深入浅出 RNN 反向传播与梯度消失tags: Agent开发, 深度学习, 算法基础excerpt: 详细解析 RNN 的随时间反向传播(BPTT)过程。从底层的前向信息流,到严谨的微积分链式法则,直击全导数展开与连乘导致梯度消失的数学本质。循环神经网络(RNN)的核心优势在于处理带有序列依赖的数据。在训练阶段,这种处理时间序列的“记忆”特性,使得其反向传播算法(Backpropa
三种模型权重对比,含数据集和训练结果。电子资料,内容包括模型训练过程、损失曲线、验证集指标等,适合AI、图像识别、深度学习相关学习和项目参考。基于yolo11的水稻田杂草检测报告1(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_可以扫码。
为了解决这种"既要记住长远,又不能什么都记"的问题,人们在循环神经网络的基础上加了一个"记忆模块"和一套"门控机制",这就是本文的主角:长短期记忆网络(LSTM,Long Short-Term Memory)。
全程无复杂公式,聚焦 **“模型能做什么、适合什么场景”**,用生活化类比讲清 CNN(看图片)、RNN(读文字)的核心用途和区别
本文深入比较了Transformer与RNN两种序列建模架构的本质区别。RNN通过循环连接处理序列,虽参数共享但存在梯度消失、难以并行等问题。Transformer则完全依赖自注意力机制,通过并行计算捕获全局依赖,解决了RNN的核心瓶颈。文章详细解析了Transformer的核心组件,包括多头注意力、位置编码等,并从计算方式、长距离依赖等维度进行对比。尽管Transformer面临计算复杂度高的挑
摘要:2015-2025年是MLLM(多模态大语言模型)从双模态拼接发展为通用AI核心底座的十年演进期。早期(2015-2017)以CNN+RNN双分支架构为主,仅支持图文浅层对齐;中期(2018-2020)Transformer统一架构推动多模态预训练范式确立;近期(2021-2023)LLM成为中央大脑,CLIP、GPT-4V等模型实现跨模态深度理解,开源生态爆发。国产技术从跟随到并跑,渗透率
AI Agent十年演进:从游戏玩家到数字员工 2015-2025年,AI Agent经历了三大技术纪元: 强化学习期(2015-2018):以AlphaGo为代表,具备反应式能力但泛化性差; 大模型规划期(2019-2023):LLM成为核心,实现任务拆解与工具调用(如AutoGPT); 2025具身智能时代: 内核级安全:通过eBPF实时审计系统调用,阻断越权操作; 多Agent协作:专家群组
本文系统介绍了RAG系统中的多跳问答技术。多跳问答通过分步推理解决复杂问题,需要多个知识片段的逻辑关联才能得出最终答案。文章分析了四大解决方案:迭代检索、查询分解、图推理和Agent框架,并探讨了混合策略的最佳实践。实际应用中,多跳问答显著提升了金融分析、医疗咨询等场景的准确率和效率,但也面临延迟增加、成本上升等挑战。未来发展趋势包括Agent范式普及、端到端训练和实时知识更新等。多跳问答不仅提升
你有没有这样的经历:刷短视频时,刚点了几条猫咪视频,接下来满屏都是猫;看了几篇科技新闻,推荐流里再也看不到其他类型的内容。久而久之,你发现自己被困在一个"舒适区"里,看到的东西越来越单一,观点也越来越固化。
文章摘要 图神经网络(GNN)通过将用户、商品及其交互建模为图结构,利用消息传递机制捕捉高阶关系,显著提升推荐系统效果。相比传统协同过滤仅分析直接交互,GNN能发现"朋友的朋友"等潜在关联,并融合多源异构数据(如用户画像、商品属性)。典型应用包括Pinterest的PinSage(随机游走采样)、阿里的EGES(异构图建模)和轻量级LightGCN。尽管面临计算成本高、过平滑等
本文系统解析NLP核心序列模型RNN、LSTM与GRU的原理与机制,并结合PyTorch提供代码实战与避坑指南,助你轻松掌握长序列建模。
卷积神经网络(Convolutional Neural Network, CNN)依托局部感受野参数共享提取局部特征,最早用于图像领域,后拓展至NLP、语音、时序分析。循环神经网络(Recurrent Neural Network, RNN)通过递归隐藏状态逐时序处理序列,当前时刻输出同时依赖当前输入与历史记忆。htfxtht−1htfxtht−1自注意力机制直接计算序列任意两个元素的关联度
本文介绍了一种基于物联网技术的空气质量实时监控与报警系统。该系统通过部署传感器网络实时监测PM2.5、PM10等主要污染物浓度,利用无线传输将数据发送至中央处理单元进行分析。当污染物超标时,系统会触发声光报警和短信通知,同时具备数据存储、趋势分析和远程查询功能。系统功能结构图展示了完整的监测-处理-报警工作流程,管理员可通过界面进行生活指数管理等操作。该系统为改善空气质量和保障公众健康提供了智能化
rnn
——rnn
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net