logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

5分钟速览深度学习经典论文 —— attention is all you need

Attention is All You Need 是一篇极其重要的论文,它提出的 Transformer 模型和自注意力机制不仅推动了 NLP 领域的发展,还对整个深度学习领域产生了深远影响。• 提出一种完全基于注意力机制(Attention Mechanism)的模型,摒弃递归和卷积结构,解决上述问题。• 在 2017 年之前,序列建模任务(如机器翻译)主要依赖于递归神经网络(RNN)和卷积神

文章图片
#深度学习#人工智能
5 分钟读懂 RNN循环神经网络和多层RNN:原理、Tensorflow代码和应用

RNN:RNN 是一种强大的工具,特别适合处理简单的序列数据,但存在梯度消失/爆炸问题。要结合实际任务选择合适的变体。多层 RNN:通过堆叠多个 RNN 层,增强了模型的表达能力,但计算开销更大。结合 LSTM/GRU:可以缓解梯度问题,适合处理复杂的序列任务。根据具体任务选择合适的模型结构和参数,通常需要结合实验进行调整。

文章图片
#rnn#tensorflow#人工智能
2025年助力拿下高薪工作的十大人工智能认证

想象一下:你一直在浏览招聘网站,梦想着获得一份年薪六位数的人工智能专家职位。但现实却很残酷——竞争激烈,雇主们在寻找既有又有的候选人。那么,你该如何脱颖而出呢?人工智能认证就是你的秘密武器。它们提供专业培训,帮助你掌握实用技能,并向雇主证明你的专业能力。无论你是刚刚起步,还是希望提升自己,这些认证都能赋予你竞争优势,助你获得理想工作。以下是2025年你应该考虑的十大人工智能认证,它们能为你开启人工

文章图片
#人工智能
5分钟速览深度学习经典论文 —— attention is all you need

Attention is All You Need 是一篇极其重要的论文,它提出的 Transformer 模型和自注意力机制不仅推动了 NLP 领域的发展,还对整个深度学习领域产生了深远影响。• 提出一种完全基于注意力机制(Attention Mechanism)的模型,摒弃递归和卷积结构,解决上述问题。• 在 2017 年之前,序列建模任务(如机器翻译)主要依赖于递归神经网络(RNN)和卷积神

文章图片
#深度学习#人工智能
一文读懂 AI 生态中人工智能、机器学习、神经网络与深度学习之间的关系

今天,我们将讨论人工智能、机器学习、神经网络和深度学习之间的相互关系。通过查看上面的图表(见本文的封面图片),我们可以得出以下结论。人工智能是一个广泛的领域。机器学习、神经网络和深度学习是人工智能的子领域。神经网络和深度学习是机器学习的特定领域。在学习神经网络和深度学习之前,你应该熟悉一般的机器学习知识。并非所有的神经网络都是深度学习模型。让我详细解释一下每个术语。

文章图片
#人工智能#机器学习#深度学习 +1
深度学习五大模型全解析:CNN、Transformer、BERT、RNN、GAN 的区别与联系,一文读懂!

深度学习中有许多重要的模型架构,以下是五种最具代表性的模型:​CNN(卷积神经网络)​、Transformer、BERT、RNN(循环神经网络)​和GAN(生成对抗网络)​。它们在不同的任务中表现出色,各自有独特的原理、应用场景和研究背景。下面将详细解释它们的区别与联系,并给出相关论文和参考代码。

文章图片
#深度学习#cnn#transformer
2025 机器学习面试就考这些!63 个问题带你冲刺 Offer

2025 机器学习面试就考这些!63 个问题带你冲刺 Offer要通过机器学习面试并非易事,因为它既要求具备深厚的技术知识,又注重实际应用。此外,由于互联网上可靠的资源并不多,那么,该从哪里开始准备机器学习面试呢?别再四处寻找了,我精心整理了这份指南(包含13个主题63个问题),它涵盖全面、不留死角,涉及广泛的机器学习主题,确保你即使面对最棘手的问题也能准备充分。

文章图片
#机器学习#人工智能#面试
AI界的拼多多-中国人工智能初创公司DeepSeek如何与硅谷巨头竞争

仅此一点就堪称一个里程碑。在一篇解释该技术研发过程的研究论文中,DeepSeek的工程师表示,他们仅使用了领先人工智能公司训练其系统所需的高度专业化计算机芯片的一小部分。斯托伊卡博士和他的学生最近打造了一个名为Sky - T1的人工智能系统,在某些基准测试中,其性能可与OpenAI最新的名为OpenAI o1的系统相媲美。“有600万美元可用于投入的公司数量,远远多于有1亿美元或10亿美元可用于投

文章图片
#人工智能#AI#DeepSeek
大模型AI Agent:简介(第一部分)—— 特性、组件、运作及应用全景

本文深入探讨人工智能代理。首先阐述从大语言模型到人工智能代理的演变,对比传统聊天机器人与大语言模型驱动的聊天机器人,引入检索增强生成(RAG)聊天机器人及AI代理概念。接着介绍AI代理定义,其具自主性、适应性等特点,核心组件涵盖感知、推理等部分。详细说明其与环境交互的“感知 - 规划 - 行动”循环及运作方式,包括编排层、模型、工具协同。还探讨使用场景,在工作流程难预先确定时AI代理优势明显,广泛

文章图片
#人工智能
LLM架构解析:门控循环单元(GRU)(第三部分)—— 从基础原理到实践应用的深度探索

**摘要**:该博客详细介绍了门控循环单元(GRUs)。首先指出它由Cho等人于2014年提出,用于解决RNN的梯度消失问题,且结构比LSTM更简化。接着阐述了GRU的两个关键门(更新门和重置门)的工作原理,并给出Python实现代码。随后分析其优缺点,在处理序列数据上表现出色,但长期记忆和复杂模式捕捉能力稍弱。最后对比GRU与LSTM的适用场景,为实际应用中的模型选择提供参考。

文章图片
#gru#深度学习#人工智能
    共 34 条
  • 1
  • 2
  • 3
  • 4
  • 请选择