logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型AI Agent:简介(第一部分)—— 特性、组件、运作及应用全景

本文深入探讨人工智能代理。首先阐述从大语言模型到人工智能代理的演变,对比传统聊天机器人与大语言模型驱动的聊天机器人,引入检索增强生成(RAG)聊天机器人及AI代理概念。接着介绍AI代理定义,其具自主性、适应性等特点,核心组件涵盖感知、推理等部分。详细说明其与环境交互的“感知 - 规划 - 行动”循环及运作方式,包括编排层、模型、工具协同。还探讨使用场景,在工作流程难预先确定时AI代理优势明显,广泛

文章图片
#人工智能
LLM架构解析:门控循环单元(GRU)(第三部分)—— 从基础原理到实践应用的深度探索

**摘要**:该博客详细介绍了门控循环单元(GRUs)。首先指出它由Cho等人于2014年提出,用于解决RNN的梯度消失问题,且结构比LSTM更简化。接着阐述了GRU的两个关键门(更新门和重置门)的工作原理,并给出Python实现代码。随后分析其优缺点,在处理序列数据上表现出色,但长期记忆和复杂模式捕捉能力稍弱。最后对比GRU与LSTM的适用场景,为实际应用中的模型选择提供参考。

文章图片
#gru#深度学习#人工智能
LLM架构解析:长短期记忆网络(LSTM)(第三部分)—— 从基础原理到实践应用的深度探索

该博客深入介绍LSTM(长短期记忆网络)。开篇阐述其作为特殊RNN,能处理长期依赖问题。接着讲解LSTM架构,包括细胞状态、三种门(遗忘门、输入门、输出门)及相关激活函数的作用机制。随后用Python从零构建LSTM模型,涵盖数据预处理、模型训练与验证的详细代码实现。最后指出模型训练中的问题及改进方向,为理解和应用LSTM进行序列数据处理提供了全面指导。

文章图片
#lstm#人工智能#rnn +2
企业必备!搭建提示词库,解锁高效Prompt提示词工程

如今,提示词是与大语言模型(LLM)交互的主要方式。提示词需要根据用户需求进行调整,为大语言模型提供正确的上下文和指引,以最大程度提高获得 “正确” 响应的几率。这促使提示词工程 [1] 作为一门专业学科兴起,提示词工程师系统地进行试验,记录他们的发现,以得出能引出 “最佳” 响应的 “正确” 提示词。然后,这些成功的提示词会以库的形式整理起来,以便能高效复用,这就是所谓的提示词库。不幸的是,策划

文章图片
#microsoft#AI
5分钟速览深度学习经典论文 —— attention is all you need

Attention is All You Need 是一篇极其重要的论文,它提出的 Transformer 模型和自注意力机制不仅推动了 NLP 领域的发展,还对整个深度学习领域产生了深远影响。• 提出一种完全基于注意力机制(Attention Mechanism)的模型,摒弃递归和卷积结构,解决上述问题。• 在 2017 年之前,序列建模任务(如机器翻译)主要依赖于递归神经网络(RNN)和卷积神

文章图片
#深度学习#人工智能
深度学习五大模型全解析:CNN、Transformer、BERT、RNN、GAN 的区别与联系,一文读懂!

深度学习中有许多重要的模型架构,以下是五种最具代表性的模型:​CNN(卷积神经网络)​、Transformer、BERT、RNN(循环神经网络)​和GAN(生成对抗网络)​。它们在不同的任务中表现出色,各自有独特的原理、应用场景和研究背景。下面将详细解释它们的区别与联系,并给出相关论文和参考代码。

文章图片
#深度学习#cnn#transformer
深度学习五大模型全解析:CNN、Transformer、BERT、RNN、GAN 的区别与联系,一文读懂!

深度学习中有许多重要的模型架构,以下是五种最具代表性的模型:​CNN(卷积神经网络)​、Transformer、BERT、RNN(循环神经网络)​和GAN(生成对抗网络)​。它们在不同的任务中表现出色,各自有独特的原理、应用场景和研究背景。下面将详细解释它们的区别与联系,并给出相关论文和参考代码。

文章图片
#深度学习#cnn#transformer
一文读懂 AI 生态中人工智能、机器学习、神经网络与深度学习之间的关系

今天,我们将讨论人工智能、机器学习、神经网络和深度学习之间的相互关系。通过查看上面的图表(见本文的封面图片),我们可以得出以下结论。人工智能是一个广泛的领域。机器学习、神经网络和深度学习是人工智能的子领域。神经网络和深度学习是机器学习的特定领域。在学习神经网络和深度学习之前,你应该熟悉一般的机器学习知识。并非所有的神经网络都是深度学习模型。让我详细解释一下每个术语。

文章图片
#人工智能#机器学习#深度学习 +1
AI界的拼多多-中国人工智能初创公司DeepSeek如何与硅谷巨头竞争

仅此一点就堪称一个里程碑。在一篇解释该技术研发过程的研究论文中,DeepSeek的工程师表示,他们仅使用了领先人工智能公司训练其系统所需的高度专业化计算机芯片的一小部分。斯托伊卡博士和他的学生最近打造了一个名为Sky - T1的人工智能系统,在某些基准测试中,其性能可与OpenAI最新的名为OpenAI o1的系统相媲美。“有600万美元可用于投入的公司数量,远远多于有1亿美元或10亿美元可用于投

文章图片
#人工智能#AI#DeepSeek
2025年助力拿下高薪工作的十大人工智能认证

想象一下:你一直在浏览招聘网站,梦想着获得一份年薪六位数的人工智能专家职位。但现实却很残酷——竞争激烈,雇主们在寻找既有又有的候选人。那么,你该如何脱颖而出呢?人工智能认证就是你的秘密武器。它们提供专业培训,帮助你掌握实用技能,并向雇主证明你的专业能力。无论你是刚刚起步,还是希望提升自己,这些认证都能赋予你竞争优势,助你获得理想工作。以下是2025年你应该考虑的十大人工智能认证,它们能为你开启人工

文章图片
#人工智能
    共 35 条
  • 1
  • 2
  • 3
  • 4
  • 请选择