logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型基石:Transformer架构完整计算流程详解

文章详细解释了Transformer神经网络架构的原理和计算步骤。首先介绍了Transformer如何取代RNN解决序列建模问题,然后分步骤阐述了输入数据处理(Tokenization、Embedding、Positional Encoding)、Encoder结构(Multi-Head Attention、残差连接、Layer Normalization、Feed-Forward Network

文章图片
#transformer#深度学习#人工智能
RAG不死,只是进化!2026年上下文工程师必备指南,建议收藏学习

RAG技术未死,而是从狂热走向冷静,将演变为"上下文工程"。GraphRAG、AgenticRAG等新技术存在成本高、稳定性问题,长上下文与RAG互补而非替代。2026年RAG将成为AI应用基础设施,智能体RAG、垂直领域RAG等趋势兴起。实际应用中,朴素的RAG配合高质量数据和精细产品设计往往比复杂方案更有效,开发者应从简单开始,持续迭代。

文章图片
#人工智能#RAG
【珍藏干货】RAG技术详解:解决大模型四大痛点,小白到专家必备

【珍藏干货】RAG技术详解:解决大模型四大痛点,小白到专家必备

文章图片
#人工智能
智能体工作流全解析:从AI Agent到实战应用的完整指南

文章系统介绍了智能体工作流(Agentic Workflow)的概念,它结合AI智能体的推理、工具和记忆三大组件,通过规划、工具使用和反思三种模式实现复杂任务的半自主执行。与传统工作流相比,智能体工作流具有更高灵活性和适应性,广泛应用于智能式RAG、研究助理和编码助理等领域。尽管存在复杂性和可靠性挑战,但其自动化和自我纠正能力显著提升了AI处理复杂任务的效率。

文章图片
#人工智能#RAG
AI大模型开发实战指南:从多模态到情感计算(附完整实战代码)

AI大模型开发实战指南:从多模态到情感计算(附完整实战代码)

文章图片
#人工智能#机器学习
什么是大模型?一文读懂大模型的基本概念

大模型是指具有大规模参数和复杂计算结构的机器学习模型。本文从大模型的基本概念出发,对大模型领域容易混淆的相关概念进行区分,并就大模型的发展历程、特点和分类、泛化与微调进行了详细解读,供大家在了解大模型基本知识的过程中起到一定参考作用。前排提示,文末有大模型AGI-CSDN独家资料包哦!大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参

文章图片
#人工智能#机器学习#深度学习 +2
什么是agent智能体?如何不写代码实现agent?

什么是agent智能体?如何不写代码实现agent?

文章图片
#人工智能
本地部署大模型与基于RAG构建私有知识库,一步到位!

以上就是本地大模型部署和基于RAG方案的私有知识库搭建的基本操作。除此之外,还有更多丰富有趣的功能等待探索。如今大模型遍布各行各业、各个领域,基于RAG方案的私有知识库技术也逐渐发展,成为提升个人工作效率与创造潜能的新风尚。本地部署模型意味着用户能在自己的设备上享受即时响应的智能辅助,无需依赖云端,既保护了个人数据隐私,又确保了操作的低延迟与高可靠性。结合RAG方案的私有知识库,则让每位用户能够构

文章图片
#java#人工智能#开发语言 +2
人工智能在医疗领域的应用:大模型如何改变医疗行业

大模型在医疗领域的应用正在深刻改变医疗行业的运作方式。通过疾病诊断、药物研发、个性化治疗和医疗管理等应用场景,AI 技术正在为医疗行业带来前所未有的变革。然而,AI 在医疗领域的应用也面临数据隐私、模型可解释性和伦理法律等挑战。通过不断的技术创新和方法改进,我们可以更好地应对这些挑战,推动医疗行业的发展。

文章图片
#人工智能#深度学习#学习 +2
大模型入门学习:一分钟了解大模型的基础概念知识

根据不同任务的需求,神经网络架构衍生出了多种形态,如前馈神经网络(Feedforward NN)、卷积神经网络(CNN)、循环神经网络(RNN)、长短时记忆网络(LSTM)、门控循环单元(GRU)、自注意力机制(Transformer)等。适用于处理序列数据,如文本、语音和时间序列分析。8.连接 (Connections):在神经网络中,每层神经元与其下一层的所有神经元通常都是全连接的,但在某些特

文章图片
#学习#语言模型#人工智能 +3
    共 463 条
  • 1
  • 2
  • 3
  • 47
  • 请选择