logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【必学收藏】AI Agent完全指南:大模型的革命性延伸,从被动生成到主动执行的跨越

AI Agent是大模型与工具结合的智能程序,能自主感知和改变外界环境,实现任务自动化。主要有两种运行模式:ReAct模式采用"思考—行动—观察"循环,适合简单明确任务;Plan-And-Execute模式采用"先规划再执行"策略,适合复杂多步骤任务。AI Agent推动大模型从"被动生成"到"主动执行"的跨越,将在编程、搜索、办公等领域广泛应用。

文章图片
#人工智能#产品经理#语言模型 +1
【收藏必看】大模型的“超能力“揭秘:Transformer架构与注意力机制工作原理详解

文章详解了Transformer架构及其注意力机制,解释大模型如何通过Query-Key-Value计算词间相关性,实现上下文理解。类比人类注意力机制,分析了"幻觉"和"失焦"问题,并提出了精简Context、位置策略、多步推理等优化方法,帮助开发者理解大模型核心原理。

文章图片
#transformer#深度学习#产品经理 +2
收藏必看!从RAG到GraphRAG:大模型复杂推理的终极解决方案,小白也能搞懂的可解释AI进阶指南

本文深入剖析了大模型检索增强生成技术的演进,从传统RAG到GraphRAG,揭示了后者通过引入知识图谱实现"实体—关系—路径"结构化证据链,在复杂推理、可解释性和可追溯性方面的显著优势。文章系统介绍了GraphRAG的实现路径、关键模块及面临的挑战,并针对不同场景提出了"轻量本体先行+GraphRAG增量生长+HybridRAG控时延"的选型策略,为构建可信智能系统提供实践指导。

文章图片
#人工智能#产品经理#语言模型
Transformer 到底在算什么?用矩阵视角看透 AI 的“思考”过程,一文讲清!

你可能还有一个疑问不是说多头注意力机制吗?为什么上述只讲的是单头注意力机制?其实很简单,当我们已经充分认识单头注意力机制了,对于多头注意力机制就很好理解了。我们之前知道对于一个16×512维的矩阵,每个词有一个512维的特征向量,用一组qkv来学习会不会产生学习不充分的问题,这组QKV可能对于前128维的特征向量作用更好,对后面的特征不好。这就提出了多头注意力机制,通过多个视角来观察特征。比如我们

文章图片
#人工智能#transformer#产品经理 +1
一文读懂AI大模型常用名词意义

通用大模型L0:是指可以在多个领域和任务上通用的大模型。它们利用大算力、使用海量的开放数据与具有巨量参数的深度学习算法在大规模无标注数据上进行训练,以寻找特征并发现规律,进而形成可“举一反三"的强大泛化能力,可在不进行微调或少量微调的情况下完成多场景任务,相当于AI完成了“通识教育”行业大模型L1:是指那些针对特定行业或领域的大模型。它们通常使用行业相关的数据进行预训练或微调,以提高在该领域的性能

文章图片
#人工智能#面试#算法 +2
AI大模型时代什么人才最抢手?哪些是万金油岗位?如何转行大模型?

近些年迅速发展的大规模预训练模型技术,正在让机器逐渐具备像人一样的认知智能,但是也对算法、系统、算力提出新的需求和挑战。那么,未来 AI 的架构将会是怎样的?大概从去年,进入了另外一个新的时代——大模型时代。在大模型时代,算法人员无法从头训练一个模型,而是需要依赖于基础模型,并且以基础模型去适配下游应用场景。

文章图片
#人工智能#算法#机器学习 +1
全球大模型应用浪潮:国内外现状与趋势展望

近年来,大模型技术已成为全球科技领域的新热点,持续引领着智能化产业的发展方向。随着技术的不断迭代升级和政策的积极引导,大模型正逐步从理论研究走向实际应用,展现出巨大的行业潜力和社会价值。美国在大模型商业化应用方面处于全球领先地位,其成功主要归因于完善的基础设施、充沛的算力和技术领先的企业。OpenAI作为行业佼佼者,以其GPT系列模型为基础,为个人、开发者和企业提供了强大的应用能力,推动了各行各业

文章图片
#人工智能#大数据#语言模型 +1
大模型产品经理必备:从技术边界到落地实操,附完整学习资源,建议收藏!

本文系统介绍AI产品打造的底层逻辑与落地步骤,涵盖技术边界分析、用户需求挖掘、产品设计与验证、团队组建及产品经理能力升级。文章强调"躬身入局"实践理念,提供从零到精通的大模型学习路径,包括基础理论、RAG开发、Agent设计等五大模块,以及行业报告、面试题等实用资源,帮助程序员和小白快速掌握AI大模型技术,抓住AI时代机遇。

文章图片
#产品经理#学习#人工智能 +1
【强烈推荐】大模型奖励模型(RM)完全指南:结构解析与代码实现,建议收藏学习!

本文详细介绍了大语言模型训练中的奖励模型(RM)结构、训练流程及应用。奖励模型通过复制SFT模型主干网络并替换LM Head为输出单一分数的Reward Head构建。训练过程包括构造数据、人类反馈打分、模型输出奖励值及使用Pairwise Loss进行训练。奖励模型主要用于排序生成结果和作为RLHF中强化学习的评价环境,文章还提供了相关代码实现。

文章图片
#学习#人工智能#产品经理 +1
【必看】大模型业务应用全攻略:程序员入门到精通的技术路线图

本文详解了大模型业务落地的四种模式:嵌入式、辅助式、代理式和群体式,以及PE、RAG、FT等六种核心技术。根据业务类型和数据条件,可选择不同技术方案:垂类业务适合微调,通用业务以提示工程和智能体为主。文章提供了从简单到复杂的升级路线图,帮助开发者根据需求选择合适的大模型应用方式。

文章图片
#人工智能#产品经理#语言模型
    共 2102 条
  • 1
  • 2
  • 3
  • 211
  • 请选择