logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

2026年必学:RAG技术让大模型拥有“开卷考试“能力

RAG技术通过"检索+生成"架构有效解决大语言模型的三大痛点:幻觉问题、知识时效性和私有数据访问。该技术让模型从"闭卷"变为"开卷",在回答问题时先检索外部知识库,再基于检索内容生成回答,显著提升了准确性、实时性和安全性。文章详细解析了RAG的三大流程(索引、检索、生成),比较了其与微调技术的适用场景,并展望了模块化、图谱式和代理式等进阶

文章图片
#人工智能#职场和发展
【后端开发转行大模型应用开发】后端开发者的破局之道:从SpringBoot到大模型工程师,120天实战逆袭指南

摘要:本文揭示了传统后端开发与大模型工程师之间的薪资与技术差距,指出后端开发者转型大模型领域的五大核心优势,包括分布式系统理解、工程化能力等迁移价值。作者提供了120天系统转型方案,涵盖Python基础、PyTorch框架到模型服务化全流程,并给出面试策略和学习资源建议。文章强调后端经验在大模型时代的复用价值,认为通过针对性学习可实现职业跃迁和薪资倍增。

文章图片
#人工智能#语言模型
DeepSeek Engram项目详解:解决大模型知识查找瓶颈的创新方案

DeepSeek Engram项目创新性地将混合专家(MoE)与条件内存结合,解决了Transformer架构缺乏原生知识查找机制的问题。该项目通过Engram模块实现了O(1)复杂度的知识检索,将传统N-gram嵌入现代化,为模型增加了"记忆稀疏性"新维度。这种设计实现了记忆与推理功能的解耦,使模型能更高效地管理海量知识。项目于2026年1月开源,其核心思想是将条件内存作为M

文章图片
#产品经理#人工智能#职场和发展
Agent-as-a-Graph:大模型多智能体系统工具与智能体精准检索新范式

本文提出Agent-as-a-Graph方法,通过构建包含智能体和工具的二分图知识图谱,解决多智能体系统中精准检索的难题。该方法采用向量初筛、类型加权RRF融合和图遍历聚合的三步流程,在LiveMCPBench基准测试中Recall@5提升18.6%至0.83。其创新点在于:1) 将智能体和工具作为平等节点统一建模;2) 提出可调优的类型加权RRF融合算法;3) 具有跨模型泛化能力,在8种不同嵌入

文章图片
#人工智能#职场和发展
AI Agent完全指南:从小白到专家的必学技术,建议收藏!

本文深入解析AI Agent技术,对比其与传统软件的区别,指出AI Agent通过LLM实现智能决策与自主执行。文章探讨Chatbot向AI Agent演进的技术驱动因素(如多工具协作、长期记忆等)和市场诉求,分析单/多智能体系统的应用价值。从感知、推理到行动的学习闭环,揭示AI Agent工作原理,为开发者提供实用指导。随着基模厂商的布局,AI Agent正成为技术竞争新焦点。

文章图片
#人工智能#语言模型
(2025最新)大语言模型(LLM)入门指南!零基础也能学,一篇搞定大模型学习路线!

Github项目上有一个[大语言模型学习路线笔记](https://github.com/mlabonne/llm-course "大语言模型学习路线笔记"),它全面涵盖了大语言模型的所需的基础知识学习,LLM前沿算法和架构,以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识,并推荐了一系

文章图片
#语言模型#人工智能#自然语言处理 +2
从“会聊天“到“会干活“:AI智能体(Agent)技术全解析,带你成为大模型应用高手!

文章探讨了AI从"会聊天"到"会干活"的范式转变,即AI智能体(Agent)的发展。从技术解构(大模型大脑、记忆系统、工具调用等)、应用落地(流程自动化、垂直专家等)、核心挑战(可靠性、长程任务等)和未来趋势(通用化、多模态等)四个维度全面分析了智能体的技术架构、应用场景和发展前景,指出智能体作为"数字同事"将与人类协同工作,是AI发展的重要阶段。

文章图片
#人工智能#深度学习#transformer
LLM大模型技术指南:提示词工程、上下文学习与指令微调,值得收藏!

本文详解大语言模型六大核心技术:提示词工程、上下文学习(零样本/单样本/少样本)和指令微调。文章解释了各项技术概念与应用场景,分析了上下文学习在小模型上效果不佳及占用上下文窗口的局限性,提出指令微调作为解决方案,并讨论了多任务微调和参数高效微调等方法以避免灾难性遗忘。

文章图片
#人工智能#架构#自然语言处理 +2
AI智能体开发的秘密武器:上下文工程四大策略与LangGraph最佳实践!

上下文工程是智能体开发中的关键,包含四大策略:写入(信息持久化)、选择(智能检索)、压缩(摘要裁剪)和隔离(上下文分割)。文章详解LangGraph框架的上下文类型及企业级最佳实践,包括分层管理、注入模式和消息过滤。通过合理上下文管理,可降低Token消耗50-70%,提升响应速度2-3倍,显著优化智能体性能。开发者可从简单消息过滤开始,逐步实现企业级上下文管理。

文章图片
#服务器#数据库#人工智能 +2
大模型基础-模型量化基础,非常详细收藏我这一篇就够了

1.掌握基本的量化数据类型(fp32/fp16/bf16/int8/int4/fp4/nf4)2.对称量化/非对称量化/均匀量化/非均匀量化3.量化尺度(token/tensor/channel)一句话定义量化是什么?

文章图片
#人工智能#算法#机器学习
    共 1101 条
  • 1
  • 2
  • 3
  • 111
  • 请选择