datian1234 个人主页

@datian1234

datian1234

2022-06-24 21:22:58 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

一文讲清！万字详解RAG进阶之路：Post-Retrieval与Generation优化技术，零基础小白收藏这一篇就够了！！

本文详细解析RAG系统的Post-Retrieval和Generation阶段优化技术。Post-Retrieval阶段通过重排(Re-Ranking)和过滤(Filtering)提升检索内容质量，包括无监督/监督重排序及多种过滤策略。Generation阶段聚焦增强模型对检索资料的理解吸收和个性化定制。文章系统介绍了RAG评估方法和业界主流技术栈，展望了从静态流水线向动态智能体演进的趋势，为RA

#人工智能 #RAG

一文讲清！万字详解RAG进阶之路：Post-Retrieval与Generation优化技术，零基础小白收藏这一篇就够了！！

#人工智能 #RAG

必收藏！一文搞懂Transformer架构：从注意力机制到LLM推理全流程（手把手教学）

本文详解Transformer架构这一大模型核心骨架，深入剖析注意力机制(QKV三要素)原理及编码器-解码器结构，并以"中国的首都是什么"为例，从分词、嵌入到预测答案的完整流程，全面解析LLM推理机制，帮助读者理解大模型工作原理。

#transformer #人工智能

手把手教你用LLaMA-Factory微调Qwen3大模型，全程干货，小白也能轻松学会！！

#人工智能

为什么你的AI总是“失忆“？上下文工程深度解析，看完这一篇你就知道了！

本文介绍了上下文工程的概念、重要性及实践方法。与提示工程不同，上下文工程聚焦于"给什么"而非"怎么说"，旨在解决AI的"上下文衰减"问题。由于AI注意力预算有限且更擅长短任务，需通过精准精简素材、按需即时检索信息，以及采用上下文压缩、结构化笔记和子智能体架构等策略，让AI用最少的关键信息高效完成任务。上下文工程重塑了人与AI的协作关系，将AI视为存在注意力极限的队友，而非无所不能的机器。

#人工智能

【收藏必备】AI Agent全面指南：从分类到开发模式详解，零基础小白收藏这一篇就够了

本文系统介绍了AI Agent的分类体系（基于自主程度、迭代方式等）、五种主要开发模式（反思、工具、ReAct、Planning、Multi-Agent）及其应用场景。详细分析了各类Agent的产品形态、功能模块，以及在生产落地中面临的私域知识注入、可信规划等挑战及解决思路，为AI Agent开发者提供了完整的技术框架和实践指导。

#人工智能

Pytorch官网Pytorch.org最近发布了一本开源书深度学习《Deep Learning with PyTorch》，共141页pdf，限时开放，涵盖了深度学习和Pytorch库的介绍，预训练网络，张量，学习机制，数据神经网络学习。书里面有详实的代码，是入门学习Pytorch深度学习必备器物，不得不看！作者介绍：过去15年一直在硅谷工作，是一名软件工程师，过去7年一直是一家制造医疗设备软件

#深度学习 #pytorch #人工智能 +1

【收藏必学】图约束推理(GCR)：消除大模型幻觉，实现知识图谱零样本迁移的新范式

Graph-constrained Reasoning (GCR)是一种新型框架，通过构建KG-Trie索引将知识图谱结构融入LLM解码过程，约束生成忠实于KG的推理路径，结合轻量级KG专用LLM生成推理路径与假设答案，再利用通用LLM进行归纳推理。该方法实现零幻觉、高精度的KG推理，在WebQSP、CWQ等数据集上表现优异，且能在未见KG上实现零样本迁移，准确率较纯LLM提升5%-8%，推理效率

#知识图谱 #人工智能

这次，LLM黑盒被LLM打开了！一文讲清如何理解大模型思维，概念描述？看完这一篇那你就懂了！！

文章综述了通过概念描述解释语言模型的新范式。传统方法依赖固定标签集，无法捕捉模型学到的新概念。概念描述使用LLM生成自然语言解释，描述神经元、注意力头等组件功能。文章探讨了不同层级的描述对象、多种描述生成方法、评估工具箱及研究趋势，指出概念描述使我们能以开放词汇方式理解LLM内部，但仍需结合因果干预确保准确性。

#人工智能

AI Agent时代必备：上下文工程完全指南 - 从提示词到智能上下文管理

文章介绍了Anthropic提出的"上下文工程"概念，这是从传统提示工程演变而来的新方法，关注管理整个上下文状态而非仅编写提示词。文章解释了上下文工程的重要性，因为上下文是一种有限且边际效益递减的资源，并提供了三大核心组件的指导原则：系统提示设计、工具规划和示例使用。此外，还讨论了应对长时程任务的策略，如压缩、结构化笔记和子智能体架构。核心思想是找到最小的高信噪比令牌集，以最大化期望结果的可能性。

#人工智能

共 739 条

请选择