忘川132 个人主页

@kk_cola

忘川132

2022-06-24 21:23:36 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

RAG系统构建全流程

本文展示了RAG向量数据库构建的全流程Mermaid流程图，涵盖6个核心阶段：数据预处理（多源数据采集、OCR识别、质量校验）、语义化文档切分（结构识别、重叠窗口设置）、批量文本向量化（模型选型、多线程处理）、向量入库与索引构建（数据库选型、混合检索配置）、效果验证与调优（精度测试、参数迭代）以及全生命周期运维（自动化同步、持续监控）。该流程图支持主流平台直接渲染，完整呈现了从数据输入到持续优化的

#RAG

AI大模型调用全链路技术规范与学习手册

本文档《AI大模型调用全链路技术规范与学习手册》系统阐述了大模型应用开发的全流程技术规范。主要内容包括：基础认知部分：修正新手常见误区，明确大模型调用的最小闭环链路（输入预处理→Prompt构建→LLM推理→输出后处理）及各节点核心价值。生产级全链路设计：提出合规、高可用等五大原则，详细拆解输入前置层、Prompt工程层等5大阶段的执行流程与必备能力，并列出关键监控指标。核心模块深度解析：

#人工智能 #学习 #网络

django和gin的对比

Django使用基于线程的请求处理方式，一个线程处理一个请求。因此，它的并发处理能力取决于服务器所能够承受的线程数。如果服务器的CPU和内存资源充足，可以支持更多的请求并行处理。从数据上看，Gin在比Django更高的吞吐量和更短的延迟方面表现更好。在基准测试方面，Gin通常比Django更快。总的来说，Gin在并发和性能方面具有优势，但要注意的是，这些结果也取决于实际应用场景和负载。Gin使用基

#人工智能 #学习 #网络

PageIndex 对现有 RAG 技术的影响：核心价值、优势与局限性

摘要：PageIndex是VectifyAI提出的创新RAG框架，通过文档原生结构（目录/章节/页码）构建树状索引，替代传统向量嵌入方法。其优势包括：结构化检索提升专业文档精度、无需向量降低部署成本、灵活知识融合；但存在文档结构依赖强、LLM调用成本高等局限。该方案特别适合长文档检索，与传统向量RAG形成互补，建议采用混合检索策略。PageIndex为专业场景RAG落地提供了新思路，推动了从碎片化

#人工智能

上下文自动评估价值方案

本文提出了一种智能上下文管理系统，通过分级评估和压缩优化长对话场景下的上下文管理。系统采用四层分类（用户指令、关键状态、中间推理、失败记录）和动态打分模型，结合多级阈值触发机制，实现差异化的上下文处理策略。技术实现上兼容MapGPT论文思想，采用模块化设计，支持规则过滤与大模型分类相结合。测试显示，相比传统方案可降低40%的token消耗和38%的响应延迟，关键信息召回率提升至96%。系统支持多种

#人工智能 #机器学习 #算法

Agent独立记忆机制四层架构设计与项目实战学习文档

本文提出一种面向AI Agent的四层记忆架构方案，通过分层存储和协同调度解决大模型对话中的上下文窗口限制、注意力稀释和跨会话记忆丢失等问题。该架构包含：核心记忆层（固定角色规则）、瞬时记忆层（当前对话核心）、短期记忆层（单会话结构化）和长期记忆层（跨会话语义）。文档详细阐述了各层设计原理、存储机制和召回策略，并展示了一个Python研发助手Agent的实现案例。实际测试表明，该方案可降低76.9

#学习 #大数据

到底了