小路739 个人主页

@weixin_60904031

小路739

2022-12-28 17:38:46 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

AI- RAG笔记05 - 生成

方案适合场景优点局限Prompt 要求 JSON简单结构化输出实现成本最低稳定性一般，需要自己解析校验字段较明确的信息抽取比纯指令更清晰仍依赖模型遵循提示Python 应用内结构化抽取能生成格式指令并自动解析格式错误时仍需重试策略Pydantic 模型强类型结构化结果字段、类型、描述集中管理Schema 设计质量很关键RAG 响应需要结构化与检索和响应合成结合好依赖 LlamaIndex 工作流需

#人工智能

拷打AI-手撕Dubbo

框架内部能力都有了之后，最后要解决使用体验。所以新增第一版没有直接引入真实 Spring，而是用扫描对象上的 @DubboService创建 ServiceConfig 并 export扫描字段上的 @DubboReference创建 ReferenceConfig 并 get 代理反射注入字段Provider 声明服务Consumer 声明引用框架负责中间过程这一步和前面的对外暴露意图对内封装过

本文为个人学习笔记整理，项目来源。

本文为个人学习笔记整理，项目来源。

本文为个人学习笔记整理，项目来源。

本文学习来源个人学习笔记整理总结，有错误或者遗漏希望大家指正。

RAG 的关键不只是“检索”，而是“怎么把用户问题变成适合检索的问题”。用户问题 -> 向量检索 -> LLM 回答用户问题-> 判断意图-> 改写 / 拆分 / 结构化 / 路由-> 选择合适检索方式-> 检索后重排 / 压缩 / 校正-> 再生成答案也就是查询时优化。

#人工智能

AI- RAG笔记03 - 索引构建

Embedding 是 RAG 检索的语义基础。向量是语义坐标语义相近，向量距离更近文档和查询必须使用同一个或兼容的 Embedding 模型检索模型通常通过对比学习等方式，让 query 和相关文档靠近多模态 Embedding 的重点是跨模态对齐，不是简单各自转向量。

#人工智能

AI- RAG笔记02 - Load Chunking

Load 是把原始资料变成可处理的知识原料。Chunking 是把知识原料设计成适合检索的知识单位。文件是否能读出来。内容是否完整准确。结构是否被识别。噪声是否被清理。元数据是否保留。chunk 是否语义完整。chunk 是否主题集中。chunk 是否长度合适。chunk 是否能被问题召回。chunk 是否带有可溯源 metadata。

#人工智能

共 11 条

请选择