Dify知识库配置全解析
本文介绍了dify知识库配置的关键选项:1)源文件上传支持多种格式;2)分段设置包括分段符、最大长度和重叠长度;3)父子分段功能实现子块检索返回父块内容;4)索引方式推荐使用高质量的嵌入模型;5)检索向量配置支持全文、向量和混合三种模式,可配合rerank优化结果。测试环节展示了知识库的成功召回,最后解析了RAG技术原理,即通过向量匹配将相关文本嵌入提示词来增强大模型回答。
dify知识库配置选项介绍
源文件上传
首先上传你要作为知识库的资源文件。
本文例子,上传一分ai生成文本作为资源文件。
在账号相关的问题中,注册失败是用户可能遇到的情况之一。如果系统提示 “手机号已被注册”,这通常意味着该手机号之前已经在平台上注册过账号,此时用户可以尝试用该手机号通过 “找回密码” 的方式重新获取账号的访问权限;而如果是因为网络问题导致注册失败,建议用户先检查网络连接状态,尝试切换到更稳定的 Wi-Fi 或移动数据网络后再次进行注册操作。
关于密码找回,用户只需在登录页面找到并点击 “忘记密码” 选项,系统会提供短信验证码或邮箱验证两种方式来帮助重置密码,需要注意的是,发送的验证码有效期为 5 分钟,用户需在有效期内完成验证操作,若超时则需要重新获取验证码。
账号注销则有一定的流程要求,用户在注销账号前,必须先解绑所有关联的支付方式,这是为了保障用户的资金安全,避免后续出现不必要的纠纷,完成解绑后,在 “设置 - 账号安全” 页面中提交注销申请,提交后系统会进入一个 72 小时的公示期,在这 72 小时内如果没有异议,账号注销操作将正式完成。
在订单问题方面,订单查询的方式较为灵活,用户可以在 “我的 - 全部订单” 页面中,直接输入订单号进行精准搜索,也可以根据下单时间来筛选查找相关订单;另外,未付款的订单系统会为用户保留 24 小时,超过这个时间未付款的话,订单将自动取消,用户若仍需购买,需要重新下单。
修改收货信息有时间限制,只有在订单尚未发货的情况下,用户才能在订单详情页点击 “修改地址” 进行操作,支持修改收件人姓名、联系电话以及收货地址等信息,一旦订单已经发货,出于物流流程的稳定性和安全性考虑,暂不支持修改收货信息。
取消订单的情况分为两种,未发货的订单,用户可以直接在订单页面点击 “取消订单”,取消后相关的退款会在 1-3 个工作日内按照原支付路径退回用户的账户;而已发货的订单,用户需要先向快递员拒收包裹,待包裹退回商家后,再申请取消订单,后续退款流程将在商家确认收到退回包裹后启动。
支付与退款环节中,支付失败可能由多种原因导致,用户首先可以检查所使用的支付方式余额是否充足,以及银行卡的状态是否正常,比如是否处于挂失、冻结等状态,也可以尝试更换微信或支付宝等其他支付方式重新进行支付;如果系统显示 “系统繁忙”,可能是当时支付系统压力较大,建议用户稍后再试。
退款时效根据不同的情况有所区别,取消订单的退款一般会在 1-3 个工作日到账,而退货退款则需要等待卖家确认收到退回的货物后,再经过 3-5 个工作日完成退款,具体的到账时间还会受到银行处理速度的影响,不同银行的处理时间可能存在差异。
退款查询的路径清晰,用户可以在 “我的 - 退款记录” 中查看退款的实时进度,如果超过了相应的时效仍未收到退款,用户可以联系客服,并提供相关的订单号,客服会协助查询具体情况并进行处理。
物流配送方面,物流跟踪服务在订单发货后即可使用,用户在订单详情页能够查看实时的物流信息,这些信息包括负责配送的快递公司名称、快递单号以及包裹当前所在的位置等,方便用户及时了解包裹的运输状态。
若遇到配送延迟的情况,即包裹超出了预计的送达时间仍未收到,用户可以联系客服进行催促,客服会与对应的快递公司进行沟通协调,争取让包裹得到优先派送,以尽快送达用户手中。
关于包裹破损或丢失的处理,用户在签收包裹时如果发现有破损情况,有权拒绝签收,同时需要拍照留存相关证据,然后联系客服申请补发商品或退款;如果包裹被确认丢失,平台将按照订单的实际金额为用户进行全额赔付,保障用户的合法权益。
商品售后政策中,七天无理由退货是一项基本保障,前提是商品未拆封且不影响二次销售,用户在收到商品后的 7 天内可以申请退货,不过需要注意的是,除了商品存在质量问题的情况外,退货所产生的邮费需要由用户自行承担。
当收到的商品存在质量问题时,用户可以拍摄包含商品细节和订单信息的照片发送给客服,客服在确认情况属实后,将支持为用户提供免费的退换服务,并且来回的邮费均由商家承担,无需用户额外支付。
保修期查询方面,平台上的大部分商品保修期为 1 年,但具体的保修期限还需以商品详情页中的说明为准,在保修期内,用户如果发现商品出现非人为的质量问题,可以申请免费维修或更换相关配件。
联系客服的渠道多样,在线客服的服务时间为工作日 9:00-21:00,非工作日 10:00-18:00,用户可以在 “我的 - 客服中心” 直接发起咨询,一般情况下,客服的回复时间不会超过 3 分钟;电话客服的服务时间与在线客服一致,用户可以拨打 400-XXX-XXXX 进行咨询,在高峰期可能会出现需要排队的情况,敬请用户耐心等待。
如果用户对服务不满意,有两种反馈渠道,一是在与客服的对话结束后直接提交评价,二是在 “设置 - 意见反馈” 中详细说明具体情况,工作人员会在 24 小时内对用户的反馈进行回复和处理。
分段设置
- 分段表示符
默认的是\n\n,也就是一个空行,将文本按照\n\n拆分,也可以自定义标识符填写,所以在上传文档时就添加标识符进行切割,对于后续的效果越好。 - 分段最大长度
每个文本段最大长度而已。 - 分段重叠长度
设置分段之间的重叠长度可以保留分段之间的语义关系,提升召回效果。建议设置为最大分段长度的 10%-25%。
例如:这里设置500分段,100重叠。可以看到有重叠的地方。
父子分段
这种是,利用子块作为检索条件,如果匹配,那么将整个父块嵌入系统提示词中。
默认\n\n切分父块,\n会切分为子块。
例子:
// 父1
123 // 子1
345 // 子2
// 父2
789 // 子3
987 // 子4
// 如果输入123,那么会匹配子1,返回父1。也就是123 456。
其他设置与普通分块相同。
索引方式
高质量就是使用嵌入模型,经济就是咱们传统的倒排搜索而已。正常咱们肯定是选高质量,不然还搞啥知识库呢。
embedding模型,也就是向量化模型,将文本转化为机器可以识别的带有语意关系的向量存放到向量数据库中。
选用不同的模型,向量的效果不同。
检索向量配置
三种向量方式。
全文:就是倒排关键字查询。
向量:通过与数据库中所有向量的相似度匹配。
混合:两种结合。
rerank:在相识度召回后,会选出很多文本块,通过rerank模型选出前topk个文档作为最终返回嵌入的结果。也可以设置score,设定一个相识度阈值,越高,那么越相似的才会返回。这两个条件可以同时存在。
不同的rerank计算重排的分数计算方式不同。
测试
这里添加我们的知识库。
发送和知识库相关query提问,可以看到成功召回。
原理解析:
下面是调用原文。
原理其实非常简单,就是找出和你提问最相关的几个文本块,嵌入到系统提示词中,再调用大模型。
你可以理解rag就是丰富你的提示词用的。当然里面还涉及一些向量匹配之类的底层原理,这里将不再赘述。
SYSTEM
Use the following context as your learned knowledge, inside <context></context> XML tags.
<context>
在账号相关的问题中,注册失败是用户可能遇到的情况之一。如果系统提示 “手机号已被注册”,这通常意味着该手机号之前已经在平台上注册过账号,此时用户可以尝试用该手机号通过 “找回密码” 的方式重新获取账号的访问权限;而如果是因为网络问题导致注册失败,建议用户先检查网络连接状态,尝试切换到更稳定的 Wi-Fi 或移动数据网络后再次进行注册操作。
关于密码找回,用户只需在登录页面找到并点击 “忘记密码” 选项,系统会提供短信验证码或邮箱验证两种方式来帮助重置密码,需要注意的是,发送的验证码有效期为 5 分钟,用户需在有效期内完成验证操作,若超时则需要重新获取验证码。
账号注销则有一定的流程要求,用户在注销账号前,必须先解绑所有关联的支付方式,这是为了保障用户的资金安全,避免后续出现不必要的纠纷,完成解绑后,在 “设置 - 账号安全” 页面中提交注销申请,提交后系统会进入一个 72 小时的公示期,在这 72 小时内如果没有异议,账号注销操作将正式完成。
支付与退款环节中,支付失败可能由多种原因导致,用户首先可以检查所使用的支付方式余额是否充足,以及银行卡的状态是否正常,比如是否处于挂失、冻结等状态,也可以尝试更换微信或支付宝等其他支付方式重新进行支付;如果系统显示 “系统繁忙”,可能是当时支付系统压力较大,建议用户稍后再试。
退款时效根据不同的情况有所区别,取消订单的退款一般会在 1-3 个工作日到账,而退货退款则需要等待卖家确认收到退回的货物后,再经过 3-5 个工作日完成退款,具体的到账时间还会受到银行处理速度的影响,不同银行的处理时间可能存在差异。
退款查询的路径清晰,用户可以在 “我的 - 退款记录” 中查看退款的实时进度,如果超过了相应的时效仍未收到退款,用户可以联系客服,并提供相关的订单号,客服会协助查询具体情况并进行处理。
物流配送方面,物流跟踪服务在订单发货后即可使用,用户在订单详情页能够查看实时的物流信息,这些信息包括负责配送的快递公司名称、快递单号以及包裹当前所在的位置等,方便用户及时了解包裹的运输状态。
</context>
When answer to user:
- If you don't know, just say that you don't know.
- If you don't know when you are not sure, ask for clarification.
Avoid mentioning that you obtained the information from the context.
And answer according to the language of the user's question.
你是一个客服。
USER
密码找回
ASSISTANT
如果您需要找回密码,可以按照以下步骤操作:
1. 在登录页面点击"忘记密码"选项
2. 选择通过短信验证码或邮箱验证方式找回
3. 系统会发送验证码到您注册时使用的手机号或邮箱
4. 请注意:验证码有效期为5分钟,请及时输入
5. 验证通过后即可设置新密码
如果遇到任何问题,可以随时联系客服协助处理。

为武汉地区的开发者提供学习、交流和合作的平台。社区聚集了众多技术爱好者和专业人士,涵盖了多个领域,包括人工智能、大数据、云计算、区块链等。社区定期举办技术分享、培训和活动,为开发者提供更多的学习和交流机会。
更多推荐
所有评论(0)