
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了DuReader-Retrieval数据集包含query(问题)、positive_passages(准确答复)和negative_passages(不准确答复)三个部分,并通过具体案例展示了数据格式的特点。作者特别
通过引入dify-import项目,支持读取高质量的txt制度类文件批量导入父子分段dify知识库并通过语言模型的推理产生相关关键字生成字段。
本文介绍了如何调用本地Qwen3-Embedding模型接口,包括基础模型和LoRA微调模型的加载方法。文章指出嵌入模型微调对提升SQL生成准确率至关重要,并提供了接口启动和使用方法。通过调整参数可选择加载基础模型或微调模型,并给出了关键代码示例。文章还展示了接口启动和调试的实际操作截图,为理解嵌入模型微调及应用提供了实践参考。
使用dify的workflow引入腾讯云的speech to text 大模型技术,实现mp3文件的语音转文字服务测试。

本地微调Qwen3-Embedding模型提升RAG召回率 本文针对通用嵌入模型在行业应用中召回率不足的问题,介绍了使用peft对Qwen3-Embedding-0.6B进行参数微调的方法。通过构建包含语义关联句对的数据集,采用3轮训练优化模型参数,最终生成的LoRA适配器权重使模型关联度判断更精准:相似句对的得分提升(如"Earth revolves around Sun"与
本文对比了Qwen3-Embedding与nomic-embed-text的召回效果。使用同一文档在相同配置条件下测试,nomic-embed-text仅召回2条关联度低的记录,导致大模型回答质量较差。实验表明nomic-embed-text的中文语义嵌入效果明显不如Qwen3-Embedding,相关前置知识包括Qwen3-Embedding部署方法和召回效果评估。结论指向nomic-embed
Dify的QA分段处理方式是将question和keywords内容进行向量化存储。根据相关实现逻辑,分段信息保存在特定URL路径下,通过datasets_segments.py中的DatasetDocumentSegmentUpdateApi接口处理更新操作。该方案明确了哪些数据进入向量库,但不包含answer内容。
dify1.3.1安装插件报错PrivkeyNotFoundError
使用uv工具解决python繁琐的依赖关系

本文描述一个读取excel文件批量导入dify知识库QA分段的解决方案








