logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【评测】DuReader-Retrieval数据集之初体验

本文介绍了DuReader-Retrieval数据集包含query(问题)、positive_passages(准确答复)和negative_passages(不准确答复)三个部分,并通过具体案例展示了数据格式的特点。作者特别

【部署】读取制度类txt文件导入dify的父子分段知识库

通过引入dify-import项目,支持读取高质量的txt制度类文件批量导入父子分段dify知识库并通过语言模型的推理产生相关关键字生成字段。

【番外篇2】调用本地的Qwen3-Embedding接口

本文介绍了如何调用本地Qwen3-Embedding模型接口,包括基础模型和LoRA微调模型的加载方法。文章指出嵌入模型微调对提升SQL生成准确率至关重要,并提供了接口启动和使用方法。通过调整参数可选择加载基础模型或微调模型,并给出了关键代码示例。文章还展示了接口启动和调试的实际操作截图,为理解嵌入模型微调及应用提供了实践参考。

【评测】免费体验dify工作流模式下腾讯语音转文字speech2text服务

使用dify的workflow引入腾讯云的speech to text 大模型技术,实现mp3文件的语音转文字服务测试。

文章图片
#测试
【番外篇1】本地微调Qwen3-Embedding模型

本地微调Qwen3-Embedding模型提升RAG召回率 本文针对通用嵌入模型在行业应用中召回率不足的问题,介绍了使用peft对Qwen3-Embedding-0.6B进行参数微调的方法。通过构建包含语义关联句对的数据集,采用3轮训练优化模型参数,最终生成的LoRA适配器权重使模型关联度判断更精准:相似句对的得分提升(如"Earth revolves around Sun"与

【评测】Qwen3-Embedding与nomic-embed-text的召回效果对比

本文对比了Qwen3-Embedding与nomic-embed-text的召回效果。使用同一文档在相同配置条件下测试,nomic-embed-text仅召回2条关联度低的记录,导致大模型回答质量较差。实验表明nomic-embed-text的中文语义嵌入效果明显不如Qwen3-Embedding,相关前置知识包括Qwen3-Embedding部署方法和召回效果评估。结论指向nomic-embed

Q: dify的QA分段方式,question、answer和keywords哪些内容进入向量库呢?

Dify的QA分段处理方式是将question和keywords内容进行向量化存储。根据相关实现逻辑,分段信息保存在特定URL路径下,通过datasets_segments.py中的DatasetDocumentSegmentUpdateApi接口处理更新操作。该方案明确了哪些数据进入向量库,但不包含answer内容。

【排错】dify1.3.1插件市场安装报错问题

dify1.3.1安装插件报错PrivkeyNotFoundError

【部署】读取excel批量导入dify的QA知识库

本文描述一个读取excel文件批量导入dify知识库QA分段的解决方案

文章图片
    共 38 条
  • 1
  • 2
  • 3
  • 4
  • 请选择