
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在阿里云服务器上部署Dify服务时,MCP服务发布失败。经排查发现Docker容器无法通过公网IP访问宿主机的8083端口,主要原因是Docker默认网络配置阻止了容器到宿主机的通信。
阿里推出第三代Qwen3大模型系列,包含8个参数规模从0.6B到235B的密集型和MoE模型,支持多模态输入和128K超长上下文。
本文介绍了解决pydub音频处理时出现"FileNotFoundError:ffprobe"错误的多种解决方法。
本文介绍了三种RAG系统中常用的召回策略:1)BM25稀疏召回,基于词频统计的快速检索方法,适合文档匹配但缺乏语义理解;2)BCE向量召回,通过双塔模型实现语义搜索,效果更好但需要训练数据;3)关键词召回,基于规则匹配的简单方法,适合结构化场景但扩展性差。三种方法各具特点,可根据实际场景需求选择使用,其中BM25适合通用检索,BCE适合语义搜索,关键词召回则适用于规则明确的垂直领域。
promptfoo是一款开源的LLM评估工具,主要功能包括提示词对比测试、模型性能评估和安全测试。它支持多模型提供商(如OpenAI、Anthropic等)和本地部署模型,提供自动化断言检查、红队测试等功能。通过YAML配置文件,用户可以设置测试用例、提示词模板和评估标准,使用命令行工具运行评估并查看结果。promptfoo适用于开发者系统性地测试不同提示词版本和模型表现,但其标准化评估流程也可根
RAG(检索增强生成)系统通过结合信息检索与文本生成技术提升大模型回答的准确性。其中,召回作为第一步,直接影响系统性能。本文系统介绍了三种核心召回方式:基于关键词匹配的BM25稀疏召回、利用语义向量的BCE稠密召回,以及融合两者的混合召回。
本文介绍了Milvus向量数据库的可视化管理工具Attu的两种安装方式:通过Docker容器启动(运行指定命令并设置相关参数)或下载桌面版程序安装。同时说明从Milvus v2.5.0版本开始内置的WebUI工具,可通过浏览器访问9091端口查看数据库详情、管理任务等。Attu作为开源工具,为Milvus提供了便捷的图形化管理界面,支持对集合、索引等核心功能的高效操作。
Ollama是一个开源本地大语言模型运行平台,支持Docker部署和API调用。
本文介绍了两种实现Docker容器自动启动的方法,以及针对模型加载问题,提出了自动加载脚本方案。
NLP三大模型架构解析:Transformer衍生出的Encoder-only、Decoder-only和Encoder-Decoder三大主流架构各具特色。







