logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【Dify 实战踩坑】工作流可运行但 MCP 服务部署失败(503)的问题定位与彻底解决

在阿里云服务器上部署Dify服务时,MCP服务发布失败。经排查发现Docker容器无法通过公网IP访问宿主机的8083端口,主要原因是Docker默认网络配置阻止了容器到宿主机的通信。

#docker#人工智能
Qwen3 模型本地部署与应用

阿里推出第三代Qwen3大模型系列,包含8个参数规模从0.6B到235B的密集型和MoE模型,支持多模态输入和128K超长上下文。

#人工智能#python
解决 Ubuntu 环境下 ffmpeg 安装依赖问题(FileNotFoundError: ffprobe 错误处理)

本文介绍了解决pydub音频处理时出现"FileNotFoundError:ffprobe"错误的多种解决方法。

#ubuntu#linux#运维
RAG中的三大召回方式详解

本文介绍了三种RAG系统中常用的召回策略:1)BM25稀疏召回,基于词频统计的快速检索方法,适合文档匹配但缺乏语义理解;2)BCE向量召回,通过双塔模型实现语义搜索,效果更好但需要训练数据;3)关键词召回,基于规则匹配的简单方法,适合结构化场景但扩展性差。三种方法各具特点,可根据实际场景需求选择使用,其中BM25适合通用检索,BCE适合语义搜索,关键词召回则适用于规则明确的垂直领域。

Promptfoo工具详解

promptfoo是一款开源的LLM评估工具,主要功能包括提示词对比测试、模型性能评估和安全测试。它支持多模型提供商(如OpenAI、Anthropic等)和本地部署模型,提供自动化断言检查、红队测试等功能。通过YAML配置文件,用户可以设置测试用例、提示词模板和评估标准,使用命令行工具运行评估并查看结果。promptfoo适用于开发者系统性地测试不同提示词版本和模型表现,但其标准化评估流程也可根

#python#人工智能
深入剖析 RAG 检索系统中的召回方式:BM25、向量召回、混合策略全解析

RAG(检索增强生成)系统通过结合信息检索与文本生成技术提升大模型回答的准确性。其中,召回作为第一步,直接影响系统性能。本文系统介绍了三种核心召回方式:基于关键词匹配的BM25稀疏召回、利用语义向量的BCE稠密召回,以及融合两者的混合召回。

#人工智能#RAG#回归
Attu-Milvus向量数据库可视化工具

本文介绍了Milvus向量数据库的可视化管理工具Attu的两种安装方式:通过Docker容器启动(运行指定命令并设置相关参数)或下载桌面版程序安装。同时说明从Milvus v2.5.0版本开始内置的WebUI工具,可通过浏览器访问9091端口查看数据库详情、管理任务等。Attu作为开源工具,为Milvus提供了便捷的图形化管理界面,支持对集合、索引等核心功能的高效操作。

#milvus
Ollama安装及使用Ollama部署大模型

Ollama是一个开源本地大语言模型运行平台,支持Docker部署和API调用。

#自动化
设置 Ollama 容器自动重启和模型自动加载的方法

本文介绍了两种实现Docker容器自动启动的方法,以及针对模型加载问题,提出了自动加载脚本方案。

#人工智能
【深度解析】三大Transformer架构:Encoder-only、Decoder-only与Encoder-Decoder

NLP三大模型架构解析:Transformer衍生出的Encoder-only、Decoder-only和Encoder-Decoder三大主流架构各具特色。

#transformer#深度学习#人工智能
    共 25 条
  • 1
  • 2
  • 3
  • 请选择