用什么都重名个人主页

@weixin_48389642

用什么都重名

2023-04-02 16:07:52 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【Dify 实战踩坑】工作流可运行但 MCP 服务部署失败（503）的问题定位与彻底解决

在阿里云服务器上部署Dify服务时，MCP服务发布失败。经排查发现Docker容器无法通过公网IP访问宿主机的8083端口，主要原因是Docker默认网络配置阻止了容器到宿主机的通信。

#docker #人工智能

Qwen3 模型本地部署与应用

阿里推出第三代Qwen3大模型系列，包含8个参数规模从0.6B到235B的密集型和MoE模型，支持多模态输入和128K超长上下文。

#人工智能 #python

解决 Ubuntu 环境下 ffmpeg 安装依赖问题（FileNotFoundError: ffprobe 错误处理）

本文介绍了解决pydub音频处理时出现"FileNotFoundError:ffprobe"错误的多种解决方法。

#ubuntu #linux #运维

RAG中的三大召回方式详解

本文介绍了三种RAG系统中常用的召回策略：1）BM25稀疏召回，基于词频统计的快速检索方法，适合文档匹配但缺乏语义理解；2）BCE向量召回，通过双塔模型实现语义搜索，效果更好但需要训练数据；3）关键词召回，基于规则匹配的简单方法，适合结构化场景但扩展性差。三种方法各具特点，可根据实际场景需求选择使用，其中BM25适合通用检索，BCE适合语义搜索，关键词召回则适用于规则明确的垂直领域。

Promptfoo工具详解

promptfoo是一款开源的LLM评估工具，主要功能包括提示词对比测试、模型性能评估和安全测试。它支持多模型提供商（如OpenAI、Anthropic等）和本地部署模型，提供自动化断言检查、红队测试等功能。通过YAML配置文件，用户可以设置测试用例、提示词模板和评估标准，使用命令行工具运行评估并查看结果。promptfoo适用于开发者系统性地测试不同提示词版本和模型表现，但其标准化评估流程也可根

#python #人工智能

深入剖析 RAG 检索系统中的召回方式：BM25、向量召回、混合策略全解析

RAG（检索增强生成）系统通过结合信息检索与文本生成技术提升大模型回答的准确性。其中，召回作为第一步，直接影响系统性能。本文系统介绍了三种核心召回方式：基于关键词匹配的BM25稀疏召回、利用语义向量的BCE稠密召回，以及融合两者的混合召回。

#人工智能 #RAG #回归

Attu-Milvus向量数据库可视化工具

本文介绍了Milvus向量数据库的可视化管理工具Attu的两种安装方式：通过Docker容器启动（运行指定命令并设置相关参数）或下载桌面版程序安装。同时说明从Milvus v2.5.0版本开始内置的WebUI工具，可通过浏览器访问9091端口查看数据库详情、管理任务等。Attu作为开源工具，为Milvus提供了便捷的图形化管理界面，支持对集合、索引等核心功能的高效操作。

#milvus

Ollama安装及使用Ollama部署大模型

Ollama是一个开源本地大语言模型运行平台，支持Docker部署和API调用。

#自动化

设置 Ollama 容器自动重启和模型自动加载的方法

本文介绍了两种实现Docker容器自动启动的方法，以及针对模型加载问题，提出了自动加载脚本方案。

#人工智能

【深度解析】三大Transformer架构：Encoder-only、Decoder-only与Encoder-Decoder

NLP三大模型架构解析：Transformer衍生出的Encoder-only、Decoder-only和Encoder-Decoder三大主流架构各具特色。

#transformer #深度学习 #人工智能

共 25 条

请选择