logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LightRAG是什么?都用在什么场景

LightRAG 是一个轻量、高效的 RAG 框架,通过结合知识图谱和向量检索,解决了传统 RAG 的上下文不足和更新成本高的问题。它在法律、学术、金融、医疗、客户支持、教育、多模态等领域有广泛应用,特别适合动态更新和低资源场景。LightRAG(Light Retrieval-Augmented Generation,轻量检索增强生成)是由香港大学数据科学实验室(HKUDS)开发的一个开源框架,

什么是fastmcp 2.0,怎么使用它构建mcp项目

fastmcp 2.0是一个Python框架,用于构建和集成MCP(Model Context Protocol)服务器与客户端,简化LLM应用开发。它通过装饰器快速声明工具/资源/提示模板,自动生成schema,支持多种传输协议(STDIO/HTTP/SSE)。2.0版新增客户端功能、服务组合/代理、OpenAPI转换及内存测试等生产级特性。典型应用包括:20行代码构建MCP服务,通过客户端调用

模型类型:文本生成和嵌入存在什么区别

文本生成(Text Generation)和嵌入(Embedding)是两种不同的自然语言处理(NLP)模型类型,它们的作用、用途和内部机制都有很大的区别。你可以根据你的具体需求选择合适的模型类型。如果你的需求涉及自然语言 SQL 生成、知识检索、语义匹配等,可以使用嵌入模型+生成模型结合的方法。,这些向量可以用于语义相似度计算、搜索、推荐系统、知识检索等任务。:[0.12, -0.34, 0.5

fastmcp做mcp工具服务

本文介绍了fastmcp框架基于STDIO的端到端通信机制。通过Content-Length帧化和JSON-RPC 2.0协议,客户端与服务器通过stdin/stdout管道进行双向通信。核心流程包括初始化握手、工具发现和调用。文章提供了最小服务器示例和客户端测试代码,强调必须正确处理帧格式(包括字节长度和CRLF分隔符)并将日志输出到stderr。还讨论了生产环境的关键注意事项,如并发控制、大结

#开发语言
用 fastmcp 2.0 做一个“短期记忆(Redis)”的 MCP 服务器(Server)+ 一个简单的 Client 例子

本文介绍了一个基于fastmcp 2.0和Redis的短期记忆(MCP)系统实现方案。系统提供5个核心工具函数:mem_put(设置KV)、mem_get(读取KV)、mem_append(追加时间线)、mem_recent(获取最近记录)和mem_clear(清理会话)。设计特点包括会话隔离存储、TTL自动续期、时间线裁剪等。文章包含完整的服务端实现代码(server.py)和客户端调用示例(c

#redis#服务器#bootstrap
模型置信度在实际中的应用

摘要:大语言模型(LLM)中的置信度本质上是基于token生成概率的评估指标,可通过logprobs字段获取。具体实现上,Qwen/DeepSeek/vLLM等框架提供了置信度计算功能,工程应用包括:1)答案可靠性判定(RAG/多Agent系统);2)多模型投票;3)拒答机制;4)提示词优化。置信度与温度参数共同控制生成质量,在实际系统中(如法律检索问答)可设置阈值来保证输出可靠性。该机制能有效降

将两个mp4的文件合并在一起形成新的文件

创建一个临时文本文件video_list.txt,列出两个视频文件的路径(格式为file ‘filename’)。合并成功后,输出文件为merged_video.mp4,位于当前目录。删除临时文件video_list.txt。

#python
vLLM的面试题

vLLM通过连续批处理和优先级调度优化推理性能与资源利用率。其核心创新包括:1)动态批处理技术,通过抢占式调度和Chunked Prefill策略平衡公平性与吞吐量;2)PagedAttention显存管理机制,实现KV Cache的块级分配与复用;3)支持分布式推理和推测解码等加速技术。相比传统静态批处理,vLLM在混合负载场景下可提升GPU利用率达数量级,并支持多租户隔离和长上下文处理(如12

VLLM Server启动的服务,怎么写一个python程序调用

这篇文章介绍了如何启动和调用vLLM服务器的详细步骤。主要内容包括: 启动vLLM服务器的bash脚本配置,包括GPU设置、并行参数、内存利用率等关键参数。 Python调用vLLM服务器的完整代码实现,通过OpenAI兼容API提供多种功能: 简单聊天功能 带历史记录的聊天 流式聊天响应 文本补全功能 交互式聊天界面 代码展示了如何配置客户端、处理错误、实现流式输出以及管理聊天历史记录。 文章提

#python#开发语言
VS Code 开启mcp控制本地的redis

由于 MCP 的具体功能不明确(可能是代理、缓存服务或自定义协议),我们假设 MCP 提供了一种机制来管理或代理本地 Redis 实例。:如果涉及 FastAPI 或其他 Python 项目,确保 Python 3.8+ 已安装,并配置好虚拟环境(参考您之前的 FastAPI 配置)。将 README 中的 JSON 配置复制到 VS Code 的 mcp.json 文件中(通常位于项目根目录或

文章图片
#redis#数据库#缓存
    共 548 条
  • 1
  • 2
  • 3
  • 55
  • 请选择