logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Zabbix7.4.8(三):通过Zabbix agent 2监控Docker相关指标

v /var/run/docker.sock:/var/run/docker.sock:ro 挂载 Docker Socket(只读),用于访问 API。它会自动获取宿主机 docker.sock 的组 ID(通常是984或 docker 组),并把容器内的 zabbix 用户加入该组。关键参数:--group-add $(stat -c %g /var/run/docker.sock)/var/

#zabbix#docker#容器
Zabbix7.4.8(二):通过http监控Nginx相关指标

使用 Zabbix 监控 Nginx 是确保 Web 服务稳定性的关键。其核心原理是通过 Nginx 的 stub_status 模块获取服务器的实时状态信息,然后由 Zabbix Agent 采集并上报给 Zabbix Server。Nginx 自带一个名为 ngx_http_stub_status_module 的模块,启用后可通过一个特定 URL(如 /nginx_status)返回简洁的状

#http#nginx#服务器
Zabbix7.4.8(一):通过Zabbix agent 2监控postgresql相关指标

​Zabbix agent 2 是新一代的 Zabbix agent,使用 Go 编写(并复用了一些来自 Zabbix agent 的 C 代码)。其设计目标包括:减少 TCP 连接的数量。提供更高效的检查并发性。通过 plugins 实现轻松扩展,支持使用最少代码实现简单检查,并支持由长时间运行的脚本组成的复杂检查,以及具有周期性报告功能的独立数据收集。作为 Zabbix agent 的替代品,

#zabbix#运维#postgresql
Postgresql17数据库中通过代码安装向量插件:PGVector0.8.1

pgvector 是一个为 PostgreSQL 数据库开发的开源扩展,它使得 PostgreSQL 能够原生支持向量(Vector)数据类型和向量相似性搜索,是构建 AI 应用(尤其是基于大语言模型 LLM 的应用)的关键基础设施。将向量与其余数据一起存储。支持:1.精确和近似最近邻搜索2.单精度、半精度、二进制和稀疏向量3.L2距离、内积、余弦距离、L1距离、汉明距离和雅克卡德距离4.具有Po

#数据库#docker
Coze:Window操作系统部署Coze Studio

Coze Studio,源自服务了上万家企业、数百万开发者的「扣子开发平台」,我们将它的核心引擎完全开放。它是一个一站式的 AI Agent 可视化开发工具,让 AI Agent 的创建、调试和部署变得前所未有的简单。通过 Coze Studio 提供的可视化设计与编排工具,开发者可以通过零代码或低代码的方式,快速打造和调试智能体、应用和工作流,实现强大的 AI 应用开发和更多定制化业务逻辑,是构

#工作流
Vllm-0.10.1:通过vllm bench serve测试TTFT、TPOT、ITL、E2EL四个指标

摘要:本文介绍了在KVM虚拟机环境下使用4张英伟达A6000 GPU进行大模型推理的性能测试,重点关注四个关键指标:首次生成token时间(TTFT)、每个token平均生成时间(TPOT)、token间延迟(ITL)和端到端延迟(E2EL)。测试基于DeepSeek-R1-Distill-Qwen-32B模型,使用vLLM 0.10.1框架,详细说明了参数配置方法(如max-model-len和

#人工智能
vllm0.8.5发布Qwen2.5-Omni-7B,报python3.10/site-packages/transformers/models/autKeyError: ‘qwen2_5_omni‘

当前安装的 HuggingFace Transformers4.51.1 库不支持这种模型结构。这通常是因为该模型是新推出的,而你当前使用的 Transformers 版本尚未包含对该模型的支持。因此需要卸载旧Transformers版本,安装Transformers4.52.3版本。注:不能安装Transformers4.52.4,会导致vllm出现问题。多模态:Qwen2.5-Omni-7B。

Langfuse2.60.3:独立数据库+docker部署及环境变量详细说明

Langfuse 是一个 **开源 LLM 工程** 平台。它帮助团队协作 **开发、监控、评估** 以及 **调试** AI 应用。Langfuse 可在几分钟内 **自托管**,并且经过 **实战考验**。其核心组件包括Web界面、Worker进程、Postgres数据库、Clickhouse存储等。## ✨ 核心特性[LLM 应用可观察性]:为你的应用插入仪表代码,并开始将追踪数据传送到 L

#docker#容器#运维 +2
大模型性能指标的监控系统(prometheus3.5.0)和可视化工具(grafana12.1.0)基础篇

Prometheus是云原生计算基金会项目,是一个系统和服务监控系统。它以给定的时间间隔从配置的目标收集指标,评估规则表达式,显示结果,并在观察到指定条件时触发警报。Prometheus与其他指标和监控系统的区别在于:多维数据模型(由度量名称和键/值维度集定义的时间序列)PromQL,一种强大而灵活的查询语言不依赖分布式存储;单个服务器节点是自主的用于时间序列收集的HTTP拉取模型通过中间网关支持

#prometheus#grafana
FastDeploy2.0:Error reading file: SafeTensorError::MetadataIncompleteBuffer

GPU:4张英伟达A6000python3.10大模型:DeepSeek-R1-Distill-Qwen-32B(aisudio上下载得)执行如下命令:报如下错误:模型文件下载不全。你说模型文件下载不全,可翻来覆去瞅了半天,愣是没看出哪个文件“缺胳膊少腿”——这感觉,就像在满屋子双胞胎里找谁多长了一根头发。模型文件一多,数着数着就眼冒金星,脑瓜子嗡嗡的,真不想重头再下一遍,光是想想,头发都快掉光了

#人工智能
    共 18 条
  • 1
  • 2
  • 请选择