logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【大模型】使用 Xinference 部署本地模型,从GPU服务器到本地知识库搭建Dify【LLM大语言模型(glm-4-9b-chat)、Rerank 模型、Embedding(向量)模型】

本文会用到博主写的一些线上脚本,如果搭建者时纯内网的话,可能需要手动压缩镜像,然后解压镜像,才能正常部署本文从GPU服务器获取、到 nvidia-docker的安装、再到Xinference 部署私有化三个模型,最后搭建dify(供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力,轻松构建和运营生成式 AI 原生应用)、最后再配置实例dify,配置dify实例,整

文章图片
【云馨AI-大模型】大模型部署进阶:Qwen3-30B-A3B + vLLM + Docker Compose全解析(A100显卡实测)

本文详细介绍了使用Docker部署Qwen3-30B-A3B大语言模型的完整流程。首先提供Docker和Git-LFS的安装教程链接,然后指导用户快速拉取vLLM 0.9.0镜像。接着说明如何通过Git-LFS下载约60G的模型文件。重点讲解了docker-compose.yaml文件的配置方法,包括GPU资源分配和参数设置,并提供了验证API调用的curl命令示例。最后展示了模型推理效果,并附有

文章图片
#人工智能#docker#elasticsearch
【大模型】PostgreSQL是向量数据库吗

PostgreSQL 本身不是一个向量数据库,但通过插件和扩展(如。

文章图片
#数据库#postgresql
【云馨AI-大模型】Docker Compose 一键部署 Milvus v2.5.13 向量数据库及 Attu 可视化工具(无需科学上网)

Milvus是一款开源向量搜索引擎,专为高效处理海量向量数据设计,支持多种索引类型和相似性算法,适用于图像检索、推荐系统等AI场景。本文详细介绍了使用Docker Compose部署Milvus的完整流程,包括准备yaml配置文件、拉取镜像、启动服务等步骤,并推荐了可视化工具Attu的使用方法。通过简单的命令即可完成部署,Attu提供了直观的管理界面,使Milvus的使用更加便捷。该方案既适合开发

文章图片
#人工智能#docker#milvus
【云原生-K8s】k8s可视化管理界面安装配置及比较【Dashboard UI篇】

虽然是由k8s官方出品的Dashboard ,但是在国内很少推荐使用所以大家可以试试这种方式,在某些特定的环境可以采用国内的开源Dashboard来使用。

文章图片
#kubernetes#云原生#docker
【云原生-K8s】k8s可视化管理界面安装配置及比较【Rancher篇】

【代码】【云原生-K8s】k8s可视化管理界面安装配置及比较【Rancher篇】

文章图片
#kubernetes#云原生#rancher
【云原生-K8s】k8s可视化管理界面安装配置及比较【Kuboard篇】

Kuboard v3 是支持 Kubernetes 多集群管理的,在 Kuboard v3 的首页里,点击 添加集群 按钮,在向导的引导下可以完成集群的添加;您新添加集群可以访问到当前集群 Master 节点 内网IP 的 30080 TCP、30081 TCP、30081 UDP 端口;如果您打算新添加到 Kuboard 中的集群与当前集群不在同一个局域网,请咨询 Kuboard 团队,帮助您解

文章图片
#kubernetes#云原生#docker
【云原生-K8s】k8s可视化管理界面安装配置及比较【Kubesphere篇】

KubeSphere 为用户提供构建企业级 Kubernetes 环境所需的多项功能,例如多云与多集群管理、Kubernetes 资源管理、DevOps、应用生命周期管理、微服务治理(服务网格)、日志查询与收集、服务与网络、多租户管理、监控告警、事件与审计查询、存储管理、访问权限控制、GPU 支持、网络策略、镜像仓库管理以及安全管理等。KubeSphere 还开源了 KubeKey 帮助企业一键在

文章图片
#kubernetes#云原生#docker
【Minio】分布式对象存储系统安装部署、项目集成、接口调用【企业级开源对象存储】

MinIO 提供高性能、与S3 兼容的对象存储系统,让你自己能够构建自己的云储存服务。MinIO原生支持 Kubernetes,它可用于每个独立的公共云、每个 Kubernetes 发行版、私有云和边缘的对象存储套件。MinIO是软件定义的,不需要购买其他任何硬件,在 GNU AGPL v3 下是 100% 开源的。

文章图片
#分布式
【云原生-Uptime Kuma】自动化运维监控工具-Uptime Kuma

uptime-kuma是一款开源的、多功能的服务器监控面板。功能真的很强大,其中比较实用,也是最初的推出的功能就是拨测功能,还有证书监控。项目上线后,我们通常会将站点监控配置到云平台上,以检测各站点的连通性。Uptime Kuma 是一个开源的监控工具,功能类似于 Uptime Robot。相较于其它同类工具,Uptime Kuma 支持自托管服务,并且限制更少。本文将介绍 Uptime Kuma

文章图片
#运维#云原生#自动化
    共 113 条
  • 1
  • 2
  • 3
  • 12
  • 请选择