logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

鲲鹏 ARM 架构 Cephadm 部署 Ceph

Ceph Reef ARM镜像兼容性问题改用 Quincy 17.2.8。

#arm开发#架构#ceph
ubuntu 22.04 部署 ollama + deepseek + open webui

上传后,文件一直转圈,如下图。后台查看 GPU 监控和 Ollama 进程都是正常的。等待一会儿后,可以继续提交内容。应该是模型在进行推理。Open WebUI 要求使用 Python 3.11。根据错误信息,虚拟机 VCPU 缺少 AVX 指令集,导致 GPU 不能使用。此时发现只有一张 v100 在被使用。没有 AVX 信息。

ubuntu 22.04 部署 vllm + deepseek r1

虚拟机 CPU 需要开启。

Kubernests YAML 详细之卷(PV、PVC、StorageClass)

PersistentVolume(PV)是集群中已由管理员配置的一段网络存储RWXROXRWXRWOPstorageKiMiGiTiPiEi* pathreadOnly* serverDeleteRetain默认releasedFilesystemBlock创建 pv。

#kubernetes#容器#云原生
AI Agent 项目重构(二)AI 生成与架构重建

生成模型时,Agent 不仅提供 legacy 模型信息,还会构建一个。为了避免 AI 生成“想象中的 Django 代码”,这样开发者可以进行人工 review。否则 AI 只能凭经验猜测。这个上下文会被送入 LLM。这些都来自之前的分析阶段。

#人工智能#重构
AI Agent 项目重构(一)系统分析与知识提取

这个 Agent 并不是直接把旧 Django 模型丢给大模型去“分析”,而是先经过项目扫描、模型提取、目标架构映射、语义分析、关系图构建、领域归纳以及新项目结构学习,最后才进入代码生成阶段。也就是说,它先完成“理解旧系统”和“学习新系统”,再执行 Django 6 模型草稿生成。旧系统完全没有按照 django apps 的方式创建应用,models 全堆在 db/models.py、domai

#人工智能#重构
AI Agent 项目重构(三)架构设计和 AI Agent 思想

在前两篇文章中,介绍了一个 AI Agent,用来辅助将 Legacy Django 项目重构为新的 Django6 架构。

#人工智能#重构
ubuntu 22.04 ray 集群部署 vllm + deepseek r1

如果需要 ray 的 dashboard 的话需要安装。:这里 api_server 默认的端口号是 8000。Ray 默认不会在 head 节点上分配 GPU。具体都有什么参数在最后。当前 work 节点 IP 地址。head 节点 IP 地址。这里可以看到 GPU 是4个了。可以看到使用了 4 个 gpu。

Elasticsearch 常用请求说明

【代码】Elasticsearch 常用请求说明。

#elasticsearch#大数据#搜索引擎
Kubernetes YAML 详解之网络服务二( Ingress、IngressClasses)

对集群中服务的外部访问进行管理的 API 对象,典型的访问方式是 HTTP可以提供负载均衡、SSL 终结(SSL Termination 是指把客户端发来的加密 HTTPS 流量,在 Ingress Controller(或负载均衡器)处解密为 HTTP 明文流量。)和基于名称的虚拟托管。Ingress公开从集群外部到集群内服务的 HTTP 和 HTTPS 路由Ingress可为Service提供

#kubernetes#容器#云原生
    共 22 条
  • 1
  • 2
  • 3
  • 请选择