logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

图谱检索知识库EviGraph开源了~~

Knowledge EviGraph 是一个基于 Neo4j 和大语言模型的知识图谱管理系统,能够将非结构化文档(如 PDF 工程规范)转化为可查询、可推理的知识图谱。系统采用 Python/Flask 后端和 Vue 3 前端技术栈,支持文档智能解析、知识图谱构建、检索与 AI 问答、图谱可视化等核心功能。通过 LLM 驱动语义分块和 Neo4j 知识网络构建,实现条款、术语、实体等知识元素的关

文章图片
#开源
HAMi + prometheus-k8s + grafana实现vgpu虚拟化监控

最近长沙跑了半个多月,跟甲方客户对了下项目指标,许久没更新回来后继续研究如何实现 grafana实现HAMi vgpu虚拟化监控,毕竟合同里写了需要体现gpu资源限制和算力共享以及体现算力卡资源共享监控先说下为啥要用HAMi吧, 一个重要原因是公司有人引见了这个工具的作者, 很多问题我都可以直接向作者提问。

文章图片
#prometheus
通过nvidia-smi 实现gpu可用卡自动选择

由于现代计算环境通常配置了多个GPU,合理地选择和管理这些资源变得至关重要。:在共享计算环境中,其他用户的任务可能会占用GPU资源。该代码可以动态查询GPU状态,确保选择的GPU在实际使用时是最优的。:通过检查GPU的可用性和状态,该代码可以防止由于选择了不可用或性能较差的GPU而导致的运行时错误。:用户可以通过参数调整选择策略,如优先考虑内存大小或功耗,从而灵活适应不同的计算需求和环境。:多个G

文章图片
OpenClaw 如何用 Markdown 文件打败向量数据库

OpenClaw:文件即记忆的AI架构革新 本文介绍OpenClaw提出的"文件即记忆"创新架构,通过将AI记忆存储为可读写的Markdown文件,解决了传统RAG方案的黑盒性、高维护成本和迁移困难三大痛点。核心亮点包括: 三大记忆文件类型: 会话日志(JSONL):记录详细对话过程 长期记忆(MEMORY.md):存储核心偏好和原则 日常日志(按日期Markdown):记录每

Harness Coding 实践Autobot 系统设计架构

本文档详细说明 autobot AI Agent 平台的技术架构、依赖组件、以及通过 Skill 调用外部服务的完整流程。

文章图片
OpenClaw 如何用 Markdown 文件打败向量数据库

OpenClaw:文件即记忆的AI架构革新 本文介绍OpenClaw提出的"文件即记忆"创新架构,通过将AI记忆存储为可读写的Markdown文件,解决了传统RAG方案的黑盒性、高维护成本和迁移困难三大痛点。核心亮点包括: 三大记忆文件类型: 会话日志(JSONL):记录详细对话过程 长期记忆(MEMORY.md):存储核心偏好和原则 日常日志(按日期Markdown):记录每

OpenClaw 如何用 Markdown 文件打败向量数据库

OpenClaw:文件即记忆的AI架构革新 本文介绍OpenClaw提出的"文件即记忆"创新架构,通过将AI记忆存储为可读写的Markdown文件,解决了传统RAG方案的黑盒性、高维护成本和迁移困难三大痛点。核心亮点包括: 三大记忆文件类型: 会话日志(JSONL):记录详细对话过程 长期记忆(MEMORY.md):存储核心偏好和原则 日常日志(按日期Markdown):记录每

Spider 数据集上实现nlp2sql训练任务

每个数据库的结构(表、列、外键)在多个问题中都会被重复使用。如果每个问题都附带完整的schema信息,会导致数据冗余,增加存储和处理的开销。所以,将schema单独存储为table.json,可以让不同的数据条目引用同一个数据库模式,减少重复数据。拆分后的结构需要更高效的数据管理,例如在训练模型时,根据每个问题的db_id去table.json中查找对应的schema信息。T5 是一个强大的自然语

文章图片
#数据库#sql#oracle
Claude Code 持久化记忆设计:planning-with-files

planning-with-files 是一款专为 Claude Code 及兼容 IDE(如 Cursor、VS Code)设计的 AI 协作增强插件。它旨在解决大模型在长任务中常见的上下文记忆丢失、目标漂移及重复犯错问题,通过文件系统为 AI 赋予“持久记忆”能力。

文章图片
deepseek 本地化部署和小模型微调

因为本人gpu卡的机器系统是centos 7, 直接使用ollama会报所以ollama使用镜像方式进行部署, 拉取镜像ollama/ollama启动命令查看ollama 是否启动成功,Ollama 没有用户界面,在后台运行。打开浏览器,输入 “http://xx:11434/”,显示 “Ollama is running”。deepseek-r1 目前有7b, 32b, 70b, 671b 多个

文章图片
    共 20 条
  • 1
  • 2
  • 请选择