DeeplyMind 个人主页

@shenjunpeng

DeeplyMind

2024-01-29 12:40:35 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

读懂 ROCm 分层：HIP → ROCr → libhsakmt 核心概念对照表

本文深入解析了AMD ROCm软件栈的分层架构与核心概念映射关系。通过分层对比表，系统梳理了HIP、ROCr/HSA运行时、libhsakmt和KFD四个层次中设备、流/队列、事件/信号等关键概念的对应关系。文章重点分析了三个典型"翻译链"：设备标识如何从hipDevice_t逐层转换为内核gpu_id；HIP流如何实现为用户态AQL队列并最终映射为MQD描述符；事件机制如何通过信号量和中断实现。

Linux 内核AI 自动Review工具 Sashiko 介绍与本地部署手册

Sashiko 是由 Meta 开发的 Linux 内核 AI 补丁审查工具，现由 Linux 基金会维护。这款基于 Rust 的开源工具专为内核补丁设计，支持多阶段审查（11个阶段）和子系统专属检查规则，可发现约53.6%的已知Bug。它提供Web和CLI两种界面，支持云端LLM（如Gemini、Claude）和本地模型（通过Ollama/vLLM）。部署需Rust 1.90+环境，配置简单，适

Linux 内核AI 自动Review工具 Sashiko 介绍与本地部署手册

3.1 异构计算的挑战：为什么 MM 需要进化

本文探讨了异构计算环境下传统Linux内存管理（MM）的局限性，并分析了HMM（异构内存管理）的解决方案。文章指出，传统split address space模型导致CPU与设备（如GPU、FPGA）间需要显式数据拷贝，不仅增加编程复杂度，还会造成库生态分裂。理想目标是实现shared address space，使设备能直接访问进程虚拟地址。但硬件现实（如PCIe带宽限制、设备内存特性差异）要求

2.2 NUMA 与页面迁移：把页面搬到正确的地方

本文探讨了Linux内核中页面迁移的核心机制，重点分析了其在NUMA系统中的实现原理。文章首先介绍了NUMA架构下内存访问延迟差异的背景，说明页面迁移的必要性——通过动态调整物理页面位置来优化访问性能。接着详细解析了migrate_pages()函数的调用模型和工作流程，包括迁移模式的选择（异步/同步）、隔离待迁移页面的步骤，以及目标页面的分配策略。文中还阐述了页面迁移的设计目标：保持虚拟地址不变

#java #前端 #服务器

Chapter 1: A Tale of Two Memory Hierarchies — CPU vs GPU at 10,000 Feet

This article compares the memory hierarchies of CPU and GPU. It points out that both face the same basic constraint: limited fast - memory capacity. To address this, both adopt a hierarchical storage

Chapter 1: A Tale of Two Memory Hierarchies — CPU vs GPU at 10,000 Feet

This article compares the memory hierarchies of CPU and GPU. It points out that both face the same basic constraint: limited fast - memory capacity. To address this, both adopt a hierarchical storage

1.5 页面回收与交换reclaim/swap：内存不够时怎么办

本文探讨了Linux内核在物理内存不足时的页面回收与交换机制。主要内容包括：回收策略：内核通过LRU算法维护5条链表区分活跃/非活跃的匿名页和文件页，利用硬件Accessed位追踪页面冷热程度，通过反向映射找到所有页面映射关系。回收过程：采用优先级控制扫描范围，优先回收文件页（根据swappiness参数调整倾向），处理脏页时文件页回写、匿名页写入swap分区，使用swap entry记录换出

Linux /proc/meminfo 命令信息详解

本文深入解析Linux系统的/proc/meminfo文件，帮助理解内核内存管理机制。该文件提供实时内存使用快照，是监控、调优和故障诊断的重要工具。文章详细介绍了其主要用途，包括内存监控、性能优化和容量规划等，并列举了典型应用场景如服务器运维、数据库调优等。通过示例系统分析，展示了如何解读关键指标（如可用内存、文件缓存、Swap使用率等），评估系统健康状态，并识别潜在风险点（如Swap使用率过高）

#linux

Linux /proc/meminfo 命令信息详解

#linux

共 24 条

请选择