logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

第二章:GEM 与 TTM 概述:2.1 DRM 设备模型速览

本节聚焦DRM设备模型核心概念,围绕drm_device(GPU硬件抽象)、drm_file(客户端上下文)和设备节点展开。drm_device作为单例封装硬件实例,包含驱动回调表、设备节点和文件列表;drm_file则记录每次open的客户端状态,管理GEM句柄、同步对象等资源。两者通过标准字符设备模型与用户态交互,其中drm_file在AMDGPU中被扩展为包含VM地址空间和上下文管理。

文章图片
libdrm中的amdgpu_va_manager的作用和实现分析

本文介绍了 libdrm amdgpu 用户态驱动中的虚拟地址空间管理机制。该机制通过用户态预分配 VA 池,避免了频繁系统调用开销,显著提升性能。关键设计包括:分层地址空间分区(32/64-bit 低/高地址区)、基于降序排列的空洞链表数据结构、线程安全模型以及智能分配/释放算法。系统初始化时根据内核上报参数划分四个子区域,分配时按标志位选择对应管理器,并支持自动回退和碎片合并。该方案在用户态高

文章图片
AMDGPU驱动性能实战: KFD Queue Quiesce/Restore 机制分析与优化方案探讨

分析了AMDGPU KFD驱动中基于进程粒度的队列停止(quiesce)/恢复机制。当前实现采用粗粒度per-process方式,当需要驱逐某个BO或SVM range时,会停止该进程的所有用户队列,即使某些队列并未访问相关BO。文章详细梳理了9种触发场景,分为SVM相关、TTM BO驱逐、系统级和CRIU四类,其中SVM MMU notifier路径对性能影响最大。这种设计源于进程级VM共享模型

文章图片
第0章:DebugFS机制与AMDGPU应用分析--专栏目录

本文全面介绍Linux内核DebugFS机制及AMD GPU驱动的DebugFS实现。第一部分阐述DebugFS的核心机制,包括虚拟文件系统特性、API接口(目录/文件操作、数值类型处理)及安全控制。第二部分分析AMDGPU驱动架构,展示其在/sys/kernel/debug/dri/下的模块化设计,涵盖核心调试、KFD、电源管理等子系统。第三部分详解关键接口实现,如寄存器访问、GPU状态查询、内

文章图片
#linux#驱动开发
Linux 内核补丁提交(Upstream)完整指南

本文档是AMD GPU驱动开发者的内核补丁提交指南,详细介绍了从环境配置到代码提交的全流程。主要内容包括:1) 环境准备,安装git send-email并配置SMTP;2) 代码规范,选择正确基线分支并整理commit历史;3) 编写符合内核标准的commit message;4) 质量检查,运行checkpatch.pl验证格式;5) 生成和发送patch series;6) 处理review

文章图片
#linux
Linux 内核补丁提交(Upstream)完整指南

本文档是AMD GPU驱动开发者的内核补丁提交指南,详细介绍了从环境配置到代码提交的全流程。主要内容包括:1) 环境准备,安装git send-email并配置SMTP;2) 代码规范,选择正确基线分支并整理commit历史;3) 编写符合内核标准的commit message;4) 质量检查,运行checkpatch.pl验证格式;5) 生成和发送patch series;6) 处理review

文章图片
#linux
11 - 编写第一个测试

本文摘要介绍了如何从零开始创建和编写IGT测试文件。主要内容包括:1) 创建测试文件的基本步骤,包括选择目录和新建文件;2) 编写最小测试模板,包含版权声明、头文件、测试描述和主函数;3) 添加子测试的方法,使用igt_main和igt_subtest结构;4) 提供完整示例,展示如何查询和验证DRM设备信息。文章还涵盖了测试准备工作和学习目标,帮助开发者理解测试框架基础并掌握编写、编译和运行测试

文章图片
第10章:Topology拓扑发现

本章深入探讨了HSA Runtime如何发现和管理系统拓扑结构,包括CPU/GPU节点互连、NUMA域映射和PCIe/XGMI链路属性等关键内容。通过典型拓扑示例和层次模型,解析了系统拓扑的组成结构。详细介绍了拓扑发现流程,包括初始化阶段的核心步骤、节点属性查询和邻接关系构建。核心数据结构部分展示了TopologyNode、IoLink等关键类的实现,以及拓扑管理器的功能接口。本章内容为优化数据传

文章图片
09 - KMS 显示测试

本文介绍了KMS(Kernel Mode Setting)显示子系统的核心概念与测试框架。主要内容包括: KMS概述:作为DRM的显示输出子系统,KMS通过内核统一管理显示硬件,解决传统显示方式的多进程协调和闪烁问题。 KMS对象模型:详细解析了Framebuffer、Plane、CRTC、Encoder和Connector等核心组件及其功能,并提供了对象交互的代码示例。 IGT测试框架:介绍了i

文章图片
OpenCL 一致性测试套件(OpenCL-CTS)完整指南

本文系统介绍了OpenCL-CTS测试框架的完整体系,分为八大部分:第一部分阐述测试框架基础架构与工具;第二部分详细解析核心功能测试,包括基础运算、API、缓冲区、图像等模块;第三部分聚焦编译器特性与语言功能测试;第四部分覆盖数学运算与原子操作;第五部分探讨内存模型与并发控制;第六部分涉及设备管理与扩展支持;第七部分测试SPIR/SPIR-V等扩展功能;第八部分介绍图形API互操作。全文构建了完整

    共 16 条
  • 1
  • 2
  • 请选择