
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
硬中断执行结束在退出之前,都会在irq_exit中判断如果有pending的软中断就触发软中断:内核代码通过调用raise_softirq_irqoff来触发相应的软中断,将相应的bit位置位,这样在irq_exit中判断就有pending的软中断,进而触发执行相应的软中断(直接执行软中断或触发软中断线程):raise_softirq_irqoff函数调用__raise_softi...
节能效果平均功耗降低39.38%,能耗降低33.36%(相比 SPDK)。在真实云负载(阿里、腾讯)下,比 Linux 节能 30.23%,比 SPDK 节能 33.36%。性能影响延迟与 SPDK 相比差异在 5% 以内(P99.9 延迟几乎一致)。显著优于 Governor、Dynamic Scheduling 的延迟表现。适用性依赖现代 CPU 的mwaitx指令(Intel 4th Gen
发现问题 -> 精准诊断 -> 提出务实方案 -> 实现并验证 -> 总结规律。问题:在 200Gbps+ 的超高速网络下,开启 IOMMU 会导致严重的性能瓶颈。创新点诊断创新:首次系统性地识别并量化了“IOTLB 墙”是导致性能下降的非 CPU 瓶颈,并分析了其成因。方案创新:设计并实现了一个名为 HPA 的、对内核侵入性小、实用性强的大页内存分配器,专门用于解决网络驱动中的 IOTLB 瓶颈
https://git.kernel.org/pub/scm/linux/kernel/git/mkp/scsi.git/commit/?id=92e8d0323a51
维度传统方案Tai Chi调度粒度毫秒级微秒级CP/DP 隔离静态分区 / 进程隔离vCPU/pCPU 混合虚拟化IPC 语义需 RPC 改造原生 IPC 透明保留部署侵入性高(需改 CP/DP)零代码修改硬件依赖需新特性(如 UINTR)兼容现有 SmartNIC生产适用性实验室原型已大规模商用三年。
清除TLB缓存所有现代的处理器都用地 址转换缓存(通常称为 TLB,全称为 Translation Lookaside Buffer)来减少这种开销。为了 降低这个缓存本身的开销,大多数处理器不会让它时刻与页表保持一致。这意味着如果操 作系统修改了页表,那么这个缓存会变得陈旧而不可用。S 模式添加了另一条指令来解决 这个问题。这条sfence.vma 会通知处理器,软件可能已经修改了页表,于是处理
转载http://bean-li.github.io/dive-into-iostat/前言iostat算是比较重要的查看块设备运行状态的工具,相信大多数使用Linux的同学都用过这个工具,或者听说过这个工具。但是对于这个工具,引起的误解也是最多的,大多数人对这个工具处于朦朦胧胧的状态。现在我们由浅到深地介绍这个工具,它输出的含义什么,介绍它的能力边界,介绍关于这个工具的常见误解。...
root@test7:/lib/systemd/system# cat multi-user.target# This file is part of systemd.## systemd is free software; you can redistribute it and/or modify it# under the terms of the GNU Lesser
ftrace也可以通过内核中固定的调度相关的tracepoint来记录线程的调度信息,但ftrace只能抓到调度的原始数据(线程调度切换流程),不能提供统计分析功能,只提供类似于perf sched script的功能。perf也是利用内核中固定的调度trcepoint,但perf提供了统计分析功能,例如可以查看某段时间内的最大调度延迟等信息。1,perf sched record2,...







