yiyeguzhou100 个人主页

@yiyeguzhou100

yiyeguzhou100

2023-04-27 16:44:27 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

local_softirq_pending位何时置位

硬中断执行结束在退出之前，都会在irq_exit中判断如果有pending的软中断就触发软中断：内核代码通过调用raise_softirq_irqoff来触发相应的软中断，将相应的bit位置位，这样在irq_exit中判断就有pending的软中断，进而触发执行相应的软中断（直接执行软中断或触发软中断线程）：raise_softirq_irqoff函数调用__raise_softi...

#arm开发

论文解读：Sleeping with One Eye Open: Fast, Sustainable Storage with Sandman

节能效果平均功耗降低39.38%，能耗降低33.36%（相比 SPDK）。在真实云负载（阿里、腾讯）下，比 Linux 节能 30.23%，比 SPDK 节能 33.36%。性能影响延迟与 SPDK 相比差异在 5% 以内（P99.9 延迟几乎一致）。显著优于 Governor、Dynamic Scheduling 的延迟表现。适用性依赖现代 CPU 的mwaitx指令（Intel 4th Gen

#网络

论文解读：Overcoming the IOTLB wall for multi-100-Gbps Linux-based networking

发现问题 -> 精准诊断 -> 提出务实方案 -> 实现并验证 -> 总结规律。问题：在 200Gbps+ 的超高速网络下，开启 IOMMU 会导致严重的性能瓶颈。创新点诊断创新：首次系统性地识别并量化了“IOTLB 墙”是导致性能下降的非 CPU 瓶颈，并分析了其成因。方案创新：设计并实现了一个名为 HPA 的、对内核侵入性小、实用性强的大页内存分配器，专门用于解决网络驱动中的 IOTLB 瓶颈

#linux #运维 #服务器

新提的一个内核小优化patch

https://git.kernel.org/pub/scm/linux/kernel/git/mkp/scsi.git/commit/?id=92e8d0323a51

论文解读：Tai Chi: A General High-Efficiency Scheduling Framework for SmartNICs in Hyperscale Clouds

维度传统方案Tai Chi调度粒度毫秒级微秒级CP/DP 隔离静态分区 / 进程隔离vCPU/pCPU 混合虚拟化IPC 语义需 RPC 改造原生 IPC 透明保留部署侵入性高（需改 CP/DP）零代码修改硬件依赖需新特性（如 UINTR）兼容现有 SmartNIC生产适用性实验室原型已大规模商用三年。

#云计算

sfence.vma

清除TLB缓存所有现代的处理器都用地址转换缓存（通常称为 TLB，全称为 Translation Lookaside Buffer）来减少这种开销。为了降低这个缓存本身的开销，大多数处理器不会让它时刻与页表保持一致。这意味着如果操作系统修改了页表，那么这个缓存会变得陈旧而不可用。S 模式添加了另一条指令来解决这个问题。这条sfence.vma 会通知处理器，软件可能已经修改了页表，于是处理

#缓存

深入理解iostat, 非常详细的解读

转载http://bean-li.github.io/dive-into-iostat/前言iostat算是比较重要的查看块设备运行状态的工具，相信大多数使用Linux的同学都用过这个工具，或者听说过这个工具。但是对于这个工具，引起的误解也是最多的，大多数人对这个工具处于朦朦胧胧的状态。现在我们由浅到深地介绍这个工具，它输出的含义什么，介绍它的能力边界，介绍关于这个工具的常见误解。...

multi-user.target

root@test7:/lib/systemd/system# cat multi-user.target# This file is part of systemd.## systemd is free software; you can redistribute it and/or modify it# under the terms of the GNU Lesser

perf sched查看调度延迟与唤醒延迟

ftrace也可以通过内核中固定的调度相关的tracepoint来记录线程的调度信息，但ftrace只能抓到调度的原始数据（线程调度切换流程），不能提供统计分析功能，只提供类似于perf sched script的功能。perf也是利用内核中固定的调度trcepoint，但perf提供了统计分析功能，例如可以查看某段时间内的最大调度延迟等信息。1，perf sched record2，...

到底了