
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
从零构建高性能通用内存池:Aurorae HostMemPool 设计与实现
Aurorae HostMemPool 是专为深度学习框架设计的高性能内存池,采用三层分级缓存架构(TLS缓存层、全局桶层、操作系统层)解决传统分配器在多线程环境下的锁竞争、内存碎片和延迟不确定问题。核心设计包括:1)28级2倍增长的分级策略实现快速映射;2)Block元数据与数据区分离提升缓存效率;3)两级溢出回收机制动态控制内存水位;4)对齐分配通过填充区域和还原头实现。实测显示该内存池在深度

到底了







