logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从零构建高性能通用内存池:Aurorae HostMemPool 设计与实现

Aurorae HostMemPool 是专为深度学习框架设计的高性能内存池,采用三层分级缓存架构(TLS缓存层、全局桶层、操作系统层)解决传统分配器在多线程环境下的锁竞争、内存碎片和延迟不确定问题。核心设计包括:1)28级2倍增长的分级策略实现快速映射;2)Block元数据与数据区分离提升缓存效率;3)两级溢出回收机制动态控制内存水位;4)对齐分配通过填充区域和还原头实现。实测显示该内存池在深度

文章图片
#c++#数据结构#深度学习 +1
到底了