logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

A Study of Failure Recovery and Logging of High-Performance Parallel File Systems——论文泛读

针对并行文件系统的可靠性的研究,主要针对故障恢复和日志记录机制。(1)本文提出PFault,故障注入工具,对PFS透明,易于部署。构建了基于iSCSI的PFault原型,涵盖了三个具有代表性的故障模型(即整个设备故障、全局不一致性和网络分区)。为了解决将iSCSI添加到PFS软件堆栈中的潜在问题,开发了非iSCSI版本,用于验证iSCSI对所研究的目标PFS行为的潜在影响。

文章图片
#论文阅读#文件系统
AStore: Uniformed Adaptive Learned Index and Cache for RDMA-Enabled Key-Value Store——论文泛读

针对客户端和服务端分离的分布式键值存储系统,传统方法利用传统索引结构或缓存,但受限于服务端CPU争用。本文提出AStore,采用客户端-服务端框架,利用RDMA、本地缓存索引、自适应学习索引模型。包括以下技术:(1)在客户端和服务端分别采用自适应学习索引模型,用于处理静态(读取)和动态工作负载(插入、更新、删除)。(2)对叶子节点的模型使用细粒度的版本控制,降低客户端和服务端的同步频率。(3)利用

文章图片
#论文阅读
Pattern-Based Prefetching with Adaptive Cache Management Inside of Solid-State Drives——论文泛读

针对SSD的预取,如何设计独立于操作系统和应用程序的数据预取机制。本文提出了支持自适应缓存管理的基于模式的预取 Cacher-SSD,在SSD的闪存转换层运行。主要包括两个技术:(1)从读请求的历史中挖掘I/O请求间的相关性,以得到经常一起读取的地址集合,在当前时间窗口中进行模式匹配以指导数据预取。(2)综合考虑读/写比率、历史预取精度,构建了一个数学模型,以支持自适应缓存管理。根据实际情况调整预

文章图片
#论文阅读#缓存
Don’t Maintain Twice, It’s Alright: Merged Metadata Management in Deduplication File System...——论文泛读

针对重复数据删除文件系统(DedupFS),现有架构需要维护文件系统的逻辑到物理(L2P)映射表和用于重复数据删除的指纹到物理(FP2P)映射表,导致额外的元数据开销。本文提出GOGETAFS,核心思想是将FP2P和L2P合并,包括3个技术:(1)LFP映射,将FP2P和L2P合并,减少元数据I/O操作,减少一致性开销。(2)全局LFP表,存储于内存中,根据FP快速查找物理地址和引用计数。并根据内

文章图片
#论文阅读
An In-depth Comparative Analysis of Cloud Block Storage Workloads: Findings and Implications——论文泛读

AliCloud:阿里云I/O负载采集于2020年1月,涵盖了1000卷的一个月I/O行为,每个卷的原始容量从40 GB到5000 GB不等,工作负载跨越不同类型的云应用程序。每个I/O请求都包括:卷号、请求类型、请求偏移量、请求大小和时间戳(以微秒为单位)。TencentCloud:腾讯云I/O负载采集于2018年10月1日12:00至10月10日1:00,涵盖了大约九天内4995卷的块级I/O

文章图片
#论文阅读
Hybrid Block Storage for Efficient Cloud Volume Service——论文泛读

针对生产环境中的云服务,如何在不影响性能的情况下降低成本。本文提出了分布式SSD-HDD混合存储结构Ursa,将主副本存储在SSD上,将备份副本复制到HDD上,不使用SSD作为缓存层。包括以下技术:(1)通过自适应日志,将小型随机写入转换为日志追加,异步合并到HDD,从而弥补SSD和HDD之间的性能差距。(2)为了提高效率,大型顺序写入直接在HDD上执行(绕过日志)。(3)设计了高效的范围优化合并

文章图片
#论文阅读
CXL论文阅读笔记整理(持续更新)

阅读CXL相关论文,整理其目标、挑战、创新点、局限性

文章图片
#论文阅读
More Than Capacity: Performance-oriented Evolution of Pangu in Alibaba——论文泛读

对阿里云盘古2.0的介绍,包括两个阶段:(1)通过文件系统重构和用户空间存储操作系统(USSOS),充分利用SSD和RDMA。设计了统一的、仅追加的持久层,引入了自包含块布局,以减少文件写操作的I/O延迟。USSOS使用运行到完成线程模型,利用高效CPU和内存资源分配的用户空间调度机制。(2)从面向容量发展为面向性能。升级基础设施,开发了每台服务器96 TB SSD,将网络带宽从25 Gbps升级

文章图片
#论文阅读#分布式
到底了