什么是稀疏文件

cp --sparse=never /data/aa.dbf /data/bb.dbf

查了慢得出--spares选项是稀疏机制用的,先说下自己的理解吧, linux中dd命令可

以在文件中填入数据,这样操作系统就会屋里地为文件分配磁盘空间。对么 DD是一

下把文件中填满了数据块,但是 稀疏文件没有, 他是把文件建立,但不往里面填充

数据;比如你建立了一个2GB大小的文件,而它真正占有的空间却是128Kb ;差不多

就是这个意识吧。

 

以下是百度词条给出的解释:

稀疏文件,这是UNIX类和NTFS等文件系统的一个特性。


  开始时,一个稀疏文件不包含用户数据,也没有分配到用来存储用户数据的磁盘

空间。当数据被写入稀疏文件时,NTFS逐渐地为其分配磁盘空间。一个稀疏文件有可

能增长得很大。稀疏文件以64KB(不同文件系统不同)为单位增量增长,因此磁盘上

稀疏文件的大小总是64KB的倍数。


  稀疏文件就是在文件中留有很多空余空间,留备将来插入数据使用。如果这些空

余空间被ASCII码的NULL字符占据,并且这些空间相当大,那么,这个文件就被称为

稀疏文件,而且,并不分配相应的磁盘块。


  这样,会产生一个问题,文件已被创建了,但相应的磁盘空间并未被分配,只有

在有真正的数据插入进来时,才会被分配磁盘块,如果这时文件系统被占满了,那么

对该文件的写操作就会失败。为防止这种情况,有两种办法:不产生稀疏文件或为稀

疏文件留够空间。


  在计算机科学方面,稀疏文件是文件系统中的一种文件存储方式,在创建一个文

件的时候,就为分配了文件需要的连续存储空间,其空间内部大多都还未被数据填充

现在有很多文件系统都支持稀疏文件,包括大部分的Unix和NTFS 。


  稀疏文件被普遍用来磁盘图像,数据库快照,日志文件,还有其他科学运用上。
 

Logo

更多推荐