|
重庆邮电大学学报(自然科学版) 2015
一种基于混合索引的HDFS小文件存储策略Keywords: Hadoop分布式文件系统(HDFS),小文件,元数据服务器,缓存,混合索引 Abstract: Hadoop分布式文件系统(hadoopdistributedfilesystem,HDFS)因其稳定高效?低成本等优势,已被很多大型企业广泛使用?针对HDFS海量小文件存储时元数据服务器节点内存开销过大,合并文件中小文件访问效率不高的问题,提出一种改进的基于混合索引的小文件存储策略,应用分类器分类标记小文件,并在元数据服务器建立H-B+树索引,在存储节点根据小文件大小建立不同的块内索引,达到提高小文件访问效率的目标?实现中采用缓存结构,以提高客户端访问的响应速度,同时也有利于元数据服务器节点的内存负载?实验结果表明,基于混合索引的小文件存储策略能有效提高小文件访问效率,并显著降低元数据节点内存开销?
|