Ceph分布式存储、Hadoop 分布式文件系统的区别是什么?

在回答它们的区别之前,先看看它们的共同点,它们的共同点是都可以归类为所谓的软件定义存储。在它们出现之前,存储软件都是跑在磁盘阵列这种专业的硬件之上的,依靠硬件来解决数据可靠性的问题,但 Ceph、HDFS 可以跑在通用服务器上,数据可靠性由软件本身保证,这是一个巨大的改变。它们的区别在于定位不一样。HDFS 是专门面向大数据设计的,针对大数据的业务特点,实现了 POSIX 标准的一个子集。Ceph 包含 3 个子系统,分别是文件存储 CephFS、块存储 RBD、对象存储 RGW,其中 CephFS 和 HDFS 有些类似,但对 POSIX 标准的兼容程度要比 HDFS 高很多。例如随机写、hardlink 这样的能力没有被 HDFS 支持,但 CephFS 就支持。

蓝海大脑 京ICP备18017748号-1