介绍

商业版来源:JuiceFS 浏览 1280 扫码分享 2021-01-18 21:03:21

JuiceFS 是什么？

JuiceFS 是什么？

JuiceFS 是为云端设计的共享文件系统。

云端：采用云服务中的对象存储作为后端，综合性价比极高。
共享：上千台机器同时挂载，高性能并发读写，共享数据。
易用：POSIX、HDFS、NFS 兼容，无门槛对接现有应用。

JuiceFS 核心特性

POSIX 兼容：像本地文件系统一样使用，无缝对接已有应用，无业务侵入性；
HDFS 兼容：完整兼容 HDFS API，并提供更强的元数据性能，云上 Hadoop 数据存储的理想选择；
强一致性：所有确认的修改会立即在所有客户端可见，保证强一致性；
卓越的性能：低至几毫秒的时延和无限的吞吐量（通过增加客户端数量）；
高可用性：元数据集群通过 Raft 协议实现高可用；
可扩展：为几十 PB 级数据和几亿级文件数设计，平滑扩容，无运维干预；
跨云跨区的复制：数据可以像 RAID-1 一样自动复制到不同区甚至不同云平台；
数据安全：所有文件数据保存在您自己的对象存储中，我们接触不到您的数据，传输过程中也是加密的。
高性价比：所有数据存储于对象存储，并经过特殊设计和压缩，大幅降低 TCO。

JuiceFS 适用于所有文件形式数据的管理、分析、归档、备份。 尤其可以支持大数据分析和机器学习对数据存储的需求。

POSIX、HDFS、NFS 兼容让 JuiceFS 不会对客户的业务系统带来任何侵入性，零成本替换。运维人员不用再为可用性、灾难恢复、监控、扩容等工作烦恼，专注于业务开发，提升研发效率。同时运维细节的简化，也让研发团队更容易向 DevOps 团队转型。

JuiceFS 主体架构

JuiceFS 由两个主要部分组成：

JuiceFS 元数据(Metadata)服务：元数据服务是由我们负责运维的一个集群，它们通过 Raft 算法实现高可用并同时保证数据的强一致性。元数据服务是专为文件系统优化的服务，非常高效和稳定。
JuiceFS 挂载客户端：即下图的 jfsmount, 它负责跟元数据服务和对象存储通信，并通过 FUSE 实现 POSIX API。另外，我们还提供一个脚本 juicefs, 用于 JuiceFS 的授权、挂载等所有操作。

注：元数据（metadata）包含文件名、文件大小、权限组、创建修改时间和目录结构。

当 JuiceFS 挂载到主机时，下图展示了它们是如何工作的：

当您的应用或者工具（可以使用任何语言编写）在使用内置的 API（open, read, write 等）访问数据时，会在底层通过系统调用经过内核中的 VFS 以及 FUSE 模块转发到 jfsmount, 再请求元数据服务或者对象存储完成操作。

JuiceFS 使用场景

JuiceFS 为海量数据存储设计，可以作为很多分布式文件系统和网络文件系统的替代，特别是以下场景：

大数据分析：HDFS 兼容，没有任何特殊 API 侵入业务；与主流计算框架（Spark, Hadoop, Hive等）无缝衔接；无限扩展的存储空间；运维成本几乎为 0；完善的缓存机制，高于对象存储性能数倍。
机器学习：POSIX 兼容，可以支持所有机器学习、深度学习框架；共享能力提升团队管理、使用数据效率。
容器集群中的持久卷：Kubernetes CSI 支持；持久存储并与容器生存期独立；强一致性保证数据正确；接管数据存储需求，保证服务的无状态化。
共享工作区：没有 VPC 限制，可以在任意主机挂载；没有客户端并发读写限制；POSIX 兼容已有的数据流和脚本操作。
数据备份：POSIX 是运维工程师最友好的接口；无限平滑扩展的存储空间；跨云跨区自动复制；挂载不受 VPC 限制，方便所有主机访问；快照（snapshot）可用于快速恢复和数据验证。

更详细的信息请查看解决方案。

JuiceFS 数据隐私

JuiceFS 的用户文件数据以私有格式保存在用户自有的对象存储中，仅对用户各主机客户端可见。用户对象存储的访问凭据不会提交到 JuiceFS 后端服务，因此也无法被除用户之外的任何一方访问。

当前内容版权归 JuiceFS 或其关联方所有，如需对内容或内容相关联开源项目进行关注与资助，请访问 JuiceFS .

本文档使用 BookStack 构建

展开/收起文章目录