未来是分解的、S3 兼容的和 Kubernetes 原生的 - 换句话说,
Hadoop HDFS 以外的东西。
如今,将计算和存储分开很有意义。 存储需要超过计算 - 高达 10-1。 计算节点是无状态的,并使用更多 CPU 内核和内存进行了优化。 存储节点是有状态的,可以通过更多更密集的驱动器和更高的带宽来优化 I/O。 通过分解,企业可以实现卓越的经济效益、更好的可管理性、改进的可扩展性和更高的总拥有成本。 HDFS 无法进行此转换。 当你离开数据本地化时,Hadoop HDFS 的优势就变成了它的弱点。
Hadoop 专为 MapReduce 计算而设计,其中数据和计算必须位于同一位置。 因此,Hadoop 需要自己的作业调度程序、资源管理器、存储和计算。 这从根本上与基于容器的架构不兼容,后者的一切都是弹性的、轻量级的和多租户的。 相比之下,MinIO 诞生于云端,专为通过 Kubernetes 进行容器和编排而设计,使其成为淘汰旧版 HDFS 实例时过渡到的理想技术。
Hadoop 专为机器数据构建,其中“非结构化数据”是指大型(GiB 到 TiB 大小)日志文件。 当用作真正非结构化数据的通用存储平台时,小对象(KB 到 MB)的流行极大地损害了 Hadoop HDFS,因为名称节点从未设计为以这种方式扩展。 MinIO 擅长任何文件/对象大小(0 到 5TiB)。
采用 Hadoop 的企业是出于对开源技术的偏好。 检查的能力、免于锁定的自由以及来自数万用户的舒适感具有真正的价值。 MinIO 也是 100% 开源的,确保组织可以在升级体验的同时忠于他们的目标。
简单是很难的。 它需要工作、纪律,最重要的是,需要承诺。 MinIO 的简单性是传奇,是使我们的软件易于部署、使用、升级和扩展的哲学承诺的结果。 即使是 Hadoop 的粉丝也会告诉你它很复杂。 要事半功倍,您需要迁移到 MinIO。
Hadoop 因其提供大数据性能的能力而声名鹊起。 在过去十年的大部分时间里,它们是企业级分析的基准。 不再。 MinIO 已在多个基准测试中证明它比 Hadoop 快得多。 这意味着在 Spark、Presto、Flink 和其他现代分析工作负载上有更好的性能。
MinIO 的服务器二进制文件都是 45MB。 尽管它很大,但它的功能足以运行数据中心,但仍然足够小,可以舒适地生活在边缘。 Hadoop 世界中没有这样的选择。 这对企业意味着您的 S3 应用程序可以随时随地使用相同的 API 访问数据。
MinIO 使用针对每个对象的内联擦除编码来保护数据,这比 HDFS 替代方案要高效得多,HDFS 替代方案是在复制之后出现的,从未被采用。 此外,MinIO 的位腐检测确保它永远不会读取损坏的数据——即时捕获和修复损坏的对象。 MinIO 还支持跨区域、双活复制。 最后,MinIO 支持一个完整的对象锁定框架,提供合法持有和保留(具有治理和合规模式)。
Hadoop HDFS 的继任者不是硬件设备,它是在商用硬件上运行的软件。 这就是 MinIO - 软件。 与 Hadoop HDFS 一样,MinIO 旨在充分利用商用服务器。 凭借利用 NVMe 驱动器和 100 GbE 网络的能力,MinIO 可以缩小数据中心——提高运营效率和可管理性。
MinIO 支持多种复杂的服务器端加密方案来保护数据——无论数据位于何处——无论是在传输中还是在静止状态。 MinIO 的方法以可忽略的性能开销确保机密性、完整性和真实性。 使用 AES-256-GCM、ChaCha20-Poly1305 和 AES-CBC 支持服务器端和客户端加密,确保应用程序兼容性。 此外,MinIO 支持行业领先的密钥管理系统 (KMS)。
如果您对 Hadoop 替换有任何疑问,请填写
下表。 您也可以通过 sales@minio.org.cn 与我们联系。