中文文档

节点故障恢复

如果MinIO节点遭受完全硬件故障(例如所有驱动器、数据等丢失), 那么一旦该节点重新加入部署,它将开始进行 恢复操作。 MinIO的恢复仅在替换的硬件上进行, 通常不会影响部署性能。

MinIO 修复确保写入驱动器上的所有数据的一致性和正确性。

Exclusive access to drives

MinIO 要求 专有 对提供给对象存储的驱动器或卷的访问。 其他任何进程、软件、脚本或人员都不得直接对提供给MinIO的驱动器或卷执行 任何 操作,也不得对MinIO放置在其上的对象或文件执行操作。

除非由MinIO工程部门指导,否则不要使用脚本或工具直接修改、删除或移动提供给MinIO的驱动器上的任何数据片段、校验片段或元数据文件,包括从一个驱动器或节点移动到另一个驱动器或节点。 这些操作很可能会导致广泛的数据损坏和丢失,超出了MinIO的修复能力。

替换节点的硬件应该与故障节点大致相同。 使用改进的硬件不会有任何负面的性能影响。

替换驱动器的硬件应该与故障驱动器在实质性上相似。 例如,用另一个具有相同容量的SSD驱动器替换故障的SSD。 虽然您可以使用容量更大的驱动器, 但MinIO会使用 最小 驱动器的容量作为所有驱动器在 :ref:`服务器池 <minio-intro-server-pool>`中的上限.

以下步骤提供了更详细的节点更换指南。 这些步骤假设了一个MinIO部署,其中每个节点都根据 文档中的先决条件 拥有一个DNS主机名。

1) 启动替换节点

确保新节点已根据行业、监管或组织标准和要求, 接收了所有必要的安全、固件和 操作系统更新。

新节点的软件配置 必须 与部署中的其他节点相匹配, 包括但不限于操作系统和内核版本以及配置。 异构软件配置可能会导致意外情况 或部署中出现不良行为。

2) 更新新节点的主机名

可选 如果替换节点的IP地址与故障主机不同, 这一步是必需的。

确保与故障节点关联的主机名现在解析为新节点。

例如,如果之前 https://minio-1.example.net 解析到故障主机, 那么现在它应该解析到新主机。

3) 下载并准备 MinIO 服务器

按照 部署步骤 下载 并运行和启动MinIO服务器,使用与其 他节点相匹配的配置。

  • 所有节点上的MinIO服务器版本 必须 保持一致。

  • 所有节点上的MinIO服务及其环境变量配置文件 必须 保持一致。

4) 将节点重新加入部署

在节点上启动MinIO服务器进程,并使用 mc admin logs 监控进程输出, 或者对于使用 systemd 管理的安装, 通过监控MinIO服务日志使用 journalctl -u minio

服务器输出应表明它已经检测到部署中的其他节点 并开始执行 修复操作

使用 mc admin heal 命令来监控部署的整体修复状态。 MinIO会积极修复节点, 以确保从降级状态中快速恢复。

5) 下一步

继续监控部署,直到修复完成。 对于持续且重复出现节点故障的部署, 应该安排专门的维护时间来识别根本原因。如果遇到持续或重复的节点故障,可以考虑使用 MinIO SUBNET 来与 MinIO 工程团队协调,获取任何此类操作的指导。

Join Slack 商业支持购买咨询