Hyper Open Edge Cloud

如果一台服务器损坏,如何确保硬件冗余?

如果一台服务器损坏,如何确保硬件冗余? 例如一个 Tioga Pass 服务器,紧急情况下我们可以用普通 x86 机器替换吗?
  • Last Update:2020-08-14
  • Version:001
  • Language:zh

Rapid.Space 冗余概念包括通过多个数据中心而不是通过单个数据中心的冗余来实现弹性。

云系统中很多地方都可能出现问题: 

  • 服务器;
  • 互联网运输;
  • 电力;
  • 机房。

无论为服务器,互联网传输还是电力提供了多少冗余,如果数据中心大楼被大火或洪水摧毁,这些冗余也是远远不够的,实际上这种情况会不时发生在传统的公共云中

因此,最安全的提供弹性的方法是在多个数据中心中部署应用程序,可使用不同的电力来源或互联网传输。 这称为数据中心冗余。 Nexedi 就是采用这样的方式,通过确保在一个或两个其他站点中始终有生产 ERP 的副本,Nexedi 通过在 Rapid.Space 上部署 ERP5 的方式,以备在发生故障时接管主要站点。 此功能称为“弹性堆栈”,是 SlapOS 示例 buildout 脚本集合的一部分。

采用数据中心冗余的方式也并不意味着也不去尝试在每个数据中心内实现高可用性。 通过在多台服务器上部署使用适当高可用性软件(例如 LinbitOpenSVCrepman 等)的应用程序,一台服务器的崩溃就不会影响整个系统。

即使 Rapid.Space 硬件是基于 OCP 标准的,但这也不能妨碍使用任何类型的硬件来扩展 Rapid.Space 基础架构,包括传统的 x86_64 服务器或是其他架构(ARM,PowerPC 等),来实现更高的弹性。