今天的“始终在线”和“始终可用”IT环境需要高可用性基础设施设计。换句话说,您不希望在业务关键型基础架构中出现单点故障。如果是这样,你很快就会发现,你的能力取决于你最薄弱的环节。冗余需要存在于整个环境中,包括物理基础设施和应用程序。

当您的主机运行应用程序和服务时,您希望确保有多个主机在其中一个主机发生故障时提供冗余。当您有运行像MS SQL Server这样的应用程序的主机,或者您有作为虚拟环境的虚拟主机的主机时,这是正确的。

在微软视窗的世界里,Windows服务器故障转移群集是一种用于以高度可用的方式托管应用程序和虚拟机监控程序的机制,以便在环境出现故障时提供最小的中断。

Windows Server 2019提供了迄今为止最先进的Windows Server;因为它提供了Windows故障切换功能方面最先进的功能。在本文中,让我们看一看Windows故障转移群集的一般情况,它是什么?什么是Hyper-V故障转移群集?它们是如何工作的?Windows Server 2019故障转移群集及其所有使用情形中的新增功能是什么?以及在Windows Server 2019中实现Windows故障转移群集。

什么是Windows故障转移群集?

为了使用Windows Server提高业务关键数据的高可用性,需要在Windows Server中使用故障转移集群来实现这一点。

下载横幅

什么是故障转移群集?

Windows Server中的故障转移集群是一组独立的节点,它们作为单个逻辑单元一起工作,以提高运行在故障转移集群之上的角色和服务的可用性和可伸缩性;这可以是众所周知的应用程序,如MS SQL Server或虚拟化特定角色,如Hyper-V。

故障转移集群通常通过物理方式连接在一起,也可以通过软件或应用程序层连接在一起。在故障转移集群上运行这些应用程序的一般优点是,如果一个或多个集群节点发生故障,其他节点将接手故障节点的应用程序、服务或角色。这个过程称为故障转移,因此它被命名为“故障转移集群”。

hyper - v故障转移集群

简单地说,一组类似的Hyper-V服务器/ Windows服务器启用了Hyper-V角色连接和工作在一起,以平衡情况,当一个连接的服务器运行任何应用程序,服务或角色下降或失败;hyper-v服务器在技术术语中被称为节点。

故障切换集群的工作机制

故障转移集群具有内部监控机制,该机制不断查询作为故障转移集群成员的节点,以确保它们健康、活动并正常运行;这被称为"心跳”. 有时,如果某个节点变得不健康,则可能会重新启动不健康节点上存在的群集服务或应用程序,以解决问题,或如上所述进行完全故障转移。

故障转移群集提供了另一种非常强大的存储机制,称为群集共享卷(CSV).CSV允许在集群节点之间提供共享存储,这样就提供了一个一致的分布式命名空间,以便从所有节点访问共享存储。这也为Hyper-V机器提供了必要的多连接存储功能。

法定人数在故障转移集群配置中,有一种特殊的投票机制,有助于防止调用脑裂

这些是什么?–如果任何一个群集节点发生故障或损坏,可能会出现大脑分裂的情况。如上所述,在Windows Server故障转移群集的节点之间维护一种特殊类型的通信。如果任何东西当故障转移集群中的节点彼此分离时,节点可能会认为它们需要获得集群资源的所有权。

阅读更多:了解故障转移集群中的仲裁

Windows Server 2019故障转移集群有什么新功能?

对于Windows Server的每个新版本,Microsoft通常会向故障转移集群特性添加一些特性和功能。Windows Server 2019也不例外;Windows Server 2019有一些非常棒的特性改进,使故障转移集群特性比以前的版本更加强大。

让我们来看看:

  1. 集群集–Windows Server 2019软件定义数据中心解决方案的一大新功能是能够形成群集集。
  2. 什么是集群集?—多个故障转移集群的松散耦合分组,包括计算、存储和超融合基础设施,使您能够在集群和不同集群集之间移动虚拟机。

  3. Azure-aware集群–Microsoft正在使在Azure IaaS环境中运行工作负载变得越来越容易。有了Azure感知群集,Windows故障转移群集现在可以在Azure内部运行时进行检测。当它们在Azure IaaS环境中运行时,它们会自动优化自身,以提供主动故障切换和Azure计划维护事件的日志记录等。此外,您不再需要使用动态网络名称配置负载平衡器。
  4. 跨域集群迁移- Windows Server 2019上运行的Windows故障转移集群现在可以在不同的Active Directory域之间移动。这是Windows故障转移集群长期以来要求的一个特性,它打开了许多可能性,并减轻了域整合、合并等的痛苦。
  5. USB证人-使用USB见证配置,即双节点Windows故障转移集群,您可以使用一个简单的USB设备,它被附加到一个普通网络设备,如路由器等,以提供仲裁见证组件,这被称为真正的两节点
  6. 集群基础设施改进—对于Windows Server 2019,默认开启CSV缓存,以提高运行在集群共享卷上的虚拟机的性能。此外,还有一些增强功能,使Windows故障转移集群具有更多的能力和逻辑来检测集群的问题并自动修复。这也包括分区节点和网络路由检测的使用。
  7. 集群感知更新支持直接存储空间- Windows Server 2012对Windows故障转移集群的一个重大改进是集群感知更新功能。这将自动化在集群服务器上应用软件更新的过程,同时维护集群中驻留的角色的可用性。这个特性在每个Windows Server版本中都得到了改进。现在在Windows Server 2019中,CAU功能可以识别并与Storage Spaces Direct (S2D)集成。该特性编排了集群中所有服务器的重新启动,以进行维护操作,包括更新。
  8. 文件共享见证增强Windows Server 2019新增了文件共享见证功能的增强、改进和故障保护功能。这包括在连接internet较差的远程位置使用文件共享见证、缺少共享驱动器、缺乏域控制器(如DMZ、工作组或跨域集群)以及阻止DFS文件共享。
  9. 集群硬化—集群内通过SMB进行的CSV卷和S2D通信利用了证书,使通信尽可能安全,并消除了对New Technology LAN Manager的依赖(NTLM)
  10. 故障转移集群不再使用NTLM身份验证- NTLM已经与Windows Server 2019故障转移集群身份验证并行。对于Windows Server 2019,故障转移集群只使用Kerberos和基于证书的身份验证。

在Windows Server 2019中提供的这个最新版本的故障转移集群中,有许多新的增强值得注意。在Windows Server故障转移集群上托管的最常见角色之一可能是Hyper-V。这允许以高可用的方式运行虚拟机;特定于hyper - v。

安装Windows故障转移群集的先决条件

在安装Windows特性组件前,需要验证前提条件。那些是什么?以下是微软通常指出的安装Windows故障转移集群特性和特定于Hyper-V的先决条件:

  • 为所有Failover Cluster节点安装相同版本的Windows Server
  • 服务器具有相同或类似的硬件配置
  • 确保存储和网络组件足够用于连接等
  • 共享存储—故障转移集群需要共享存储,可以是直接存储空间(S2D)的形式,也可以是共享存储。共享存储可以是传统的共享存储,通过SAN设备与iSCSI和NFS目标,以及新的软件定义的方法,如storage Spaces Direct。
  • 连接的存储应包含多个物理磁盘,这些磁盘的配置方式应提供冗余。某些配置可能使用磁盘或逻辑存储器作为磁盘见证
    • 支持基本磁盘,而不是动态磁盘
    • 对于群集共享卷,请使用NTFS-对于S2D,建议使用REF
  • 特别是对于软件定义的Windows故障转移集群解决方案(如直接存储空间等),请使用WSSD认证的硬件解决方案
  • 如果您正在运行专门的Windows故障转移集群(如Storage Spaces Direct (S2D)),则必须密切关注硬件需求,因为S2D有非常具体的需求
  • 对于Hyper-V特定的集群,集群服务器必须支持Hyper-V角色的硬件要求,包括具有硬件辅助虚拟化的处理器。这包括英特尔虚拟化技术(Intel VT)或AMD虚拟化(AMD- v)技术。此外,还必须启用硬件强制的DEP。

如何在Windows Server中实现故障转移群集?

在以下演练中,让我们看一看Windows Server 2019中故障转移群集的实现。这包括以下几个步骤:

  • 在至少两个故障转移集群节点上安装相同版本的Windows Server和补丁。
  • 决定加入域、多域或工作组群集。
  • 在故障转移集群节点之间配置共享存储。
  • 安装故障转移集群特性和要集群的角色服务(Hyper-V等)。
  • 测试集群配置。
  • 创建故障转移群集。
  • 配置法定人数。

你可以在以下部分找到对上述步骤的简要解释:

  1. 安装Windows Server 2019及其补丁

    让我们跳过安装Windows Server,因为我们已经在两个故障转移集群主机上安装了Windows Server 2019。需要注意的一点是,您希望确保故障转移集群主机运行的是相同版本的Windows Server,并且处于相同的补丁级别。这确保了主机之间的所有操作都是一致的,并且节点之间没有意外的行为或差异。

    Windows下的故障转移集群

    确保故障转移集群主机运行相同的Windows版本和补丁级别。

  2. Active Directory域加入?

    在Windows Server 2016中,微软在提供域连接灵活性方面,用Windows Server故障转移集群开辟了一些新的、非常令人兴奋的功能。

    从Windows Server 2016开始并扩展到2019年,您可以拥有域加入、跨域加入(多域)或工作组集群。对于实验演练,我们将使用典型的域加入集群配置。请注意其他可用的选项。

    Windows下的故障转移集群

    两个集群主机都加入了域。

  3. 共享存储

    下面是两个通过iSCSI连接挂载到SAN存储的共享驱动器。如您所见,为仲裁目的挂载了一个卷,还有一个更大的卷用于实际存储Hyper-V虚拟机的数据。

    您将希望确保所有集群主机都能连接到共享卷,以便根据需要进行集群故障转移、仲裁和其他进程。

    当创建集群时,集群向导通常可以有效地选择用于仲裁目的的磁盘(最小的磁盘等)。但是,您也可以在故障转移集群管理器中找到的“配置集群仲裁向导”中手动为仲裁分配磁盘。

    在故障转移集群管理器中右键单击故障转移集群名称>更多操作>配置集群仲裁设置。

    Windows下的故障转移集群

    手动分配法定人数

    Windows下的故障转移集群

    挂载两个卷用于故障转移集群共享存储。

  4. 在集群中安装Hyper-V和其他角色

    由于这两个节点将作为Hyper-V主机,我们将在每个主机上安装Hyper-V Role,以便准备将这两个节点都添加到承载虚拟机的故障转移集群中。您可以使用服务器管理器来安装角色/功能,然而,PowerShell是一种快速、轻松地安装Windows Server组件(如角色和功能)的好方法。要安装Hyper-V,请使用以下一行代码。

    • 安装- windows feature -Name Hyper-V -IncludeAllSubFeature-IncludeManagementTools -重启

    Windows下的故障转移集群

    在故障切换集群主机上安装Hyper-V角色

  5. 安装故障转移群集功能

    现在,让我们安装故障转移集群特性和管理工具(故障转移集群管理器)来管理故障转移集群特性。同样,PowerShell是实现这一点的好方法。使用下面的PowerShell一行程序:

    • 安装- windows feature -Name failover - cluster -IncludeManagementTools

    Windows下的故障转移集群

    安装故障转移群集功能。

  6. 测试故障转移集群配置

    Microsoft提供的在配置Windows Server故障转移群集时非常有用的工具之一是验证配置工具可以在故障转移集群管理器中找到。这有助于在创建集群之前了解配置中的任何问题。

    该验证对集群配置中非常常见的问题区域(包括网络配置和存储配置)运行广泛的测试。它确保配置的共享存储满足Windows Server故障转移集群所需的要求,包括iSCSI Persistent reservation。

    Windows下的故障转移集群

    使用“验证集群”工具验证故障转移集群配置,
    您还可以使用PowerShell对预期的故障转移群集主机运行验证。

    • 测试集群

    Windows下的故障转移集群

    在创建故障转移集群之前,对集群主机运行Test-Cluster cmdlet。

    Windows下的故障转移集群

    验证过程在它运行的集群主机上创建一个报告C:\Windows\Cluster\Reports故障转移群集主机上的目录。

    Windows下的故障转移集群

    查看创建的验证报告

    验证过程创建一个非常详细的报告,将其划分为验证的主要部分。这包括Hyper-V配置、库存、网络、存储、系统配置等。在继续进行故障转移集群配置之前,您需要记录报告中的任何错误或警告,以确保这些错误或警告得到纠正。

    Windows下的故障转移集群

    查看故障切换集群验证报告

  7. 创建故障切换集群

    一旦验证了集群配置并解决了发现的任何问题,就可以创建故障转移集群了。在PowerShell中创建Windows Server故障转移集群很容易:

    • New-Cluster -Name HyperVCluster -node < node1 >,< node2 > -staticAddress < IP Address >

    Windows下的故障转移集群

    创建新的Windows Server故障转移集群

    创建群集后,您可以验证是否已创建Active Directory对象,以及是否在故障转移群集管理器中看到该群集。

    Windows下的故障转移集群

    因此,将在Active Directory中创建一个新的故障转移集群计算机对象。

最后的想法

Windows Server故障转移群集为运行业务关键型应用程序和服务提供了一个非常强健且具有弹性的平台。随着Windows Server平台的每一个版本的发布,故障转移群集功能都在不断增强。在Windows Server 2019的发行版中,它拥有迄今为止功能最丰富的故障转移群集平台。

无论您的平台从高可用性角度来看有多强的弹性,您都必须确保数据受到保护。这意味着您应该对运行在Windows服务器故障转移集群(包括Hyper-V虚拟机)上的关键任务数据进行有效备份。

Vembu BDR套件曾经是市场上一个有效的备份解决方案,它允许您确保Hyper-V环境的完整数据可用性,包括独立Hyper-V主机到承载Hyper-V角色的多个Windows Server故障转移群集。

在Vembu BDR Suite中,即使您的虚拟机被转移到另一个Hyper-V主机,备份也将继续工作而不中断。与Hyper-V的本地高可用性特性结合使用,Vembu Backup for Microsoft Hyper-V确保即使在灾难时刻也可以为您的Hyper-V生产工作负载提供数据可用性。

Vembu BDR Suite提供了一个非常健壮的备份解决方案,具有企业级特性,以惊人的价格范围有效地保护Hyper-V集群。下载一个免费的,功能齐全的Vembu BDR套件试用版。

跟随我们的推特脸谱网新版本、更新、有见地的文章等的提要。