Содержание

Экземпляры отказоустойчивого кластера AlwaysOn (SQL Server) Always On Failover Cluster Instances (SQL Server)
Преимущества экземпляра отказоустойчивого кластера Benefits of a Failover Cluster Instance
Рекомендации Recommendations
Общие сведения об экземпляре отказоустойчивого кластера Failover Cluster Instance Overview
Прогнозируемое время отработки отказа Predictable Failover Time
Надежный мониторинг исправности и гибкая политика отработки отказа Reliable Health Monitoring and Flexible Failover Policy
Элементы экземпляра отказоустойчивого кластера Elements of a Failover Cluster Instance

Экземпляры отказоустойчивого кластера AlwaysOn (SQL Server) Always On Failover Cluster Instances (SQL Server)

Применимо к: Applies to: SQL Server SQL Server (все поддерживаемые версии) SQL Server SQL Server (all supported versions) Применимо к: Applies to: SQL Server SQL Server (все поддерживаемые версии) SQL Server SQL Server (all supported versions)

В рамках SQL Server SQL Server AlwaysOn экземпляры отказоустойчивой кластеризации AlwaysOn используют функциональные возможности отказоустойчивой кластеризации Windows Server (WSFC) для обеспечения высокого уровня доступности локальных ресурсов за счет избыточности на уровне экземпляра сервера — экземпляра отказоустойчивого кластера (FCI). As part of the SQL Server SQL Server Always On offering, Always On Failover Cluster Instances leverages Windows Server Failover Clustering (WSFC) functionality to provide local high availability through redundancy at the server-instance level-a failover cluster instance (FCI). Экземпляр отказоустойчивого кластера (FCI) является единственным экземпляром SQL Server SQL Server , установленным на всех узлах отказоустойчивой кластеризации Windows Server (WSFC) и, возможно, в нескольких подсетях. An FCI is a single instance of SQL Server SQL Server that is installed across Windows Server Failover Clustering (WSFC) nodes and, possibly, across multiple subnets. Экземпляр отказоустойчивого кластера выглядит в сети как экземпляр SQL Server SQL Server , запущенный на одном компьютере, но экземпляр отказоустойчивого кластера обеспечивает отработку отказа с переходом одного узла WSFC на другой узел, если текущий узел становится недоступным. On the network, an FCI appears to be an instance of SQL Server SQL Server running on a single computer, but the FCI provides failover from one WSFC node to another if the current node becomes unavailable.

Экземпляр отказоустойчивого кластера (FCI) может эффективно использовать группы доступности для удаленного аварийного восстановления на уровне базы данных. An FCI can leverage Availability Groups to provide remote disaster recovery at the database level. Дополнительные сведения см. в статье Failover Clustering and Always On Availability Groups (SQL Server) (Отказоустойчивая кластеризация и группы доступности AlwaysOn (SQL Server)). For more information, see Failover Clustering and Availability Groups (SQL Server).

В версии Windows Server 2016 Datacenter добавлена поддержка локальных дисковых пространств (S2D). Windows Server 2016 Datacenter edition introduces support for Storage Spaces Direct (S2D). Экземпляры отказоустойчивого кластера SQL Server поддерживают S2D для ресурсов хранилища кластера. SQL Server Failover Cluster Instances support S2D for cluster storage resources. Дополнительные сведения см. в статье Локальные дисковые пространства в Windows Server 2016. For more information, see Storage Spaces Direct in Windows Server 2016.

Также экземпляры отказоустойчивого кластера поддерживают кластеризованные общие тома (CSV). Failover Cluster Instances also support Clustered Shared Volumes (CSV). Дополнительные сведения см. в разделе Основные сведения о кластерных общих томах в отказоустойчивом кластере. For more information, see Understanding Cluster Shared Volumes in a Failover Cluster.

В этом разделе. In this Topic:

Преимущества экземпляра отказоустойчивого кластера Benefits of a Failover Cluster Instance

При сбое оборудования или программного обеспечения сервера приложения или клиенты, связывающиеся с сервером, будут простаивать. When there is hardware or software failure of a server, the applications or clients connecting to the server will experience downtime. Если экземпляр SQL Server SQL Server настроен как отказоустойчивый кластер (а не как независимый экземпляр), высокий уровень доступности такого экземпляра SQL Server SQL Server защищен наличием избыточных узлов в отказоустойчивом кластере. When a SQL Server SQL Server instance is configured to be an FCI (instead of a standalone instance), the high availability of that SQL Server SQL Server instance is protected by the presence of redundant nodes in the FCI. Только один из узлов в FCI принадлежит группе ресурсов WSFC одновременно. Only one of the nodes in the FCI owns the WSFC resource group at a time. В случае сбоя (отказа оборудования, сбоя операционной системы, приложений или служб) либо при выполнении запланированного обновления группа передается во владение другому узлу отказоустойчивого кластера. In case of a failure (hardware failures, operating system failures, application or service failures), or a planned upgrade, the resource group ownership is moved to another WSFC node. Данный процесс не заметен для клиента или приложения, соединяющегося с SQL Server SQL Server , и сводит к минимуму время ожидания приложения или клиента во время сбоя. This process is transparent to the client or application connecting to SQL Server SQL Server and this minimize the downtime the application or clients experience during a failure. Ниже перечислены некоторые ключевые преимущества, которые обеспечивают экземпляры отказоустойчивого кластера SQL Server SQL Server : The following lists some key benefits that SQL Server SQL Server failover cluster instances provide:

Защита на уровне экземпляра через избыточность Protection at the instance level through redundancy

Автоматический переход на другой ресурс в случае сбоя (отказа оборудования, сбоя операционной системы, приложений или служб) Automatic failover in the event of a failure (hardware failures, operating system failures, application or service failures)

В группе доступности не поддерживается автоматический переход с FCI на другие узлы в пределах группы доступности. In an availability group, automatic failover from an FCI to other nodes within the availability group is not supported. Это означает, что отказоустойчивые кластеры и независимые узлы не следует объединять внутри одной группы доступности, если автоматический переход на другой ресурс является важным компонентом решения высокого уровня доступности. This means that FCIs and standalone nodes should not be coupled together within an availability group if automatic failover is an important component your high availability solution. Однако такое объединение можно сделать для решения аварийного восстановления . However, this coupling can be made for your disaster recovery solution.

Поддержка широкого массива решения хранения, включая диски кластеров WSFC (iSCSI, Fiber Channel и т. д.) и общие папки протокола SMB. Support for a broad array of storage solutions, including WSFC cluster disks (iSCSI, Fiber Channel, and so on) and server message block (SMB) file shares.

Решения аварийного восстановления с использованием нескольких подсетей FCI или запуска базы данных на FCI внутри группы доступности. Disaster recovery solution using a multi-subnet FCI or running an FCI-hosted database inside an availability group. Благодаря новой поддержке большого числа подсетей в среде Microsoft Microsoft SQL Server 2012 (11.x) SQL Server 2012 (11.x) кластеру FCI с большим количеством подсетей больше не нужна виртуальная локальная сеть, что повышает управляемость и безопасность кластера FCI с большим числом подсетей. With the new multi-subnet support in Microsoft Microsoft SQL Server 2012 (11.x) SQL Server 2012 (11.x) , a multi-subnet FCI no longer requires a virtual LAN, increasing the manageability and security of a multi-subnet FCI.

Нулевая реконфигурация приложений и клиентов при сбое Zero reconfiguration of applications and clients during failovers

Гибкая политика отработки отказа для гранулированных событий триггера для автоматической отработки отказа Flexible failover policy for granular trigger events for automatic failovers

Надежная отработка отказа посредством периодического подробного отслеживания исправности системы с помощью выделенных и постоянных соединений Reliable failovers through periodic and detailed health detection using dedicated and persisted connections

Возможность настройки и предсказуемость во время отработки отказа посредством косвенных контрольных точек Configurability and predictability in failover time through indirect background checkpoints

Использование регулируемых ресурсов при отработке отказа Throttled resource usage during failovers

Общие сведения об экземпляре отказоустойчивого кластера Failover Cluster Instance Overview

FCI работает в группе ресурсов WSFC вместе с одним или несколькими узлами WSFC. An FCI runs in a WSFC resource group with one or more WSFC nodes. Когда экземпляр FCI запускается, один из узлов принимает владение группой ресурсов и выводит свой экземпляр служб SQL Server SQL Server в сеть. When the FCI starts up, one of the nodes assume ownership of the resource group and brings its SQL Server SQL Server instance online. Ресурсы, принадлежащие данному узлу включают в себя: The resources owned by this node include:

Сетевое имя Network name

IP-адрес IP address

Общие диски Shared disks

SQL Server SQL Server Служба компонента Database Engine Database Engine service

SQL Server SQL Server Служба агента Agent service

SQL Server SQL Server Analysis Services, если эти служб установлены Analysis Services service, if installed

Один файловый ресурс общего доступа, если установлен компонент FILESTREAM One file share resource, if the FILESTREAM feature is installed

В любое время только владелец группы ресурсов (и никакой другой узел в FCI) запускает соответствующие службы SQL Server SQL Server в группе ресурсов. At any time, only the resource group owner (and no other node in the FCI) is running its respective SQL Server SQL Server services in the resource group. Когда происходит переход на другой ресурс, будь то автоматический или запланированный переход на другой ресурс, происходит следующая последовательность событий. When a failover occurs, whether it be an automatic failover or a planned failover, the following sequence of events happen:

Если событие не является сбоем оборудования или системы, все «грязные» страницы в буферном кэше записываются на диск. Unless a hardware or system failure occurs, all dirty pages in the buffer cache are written to disk.

Все соответствующие службы SQL Server SQL Server в группе ресурсов останавливаются на активном узле. All respective SQL Server SQL Server services in the resource group are stopped on the active node.

Права владения группой ресурсов переносятся на другой узел в FCI. The resource group ownership is transferred to another node in the FCI.

Новый владелец группы ресурсов запускает свои службы SQL Server SQL Server . The new resource group owner starts its SQL Server SQL Server services.

Клиентские запросы на подключение приложения автоматически перенаправляются на новый активный узел, используя то же имя виртуальной сети (VNN). Client application connection requests are automatically directed to the new active node using the same virtual network name (VNN).

FCI находится в сети, если его базовый кластер WSFC находится в исправном состоянии (большая часть узлов кворума WSFC доступны в качестве целей автоматического перехода на другой ресурс). The FCI is online as long as its underlying WSFC cluster is in good quorum health (the majority of the quorum WSFC nodes are available as automatic failover targets). Когда кластер WSFC теряет кворум из-за сбоя аппаратной части, программного обеспечения, сети или неверной настройки кворума, весь кластер WSFC вместе с FCI выводится из сети. When the WSFC cluster loses its quorum, whether due to hardware, software, network failure, or improper quorum configuration, the entire WSFC cluster, along with the FCI, is brought offline. Для этого незапланированного сценария отработки отказа требуется вмешательство пользователя, который должен переустановить кворум для оставшихся доступных узлов, чтобы вернуть кластер WSFC и FCI обратно в сеть. Manual intervention is then required in this unplanned failover scenario to reestablish quorum in the remaining available nodes in order to bring the WSFC cluster and FCI back online. Дополнительные сведения см. в статье Режимы кворума и конфигурация голосования WSFC (SQL Server). For more information, see WSFC Quorum Modes and Voting Configuration (SQL Server).

Прогнозируемое время отработки отказа Predictable Failover Time

В зависимости от того, когда экземпляр SQL Server SQL Server в последний раз выполнил операцию контрольной точки, в кэше буфера может быть достаточное число «грязных» страниц. Depending on when your SQL Server SQL Server instance last performed a checkpoint operation, there can be a substantial amount of dirty pages in the buffer cache. Последующая отработка отказа длится столько, сколько потребуется времени для записи оставшихся «грязных» страниц на диск, что может увеличить время отработки отказа непредсказуемым образом. Consequently, failovers last as long as it takes to write the remaining dirty pages to disk, which can lead to long and unpredictable failover time. Начиная с Microsoft Microsoft SQL Server 2012 (11.x) SQL Server 2012 (11.x) FCI может использовать косвенные контрольные точки для регулирования числа «грязных» страниц, хранимых в кэше буфера. Beginning with Microsoft Microsoft SQL Server 2012 (11.x) SQL Server 2012 (11.x) , the FCI can use indirect checkpoints to throttle the amount of dirty pages kept in the buffer cache. Несмотря на то что это занимает дополнительные ресурсы при нормальной рабочей нагрузке, время отработки отказа становится более прогнозируемым и регулируемым. While this does consume additional resources under regular workload, it makes the failover time more predictable as well as more configurable. Это очень полезно, когда в соглашении об уровне обслуживания в организации указана цель времени восстановления (RTO) для решения высокого уровня доступности. This is very useful when the service-level agreement in your organization specifies the recovery time objective (RTO) for your high availability solution. Дополнительные сведения о косвенных контрольных точках см. в разделе Indirect Checkpoints. For more information on indirect checkpoints, see Indirect Checkpoints.

Надежный мониторинг исправности и гибкая политика отработки отказа Reliable Health Monitoring and Flexible Failover Policy

После успешного запуска FCI служба WSFC мониторит состояние базового кластера WSFC, а также состояние экземпляра SQL Server SQL Server . After the FCI starts successfully, the WSFC service monitors both the health of the underlying WSFC cluster, as well as the health of the SQL Server SQL Server instance. Начиная с Microsoft Microsoft SQL Server 2012 (11.x) SQL Server 2012 (11.x) служба WSFC использует выделенную линию для обращения к экземпляру SQL Server SQL Server и получения подробной диагностики компонентов посредством системной хранимой процедуры. Beginning with Microsoft Microsoft SQL Server 2012 (11.x) SQL Server 2012 (11.x) , the WSFC service uses a dedicated connection to poll the active SQL Server SQL Server instance for detailed component diagnostics through a system stored procedure. Это имеет три последствия. The implication of this is three-fold:

Выделенное соединение с экземпляром SQL Server SQL Server позволяет получать надежную диагностику компонентов в любое время, даже когда FCI испытывает перегрузку. The dedicated connection to the SQL Server SQL Server instance makes it possible to reliably poll for component diagnostics all the time, even when the FCI is under heavy load. В результате можно выделить систему, испытывающую большую нагрузку, и систему, которая находится на грани отработки отказа, позволяя избежать проблем, связанных с ложной отработкой отказа. This makes it possible to distinguish between a system that is under heavy load and a system that actually has failure conditions, thus preventing issues such as false failovers.

Подробная диагностика компонентов позволяет настроить более гибкую политику отработки отказа, с помощью которой вы можете выбрать, какие условия отказа запускают отработку отказа, а какие нет. The detailed component diagnostics makes it possible to configure a more flexible failover policy, whereby you can choose what failure conditions trigger failovers and which failure conditions do not.

Подробная диагностика компонентов также позволяет лучше устранять ошибки автоматической отработки отказа. The detailed component diagnostics also enables better troubleshooting of automatic failovers retroactively. Сведения диагностики сохраняются в файлы журналов, связанные с журналами ошибок SQL Server SQL Server . The diagnostic information is stored to log files, which are collocated with the SQL Server SQL Server error logs. Файлы можно загрузить в средство просмотра файлов журнала для изучения состояний компонентов, которые привели к отработке отказа, чтобы определить причину сбоя. You can load them into the Log File Viewer to inspect the component states leading up to the failover occurrence in order to determine what cause that failover.

Элементы экземпляра отказоустойчивого кластера Elements of a Failover Cluster Instance

FCI включает набор физических серверов (узлов), которые имеют схожую аппаратную и программную конфигурацию, в том числе версию операционной системы и уровень обновления, версию SQL Server SQL Server , ее уровень обновления, компоненты и имя экземпляра. An FCI consists of a set of physical servers (nodes) that contain similar hardware configuration as well as identical software configuration that includes operating system version and patch level, and SQL Server SQL Server version, patch level, components, and instance name. Идентичная программная конфигурация необходима для того, чтобы FCI смог работать после отработки отказа между двумя узлами. Identical software configuration is necessary to ensure that the FCI can be fully functional as it fails over between the nodes.

Группа ресурсов WSFC WSFC Resource Group
FCI SQL Server SQL Server работает в группе ресурсов WSFC. A SQL Server SQL Server FCI runs in a WSFC resource group. Каждый узел в группе ресурсов поддерживает синхронизированную копию параметров конфигурации и разделов реестра для того, чтобы сохранить полную функциональность FCI после отработки отказа, при этом только один узел в кластере владеет группой ресурсов одновременно (активный узел). Each node in the resource group maintains a synchronized copy of the configuration settings and check-pointed registry keys to ensure full functionality of the FCI after a failover, and only one of the nodes in the cluster owns the resource group at a time (the active node). Служба WSFC управляет кластером сервера, конфигурацией кворума, политикой и операциями отработки отказа, а также именем виртуальной сети и виртуальными IP-адресами для FCI. The WSFC service manages the server cluster, quorum configuration, failover policy, and failover operations, as well as the VNN and virtual IP addresses for the FCI. В случае сбоя (сбоев оборудования, сбоев операционной системы, приложений или служб) либо при выполнении запланированного обновления группа ресурсов передается во владение другому узлу в FCI. In case of a failure (hardware failures, operating system failures, application or service failures) or a planned upgrade, the resource group ownership is moved to another node in the FCI. Количество узлов, поддерживаемых в группе ресурсов WSFC, зависит от выпуска SQL Server SQL Server . The number of nodes that are supported in a WSFC resource group depends on your SQL Server SQL Server edition. Также один кластер WSFC может запускать несколько FCI (множественные группы ресурсов), в зависимости от возможностей оборудования, например ЦП, памяти и числа дисков. Also, the same WSFC cluster can run multiple FCIs (multiple resource groups), depending on your hardware capacity, such as CPUs, memory, and number of disks.

Двоичные файлы SQL Server SQL Server Binaries
Двоичные файлы устанавливаются локально на каждом узле FCI, так же как и в случае изолированной установки SQL Server SQL Server . The product binaries are installed locally on each node of the FCI, a process similar to SQL Server SQL Server stand-alone installations. Однако во время запуска службы не запускаются автоматически, а управляются службой WSFC. However, during startup, the services are not started automatically, but managed by WSFC.

Память Storage
В отличие от группы доступности, на всех узлах FCI должно использоваться общее хранилище для базы данных и журналов. Contrary to the availability group, an FCI must use shared storage between all nodes of the FCI for database and log storage. Это общее хранилище может быть организовано в форме дисков кластера WSFC, дисков в сети хранения данных (SAN), локальных дисковых пространств (S2D) или общих папок SMB. The shared storage can be in the form of WSFC cluster disks, disks on a SAN, Storage Spaces Direct (S2D), or file shares on an SMB. Таким образом, все узлы в FCI имеют одинаковое представление данных экземпляра всегда, когда происходит отработка отказа. This way, all nodes in the FCI have the same view of instance data whenever a failover occurs. Однако в этом случае общее хранилище может стать единственной точкой сбоя, в то время как FCI зависит от базового решения хранилища для обеспечения защиты данных. This does mean, however, that the shared storage has the potential of being the single point of failure, and FCI depends on the underlying storage solution to ensure data protection.

Сетевое имя Network Name
VNN для FCI предоставляет единую точку соединения для FCI. The VNN for the FCI provides a unified connection point for the FCI. Это позволяет приложениям подключаться к VNN без необходимости знать текущий активный узел. This allows applications to connect to the VNN without the need to know the currently active node. Когда происходит отработка отказа, VNN регистрируется на новом активном узле после его запуска. When a failover occurs, the VNN is registered to the new active node after it starts. Данный процесс не заметен для клиента или приложения, соединяющегося с SQL Server SQL Server , и сводит к минимуму время ожидания приложения или клиента во время сбоя. This process is transparent to the client or application connecting to SQL Server SQL Server and this minimize the downtime the application or clients experience during a failure.

Виртуальные IP-адреса Virtual IPs
В случае многоподсетевого кластера FCI виртуальный IP-адрес присваивается каждой подсети FCI. In the case of a multi-subnet FCI, a virtual IP address is assigned to each subnet in the FCI. В ходе отработки отказа VNN-имя DNS-сервера обновляется и указывает на виртуальный IP-адрес соответствующей подсети. During a failover, the VNN on the DNS server is updated to point to the virtual IP address for the respective subnet. Приложения и клиенты могут подключиться к FCI, используя то же самое имя VNN после многоподсетевой отработки отказа. Applications and clients can then connect to the FCI using the same VNN after a multi-subnet failover.

Кластер windows sql server