Loading...
MySQL 9.5 Reference Manual 9.5의 20.7 Group Replication Performance and Troubleshooting의 한국어 번역본입니다.
아래의 경우에 피드백에서 신고해주신다면 반영하겠습니다.
감사합니다 :)
20.7.1 Fine Tuning the Group Communication Thread
20.7.2 Flow Control
20.7.3 Single Consensus Leader
20.7.4 Message Compression
20.7.5 Message Fragmentation
20.7.6 XCom Cache Management
20.7.7 Responses to Failure Detection and Network Partitioning
20.7.8 Handling a Network Partition and Loss of Quorum
20.7.9 Monitoring Group Replication Memory Usage with Performance Schema Memory Instrumentation
Group Replication은 내장된 장애 감지와 자동 복구 기능을 갖춘 장애 허용 시스템을 생성하도록 설계되었습니다. 어떤 멤버 서버 인스턴스가 자발적으로 그룹에서 이탈하거나 그룹과의 통신을 중단하면, 남은 멤버들은 서로 간에 그룹의 재구성을 합의하고, 필요하다면 새로운 프라이머리를 선택합니다. 추방된 멤버들은 자동으로 그룹에 다시 조인(join)을 시도하고, 분산 복구에 의해 최신 상태로 동기화됩니다. 그룹이 의사결정을 합의하기 위해 그 멤버들의 과반수에 접속할 수 없는 수준의 문제를 겪는 경우, 해당 그룹은 쿼럼을 상실한 것으로 스스로를 인식하고 트랜잭션 처리를 중단합니다.
Group Replication에는 또한 워크로드와 메시지 크기의 변화에 그룹이 적응하고 이를 관리하도록 돕고, 기본 시스템 및 네트워킹 리소스의 한계 내에 머물 수 있도록 하는 내장된 메커니즘과 설정들이 있습니다.
Group Replication의 시스템 변수에 대한 기본 설정은 그룹의 성능과 자율성을 극대화하도록 설계되었습니다. 이 절차의 정보는, 특정 시스템에서 발생하는 일시적인 네트워크 장애나 서버 인스턴스의 리소스를 초과하는 워크로드와 트랜잭션과 같은 반복되는 문제의 자동 처리를 최적화하도록 레플리케이션 그룹을 구성하는 데 도움을 주기 위한 것입니다.
만약 그룹 멤버들이 원하는 것보다 더 자주 추방되었다가 그룹에 다시 조인하는 현상이 발생한다면, Group Replication의 기본 장애 감지 설정이 시스템에 비해 지나치게 민감한 것일 수 있습니다. 이러한 상황은 속도가 느린 네트워크나 머신, 예기치 않은 일시적 장애가 자주 발생하는 네트워크, 또는 계획된 네트워크 장애 동안에 발생할 수 있습니다. 해당 상황을 설정 조정을 통해 처리하는 방법에 대한 조언은
Section 20.7.7, “Responses to Failure Detection and Network Partitioning”을 참고하십시오.
Group Replication 설정에 관리자가 수동으로 개입해야 하는 경우는, 그룹이 자동으로 처리할 수 없는 일이 발생했을 때뿐이어야 합니다. 관리자의 개입이 필요한 주요한 이슈로는, 멤버가 ERROR 상태에 있고 그룹에 다시 조인할 수 없는 경우, 또는 네트워크 분할로 인해 그룹이 쿼럼을 상실한 경우가 있습니다.
정상적으로 동작하고 올바르게 설정된 멤버가 분산 복구를 사용하여 그룹에 조인 또는 재조인할 수 없고
계속해서 ERROR 상태에 머무른다면,
Section 20.5.4.4, “Fault Tolerance for Distributed Recovery”에서 가능한 문제들을 설명합니다. 한 가지 가능성이 높은 원인은 조인하는 멤버가 그룹의 기존 멤버들에는 존재하지 않는 추가 트랜잭션을 가지고 있는 경우입니다. 해당 상황을 처리하는 방법에 대한 조언은 Section 20.4.1, “GTIDs and Group Replication”을 참고하십시오.
그룹이 쿼럼을 상실한 경우, 이는 그룹이 두 부분으로 나뉘는 네트워크 분할 때문일 수도 있고, 서버의 과반수가 장애가 난 것 때문일 수도 있습니다. 해당 상황을 처리하는 방법에 대한 조언은
Section 20.7.8, “Handling a Network Partition and Loss of Quorum”을 참고하십시오.
20.6.4 Group Replication IP Address Permissions
20.7.1 Fine Tuning the Group Communication Thread