대부분의 데이터베이스는 처음 시작할 때 사용 가능한 정보를 기반으로 올바르게 구성되고 크기가 결정되지만, 데이터 세트의 유기적인 증가 및/또는 워크로드 프로필의 변경으로 인해 상태가 좋지 않거나 크기가 부족해지는 경향이 있습니다. 카우치베이스는 두 가지 문제를 쉽게 처리할 수 있는 분산 데이터베이스이지만, 성능을 조정하고 꼭 필요한 경우 용량을 추가할 수 있는 최선의 방법을 찾기 위해 정기적인 상태 점검이 필요합니다. 이 블로그에서는 Couchbase 클러스터 상태 점검이 무엇이며, 상태 점검을 준비하고 수행할 때 따라야 할 모범 사례가 무엇인지 설명합니다.
건강 검진이란 무엇인가요?
카우치베이스는 CoE에 따라 여러 유료 서비스 패키지를 제공합니다(센터 오브 엑설런스) 날개의 프로페셔널 서비스. 이러한 서비스 패키지 중 하나는 건강 체크. 건강 검진 결과는 기본 형태의 무료 보고서와 유료 형태의 종합 보고서로 제공됩니다. 전자는 후자의 하위 집합입니다. 간단히 말해, 이 보고서는 Couchbase 클러스터의 전반적인 상태를 평가한 것입니다. 이 보고서는 상태가 좋지 않은 문제를 찾기 위한 것입니다. 종합 보고서에는 발견된 문제를 해결하거나 해결하기 위한 권장 사항도 포함되어 있습니다.
건강 검진을 받아야 하는 이유는 무엇인가요?
상태 점검을 받으면 성능 튜닝부터 용량 계획, TCO 절감에 이르기까지 다양한 혜택을 누릴 수 있습니다.
배포 초기에 사용 가능한 데이터를 기반으로 Couchbase 클러스터의 크기와 구성이 올바르게 설정되는 경우가 많지만, 시간이 지나면서 데이터 세트의 크기가 커지고 데이터 액세스 패턴이 변경되며 클러스터의 전반적인 워크로드가 변경되어 클러스터가 건강하지 않을 수 있습니다. 상태가 좋지 않은 클러스터는 다음 증상 중 하나 이상을 나타낼 수 있습니다.
- 높은 리소스 활용도
- 느린 응답 시간
- 시간 초과
- 열악한 최종 사용 환경
- 옴 킬러 액션
- 잦은 장애 조치
- 복원력 부족
건강 검진 시 이러한 증상의 근본 원인을 파악하고 분석합니다. 앞서 말했듯이 유료 건강 검진 서비스를 통해 근본적인 문제를 해결할 것을 권장합니다.
상태 점검은 클러스터 소유자가 블랙 프라이데이나 사이버 먼데이 등 계절적 성수기나 연말연시를 앞둔 쇼핑 시즌에 발생하는 업무량 증가에 대비하는 데도 도움이 됩니다. 리테일 업계에서 신제품이 출시되거나 특별 행사가 진행되는 동안에도 워크로드가 증가할 수 있습니다.
추가적인 이점으로는 리소스 활용도 향상, 생산 문제 감소, 잠재적인 TCO 절감, 보안 정책 및/또는 정부 규정 준수 등이 있습니다.
범위
Couchbase CoE 전문가는 상태 점검 중에 운영 데이터, 서버 로그, 워크로드, 사이징 및 버킷, 노드, OS 및 클러스터 수준 구성의 다양한 조합을 살펴봅니다. 운영 데이터는 클라이언트 운영과 관련된 단기 및 장기 메트릭, 서버 소프트웨어의 더 깊은 계층에서 생성된 메트릭, IO, 메모리, 네트워크 및 CPU 리소스 사용률과 같은 OS에서 기록하는 메트릭으로 구성됩니다.
또한 서버 로그와 OS 로그에 기록된 오류와 예외도 분석됩니다.
기본 양식에는 상태 확인 보고서가 포함됩니다:
- 클러스터 개요
- 노드 프로필
- 색인 정의(있는 경우)
- 보기 정의(있는 경우)
- 이슈 요약
종합 양식은 기본 양식에 다음 섹션을 추가합니다:
- 노드별 이슈에 대한 자세한 정보
- 이러한 문제를 해결하기 위한 권장 사항
참조 add_on_sections_for_a_detailed_report
프로세스
- 고객이 Couchbase 계정 팀 또는 Couchbase 파트너에게 연락하여 상태 확인을 요청합니다.
- 고객의 요청을 받은 담당자가 점검이 필요한 클러스터를 식별합니다. 상태 점검의 범위와 결과에 대한 기대치를 설정합니다.
- 고객은 대상 클러스터와 관련된 사용 사례, 클라이언트, 데이터 흐름에 대해 가능한 한 많은 정보를 공유합니다.
- 고객은 주어진 지침에 따라 Couchbase Server 로그를 수집합니다. 여기 그리고 여기. 이 로그 수집의 결과는 각 Couchbase 노드에 대한 zip 파일을 생성해야 합니다. 이 파일을 cbcollect라고 합니다. 여기에는 환경 정보, OS 수준 로그 및 Couchbase Server를 구성하는 다양한 프로세스에서 작성한 로그가 포함됩니다. cbcollect 파일의 형식이나 내용을 변경해서는 안 됩니다. 그렇게 하면 쓸모없게 됩니다.
- 고객은 일반적으로 다음과 같은 cURL 명령 구문을 사용하여 Couchbase의 S3 스토어에 cbcollect를 업로드합니다.
curl -업로드 파일 fileN.zip S3Target/customerName/clusterName/
어디에:
fileN.zip = cbcollect zip 파일 이름입니다.
S3Target = https://uploads.couchbase.com
고객 이름 = 카우치베이스 기술 지원팀에 가입한 고객 이름입니다.
clusterName = 상태 확인 중인 Couchbase 클러스터의 고유 이름입니다.
참고: curl 명령의 끝에 오는 /는 매우 중요합니다. 추가하는 것을 잊지 마세요. - 고객은 모든 cbcollect가 성공적으로 업로드된 후 Couchbase 계정 팀 또는 Couchbase 파트너에게 알립니다.
- 이때 카우치베이스 전문가가 인수인계를 받아 cbcollect에 포함된 데이터에 대한 광범위한 분석을 수행합니다. 마지막에 상태 점검 보고서가 생성됩니다.
모범 사례
- 건강 검진 대상과 검진을 통해 달성할 수 있는 목표에 대해 명확하게 상호 이해합니다.
- 완전한 cbcollect 세트를 제공하세요. 날짜가 오래된 파일이나 부분 파일을 사용하지 마세요.
- 한 번에 너무 많은 cbcollect가 업로드되거나 매우 큰 cbcollect가 연속으로 업로드되는 경우 S3에 문제가 발생하는 경우가 있습니다. 이러한 문제로 인해 파일이 거부되거나 손상될 수 있습니다. 이러한 문제를 방지하려면 업로드 속도를 늦추고 간격을 두는 것이 좋습니다.
- 상태 점검의 일부로 데이터 세트 증가 및 워크로드 기록을 검토하세요.
- 상태 점검의 노드 크기 조정, 버킷 크기 조정 및 다차원 확장 토폴로지 부분을 검토하세요.
- 보고서가 생성되면 고객과 함께 검토한 후 마무리하여 고객에게 보내세요.
- 고객으로부터 기한 내에 권장 사항을 구현하겠다는 약속을 받아보세요.
- 후속 조치를 통해 권장 사항이 논의된 대로 구현되었는지 확인합니다.
- 권장 사항을 실행한 후 몇 주 또는 몇 달 후에 다시 건강 검사를 권장하여 전후의 차이를 확인합니다.