Couchbase의 데이터 분석 기능이 더욱 강력해졌습니다. 7.0 릴리스와 함께.

이제 카우치베이스 애널리틱스의 일부로 제공되는 두 가지 강력한 새 기능을 발표하게 되어 기쁩니다: 1) CUBE 기능, 2) 롤업 집계는 여러 문서 속성에서 데이터를 집계하는 데 도움이 됩니다.

추가 CUBE 확장 기능을 카우치베이스 애널리틱스 서비스 의 일부입니다. 카우치베이스 서버 7.0 릴리즈. (우리는 다루었습니다 롤업 기능 지난 주 기사에서)

새로운 CUBE 기능의 워크스루 예시

SQL에서와 마찬가지로, CUBE 집계 기능은 GROUP BY 절.

CUBE 확장 하위 절을 사용하면 GROUP BY 절에 지정된 그룹화 열의 모든 조합에 대한 소계를 생성할 수 있습니다. 특히, 결과에는 일반적인 총합계 행과 함께 데이터의 소계를 나타내는 추가 행(일반적으로 초집계 행이라고 함)이 포함됩니다.

예를 들어 전자상거래 정보를 추적하는 주문이라는 샘플 분석 컬렉션이 있다고 가정해 보겠습니다. 가장 추적하려는 주요 데이터 요소는 지역/주, 주문 날짜, 수량 및 가격입니다. Sales(매출)를 Sales = 수량 * 가격으로 계산한다고 가정해 보겠습니다.

아래는 이 예제의 이커머스 데이터 샘플입니다:

이제 비즈니스 사용자가 전자상거래 데이터에서 다음 사항을 알고 싶어한다고 가정해 보겠습니다:

1) 지역별 연도별 총 매출
2) 연도별 모든 지역의 총 매출
3) 연도별 지역별 총 매출
4) 모든 지역 및 모든 연도의 총 매출

CUBE 확장 프로그램은 이러한 집계 기반 데이터 분석 질문에 답할 수 있는 좋은 사용 사례입니다. 데이터 엔지니어나 데이터 분석가는 단순히 N1QL 쿼리 는 Couchbase 애널리틱스 서비스 내에서 아래와 같이 표시됩니다.

위의 N1QL 쿼리에서는 다음을 사용했습니다. 그리고 지역 를 변수로 사용할 수 있습니다. 결과적으로 CUBE(지역, 연도) 은 샘플 데이터에 대해 다음과 같은 쿼리 결과를 생성합니다:

출력은 사용자가 원래 찾고 있던 것과 정확히 일치합니다:

  1. 결과 상단의 총합계에는 모든 연도 및 지역의 총 매출이 표시됩니다. 쿼리 출력에서 NULL 국가 및 지역 속성의 값을 각각 '모든 연도' 및 '모든 지역'으로 변환하여 출력을 더 쉽게 읽을 수 있도록 합니다.
  2. 그런 다음 2020년과 2021년과 같이 각 연도별로 모든 지역을 요약하여 총 매출을 표시하는 또 다른 소계의 결과를 볼 수 있습니다. 이러한 JSON 필드에서 지역 속성은 다음에서 변환됩니다. NULL 를 '모든 지역'으로 변경합니다.
  3. 그 다음에는 각 지역의 총 매출을 표시하는 '모든 연도'에 대한 또 다른 소계 요약이 표시됩니다(예: 앨라배마 및 캘리포니아). 이러한 필드에서 지역 속성은 다음에서 변환됩니다. NULL 를 '모든 지역'으로 변경합니다.
  4. 마지막으로 출력에는 연도별 각 지역에 대해 롤업된 총 매출이 표시됩니다. 이 예제에서는 2020년 캘리포니아의 매출

결론

카우치베이스 애널리틱스에서 사용할 수 있는 강력한 분석 표현식을 확장하는 이 새로운 집계 CUBE 기능에 많은 관심을 가져주시기 바랍니다. 자세한 내용은 여기를 참조하세요, 를 확인해보세요. CUBE 문서. 이 새로운 기능이 기업에서 향후 데이터 분석 프로젝트에 유용하게 사용되기를 바랍니다.

다음을 기대합니다. 카우치베이스 포럼에 대한 귀하의 피드백 - 여러분의 의견을 알려주세요!

카우치베이스 애널리틱스 체험하기 :
지금 Couchbase 다운로드

 

작성자

게시자 이드리스 모티왈라

Idris는 디지털 혁신, 클라우드 및 분석 분야의 팀을 이끄는 Fortune 500대 기업과 스타트업에서 소프트웨어 제품의 설계, 개발 및 실행 분야에서 20년 이상의 경력을 쌓은 Couchbase의 분석 부문 수석 제품 관리자입니다. Idris는 기술 관리 석사 학위와 제품 관리 자격증을 보유하고 있습니다.

댓글 남기기