두 가지 새로운 강력한 데이터 분석 기능을 발표하게 되어 기쁩니다. 이제 카우치베이스 애널리틱스의 일부로 사용할 수 있습니다: 1) 롤업 집계, 2) CUBE 기능을 사용하여 여러 문서 속성에서 데이터를 집계할 수 있습니다.

추가 롤업 집계 기능으로 카우치베이스 애널리틱스 서비스 의 일부입니다. 카우치베이스 서버 7.0 릴리즈. (이 글에서는 CUBE 기능을 다음 주 기사에서 소개할 예정입니다.)

롤업 집계 예시: 전자상거래 데이터

그리고 롤업 집계 함수는 그룹 기준 절을 사용합니다.

그리고 롤업 하위 절을 사용하면 총합계 행과 함께 데이터의 소계를 나타내는 추가 행(일반적으로 초집계 행이라고 함)을 포함할 수 있습니다.

예를 들어 비즈니스의 전자상거래 정보를 추적하는 Sales라는 분석 컬렉션이 있다고 가정해 보겠습니다. 가장 추적하려는 주요 데이터 요소는 국가, 지역/주, 제품, 수량 및 가격입니다. (Sales를 Sales = 수량 * 가격으로 계산한다고 가정해 보겠습니다.)

아래는 이커머스 데이터 수집 예시의 일부입니다:

이제 사용자가 위의 데이터를 사용하여 다음 정보를 확인해야 한다고 가정해 보겠습니다:

1) 모든 국가 및 지역의 총 매출
2) 국가별 모든 지역의 총 매출
3) 지역별 총 매출

그리고 롤업 집계 하위 절은 이러한 종류의 데이터 분석 질문에 답하는 데 탁월한 선택입니다. 데이터 엔지니어나 데이터 분석가는 단순히 N1QL 쿼리 에 표시됩니다.

위의 N1QL 쿼리에서는 국가와 지역을 변수로 사용합니다. 국가와 지역은 롤업 하위 절은 지정된 데이터 속성 간의 계층 구조를 가정합니다.

예를 들어 입력 열이 (국가, 지역)계층 구조 국가 보다 높거나 지역. 그렇기 때문에 롤업 를 사용하여 보고용으로 소계와 총계를 생성합니다.

위의 쿼리를 기반으로 합니다, 롤업(국가, 지역) 은 다음과 같은 결과를 생성합니다:

출력은 예제 사용자가 원래 찾고 있던 것과 정확히 일치합니다:

  1. 결과 상단의 총합계 요약 JSON 필드에는 모든 국가 및 지역의 총 매출이 표시됩니다. 이 행에서 국가 및 지역 속성의 NULL 값은 각각 "모든 국가" 및 "모든 지역"으로 변환되어 출력을 더 쉽게 읽을 수 있도록 합니다.
  2. 그 후 각 국가(이 경우 미국)에 대해 총 매출을 표시하는 추가 소계 요약 JSON 데이터 요소가 나타납니다. 여기서 지역 속성의 값은 NULL에서 "모든 지역"으로 변환됩니다.
  3. 마지막으로 출력에는 미국 내 각 지역에 대한 총 매출이 롤업되어 표시됩니다. 이 예에서는 미국 내 캘리포니아, 콜로라도 및 코네티컷의 매출이 표시됩니다.

결론

지금까지 새로운 기능에 대해 간략히 살펴보았습니다. 롤업 집계 기능을 사용할 수 있습니다. 자세한 내용은 여기를 참조하세요, 를 확인해보세요. 롤업 문서. 이 새로운 기능이 기업에서 향후 데이터 분석 프로젝트에 유용하게 사용되기를 바랍니다.

다음을 기대합니다. 카우치베이스 포럼에 대한 귀하의 피드백 - 여러분의 의견을 알려주세요!

제 말을 믿지 않아도 됩니다: 지금 바로 Couchbase Analytics를 사용해 보세요.카우치베이스 체험하기

 

작성자

게시자 이드리스 모티왈라

Idris는 디지털 혁신, 클라우드 및 분석 분야의 팀을 이끄는 Fortune 500대 기업과 스타트업에서 소프트웨어 제품의 설계, 개발 및 실행 분야에서 20년 이상의 경력을 쌓은 Couchbase의 분석 부문 수석 제품 관리자입니다. Idris는 기술 관리 석사 학위와 제품 관리 자격증을 보유하고 있습니다.

댓글 남기기