두 가지 새로운 강력한 데이터 분석 기능을 발표하게 되어 기쁩니다. 이제 카우치베이스 애널리틱스의 일부로 사용할 수 있습니다: 1) 롤업
집계, 2) CUBE
기능을 사용하여 여러 문서 속성에서 데이터를 집계할 수 있습니다.
추가 롤업
집계 기능으로 카우치베이스 애널리틱스 서비스 의 일부입니다. 카우치베이스 서버 7.0 릴리즈. (이 글에서는 CUBE
기능을 다음 주 기사에서 소개할 예정입니다.)
롤업 집계 예시: 전자상거래 데이터
그리고 롤업
집계 함수는 그룹 기준 절을 사용합니다.
그리고 롤업
하위 절을 사용하면 총합계 행과 함께 데이터의 소계를 나타내는 추가 행(일반적으로 초집계 행이라고 함)을 포함할 수 있습니다.
예를 들어 비즈니스의 전자상거래 정보를 추적하는 Sales라는 분석 컬렉션이 있다고 가정해 보겠습니다. 가장 추적하려는 주요 데이터 요소는 국가, 지역/주, 제품, 수량 및 가격입니다. (Sales를 Sales = 수량 * 가격으로 계산한다고 가정해 보겠습니다.)
아래는 이커머스 데이터 수집 예시의 일부입니다:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 |
{ "국가": "US", "지역": "캘리포니아", "제품": "고무 키보드", "수량": 1, "가격": 35.5 }, { "국가": "US", "지역": "콜로라도", "제품": "장갑", "수량": 4, "가격": 6.95 }, { "국가": "US", "지역": "코네티컷", "제품": "코튼 타이", "수량": 2, "가격": 12.75 } ... |
이제 사용자가 위의 데이터를 사용하여 다음 정보를 확인해야 한다고 가정해 보겠습니다:
1) 모든 국가 및 지역의 총 매출
2) 국가별 모든 지역의 총 매출
3) 지역별 총 매출
그리고 롤업
집계 하위 절은 이러한 종류의 데이터 분석 질문에 답하는 데 탁월한 선택입니다. 데이터 엔지니어나 데이터 분석가는 단순히 N1QL 쿼리 에 표시됩니다.
1 2 3 4 5 6 7 8 |
선택 IFNULL(국가,"모든 국가") 국가, IFNULL(지역,"모든 지역") 지역, 라운드(SUM(o.수량 * o.가격),0) 판매 FROM 주문 o 어디 지역 좋아요 "C%" LET 국가 = o.국가, 지역 = o.지역 그룹 BY 롤업(국가, 지역) 주문 BY 국가 ASC, 지역 ASC, 판매 DESC; |
위의 N1QL 쿼리에서는 국가와 지역을 변수로 사용합니다. 국가와 지역은 롤업
하위 절은 지정된 데이터 속성 간의 계층 구조를 가정합니다.
예를 들어 입력 열이 (국가, 지역)
계층 구조 국가
보다 높거나 지역
. 그렇기 때문에 롤업
를 사용하여 보고용으로 소계와 총계를 생성합니다.
위의 쿼리를 기반으로 합니다, 롤업(국가, 지역)
은 다음과 같은 결과를 생성합니다:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
{ "국가": "모든 국가", "지역": "모든 지역", "판매": 19921991 }, { "국가": "US", "지역": "모든 지역", "판매": 199219915 }, { "국가": "US", "지역": "캘리포니아", "판매": 6610804 }, { "국가": "US", "지역": "콜로라도", "판매": 6569542 } { "국가": "US", "지역": "코네티컷", "판매": 6741644 } ... |
출력은 예제 사용자가 원래 찾고 있던 것과 정확히 일치합니다:
- 결과 상단의 총합계 요약 JSON 필드에는 모든 국가 및 지역의 총 매출이 표시됩니다. 이 행에서 국가 및 지역 속성의 NULL 값은 각각 "모든 국가" 및 "모든 지역"으로 변환되어 출력을 더 쉽게 읽을 수 있도록 합니다.
- 그 후 각 국가(이 경우 미국)에 대해 총 매출을 표시하는 추가 소계 요약 JSON 데이터 요소가 나타납니다. 여기서 지역 속성의 값은 NULL에서 "모든 지역"으로 변환됩니다.
- 마지막으로 출력에는 미국 내 각 지역에 대한 총 매출이 롤업되어 표시됩니다. 이 예에서는 미국 내 캘리포니아, 콜로라도 및 코네티컷의 매출이 표시됩니다.
결론
지금까지 새로운 기능에 대해 간략히 살펴보았습니다. 롤업
집계 기능을 사용할 수 있습니다. 자세한 내용은 여기를 참조하세요, 를 확인해보세요. 롤업
문서. 이 새로운 기능이 기업에서 향후 데이터 분석 프로젝트에 유용하게 사용되기를 바랍니다.
다음을 기대합니다. 카우치베이스 포럼에 대한 귀하의 피드백 - 여러분의 의견을 알려주세요!