원격 링크 소개
카우치베이스는 새로운 기능을 발표하게 되어 기쁘게 생각합니다. 원격 링크 분석 서비스 기능의 최신 카우치베이스 서버 6.6 릴리스. 원격 링크를 사용하면 실시간 운영 분석을 통해 분석 서비스 전용의 별도 클러스터에서 여러 Couchbase 데이터 클러스터 및 데이터센터의 데이터를 가져와 분석할 수 있습니다.
고객 사용 사례
6.6 릴리즈 이전에는 분석 서비스를 하나의 클러스터 내에서 사용할 수 있었지만, 서비스와 분석은 해당 클러스터에 묶여 있었습니다. 소매, 라이프스타일, 여행 분야의 여러 고객들은 각자의 비즈니스 부문(예: 전자상거래, 마케팅, 공급망 등)에 대한 분석을 별도의 Couchbase 클러스터에서 수행하고 있었습니다. 이들은 다양한 운영 애플리케이션의 데이터를 중앙 집중식 분석 클러스터로 통합하고 싶다는 의사를 표명했습니다. 이에 따라 엔지니어링 팀과 제품 팀은 이러한 고객의 요구를 해결하도록 지원하게 되었습니다. 다른 분석 사용 사례에 대해 자세히 읽어보세요. 여기.
원격 링크는 어떻게 작동하나요?
원격 링크를 사용하면 데이터 서비스, 원격 Couchbase 클러스터에서 Analytics 클러스터로 데이터를 수집할 수 있습니다. 이 작업은 간단한 세 단계로 이루어집니다:
- REST API 호출 또는 명령줄 인터페이스(CLI)를 사용하여 원격 링크를 설정합니다.
- 위에 구성된 원격 링크에서 Analytics 클러스터에 데이터 집합을 만듭니다.
- 다음을 사용하여 데이터 집합을 쿼리합니다. SQL++ (또는 선호하는 BI 도구)
간단한 예를 들어 보겠습니다. 전자상거래 회사인 iWorks는 iPhone 액세서리를 온라인으로 판매합니다. 주문 데이터는 문서 유형이 "order"인 "ecommerce"라는 버킷에 하나의 Couchbase 클러스터에 저장됩니다. 고객 데이터는 "customer360"이라는 버킷의 두 번째 Couchbase 클러스터에 문서 유형 "customer"로 저장됩니다. iWorks는 분석 서비스를 사용하여 주문 데이터와 고객 데이터를 결합하고 분석하여 매출 기준 상위 3개 고객을 파악하고자 합니다. 바로 아래 그림은 원격 링크를 설정하기 전의 그림입니다:

샘플 고객 데이터:
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |
[ { "custid": "C31", "name": "D. Pitts", "docType": "customer", "주소": { "street": "360 Mountain Ave.", "city": "미주리주 세인트루이스", "우편번호": "63101" } }, { "custid": "C35", "name": "F. Robert", "docType": "customer", "주소": { "street": "420 Green St.", "city": "Boston, MA", "우편번호": "02115" }, "rating": 565 } ] |
샘플 주문 데이터:
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 |
[ { "orderno": 1004, "custid": "C35", "docType": "주문", "order_date": "2020-07-10", "ship_date": "2020-07-15", "items": [ { "itemno": 680, "qty": 6, "가격": 10.00 }, { "itemno": 195, "qty": 4, "가격": 20.00 } ] } { "orderno": 1050, "custid": "C31", "docType": "주문", "order_date": "2020-06-05", "ship_date": "2020-06-12", "items": [ { "itemno": 680, "qty": 4, "가격": 10.00 }, { "itemno": 195, "qty": 2, "가격": 20.00 } ] } ] |
위의 세 단계에 따라 샘플 설정 코드와 SQL++ 쿼리를 사용해 보겠습니다.
1단계: 원격 링크 설정
다음을 사용하여 새 Analytics 클러스터에 두 개의 원격 링크를 만듭니다. REST API 호출합니다. (또는 원격 링크 생성을 위한 CLI.) 먼저 '주문' 원격 링크를 설정해 보겠습니다. 다음을 제공해야 합니다:
-
- 분석 클러스터 호스트 이름
- 애널리틱스 사용자 자격 증명
- 원격 링크 이름(이 경우 remoteOrders)
- 데이터버스 이름(기본값과 다른 경우)
- 링크 유형을 카우치베이스로 설정
- 주문 클러스터 호스트 이름
- 주문 사용자 자격 증명
- 원하는 암호화 유형을 지정합니다(이 경우 없음).
|
1 2 3 4 5 6 7 8 9 |
$ curl -u <사용자 이름>:<pwd> -X POST "http:///분석/링크" -d 데이터버스=기본값 -d 이름=원격 주문 -d 유형=카우치베이스 -d 호스트 이름=<주문_호스트이름> -d 사용자 이름=<주문_사용자 이름> -d 비밀번호=<주문_비밀번호> -d 암호화=없음 |
이제 애널리틱스 클러스터에서 "고객" 원격 링크를 설정해 보겠습니다. 이 단계는 위에 나열된 단계와 유사하지만 고객 클러스터 호스트 세부 정보 및 자격 증명과 함께 새 원격 링크 이름(이 경우 remoteCustomers)을 제공해야 한다는 점을 제외하면 비슷합니다. 이 경우 암호화 유형으로 "전체"를 선택하고(설명용으로) 필수 인증서 매개 변수를 포함합니다.
|
1 2 3 4 5 6 7 8 9 |
$ curl -u <사용자 이름>:<pwd> -X POST "http:///분석/링크" -d 데이터버스=기본값 -d 이름=원격 고객 -d 유형=카우치베이스 -d 호스트 이름=<고객_호스트명> -d 사용자 이름=<고객_사용자명> -d 비밀번호=<비밀번호> -d 암호화=전체 --데이터-urlencode "인증서=$(cat ./targetClusterRootCert.pem)" |
인증서는 대상클러스터루트인증서.pem 는 대상 클러스터의 웹 콘솔에서 검색할 수 있습니다.

아래 그림은 두 원격 링크가 모두 설정된 후의 모습입니다:

2단계: 데이터 집합 만들기 및 원격 링크 연결하기
이제 분석 워크벤치를 사용하여 위에서 만든 두 개의 원격 링크에 '주문'과 '고객'이라는 두 개의 데이터 집합을 생성하겠습니다:
|
1 2 3 |
만들기 데이터 세트 주문 켜기 `전자 상거래` AT 원격 주문 어디 문서 유형 = '주문'; |
|
1 2 3 |
만들기 데이터 세트 고객 켜기 `customer360` AT 원격 고객 어디 문서 유형 = '고객'; |
다음으로, 주문 및 고객 데이터 클러스터에서 분석 클러스터로 데이터를 수집할 수 있도록 remoteOrders 및 remoteCustomers 링크를 모두 연결해 보겠습니다. 이것은 JSON 분석의 강력한 NoETL 기능을 보여줍니다. 명확히 말하면, 분석하기 전에 한 시스템에서 다른 시스템으로 NoSQL JSON 데이터를 이동하는 데 ETL이 필요하지 않습니다. 이렇게 하면 시간과 처리 능력이 절약되어 데이터를 Analytics 클러스터에서 자연스러운(애플리케이션) 형태로 바로 분석할 수 있습니다.
|
1 |
연결 링크 원격 주문; |
|
1 |
연결 링크 원격 고객; |
3단계: SQL++를 사용한 쿼리
마지막 단계로, 이제 아래 나열된 SQL++ 쿼리를 실행하여(SQL :)) 주문과 고객을 연결하여 매출이 가장 높은 상위 3개 고객을 가져올 수 있습니다.
|
1 2 3 4 5 6 |
선택 c.이름 고객, SUM(i.수량 * i.가격) 판매 FROM 주문 o, o.항목 i, 고객 c 어디 o.custid = c.custid 그룹 BY c.이름 주문 BY 판매 DESC LIMIT 3; |
다음은 JSON 쿼리 결과입니다:
|
1 2 3 4 5 |
[ { "고객": "D. Pitts", "판매": 19005.31 }, { "고객": "F. Robert", "판매": 13036.8 }, { "고객": "S. 위버","판매": 4639.92 } ] |
우후! 원격 링크가 작동하여 이제 고객 데이터와 주문 데이터를 함께 결합하고 분석할 수 있게 되었습니다. 이제 사용자는 추가 데이터 탐색을 위해 다양하고 복잡한 임시 쿼리를 개발하고, 새로운 비즈니스 질문에 답하고, 추가 Couchbase 데이터 원본을 가져올 수 있습니다.
혜택
원격 링크를 사용할 때 얻을 수 있는 주요 이점은 다음과 같습니다:
- 애널리틱스의 도달 범위를 확장하세요. 여러 클러스터에서 데이터를 수집하면 더 많은 데이터를 통합할 수 있습니다. 사용 사례에는 방금 살펴본 것처럼 여러 위치 또는 여러 애플리케이션의 데이터를 결합하고 상호 연관시키는 것이 포함됩니다.
- 애널리틱스의 총소유비용을 낮추세요. 위의 예에서 보았듯이 독립적인 Analytics 클러스터를 사용하면 각 개별 클러스터에 포함할 Analytics 노드의 필요성을 줄이거나 없앨 수 있습니다.
- 인사이트 확보 시간을 더욱 단축하세요. 고객은 관심 있는 데이터를 데이터 웨어하우스에 먼저 게시할 필요 없이 서로 다른 데이터 집합 간에 상관관계를 수행하여 더 많은 인사이트를 즉시 얻을 수 있습니다. 데이터를 분석하는 데 필요한 단계가 얼마나 적은지, ETL이 필요하지 않았고 데이터를 즉시 사용할 수 있었습니다.
요약
원격 링크는 최신 애플리케이션에 자주 필요한 하이브리드 트랜잭션/분석 처리(HTAP)를 통해 TCO를 낮추고, 리소스 활용도를 개선하며, NoSQL 솔루션 개발 및 배포를 가능하게 해줍니다. 원격 링크를 통해 사용자는 더 많은 데이터를 한곳에 모을 수 있으므로 조직은 더 많은 인사이트를 수집하고 여러 클러스터에서 가져온 다양한 데이터 세트에 대해 더 많은 상관관계 분석을 수행할 수 있습니다.
원격 링크에 대해 자세히 알아볼 수 있습니다. 여기. 등록 여기 에서 예정된 "릴리스 6.6의 새로운 기능 웨비나"를 확인하세요.
Couchbase Server 6.6 리소스 살펴보기
|
블로그 |
문서 및 튜토리얼 |
웹페이지 및 웹 세미나 |

공동 저자
이드리스 모티왈라, 수석 제품 관리자
Idris는 디지털 혁신, 클라우드 및 분석 분야의 팀을 이끄는 Fortune 500대 기업과 스타트업에서 소프트웨어 제품의 설계, 개발 및 실행 분야에서 20년 이상의 경력을 쌓은 Couchbase의 분석 부문 수석 제품 관리자입니다. Idris는 기술 관리 석사 학위와 제품 관리 자격증을 보유하고 있습니다.