사물 인터넷(IoT), 빅데이터가 아닙니다.

맞습니다. 사물 인터넷은 빅 데이터가 아닙니다. 연속 데이터입니다. 빅 데이터가 바다라면 연속 데이터는 지류입니다. 그리고...

지류는 바다나 대양으로 직접 흐르지 않습니다. Wikipedia

데이터가 빅데이터 플랫폼으로 바로 유입되는 것도 아닙니다. 빅 데이터 플랫폼은 볼륨입니다. 속도도 아니고 다양성도 아닙니다. 데이터는 빅 데이터 플랫폼으로 유입되기 전에 스트림 프로세서 및/또는 데이터베이스(관계형 또는 NoSQL)로 직접 유입됩니다.

이는 데이터베이스에 두 가지 과제를 제시합니다:

  • 데이터 흐름 속도입니다.
  • 데이터 흐름의 수입니다.

데이터 흐름 속도

풍력 터빈은 빅데이터 플랫폼을 읽고 쓰지 않습니다. 빅데이터 플랫폼은 불연속적인 비정형 데이터를 위해 설계되었습니다. 풍력 터빈은 연속적인 반정형 데이터를 생성합니다. 풍력 터빈은 초당 수천 개의 데이터 포인트를 생성합니다. 하지만 센서 데이터를 로컬 파일에 추가하고 그 파일을 빅 데이터 플랫폼으로 가져올 수 있습니다. 하지만 더 이상 실시간 데이터가 아닙니다. 운영 민첩성을 구현하지 못합니다.

데이터 흐름의 수

140억 things 인터넷에 연결되어 있습니다. 500억 개의 센서가 things 데이터. 이는 엄청난 양의 데이터 흐름입니다.

이것이 카우치베이스와 어떤 관련이 있나요?

스마트 냉장고입니다. 나도 갖고 싶어요. 마지막 우유를 마실 때 냉장고가 이를 알아차렸으면 좋겠어요. 냉장고가 저를 위해 식료품 목록을 관리해 주었으면 좋겠어요. 빈 우유 1갤런을 쓰레기통에 버리기 전에 냉장고 문에 있는 스캐너로 바코드를 스캔할 의향이 있습니다. 식료품점에 갈 때 휴대폰에 식료품 목록을 표시하고 싶습니다. 제 휴대폰일 수도 있습니다. 아내의 휴대폰일 수도 있습니다.

반정형 데이터

데이터는 반정형이어야 합니다. 왜일까요? 목록이기 때문입니다. 간단합니다. 행과 열로 저장할 수 있습니다. 하지만 재고를 추적하기 위해 애플리케이션을 업데이트한다면 어떨까요? 냉장고에 남은 생수병이 몇 병인지 알고 싶습니다. 개발자가 데이터베이스 관리자에게 스키마 수정을 위한 변경 요청을 제출해야 하나요? 아니요. 특정 식료품 목록에 생수를 추가할 수 있도록 여러 식료품점의 생수 가격을 표시하도록 애플리케이션을 업데이트하면 어떻게 되나요? 개발자가 스키마를 수정하기 위해 데이터베이스 관리자에게 두 번째 변경 요청을 다시 제출해야 하나요? 아니요. 이것이 바로 인텔리전트 엔터프라이즈가 Couchbase Server에 의존하는 이유입니다. 유연한 데이터 모델은 개발자의 생산성을 높이고 개발 비용을 절감하며 시장 출시 시간을 단축합니다. 시장 민첩성이 향상됩니다.

확장성

모든 사람이 스마트 냉장고를 원한다고 가정해 보겠습니다. 제가 첫 번째 고객이 되겠지만 고객이 천 명이 되고, 수만 명이 되고, 마침내 수백만 명이 되면 어떻게 될까요? 단군 이래 최고의 일이 될 것입니다. 하지만 데이터베이스 관리자는 수백만 명의 고객과 수십억 개의 데이터 포인트를 지원하기 위해 관계형 데이터베이스를 어떻게 확장할까요? 얼마나 어려울까요? 너무 어렵습니다. 얼마나 많은 시간과 노력이 필요할까요? 너무 많습니다. 이것이 바로 인텔리전트 엔터프라이즈가 Couchbase Server에 의존하는 이유입니다. 분산형 공유 아키텍처는 운영 효율성을 높이고 운영 비용을 절감합니다. 운영 민첩성이 향상됩니다.

모든 사람이 스마트 냉장고를 원한다는 말은 모든 사람을 의미합니다. 북미, 중남미, 유럽-중동-아프리카, 아시아 태평양 등의 소비자를 의미합니다. 데이터센터 내에서 데이터베이스를 확장하는 것은 별개의 문제입니다. 데이터베이스를 여러 데이터센터로 확장하는 것은 또 다른 문제입니다.

데이터 센터를 넘어 확장해야 하는 이유는 무엇인가요?

데이터 로컬리티

  • 캘리포니아에 있는 스마트 냉장고는 미국의 데이터베이스를 읽고 쓸 수 있어야 합니다.
  • 더블린의 스마트 냉장고는 아일랜드의 데이터베이스를 읽고 쓸 수 있어야 합니다.
  • 도쿄의 스마트 냉장고는 일본의 데이터베이스를 읽고 쓸 수 있어야 합니다.

고가용성

  • 노드에 장애가 발생하더라도 데이터베이스는 계속 사용할 수 있어야 합니다.
  • 랙에 장애가 발생하더라도 데이터베이스는 계속 사용할 수 있어야 합니다.
  • 데이터 센터에 장애가 발생하더라도 데이터베이스는 계속 사용할 수 있어야 합니다.

요약

카우치베이스 서버는 데이터센터 간 복제(XDCR)를 통해 글로벌 데이터 로컬리티를 지원합니다. 랙 인식을 통해 글로벌 가용성을 지원합니다.

글로벌 도달 범위를 넓힐 수 있습니다.

이 문서 공유하기
받은 편지함에서 카우치베이스 블로그 업데이트 받기
이 필드는 필수 입력 사항입니다.

작성자

게시자 Shane Johnson, 제품 마케팅 담당 이사, Couchbase

셰인 K 존슨은 Couchbase의 제품 마케팅 디렉터였습니다. Couchbase에 입사하기 전에는 Java 및 분산 시스템에 대한 배경 지식을 바탕으로 개발 및 전도 분야에서 다양한 역할을 수행했습니다. 그는 금융, 소매, 통신 및 미디어 업계의 조직과 컨설팅을 통해 데이터 및 분석을 위해 분산 시스템에 의존하는 아키텍처의 초안을 작성하고 구현했습니다.

댓글 남기기

카우치베이스 카펠라를 시작할 준비가 되셨나요?

구축 시작

개발자 포털에서 NoSQL을 살펴보고, 리소스를 찾아보고, 튜토리얼을 시작하세요.

카펠라 무료 사용

클릭 몇 번으로 Couchbase를 직접 체험해 보세요. Capella DBaaS는 가장 쉽고 빠르게 시작할 수 있는 방법입니다.

연락하기

카우치베이스 제품에 대해 자세히 알고 싶으신가요? 저희가 도와드리겠습니다.