AI의 계절에 오신 것을 환영합니다. 제너레이티브 AI. 이 블로그에서는 제너레이티브 AI가 Couchbase에서 어떻게 작동하는지 설명합니다. 제너레이티브 AI가 거의 모든 데이터 기반 엔터프라이즈 애플리케이션에서 큰 이슈이자 기회가 될 것이라는 점을 잘 알고 있습니다. 이 블로그에서는 제너레이티브 AI가 무엇인지, 제너레이티브 AI가 어떻게 작동하는지, 그리고 제너레이티브 AI의 세계에서 Couchbase가 어디에 적합한지에 대해 자세히 살펴보겠습니다.
제너레이티브 AI란 무엇인가요?
생성형 AI(인공 지능)는 대규모 언어 모델(LLM)을 사용하여 LLM이 축적한 유사성 기반 지식을 기반으로 새로운 콘텐츠를 구성하는 콘텐츠 생성 알고리즘을 설명하는 데 사용되는 포괄적인 용어입니다. 생성되는 콘텐츠는 텍스트, 코드, 그래픽, 사진, 오디오, 음성, 음악 또는 동영상이 될 수 있습니다. 사용자나 프로그램이 원하는 출력물의 주제와 형식을 제안하는 프롬프트를 사용하여 LLM을 조사합니다. 결과 콘텐츠는 모델에 의해 생성되고 정제되므로 "생성형 AI"라는 용어가 사용됩니다.
제너레이티브 AI는 어떻게 작동하나요?
자연어 처리(NLP)와 이미지 처리의 발전으로 탄생한 생성형 AI는 문구의 의도된 의미를 파악하고 이미지 내에서 나무나 바위와 같은 물체를 인식하는 데 도움을 줍니다. 이러한 각 예는 유사성을 감지하는 알고리즘을 사용하여 구축되었습니다. 예를 들어, 알고리즘은 호랑이와 얼룩고양이 모두 비슷한 종류의 고양이라는 것을 식별할 수 있습니다. 대부분의 경우 이러한 유사성은 여러 차원을 따라 표현되며, 알고리즘은 한 항목이나 문구가 다른 항목이나 문구와 얼마나 유사한지를 설명하는 벡터로 숫자로 표현합니다. 벡터 검색에 대한 블로그를 참조하세요.
이러한 알고리즘의 문제점은 한 항목이 이미 인식된 다른 항목과 유사한 경우 이를 인식하도록 학습시켜야 한다는 것입니다. 이러한 훈련을 위해서는 모델이 인식 영역을 복합적으로 확장할 수 있도록 방대한 양의 데이터를 모델에 공급해야 합니다. 일부 LLM은 지식 기반과 이해를 구축하기 위해 인터넷의 전체 콘텐츠를 스캔하는 방식으로 학습을 진행하기도 합니다.
제너레이티브 AI 도구의 예
제너레이티브 AI 모델을 구축하고 액세스하는 주요 플레이어는 다음과 같습니다. AWS, Open.AI, Microsoft, Google, 메타 그리고 인류학. 각 업체는 무료 버전과 엔터프라이즈 버전 모두에서 자체 모델을 출시했습니다. LLM을 관리하는 데 엄청난 리소스 집약적이기 때문에 이러한 공급업체는 클라우드 및 소셜 서비스에서 그랬던 것처럼 LLM을 통해 중앙 집중화된 중력을 만들 것으로 예상합니다.
또한 다음과 같이 수천 개의 제너레이티브 AI 브라우저 플러그인이 등장하고 있습니다. ZDNet 기사. 이러한 플러그인은 최종 사용자의 모든 종류의 콘텐츠 제작을 돕고 있습니다. 카우치베이스의 경우, 자체 개발한 AI 기반 코딩 어시스턴트의 비공개 프리뷰를 발표했습니다, Couchbase iQ.
Couchbase가 제너레이티브 AI 기반 애플리케이션의 선두주자인 이유
카우치베이스는 이미 다음과 같은 데이터 플랫폼으로 사용되고 있습니다. AI 기반 애플리케이션. 여기에는 JSON 데이터 형식의 가치와 유연성, Couchbase가 제공하는 데이터 액세스 패턴의 다양성, 최신 기능의 도입 등 여러 가지 이유가 있습니다, 카우치베이스 카펠라 iQ.
JSON은 AI 지향 데이터에 이상적인 데이터 형식입니다.
프롬프트 엔지니어링은 LLM으로부터 관련성 있고 정확한 응답을 받기 위해 적절한 양의 문맥 데이터를 포함하는 생성형 AI 프롬프트를 구축하는 프로세스입니다. 프롬프트 엔지니어링은 빠르게 성장하는 전문 분야이며 JSON은 프롬프트 데이터를 저장하는 데 이상적인 형식입니다. 이를 고려해 보세요:
-
- JSON 문서에는 프롬프트를 제공하기 위해 단일 문서 내에 데이터와 해당 데이터에 대한 메타데이터를 모두 포함할 수 있습니다.
- JSON은 개인화 및 사용자 경험을 위한 속성을 포함하여 계정 프로필 정보를 저장하는 데 매우 널리 사용됩니다.
- JSON에는 전체 프롬프트 문자열도 포함될 수 있으므로 세션 간에 대화 컨텍스트를 유지하는 데 도움이 될 수 있습니다. 이는 대부분의 LLM이 상태 비저장형이며 진행 중인 대화에 대한 컨텍스트를 유지하지 않기 때문에 중요합니다.
이러한 각각의 관찰은 JSON이 제너레이티브 AI에 이상적인 데이터 형식인 이유를 보여줍니다.
데이터 복잡성은 생성 AI의 적입니다.
생성형 AI는 세부적인 내용이 아닌 유사성을 다룬다는 점을 잘 알고 있습니다. 따라서 생성형 AI 대화에서 파생된 정보는 환각을 일으킬 수 있습니다. 생성형 AI의 환각은 실제 사실처럼 보일 수 있지만 실제 사실로 추적할 수는 없습니다. 이는 제너레이티브 AI의 부정확한 특성을 강조합니다. 환각을 최소화하고 AI의 정확도를 높이려면 데이터 아키텍처를 단순화해야 한다고 생각합니다. 그러나 많은 애플리케이션이 세션 캐싱, JSON으로 사용자 프로필 업데이트, 관계형 트랜잭션 관리, 텍스트 및 위치 검색, 이벤트 트리거, 시계열 로그 스캔, AI용 벡터 임베딩 검색 등 각각의 개별 작업을 수행하는 여러 데이터베이스로 구동되고 있습니다.
그러나 이러한 각 액세스 패턴에 대해 여러 데이터베이스를 사용하는 복잡성으로 인해 프롬프트가 여러 소스에서 파생될 때 LLM에 혼란을 줄 수 있습니다. 데이터 설계자는 LLM 결과의 정확도를 향상시키기 위해 생성된 AI 프롬프트에 깔끔하고 단순한 데이터 아키텍처와 단일 프롬프트 데이터 풀이 필요하다는 것을 깨닫게 될 것으로 예상합니다.
따라서 위에서 언급한 모든 액세스 패턴을 활용하는 Couchbase 기반 애플리케이션을 사용하면 아키텍처 비용을 절감할 수 있을 뿐만 아니라 더 깨끗하고 정확한 데이터를 생성하여 AI 모델에 정보를 제공할 수 있습니다.
생성형 AI LLM은 중앙 집중식이지만, AI 활용은 엣지에서 분산되어 있습니다.
대규모 언어 모델과의 생성적 AI 상호 작용은 처리 및 인프라 요구 사항이 매우 높기 때문에 주요 CSP의 중력을 집중시키고 있습니다. 하지만 AI 데이터 생성 및 LLM 결과 소비는 엣지와 모바일 디바이스에서 이루어집니다. 애플리케이션이 최종 사용자를 대면하고 초개인화된 콘텐츠를 제공하는 경우 특히 그렇습니다. 모바일 애플리케이션은 분산되어 있고 연결이 자주 끊어집니다. 최근 블로그에서 이러한 현상에 대해 설명합니다. 새로운 스택.
카우치베이스는 제너레이티브 AI 정확도 격차를 해소할 수 있습니다.
생성형 AI는 강력하지만 많은 답변에서 정확성이 부족합니다. 이는 개발자에게 새로운 과제를 안겨줄 수 있습니다:
-
- 트랜잭션 및 SQL 쿼리와 같은 기존 DBMS 기능의 정확성과 AI가 생성한 결과의 부정확성 사이의 간극을 메우는 방법.
- 개발자는 Couchbase Capella iQ를 사용하여 SQL++ 및 다중 문서 분산형 ACID 트랜잭션의 정밀도를 활용하여 Couchbase Capella로 구축된 AI 기반 애플리케이션의 정확도를 개선할 수 있습니다.
Couchbase는 AI 기반 애플리케이션을 위한 데이터 플랫폼입니다.
카우치베이스 고객은 이미 AI 기반 애플리케이션 애플리케이션에는 다음과 같은 Couchbase의 기본 기능이 필요하기 때문입니다:
애플리케이션 성능
-
-
- 응답성을 위한 고속 인메모리 캐싱
- AI 타깃 데이터가 생성되고 소비되는 엣지에서도 짧은 지연 시간 제공
- 클러스터에서 워크로드를 격리하고 최적화하기 위한 성능 튜닝
-
다용도성
-
-
- 운영 데이터, 메타데이터, 검색 배열 및 프롬프트 시퀀스를 저장하기 위한 JSON
- 키/값, 텍스트 및 지리적 검색, 문서 변경, 시계열 데이터, 이벤트 캡처 및 스트리밍, 재귀(그래프 탐색) 쿼리, 운영 분석 처리를 위한 다중 모델 액세스 서비스
- Couchbase Lite의 예측 쿼리.
- SQL++ 쿼리 언어의 정확성과 용이성.
- 에지 처리, 계층적 데이터 동기화, 로컬에 임베디드된 모바일 데이터베이스 인스턴스 간의 피어 투 피어 동기화(Couchbase Lite).
-
엔터프라이즈 확장성
-
-
- 분산형, 지리적 클러스터링
- 멀티 클라우드, DBaaS, Kubernetes 및 자체 관리형 배포 지원
- 필요할 때 신뢰할 수 있는(특허 받은) 분산형 다중 문서 ACID 트랜잭션이 필요합니다.
- 엔터프라이즈급 보안 및 PCI, HIPAA, SOC 2 유형 II에 대한 인증.
-
카우치베이스는 서비스형 Capella 데이터베이스를 관리하고 운영하는 데 AI를 사용하나요?
예, Couchbase는 클러스터 크기 조정, 확장, 재조정, 에지 자동화 등과 같은 운영 활동을 지원하기 위해 AI를 사용하는 방법을 모색하고 있습니다.
결론: 제너레이티브 AI를 위한 Couchbase의 준비 완료
카우치베이스는 특히 다음 분야에 집중하여 제품 라인 전반에 걸쳐 AI 기능을 지속적으로 통합할 예정입니다:
-
- Capella iQ와 같은 기능 도입을 통한 개발자 생산성 향상
- Couchbase 플랫폼 내에서 AI 처리 최적화하기
- 엣지를 포함한 모든 곳에서 AI 기반 애플리케이션 지원
- 활기찬 AI 파트너 에코시스템 구축
Capella iQ는 어떻게 사용하나요?
카우치베이스는 카우치베이스 커뮤니티에 비공개 기술 미리보기를 제공하고 있습니다.
