생성 AI(GenAI) 은 현재 직원 업무 시간의 60~70%를 차지하는 업무 활동을 자동화하여 다양한 산업 분야에서 상당한 생산성 향상을 가져올 수 있는 잠재력을 가지고 있습니다. 그러나 범용(GP) 머신러닝의 지식은 학습 데이터에 국한되어 있어 불완전하거나 부정확한 응답을 제공하는 '환각'을 일으킬 수 있습니다. 이로 인해 신뢰와 공신력이 약화되어 많은 GenAI 개념 증명(POC)이 생산 단계에 도달하지 못합니다. 검색 증강 생성(RAG) 기술을 도입하면 최신의 신뢰할 수 있는 사실에 근거한 독점적인 데이터로 LLM을 증강하여 LLM 응답의 근거를 마련할 수 있습니다. 성공적인 RAG 구현을 위해서는 지식 기반, 벡터 데이터베이스, LLM 캐시 역할을 하는 확장성과 신뢰성이 뛰어난 데이터베이스와 함께 주요 기반 모델을 사용하여 GenAI 애플리케이션을 개발하고 확장할 수 있는 강력한 플랫폼이 필요합니다.

카우치베이스 및 아마존 베드락 는 소매업, 의료, 숙박업, 게임 등 다양한 산업에서 성능이 뛰어난 RAG 애플리케이션을 원활하게 구축할 수 있는 엔드투엔드 플랫폼을 제공합니다.

카우치베이스 카펠라는 클라우드 네이티브 고성능 DBaaS(서비스형 데이터베이스)로, JSON의 유연성을 활용하면서 RAG 애플리케이션을 위한 운영, 벡터, 시계열, 텍스트 및 위치 기반 데이터의 저장, 색인 및 쿼리를 빠르게 시작할 수 있게 해줍니다. 또한, 다음과 같은 고유한 기능을 제공합니다. 하이브리드 검색는 단일 SQL++ 쿼리 내에서 기존 검색과 벡터 검색을 혼합하여 시맨틱 검색의 수준을 한 단계 끌어올려 높은 선택 특이도로 매우 세분화된 검색을 필요로 하는 애플리케이션을 지원합니다. 이 기능은 클라우드, 엣지, 모바일을 아우릅니다. Capella를 지식 베이스, 벡터 DB 또는 LLM 캐시 생산 등급 RAG 파이프라인을 구축하기 위해 LangChain 또는 LlamaIndex와 같은 오케스트레이션 프레임워크를 사용하는 Amazon Bedrock과 같은 선도적인 GenAI 플랫폼과 함께 사용할 수 있습니다. Amazon Bedrock은 보안, 개인정보 보호, 책임감 있는 AI를 갖춘 생성형 AI 애플리케이션을 구축하는 데 필요한 광범위한 기능과 함께 단일 API를 사용하여 AI21 Labs, Anthropic, Cohere, Meta, Mistral AI, Stability AI, Amazon과 같은 선도적인 AI 회사의 고성능 기초 모델(FM)을 선택할 수 있는 완전 관리형 서비스입니다.  

이 블로그에서는 다음을 사용하여 구축한 RAG 기반 챗봇 애플리케이션을 소개합니다. 카우치베이스 벡터 검색 및 Amazon Bedrock. 카우치베이스 여행 샘플 데이터 아마존 베드락의 카우치베이스 카펠라 및 앤트로픽 클로드 모델에 저장됩니다.

Build Performant RAG Applications using Couchbase Vector Search and Amazon Bedrock

그림 1: Capella와 Amazon Bedrock을 사용하여 개발한 챗봇 애플리케이션

아래 단계에 따라 그림 1에 표시된 RAG 애플리케이션을 개발할 수 있습니다.

1단계: 벡터 인덱스 만들기

1.1단계: 몇 분 안에 카펠라 클러스터 만들기

1.2단계: 벡터 인덱스 생성

    • 에서 데이터베이스 페이지에서 벡터 인덱스를 만들려는 평가판 클러스터를 선택합니다.
    • 다음으로 이동 데이터 도구 > 검색.
    • 클릭 검색 색인 만들기.
    • 기본적으로 다음 위치에서 시작합니다. 빠른 모드. 로 전환 고급 모드.
    • 클릭 색인 정의.
    • 클릭 파일에서 가져오기.
    • 업로드 인덱스 파일.
    • 클릭 색인 만들기

2단계: 임베딩 모델과 LLM을 선택합니다.

    • 로 이동합니다. 아마존 베드락 콘솔 를 클릭하고 AWS 계정에서 "모델 액세스"를 클릭합니다.
    • 다음 모델을 선택하고 '모델 액세스 요청' 버튼을 클릭합니다:
      • Amazon: 타이탄 임베딩 G1 - 텍스트
      • Anthropic: 클로드 2

3단계: RAG 애플리케이션 빌드

    • 다음 지침에 따라 Amazon 계정에서 Amazon SageMaker 노트북 인스턴스를 만듭니다. 여기
    • "RAG_with_Couchbase와_아마존_베드락" 주피터 노트북 파일을 Amazon 세이지메이커 노트북으로 옮깁니다. 
    • Couchbase 환경 연결 세부 정보로 노트북을 구성합니다.

    • 필요에 맞게 이 애플리케이션을 업데이트하고 완료되면 실행하세요.

이제 챗봇에게 질문할 수 있습니다. 이 블로그에서는 다루지 않았지만 다음을 사용해 보세요. 암반 가드레일 를 설정하여 회사 정책상 부적절하다고 판단되는 콘텐츠가 최종 사용자에게 응답으로 반환되지 않도록 합니다.

Couchbase의 고성능 데이터 저장 및 검색 기능과 원하는 LLM에 액세스할 수 있는 Amazon Bedrock의 광범위한 모델 범위, 보안 및 사용 편의성을 결합하면 성능이 뛰어난 RAG 애플리케이션을 구축할 수 있습니다. 이제 이러한 애플리케이션은 높은 관련성과 문맥 정확도를 위해 설계되어 콘텐츠 생성, 질문 답변, 요약 및 보고서 생성 등과 같은 다양한 사용 사례를 지원할 수 있습니다.

추가 리소스

작성자

게시자 Saurabh Shabhag, 파트너 솔루션 아키텍트, AWS

댓글 남기기