What Are My AI Agents Doing? How to Gain Insight and Control.

AI 에이전트는 더 이상 단순한 챗봇이 아니라 자율적인 문제 해결사입니다. 도구를 호출하고 워크플로를 조율하며 사용자를 대신하여 의사 결정을 내릴 수 있습니다. 이러한 능력은 엄청난 가치를 창출할 수 있지만, 동시에 문제가 발생했을 때 그 원인을 어떻게 파악할 수 있을까요?

이 게시물에서는 안정적인 에이전트를 위해 추적이 필수적인 이유, 팀이 직면하는 실질적인 통합 가시성 과제, Couchbase의 에이전트 카탈로그 및 에이전트 트레이서가 어떻게 불투명한 에이전트 행동을 실행 가능하고 디버깅 가능한 데이터 추적으로 전환하여 대규모 엔터프라이즈 에이전트를 지원하는지에 대해 설명합니다.

문제: 가시성이 없는 자율적 행동

기존 소프트웨어는 결정론적입니다. AI 에이전트는 그렇지 않습니다. 프롬프트와 모델이 진화함에 따라 선택지를 생성하고, 도구를 선택하고, 행동을 변경합니다. 장애가 발생하면 혼란스러운 프롬프트와 모호한 도구 설명, 중요한 컨텍스트가 누락된 에이전트 간의 핸드오프 등 복합적이고 맥락적인 문제가 발생하는 경우가 많습니다.

추적이 없으면 팀에서는 잘못된 결과물을 볼 수 있지만 그러한 결과물을 생성한 상담원의 추론, 도구 호출 또는 스키마 불일치를 재구성할 수 없기 때문에 사실상 맹목적인 비행을 하는 것과 마찬가지입니다.

추적이 중요한 이유

간단히 말해, 시스템의 출력을 신뢰할 수 없다면 사용하지 않을 것입니다. 하지만 추적은 다른 이유에서도 중요합니다.

설명 가능성과 신뢰: 프롬프트, 모델의 궤적, 도구 호출 및 결과를 확인하여 이해 관계자에게 상담원의 결정을 설명할 수 있습니다.
더 빠른 디버깅: 추측하지 말고 실패한 정확한 단계(LLM 호출, 도구 호출 또는 핸드오프)를 정확히 찾아내세요.
비용 관리: 지나치게 반복적인 LLM 호출로 인해 비용이 높아지는 에이전트 시나리오를 모니터링하세요. 또한 팀에서는 도구 선택 기능을 적용하여 토큰과 API 크레딧을 소진하는 시행착오적인 도구 호출을 피할 수 있습니다.
거버넌스 및 롤백: 버전 프롬프트 및 도구를 사용하여 프로덕션 동작을 저하시키는 변경 사항을 되돌릴 수 있습니다.

상담원이 소개하는 세 가지 통합 가시성 과제

AI 에이전트가 더욱 자율적이고 복잡해짐에 따라 기존 모니터링으로는 해결할 수 없는 고유한 통합 가시성 문제가 발생하고 있습니다. 다음은 세 가지 중요한 문제와 최신 추적을 통해 이러한 문제를 해결하는 방법입니다:

비결정적 실패: 작은 프롬프트나 환경 변경이 연쇄적으로 장애로 이어질 수 있습니다. 추적은 세션 수준의 컨텍스트와 LLM의 중간 “생각'을 캡처하여 문제를 재현하고 수정할 수 있도록 합니다.
도구 폭발 및 컨텍스트 혼동: 도구 세트가 크면 설명이 중복되고 도구 선택이 잘못될 수 있습니다. 시맨틱 도구 선택성은 모델에 표시되는 도구 집합을 사용자의 쿼리와 관련된 도구로만 축소합니다.
다중 에이전트 조정 문제: 여러 상담원이 공동 작업하는 경우 핸드오프에서 컨텍스트가 손실되거나 추론과 행동이 일치하지 않을 수 있습니다. 추적을 사용하면 핸드오프 메시지가 보존되므로 상담원 간에 전달된 내용을 검사할 수 있습니다.

카우치베이스가 답합니다: 상담원 카탈로그 및 상담원 추적기

Couchbase는 거버넌스와 통합 가시성을 단일 플랫폼에 결합하여 팀이 도구와 프롬프트를 관리하면서 디버깅 및 분석을 위한 엔드투엔드 추적을 캡처할 수 있도록 지원합니다.

상담원 카탈로그 (도구 및 프롬프트 거버넌스)
- 도구 및 프롬프트에 대한 중앙 집중식 버전 저장소 역할을 합니다.
- 시맨틱 검색을 사용하여 가장 관련성이 높은 도구만 반환합니다(정확도 향상 및 토큰 사용량 감소).
- 신속한 버전 관리 및 롤백을 적용하여 프로덕션에 영향을 주지 않고 변경 사항을 감사하고 되돌릴 수 있습니다.
에이전트 추적기 (트레이스 스토어와 UI 및 SQL++)
- 스팬과 다양한 추적 유형(사용자, 내부, LLM, 도구 호출, 도구 결과, 핸드오프, 시스템, 어시스턴트)을 수집하여 세션의 모든 의미 있는 이벤트가 기록되도록 합니다.
- SQL++로 즉각적이고 풍부한 쿼리 및 프로그래밍 방식의 분석을 위해 추적을 Couchbase에 JSON으로 저장합니다.
- 세션을 드릴다운할 수 있는 시각적 UI와 계측 및 검색을 위한 CLI/SDK를 제공합니다.

실제 작동 방식: 스팬, 콜백 및 추적 유형

스팬은 시작 시간 및 종료 시간(대기 시간), 작업 이름, 상태(성공/오류), 메타데이터(태그/속성, 로그) 등과 같은 정보를 기록하는 단일 작업입니다. 루트 스팬은 전체 요청 또는 워크플로우(예: 하나의 에이전트 실행)를 나타내며, 하위 스팬은 해당 워크플로우 내에서 발생하는 하위 작업을 나타냅니다. 이 두 스팬은 함께 시스템에서 작업이 어떻게 흐르는지를 보여주는 추적을 형성합니다.

LLM 호출, 문서 검색 및 도구 실행과 같은 작업을 위한 루트 스팬과 하위 스팬을 추가하여 에이전트 앱을 계측하세요. 사용자 지정 태그를 추가하고 콜백을 사용하여 도구 결과를 캡처할 수 있습니다. 에이전트가 실행되면 프로젝트의 에이전트 활동 폴더에 추적이 기록되고 에이전트 트레이서에서 볼 수 있도록 Couchbase Capella™ 또는 운영 클러스터로 전달될 수 있습니다.

추적 유형에는 다음이 포함됩니다:

사용자: 최종 사용자로부터 수신 메시지
LLM: 모델 응답 및 중간 추론
도구 호출/도구 결과: 호출된 도구와 반환된 출력
핸드오프: 상담원 간에 전달되는 컨텍스트
시스템/내부/어시스턴트: 제어 흐름, 헤더 및 최종 어시스턴트 응답

데이터와 구조의 다양성을 고려할 때 JSON은 이러한 유형의 데이터를 캡처하고 상호 작용하는 데 자연스러운 형식입니다.

3단계 문제 해결 워크플로

실제로는 어떻게 작동하나요?

설정: 스팬 및 콜백으로 앱을 계측합니다(루트 스팬 이름은 UI의 앱 이름에 매핑됨). 로그가 .agent-activity로 캡처되어 클러스터로 전달되는지 확인합니다.
식별: 에이전트 추적기 UI 필터(앱 이름, 태그, 날짜, 주석)를 사용하여 문제가 있는 세션을 찾습니다.
드릴다운합니다: 세션 추적을 열고 LLM 궤적, 도구 호출, 핸드오프 및 모든 가드레일 트리거를 검사합니다. SQL++를 사용하여 프로그래밍 방식의 근본 원인 분석을 위해 JSON 추적에 대해 대상 쿼리를 실행합니다.

실패 사례 및 추적의 도움

카우치베이스가 상담원 추적에 도움이 되는 몇 가지 사례에는 어떤 것이 있나요?

잘못된 도구가 호출되었습니다: tool_call 항목을 검사하여 상담원이 의미적으로는 유사하지만 잘못된 도구를 선택했는지 확인하세요. 도구 설명을 개선하거나 카탈로그 선택 기능에 의존하여 중복을 줄이세요.
도구 스키마 불일치: tool_call 인수를 추적에서 도구의 예상 스키마와 비교합니다. 필요한 경우 입력 유효성 검사 또는 변환 레이어를 추가합니다.
에이전트가 루프에 갇혔습니다: 추적에서 반복되는 스팬 패턴과 루프를 감지합니다. 가드레일 또는 타임아웃 로직을 추가하여 주기를 중단합니다.
상담원 간 조정 실패: 핸드오프 추적을 검토하여 보류된 컨텍스트나 상담원 간의 기대치가 일치하지 않는 부분을 파악하세요.

에이전트 AI 애플리케이션을 위한 카우치베이스가 필요한 이유

Couchbase의 통합 데이터베이스 플랫폼이 AI 및 기타 최신 미션 크리티컬 애플리케이션에 이상적인 데이터 계층이 되는 이유는 여러 가지가 있지만, 몇 가지 고려해야 할 사항은 다음과 같습니다:

통합 스토어: 통합된 Couchbase 데이터베이스 플랫폼으로 파편화된 스택(캐싱/로그/벡터 검색을 위한 여러 데이터베이스)을 방지하여 운영을 간소화하고 ETL 마찰을 줄이세요. 자세히 알아보기
규모에 맞는 성능: 메모리 우선 아키텍처, 수평적 확장, 기본 JSON 지원으로 지연 시간이 짧은 수집과 유연한 추적 스키마 진화를 제공합니다. 자세히 알아보기
AI 서비스: 이러한 부가 가치 서비스를 통해 신뢰할 수 있는 AI 시스템의 구축, 관리 및 확장을 가속화하여 운영 노력과 총소유비용을 절감할 수 있습니다. 자세히 알아보기
익숙한 쿼리: SQL++를 사용해 프로그래밍 방식으로 JSON 추적에서 구조화된 인사이트를 분석하고 추출하세요. 자세히 알아보기

결론

에이전트 추적은 블랙박스 행동을 반복 가능하고 설명 가능한 워크플로로 전환합니다. 추적을 관리되는 도구 및 신속한 관리와 결합하면 팀은 더 빠르게 움직이고, 비용을 절감하며, 자신감과 가시성을 확보하여 에이전트 앱을 출시할 수 있습니다. 이러한 가시성은 기술 팀, 비즈니스 팀, 경영진이 중요한 비즈니스 애플리케이션을 위한 에이전트 AI를 배포하는 데 매우 중요합니다.

추가 리소스

Platform

Self-Managed

Services

Capabilities

Why Couchbase?

Migrate to Capella

By Use Case

By Industry

By Application Need

Popular Docs

By Developer Role

Quickstart

Resource Center

About

Partnerships

Our Services

Partners: Register a Deal

Ready to register a deal with Couchbase?

Marriott

내 AI 에이전트는 무엇을 하고 있나요? 인사이트를 얻고 제어하는 방법.

문제: 가시성이 없는 자율적 행동

추적이 중요한 이유

상담원이 소개하는 세 가지 통합 가시성 과제

카우치베이스가 답합니다: 상담원 카탈로그 및 상담원 추적기

실제 작동 방식: 스팬, 콜백 및 추적 유형

3단계 문제 해결 워크플로

실패 사례 및 추적의 도움

에이전트 AI 애플리케이션을 위한 카우치베이스가 필요한 이유

결론

받은 편지함에서 카우치베이스 블로그 업데이트 받기

작성자

게시자 티모시 로타치

댓글 남기기 응답 취소

카우치베이스 카펠라를 시작할 준비가 되셨나요?

구축 시작

카펠라 무료 사용

연락하기