Agent Contract
Scope
goal에이전트가 완료해야 하는 업무 결과입니다. “답변하기”보다 “승인 가능한 보고서 초안 생성”처럼 검증 가능한 결과로 씁니다.user_intent사용자의 현재 요청과 장기 목표를 분리합니다. 도구 실행 전에 실제 의도를 다시 확인해야 할 때 기준이 됩니다.success_metric작업 성공을 판정하는 기준입니다. 정확도, 해결률, 승인률, 테스트 통과, 처리 시간처럼 측정 가능한 값으로 둡니다.failure_mode실패했을 때 사용자에게 숨기면 안 되는 상태입니다. 모름, 권한 부족, 도구 실패, 최신성 부족을 구분합니다.stopping_condition언제 멈추고 결과를 내거나 사람에게 넘길지 정합니다. 무한 반복과 과도한 도구 호출을 막습니다.
Instruction
instructions역할, 우선순위, 금지 행동, 응답 톤, 도구 사용 기준을 담는 시스템 지침입니다. 짧지만 충돌 없이 써야 합니다.policy업무 규칙과 보안 규칙입니다. 결제, 삭제, 외부 전송, 개인정보 처리처럼 모델 판단에 맡기면 안 되는 기준을 명시합니다.output_schema최종 산출물의 구조입니다. JSON, 표, 체크리스트, 보고서 섹션처럼 후속 시스템이 파싱 가능한 형태가 좋습니다.confidence정답처럼 말할 수 있는 조건과 추정으로 표시해야 하는 조건을 나눕니다. 근거 없는 단정과 과신을 줄입니다.escalation도구 권한, 법무/보안 리스크, 사용자 확인 필요 상황에서 사람에게 넘기는 규칙입니다.
Autonomy
recommend읽고 판단만 합니다. 초기 도입, 민감한 업무, 근거 검토 작업에 적합합니다.draft초안을 만들지만 외부 시스템에는 반영하지 않습니다. 사람이 승인 후 실행하는 업무에 맞습니다.act_with_approval도구 실행 전 승인 단계를 둡니다. 파일 수정, 티켓 변경, 이메일 발송 같은 작업에 필요합니다.act_autonomously정해진 범위 안에서 직접 실행합니다. 권한, 예산, 로그, 롤백 경로가 준비된 경우에만 사용합니다.