에이전트 프레임워크AI 개발HandoffA2ACapabilityArtifact시스템 설계

에이전트 프레임워크 스터디 Day 8: 여러 에이전트는 역할이 아니라 계약으로 연결된다

2026년 6월 18일15분 읽기

오늘의 목표

Day 1에서는 에이전트를 모델 하나가 아니라 harness, 즉 실행 환경 전체로 봤습니다. Day 2에서는 도구를 함수가 아니라 계약(contract) 으로 봤고, Day 3에서는 컨텍스트를 실행 상태(state) 로 봤습니다. Day 4에서는 관측 가능성, Day 5에서는 워크플로와 에이전트 판단의 경계, Day 6에서는 위험도 기반 사람 개입, Day 7에서는 이벤트와 산출물 수명주기를 다뤘습니다.

오늘은 자연스럽게 다음 질문으로 넘어갑니다.

text

에이전트가 하나가 아니라 여러 개라면,
무엇이 서로를 이어 주는가?

처음에는 이렇게 생각하기 쉽습니다.

text

- planner agent
- coder agent
- reviewer agent
- researcher agent

이름만 보면 그럴듯합니다. 그런데 실제 운영에서는 역할 이름보다 더 중요한 것이 있습니다.

text

이 에이전트는 무엇을 할 수 있는가?
어떤 입력을 받는가?
어떤 산출물을 돌려주는가?
어떤 권한을 갖는가?
실패하면 어떤 상태로 남기는가?
다음 에이전트는 무엇을 믿고 이어받는가?

그래서 오늘의 문장은 이겁니다.

여러 에이전트는 사람 역할이 아니라 계약된 capability와 handoff로 연결된다.

여기서 capability는 “할 수 있는 일”이고, handoff는 “일을 넘기는 방식”입니다. A2A 같은 프로토콜이 말하는 방향도 결국 이쪽입니다. 에이전트를 사람처럼 부르는 것이 아니라, 작업·메시지·산출물·상태 전이로 연결하는 겁니다.

1. 역할 이름만 늘리면 왜 불안정해지는가

멀티 에이전트 구조를 만들 때 가장 흔한 실수는 이름을 먼저 붙이는 겁니다.

text

Planner가 계획한다.
Coder가 구현한다.
Reviewer가 검토한다.
Manager가 조율한다.

문제는 이 설명만으로는 아무것도 고정되지 않는다는 점입니다.

text

Planner가 어디까지 결정해도 되는가?
Coder는 계획을 바꿔도 되는가?
Reviewer는 수정까지 해도 되는가?
Manager는 실패한 작업을 어떻게 재시도하는가?

역할 이름은 사람이 읽기에는 편하지만 시스템 계약은 아닙니다. 같은 “reviewer”라도 어떤 시스템에서는 스타일만 봅니다. 다른 시스템에서는 보안 이슈까지 막습니다. 또 다른 시스템에서는 테스트를 직접 돌리고 수정까지 합니다.

역할이 계약으로 내려오지 않으면 이런 문제가 생깁니다.

text

- 같은 일을 두 에이전트가 중복해서 한다.
- 아무도 마지막 검증 책임을 지지 않는다.
- 중간 산출물이 대화 요약으로만 남아 다음 실행이 재현되지 않는다.
- 권한이 넓은 에이전트가 필요 이상으로 파일을 수정한다.
- 실패가 '잘 안 됨'이라는 문장으로만 남고 재시도 가능한 상태가 없다.

text

Capability: seojing_content_publish
Inputs:
  - target_series
  - next_day
  - topic_contract
  - repo_root
Permissions:
  - write content MDX under scoped path
  - run format/lint/build
  - commit scoped files
  - push to origin/main if standing approval applies
Outputs:
  - changed_files
  - verification_results
  - commit_sha
  - public_url
Failure states:
  - blocked_by_dirty_scope
  - verification_failed
  - push_failed
  - deploy_pending

text

- 어떤 파일이 바뀌었는가?
- 사용자의 원래 요구는 무엇이었는가?
- 테스트는 어떤 명령으로 돌렸는가?
- 실패한 검사는 없었는가?
- 미해결 판단은 무엇인가?
- 커밋/푸시가 허용된 작업인가?

text

HandoffContract:
  task_id: W-20260618-001
  source_capability: implementation
  target_capability: final_review
  user_intent: "..."
  scope:
    allowed_paths: [...]
    no_touch: [...]
  artifacts:
    - path: changed-file-list.txt
    - path: test-output.md
    - path: diff.patch
  claims:
    - "format passed"
    - "lint passed"
  open_questions:
    - "public deploy not checked yet"
  required_decision:
    - "block or approve remote handoff"

text

AgentCard:
  이 에이전트는 무엇을 할 수 있는가?
  어떤 인증/권한이 필요한가?
  어떤 입력/출력 형식을 쓰는가?

Task:
  지금 맡겨진 일은 무엇인가?
  상태는 queued/running/completed/failed 중 어디인가?

Message:
  작업 중 오간 설명이나 요청은 무엇인가?

Artifact:
  작업 결과로 남은 파일/데이터/보고서는 무엇인가?

text

OkayJing Hub
  - 사용자와 대화한다.
  - 최종 결정을 소유한다.
  - 티켓/결과 ledger를 관리한다.

Spoke profile
  - 특정 프로젝트/작업 세계의 맥락을 가진다.
  - 제한된 contract를 받아 실행한다.
  - 결과와 검증 근거를 artifact로 돌려준다.

Work ledger
  - handoff contract와 결과 ledger를 남긴다.
  - full transcript를 hub에 흡수하지 않는다.

text

Hub capability:
  - user_conversation
  - final_decision
  - ticket_ledger
  - absorption_policy
  - cross_profile_memory_policy

SEOJing spoke capability:
  - repo_context_read
  - content_generation
  - local_verification
  - scoped_publish_when_approved

Ops spoke capability:
  - local_api_status
  - dashboard_health
  - cron_prompt_patch
  - work_ledger_run

yaml

id: seojing-publisher
kind: profile-capability
owner: OkayJing Hub
summary: SEOJing study/okayJing content publishing lane
inputs:
  - series
  - topic
  - target_path
  - standing_approval_scope
permissions:
  files:
    write:
      - apps/web/content/study/agent-framework/day*.mdx
      - apps/web/content/okayJing/**
  commands:
    - pnpm exec prettier
    - pnpm format:check
    - pnpm lint
    - pnpm build
    - git commit
    - git push origin main
constraints:
  - do_not_stage_unrelated_files
  - use_isolated_worktree_when_canonical_checkout_dirty
   run_notjing_or_content_review_gate

text

[DRAFT]
  contract written but not accepted

[QUEUED]
  target profile/capability can claim it

[RUNNING]
  target is executing with bounded permissions

[NEEDS_INPUT]
  execution reached a real missing decision/input

[FAILED]
  execution stopped with reason and evidence

[COMPLETED]
  artifact and verification are attached

[ABSORBED]
  Hub reviewed result and stored only durable outcome/rules

[ARCHIVED or DISCARDED]
  task-local context is closed without promotion

text

1. 이 일은 하나의 workflow로 충분한가?
2. 다른 context world가 필요해서 profile을 나눠야 하는가?
3. 나눴을 때 handoff artifact가 무엇인가?
4. Hub가 최종적으로 흡수해야 할 정보는 무엇인가?
5. 실패하면 어디에 어떤 상태로 남는가?
6. 사람 승인이 필요한 위험 경계는 어디인가?
7. 다음 실행이 이 결과를 재사용할 수 있는가?

text

1. 에이전트 이름보다 capability contract를 먼저 쓴다.
2. handoff는 요약이 아니라 task/artifact/state 계약이다.
3. Hub는 최종 decision과 ledger를 소유한다.
4. Spoke는 bounded context와 scoped permission을 가진다.
5. 전체 transcript를 흡수하지 말고 결과/검증/재사용 규칙만 흡수한다.
6. multi-agent는 역할놀이가 아니라 상태 전이와 산출물 흐름이다.

에이전트 프레임워크 스터디 Day 8: 여러 에이전트는 역할이 아니라 계약으로 연결된다

에이전트 프레임워크 스터디 Day 8: 여러 에이전트는 역할이 아니라 계약으로 연결된다

오늘의 목표

1. 역할 이름만 늘리면 왜 불안정해지는가

오케이징에게 물어보기

포스트 목록

같은 섹션의 대표 이미지

에이전트 프레임워크 스터디 Day 13: Trace는 로그가.

2. capability는 함수보다 크고, 사람 역할보다 작다

3. handoff는 요약 전달이 아니다

4. A2A식 사고: agent card, task, artifact

5. OkayJing hub-spoke를 capability 관점으로 다시 보기

6. handoff 실패 패턴

6.1 책임 없는 relay

6.2 transcript 복사

6.3 권한 과잉 spoke

6.4 결과만 있고 근거가 없음

6.5 사람 역할놀이로 흐름

7. capability manifest의 최소 형태

8. handoff state machine

9. 여러 에이전트를 붙이기 전에 물어야 할 질문

10. 오늘의 설계 규칙

마무리

에이전트 프레임워크 스터디 Day 12: Agent Card는.

에이전트 프레임워크 스터디 Day 11: MCP 서버는 설치.

에이전트 프레임워크 스터디 Day 10: harness는 팀.

에이전트 프레임워크 스터디 Day 9: 확장점은 플러그인이.

에이전트 프레임워크 스터디 Day 8: 여러 에이전트는 역할이.

에이전트 프레임워크 스터디 Day 7: 작업은 답변이 아니라.

에이전트 프레임워크 스터디 Day 6: 사람 개입은 예외가.

에이전트 프레임워크 스터디 Day 5: 워크플로와 에이전트의.

에이전트 프레임워크 스터디 Day 4: 관측 가능해야.

에이전트 프레임워크 스터디 Day 3: 컨텍스트는 자료 더미가.

에이전트 프레임워크 스터디 Day 2: 도구는 함수가 아니라.

에이전트 프레임워크 스터디 Day 1: 프레임워크보다 먼저.