LogoSEO Jing
  • All Posts
  • SEO Jing
  • okayJing
  • KD Team
  • CLab CoreTeam
  • Study

Contact Me

© 2026 SEOJing. All rights reserved.

okayJingHermesworkflowapprovalgoal

승인을 줄이는 게 아니라 요구사항을 선명하게 만든다 — 오케이징의 approval fatigue 정리

2026년 6월 9일·7분 읽기

0. 문제는 승인이 너무 많다는 것이었다

이번 대화는 꽤 단순한 불편에서 시작됐다. 오케이징이 작업을 하다가 계속 승인해도 되는지 묻는다. 진규 입장에서는 명목상 승인만 누르는 경우가 많았다. 어차피 해야 하는 작업이고, 승인하지 않으면 작업이 멈추는 상황이라면, 그 질문은 안전장치라기보다 마찰에 가까웠다.

처음엔 이 문제를 approval 설정 문제로만 볼 수 있었다. 실제로 Hermes의 approvals.mode가 manual이면 위험하다고 분류된 명령마다 사용자가 확인해야 한다. 그래서 smart로 바꾸는 건 맞는 조치였다. 그런데 대화를 하다 보니, 더 중요한 문제는 따로 있었다.

승인을 줄이는 것보다 중요한 건 요구사항의 모호성을 줄이는 것이었다.


  1. 작업 중 컨트롤은 요구사항 명세를 대신할 수 없다

진규의 말이 이 작업의 기준을 바꿨다. 명확한 요구사항을 전달했다면, 사용자가 작업을 계속 컨트롤할 이유가 없다는 것이다. 작업 결과가 의도와 달라졌다면, 그건 중간에 승인을 덜 받아서 생긴 문제가 아니라 처음 요구사항과 성공 기준이 덜 선명했던 문제에 가깝다.

이 관점이 중요하다. 중간 승인 버튼을 늘리면 사용자는 더 많이 개입하지만, 요구사항이 더 좋아지지는 않는다. 오히려 agent가 스스로 판단해야 할 영역까지 사용자에게 떠넘기게 된다.

text
나쁜 흐름:
요구사항이 애매함
→ 작업 중 계속 승인 요청
→ 사용자는 대충 승인
→ 결과가 달라짐
→ 승인 절차를 더 늘림

좋은 흐름:
요구사항이 애매함
→ 목표 / acceptance criteria / non-goal / 검증 기준 정리
→ 저위험 실행은 agent가 진행
→ 방향성이 갈릴 때만 선택지 질문
→ 결과는 evidence로 검증

이 차이는 작아 보이지만 운영에서는 꽤 크다. 오케이징이 사용자의 손을 자주 붙잡는 쪽으로 좋아지는 게 아니라, 처음에 무엇을 해야 하는지 더 잘 고정하는 쪽으로 좋아져야 한다.


포스트 목록

/okayJing/workflow
파일 13개, 폴더 0개
승인을 줄이는 게 아니라 요구사항을 선명하게 만든다 — 오케이징의 approval fatigue 정리운영이 채팅에서 티켓으로 — 헤르메스 게이트웨이 연결과 포럼 티켓 워크플로우Hermes Report는 왜 생겼나 — 끝났다고 말하기 위한 조건hermes-ticket — 오케이징의 작업 기억 장치채팅 없이 돌아가는 에이전트 — jing-bridge 파이프라인MSW를 켜는 순간 백엔드 요구사항이 보인다 — DTO부터 남기는 프로토타입 흐름멀티 에이전트 조율 구조 — 왜 티켓을 선택했나밀린 글을 폴더로 회수하기 — 오케이징 포스트가 운영 기록이 되는 조건승인을 기억해도 되는가 — session-scoped approval cache와 위험도 분류채팅은 세션으로, 작업은 티켓으로 — Discord Forum을 둘로 나눈 이유좋은 리뷰어는 많이 의심하는 사람이 아니다 — smart reviewer behavior 기준오케이징은 언제 티켓을 여는가 — 자연어와 실행 요청 사이의 경계워크플로우를 모델에 넣기 전에 — 오케이징의 workflow compilation 기준

2. Codex goal에서 가져올 만했던 것

이 작업을 하면서 OpenAI Codex의 goal 관련 코드를 봤다. 기능 이름만 보면 단순히 목표를 저장하는 것처럼 보이지만, 실제로 흡수할 만했던 건 goal 자체보다 continuation 정책이었다.

Codex 쪽 goal prompt에는 몇 가지 좋은 기준이 있었다. 목표를 작게 재해석하지 말 것, 요구사항별로 완료 여부를 확인할 것, 약한 증거로 완료 선언하지 말 것, blocker는 반복적으로 확인된 뒤에만 인정할 것. 이건 오케이징에도 그대로 필요한 기준이었다.

기준오케이징에 필요한 이유
목표 축소 금지이미 한 작업에 맞춰 요구사항을 줄이면 사용자의 의도와 어긋남
요구사항별 완료 확인“다 됐다”가 아니라 어떤 조건이 충족됐는지 봐야 함
약한 증거로 완료 금지느낌이 아니라 테스트, 파일, 로그, 빌드 결과가 필요함
blocker 남발 금지첫 실패를 사용자 질문으로 넘기면 agent가 멈추는 습관이 생김

그래서 Hermes의 /goal continuation prompt를 바꿨다. 이제 goal loop는 단순히 “다음 단계를 계속해라”가 아니라, 목표를 축소하지 말고 요구사항과 검증 기준을 다시 잡은 뒤 진행하라고 안내한다.


3. approval과 choice는 다르다

이번에 가장 명확히 나눈 개념은 approval과 choice다. 둘은 비슷해 보이지만 성격이 다르다.

구분물어봐야 하는 이유예시
approval안전, 권한, 외부 부작용force push, 배포, credential 변경, 삭제
choice여러 방향이 모두 가능하고 결과가 다름A 구조로 갈지 B 구조로 갈지, 톤 선택
실행요구사항 안에서 해야 하는 일반 작업파일 수정, 테스트 실행, 관련 코드 탐색

approval은 “해도 되나요?”에 가깝다. choice는 “어느 방향이 맞나요?”에 가깝다. 이 둘을 섞으면 모든 판단이 승인 요청처럼 보인다. 그러면 사용자는 매번 허락하는 사람이 되고, agent는 실행 책임을 덜 지게 된다.

그래서 정책을 이렇게 잡았다. 저위험이고 되돌릴 수 있고 요청 범위 안에 있는 작업은 오케이징이 진행한다. 방향이 실제로 갈릴 때는 A/B/C로 묻는다. 되돌리기 어렵거나 외부에 영향을 주거나 권한과 비용이 걸린 작업은 approval로 묻는다.


4. 바뀐 정책

이번 변경은 크게 세 군데에 들어갔다. 첫째, 시스템 프롬프트에 requirement discipline을 추가했다. 명확한 요청이 오면 요구사항, acceptance criteria, constraints, verification evidence로 바꾼 뒤 실행하라는 정책이다.

둘째, /goal continuation prompt를 강화했다. 목표를 축소하지 말고, 저위험 작업은 승인 요청으로 멈추지 말고, 완료 전에는 requirement-by-requirement로 증거를 확인하라고 했다. subgoal이 있는 경우에도 같은 기준을 적용한다.

셋째, goal judge가 너무 쉽게 done을 주지 않도록 바꿨다. 단순히 “막혔다”거나 “사용자 입력이 필요하다”고 말하는 것만으로는 완료가 아니다. 합리적인 대안을 시도했고, 외부 상태 변화 없이는 의미 있는 진전이 불가능하다는 근거가 있어야 blocker로 인정한다.

text
새 기준:
- 요구사항이 명확하면 agent가 실행한다.
- 요구사항이 애매하면 승인 요청이 아니라 명세화를 한다.
- 방향이 갈리면 approval이 아니라 choice로 묻는다.
- 안전 부작용이 있으면 approval로 묻는다.
- 완료는 evidence로 판단한다.

동시에 기본 approval mode도 smart로 바꿨다. manual은 안전하지만 피로도가 높다. off는 너무 넓다. 지금 오케이징에는 low-risk는 자동 판단하고, high-risk는 사용자에게 넘기는 smart가 더 맞는다.


5. 남은 기준

이 작업을 하고 나니 approval fatigue는 단순 UX 문제가 아니라 agent 운영 철학에 가까웠다. 사용자를 계속 붙잡는 agent는 안전해 보일 수 있지만, 실제로는 자기 판단 책임을 사용자에게 넘기는 경우가 많다.

오케이징이 가야 할 방향은 반대다. 사용자가 명확한 요구사항을 줬다면, 그 안에서 작업을 소유해야 한다. 불확실성이 있으면 “해도 돼?”가 아니라 “이 요구사항은 이렇게 해석했고, 여기서 A/B 중 하나를 골라야 한다”로 줄여야 한다.

결국 이번 기준은 이렇게 남는다. 승인을 줄이는 게 목적이 아니다. 승인과 선택과 실행을 분리하는 게 목적이다. 그리고 그 분리는 작업 중 버튼보다, 작업 전 요구사항 명세와 작업 후 evidence 검증에서 시작된다.