프롬프트 96번 고치는 건 자동화가 아니다 — 에이전트가 알아서 쓰게 만든 이미지 생성기

텍스트 쪽은 비교적 순탄했어요. 번역하고 카피 쓰고 검수하면 끝이니까요. 진짜 문제는 이미지였다고.

아마존에 제품을 올리려면 상세페이지를 통째로 바꿔야 해요. 번역만 하면 될 것 같지만 전혀 아니거든요. 제품 설명을 현지 톤에 맞게 다시 쓰고, 이미지 속 한국어 텍스트를 바꾸고, 모델도 현지인으로 교체하면 더 좋겠죠. 진출 국가가 4곳이면 이걸 4번 반복해야 하고요. 조이(Zoey)라는 사람이 이 전체 과정을 Claude Code 멀티 에이전트 시스템으로 자동화한 3편짜리 시리즈의 마지막 이야기예요.

"프롬프트를 잘 쓰면 되는 거 아니야?"가 안 통하는 이유

이미지 생성 얘기를 하면 대부분 이렇게 생각하잖아요. "프롬프트를 잘 쓰면 되는 거 아니야?" 맞는 말이에요. 근데 이 시스템에서는 프롬프트를 쓰는 게 사람이 아니라 에이전트거든요.

일반적인 AI 이미지 생성 워크플로우라면 사람이 프롬프트를 쓰고, 결과를 보고, 마음에 안 들면 다시 쓰고. 근데 이러면 자동화가 아니에요. 이미지 하나에 사람이 프롬프트를 3번 고치면, 8장짜리 상세페이지를 4개 나라에 만드는 데 프롬프트를 96번 수정해야 해요. 그건 그냥 노가다잖아요.

그래서 이 시스템에서는 사람이 프롬프트를 한 번도 안 써요. 대신 에이전트가 매번 일관되게 좋은 프롬프트를 쓸 수 있도록, 스킬 파일(SKILL.md)에 규칙을 구체적으로 적어두는 거예요. "프롬프트에 이렇게 썼다"는 건, 직접 쓴 게 아니라 에이전트가 이렇게 쓰도록 지침을 만들었다는 뜻이고요. 프롬프트 하나를 잘 쓰는 건 쉽거든요. 에이전트가 매번 알아서 그 수준의 프롬프트를 쓰게 만드는 게 어려운 거예요.

여기서 핵심 차이가 나요.

6명의 에이전트가 순서대로 일하는 파이프라인

1편에서 6명의 에이전트와 6개의 스킬로 시스템을 설계했다고 해요. "이 제품을 미국이랑 일본용으로 현지화해줘" 한마디에, 시장 조사부터 번역, 카피라이팅, 이미지 생성, 품질 검수까지 Claude Code가 알아서 돌리게 만든 거죠.

파이프라인을 간단히 보면 이래요. Phase 0에서 Orchestrator가 URL을 파싱해서 스프레드시트에서 제품 정보를 가져오고, Phase 1에서 Market Researcher 에이전트가 타겟 국가별로 조사를 해요. 여기서 캐시 우선 정책을 적용했는데, config/market-research/JP.json이 이미 있으면 조사를 건너뛴대요. 같은 나라에 제품을 여러 개 올릴 때 시간 절약이 크다고. 근데 1년 뒤에도 그 조사가 유효할 리는 없잖아요? 그래서 30일 이내 정책을 뒀어요. (이런 디테일이 진짜 실전이라는 느낌을 주더라고요.)

로컬 파일도 돼요. data/input/{brand}/{product_id}/ 폴더에 JSON이랑 이미지를 넣어두면 똑같이 동작한다고.

"이것만 바꾸고 나머지는 건드리지 마"가 어려운 이유

제품 이미지 변형이 진짜 골치였대요. "이것만 바꾸고 나머지는 건드리지 마"가 AI 이미지 생성에서 가장 어려운 주문이거든요. 텍스트를 바꾸면 배경이 달라지고, 모델을 바꾸면 제품 색상이 변하고.

지인이 운영하는 헤어케어 브랜드가 해외 진출을 준비하고 있었는데, 제품 하나 현지화하는 데 꽤 오랜 시간이 걸린다고 하더래요. 번역하고, 최적화하고, 디자이너가 이미지 수정하고. 이 과정이 제품마다 반복되는 거죠. "그거 자동화 해줄까?"라고 했다가, 생각보다 큰 프로젝트가 됐다고. (왜 그랬을까, 가마니 있을걸.)

결과물부터 말하면, 시장 조사부터 번역, 카피라이팅, 이미지 생성, 품질 검수까지 Claude Code가 알아서 돌리게 되었어요. 1편은 전체 설계와 아키텍처, 2편은 파이프라인, 3편은 이미지 생성의 함정과 삽질 기록.

Anthropic 구독 차단 D-4시간, 금요일 밤 11시

여담이지만 이 시리즈를 쓴 조이한테 더 극적인 사건이 있었어요. 4월 4일 금요일 밤이었는데, "Anthropic이 4월 5일 오후 12시(PT)부터 서드파티 하니스에서 구독 토큰 사용을 차단합니다." 한국 시간으로 4월 5일 새벽 4시.

에이전트 팀 전원이 Anthropic 구독 토큰으로 돌아가고 있었어요. 달밤이, 슝이, 돈냥이, 루틴이, 글냥이 — 다섯 모두. 새벽 4시에 토큰이 막히면 팀 전체가 먹통이 되는 거죠.

보통이면 "내일 해도 되지" 하겠잖아요. 근데 무서운 걸 깨달은 거예요. 끊기면 "내일 해"라고 지시할 대상이 없다는 것. OpenClaw로 AI 비서를 운영한다는 건, AI가 항상 깨어있다는 뜻이거든요. LLM provider가 끊기면 비서의 두뇌가 날아간 거예요. 몸은 있는데 생각을 못 하는 상태.

결국 금요일 밤 11시 36분에 전환 작업을 시작했대요. GitHub Copilot과 ACP 하이브리드로 운영 체제를 갈아탄 거죠. AI 에이전트를 5명이나 운영하는 사람의 현실이 이렇게 생겼다는 게 좀 충격적이었어요. (솔직히 좀 부럽기도 하고요.)

자동화의 끝은 결국 "사람이 프롬프트를 안 쓰는 것"이에요. 에이전트한테 규칙을 가르치는 거지, 매번 지시하는 게 아닌 거죠. 96번 고치던 걸 0번으로 만든 차이. 근데 그 규칙을 만드는 과정이 3편짜리 시리즈가 될 만큼 녹록하진 않았다는 게 포인트예요.