바이브 코딩 도구가 느려지는 진짜 원인은 모델이 아니라 컨텍스트 오염이다

응답이 느려지고, 이미 합의한 제약을 잊어버리고, 관련 없는 파일까지 건드리기 시작해요. Claude Code나 Codex를 오래 쓰다 보면 어느 순간부터 나타나는 증상이죠. 모델의 성능 문제처럼 보이지만, 실제 원인은 대부분 컨텍스트 오염(Context Rot)이에요. 대화 로그, 실패한 시도, 임시 가설, 긴 빌드 로그가 계속 누적되면서 모델이 지금 중요한 정보와 이미 폐기된 정보를 구분하지 못하게 되는 거예요.

.claudeignore 하나로 30~40% 토큰 절감이 가능하다

가장 ROI가 높은 단일 조치는 `.claudeignore`로 읽지 말아야 할 것을 원천 차단하는 거예요. node_modules, 빌드 산출물, 로그, 바이너리를 제외하는 것만으로 30~40% 수준의 절감 효과가 보고되고 있어요. 그다음으로 효과적인 건 tasks.md를 하나로 몰아넣지 않고 인덱스 구조로 쪼개는 방법이에요. 단일 대형 tasks.md를 도메인별 문서와 INDEX.md 구조로 나눠서 76.1% 절감을 달성한 케이스도 있거든요.

세션 관리도 중요해요. `/clear`는 작업 맥락을 완전히 초기화할 때, `/compact`는 중요한 내용만 남기고 대화 이력을 요약할 때 쓰면 되죠. 긴 대화를 계속 유지하는 게 생산적이라는 착각에서 벗어나는 게 핵심이에요. 세션을 자주 끊으려면 재개 비용이 낮아야 하는데, HANDOFF.md 같은 짧은 인계 문서가 이 문제를 해결해줘요.

Plan mode를 먼저 거치면 20~30%를 더 줄일 수 있다

큰 작업을 곧바로 실행 모드로 던지면 시행착오가 많아지고 토큰도 많이 들어요. Plan mode를 먼저 거쳐 범위를 줄인 뒤 구현으로 들어가는 습관이 20~30% 절감에 기여하죠. CLAUDE.md를 전역, 프로젝트, 모듈 단위로 계층적으로 관리하는 것도 반복되는 설명을 줄이는 좋은 방법이에요.

마지막 전략은 Skills를 적극적으로 활용하는 거예요. Skills는 YAML frontmatter만 항상 로드되고, SKILL.md 본문은 관련 있다고 판단될 때만, references/ 같은 연결 문서는 필요할 때만 추가로 탐색되는 3단계 점진적 노출 구조를 가지고 있어요. 지식을 한 번에 다 넣지 않는 것, 그게 토큰 관리의 본질이에요. 토큰 부족은 결국 모델 성능의 문제가 아니라, 컨텍스트 운영 방식의 문제거든요.