"4월에 $39 나왔는데 6월에는 $902 나왔습니다."
실제로 있었던 일입니다. 가상의 시나리오가 아닙니다. GitHub의 Billing Preview 도구로 4월 사용량을 새 과금 체계에 적용해봤더니 나온 숫자입니다. 어떻게 이런 일이 일어나고, 어떻게 막는지 — 숫자로 직접 보여드립니다.
핵심 요약
→ $902 사례: Pro+ 사용자가 에이전트 루프 + Opus 위주로 사용 → 구 과금 $39 → 신 과금 $902
→ 핵심 원인: 컨텍스트 누적 — 에이전트 루프는 매 턴마다 이전 대화 전체를 재전송
→ 에이전트 세션 1회 = $30~40 발생 가능 (Pro 월 크레딧 $10 초과)
→ Tab 자동완성은 절대 안 나감 — 크레딧 소비는 Chat/Agent/Review만
→ 절감 전략 1: 기본 모델 GPT-5 mini로 세팅 (무료 included)
→ 절감 전략 2: 작업별 모델 라우팅 — 쉬운 것 → 싸게, 복잡한 것만 → 비싸게
→ 절감 전략 3: 대화창 자주 새로 열기 — 누적 컨텍스트 차단
→ 절감 전략 4: $0 추가 예산 설정 → 폭탄 원천 차단
→ 절감 전략 5: Code Review self-hosted runner → Actions 분 면제
→ LTS 모델 GPT-5.3-Codex = 크레딧 0 소비 (Business/Enterprise 전용)
→ Flex 크레딧은 가변, Base만 고정 → Flex 줄어들 수 있음 대비 필요
실전 1 — $902 청구서 해부: 어떻게 발생했나
실제 사례 재구성
사용자 프로필:
- 플랜: Pro+ ($39/월)
- 구 과금 추정: $39 (PRU 기준)
- 신 과금 실제: $902
주로 한 일:
- 매일 Claude Opus 4.7로 에이전트 세션 3~4회
- 대규모 레거시 코드베이스 리팩토링
- 세션마다 수천 줄 파일 컨텍스트 포함
- Code Review 자동화로 PR마다 리뷰 실행
왜 이렇게 나왔나: 컨텍스트 누적의 함정
에이전트 루프에서 크레딧이 폭발하는 핵심 원인은 컨텍스트 누적입니다.
에이전트 턴 1:
입력: 시스템 프롬프트(2K) + 내 질문(500) = 2,500 토큰
출력: 코드 제안(1,000 토큰)
에이전트 턴 2:
입력: 시스템 프롬프트(2K) + 턴1 전체(3,500) + 내 질문(500) = 6,000 토큰
출력: 수정된 코드(1,500 토큰)
에이전트 턴 3:
입력: 시스템 프롬프트(2K) + 턴1+턴2(8,000) + 내 질문(500) = 10,500 토큰
출력: 추가 수정(2,000 토큰)
에이전트 턴 10:
입력: 시스템 프롬프트(2K) + 누적 대화(50,000+) = 50,000+ 토큰
→ 이 한 턴만 Claude Opus로 보내면 크레딧 약 25 소비
Claude Opus로 에이전트 세션 비용 계산
Opus 요금: 입력 $5/1M + 출력 $25/1M
에이전트 세션 (2시간, 20턴 기준):
평균 입력: 턴당 30,000 토큰
평균 출력: 턴당 2,000 토큰
입력 비용: 20 × 30,000 × $5/1M = $3.00 → 300 크레딧
출력 비용: 20 × 2,000 × $25/1M = $1.00 → 100 크레딧
세션 1회: 약 400 크레딧 = $4
Pro+ 월 7,000 크레딧 ÷ 400 = 월 17회 에이전트 세션으로 소진
하루 1회만 써도 17일이면 끝
Code Review 이중 과금 추가
PR 1개당:
→ AI Credits (Copilot 모델 토큰): 약 50~200 크레딧
→ GitHub Actions 분: 약 2~5분 × $0.008/분 = $0.016~0.04
한 달에 PR 50개:
→ AI Credits: 50 × 100 = 5,000 크레딧 ($50 상당)
→ Actions: 50 × 3분 = 150분 × $0.008 = $1.20
→ 합계: Actions 포함 약 $51.20
실전 2 — 지출 완전 차단: $0 예산 설정
이것만 해도 $902 폭탄은 불가능합니다.
설정 방법 (지금 바로)
Step 1. github.com 접속 → 로그인
Step 2. 우상단 프로필 아이콘 → Settings
Step 3. 좌측 메뉴 → Billing and plans → Budget and alerts
(직접 주소: github.com/settings/billing)
Step 4. "GitHub Copilot" 항목 찾기
→ "Spending limit" 또는 "Budget limit" 클릭
Step 5. 금액 입력창에 "0" 입력 → Save
완료: 월 포함 크레딧 소진 후 자동 정지
추가 청구 = $0 보장
$0 설정 시 어떻게 됨?
포함 크레딧 소진 전: 평소대로 정상 작동
포함 크레딧 소진 후: Chat/Agent = 응답 없음 (차단)
Tab 자동완성 = 계속 작동 (무료)
다음 달 1일 자정: 크레딧 리셋 → 다시 정상 작동
알림 설정 (권장)
Budget and alerts 페이지 → Add alert
→ 80% 소진 시 이메일 알림
→ 남은 크레딧 20%일 때 알림 받음
→ 미리 모델 전략 조정 가능
실전 3 — 모델 라우팅 전략: 작업별 모델 선택
하루에 하는 작업을 4가지 유형으로 나눠서 모델을 다르게 씁니다.
유형별 추천 모델 (비용 순)
작업 유형 예시 추천 모델 크레딧 절감
| 💬 빠른 Q&A | 함수 설명, 에러 원인 | GPT-5 mini (무료) | 100% 절감 |
| 📝 단순 생성 | 주석 추가, 변수명 제안 | GPT-5.4 nano | ~90% 절감 |
| 🔧 일반 코딩 | 함수 구현, 리팩토링 | Gemini 3 Flash | ~80% 절감 |
| 🔍 복잡한 디버깅 | 멀티파일 버그, 아키텍처 | Claude Sonnet 4.6 | 기준 |
| 🏗️ 핵심 설계 | 중요한 알고리즘, 보안 검토 | Claude Opus / GPT-5.5 | -67% (더 비쌈) |
VS Code에서 모델 변경하는 법
Chat 패널 하단 입력창 왼쪽 → 모델 이름 클릭
→ 드롭다운에서 원하는 모델 선택
→ 대화 중간에도 바꿀 수 있음
기본 모델 고정 설정:
Ctrl+, → 설정 검색창에 "copilot chat model"
→ "Github › Copilot: Default Chat Model"
→ "gpt-5-mini" 입력 → 저장
실제 하루 워크플로 예시
오전: 코드 리뷰 + 질문
→ GPT-5 mini 사용 (무료)
예: "이 코드 뭐 하는 거야?", "이 에러 왜 나?"
크레딧 소비: 0
점심 전: 기능 구현
→ Gemini 3 Flash 사용
예: "user.ts에 이메일 검증 함수 추가해줘"
크레딧 소비: ~5 크레딧
오후: 복잡한 버그 디버깅
→ Claude Sonnet 4.6 사용
예: "로그인 후 세션이 간헐적으로 끊기는 버그 찾아줘"
크레딧 소비: ~15 크레딧
하루 합계: ~20 크레딧 ($0.20)
Pro 1,500 크레딧 ÷ 20 = 75일치 지속 가능
실전 4 — 컨텍스트 관리: 크레딧 먹는 주범 차단
전략 1: 대화창 자주 새로 시작하기
❌ 나쁜 습관:
아침부터 저녁까지 같은 Chat 창에서 계속 대화
→ 컨텍스트 계속 누적
→ 나중 턴에서 토큰 폭발
✅ 좋은 습관:
작업 하나 끝나면 → 새 Chat 창 시작
단축키: Chat 창 상단 +(새 채팅) 아이콘 클릭
또는: Ctrl+Shift+P → "Chat: New Chat"
전략 2: 파일 첨부 최소화
❌ 크레딧 낭비:
"이 프로젝트 전체 파일 다 봐서 리팩토링해줘"
→ 수십 개 파일이 컨텍스트로 들어감 → 토큰 폭발
✅ 절약:
"src/auth/login.js 이 파일만 보고 에러 핸들링 개선해줘"
→ 필요한 파일만 지정
전략 3: 구체적인 질문으로 짧게
❌ 토큰 낭비 질문:
"이 프로젝트에서 개선할 수 있는 모든 것을 설명해줘"
→ 긴 답변 = 출력 토큰 폭발
✅ 절약 질문:
"login() 함수에서 비밀번호 해싱 부분만 보안 검토해줘"
→ 범위 좁혀서 짧은 답변 유도
전략 4: Ask → Edit 순서 사용
비용 효율 순서:
1. Ask 모드로 방향 파악 (저렴)
"이 코드 어떻게 개선하면 좋을까?"
2. 방향 정해지면 Edit 모드로 실행 (중간)
"위에서 말한 방법으로 수정해줘"
3. Agent 모드는 마지막 수단으로 (비쌈)
→ 파일 여러 개 건드려야 할 때만
실전 5 — Code Review 이중 과금 피하는 법
이중 과금 구조 복습
PR에 Copilot Code Review 요청 시:
AI Credits (토큰 비용) → Copilot 과금
+ GitHub Actions 분 → 별도 과금
Actions 기본 무료 한도:
Free 계정: 500분/월
Pro: 3,000분/월
Pro+: 3,000분/월
Actions 분 아끼는 방법
방법 1: Self-hosted runner 사용
→ 내 서버/PC에서 Actions 실행
→ GitHub Actions 분 소비 없음
→ AI Credits만 소비
설정:
레포 Settings → Actions → Runners
→ New self-hosted runner → 가이드 따라 설치
방법 2: Public 레포는 Actions 무료
→ 오픈소스 프로젝트라면 Actions 분 걱정 없음
방법 3: Code Review 요청 횟수 줄이기
→ 모든 PR에 자동 요청 대신 중요한 PR에만 수동 요청
Code Review 자동 요청 끄는 법
레포 Settings → Copilot → Code review
→ "Automatically run code review on pull requests" 비활성화
→ 필요할 때만 PR 페이지에서 수동 요청
실전 6 — 사용량 모니터링하는 법
현재 남은 크레딧 확인
방법 A: GitHub 웹
github.com → Settings → Billing and plans
→ "GitHub Copilot" 섹션
→ 이번 달 사용량 / 남은 크레딧 표시
방법 B: VS Code
상태바 Copilot 아이콘 우클릭 → "View Usage"
→ 오늘/이번 주 사용량 확인
일별 사용량 그래프 확인
github.com/settings/billing → "Usage history" 탭
→ 날짜별 크레딧 소비 그래프
→ 어느 날 많이 썼는지 확인 가능
→ 많이 쓴 날 어떤 작업 했는지 돌이켜보기
팀/기업 관리자 대시보드
Business/Enterprise 관리자:
github.com/{조직명}/settings/billing
→ 유저별 크레딧 소비 확인
→ 누가 가장 많이 쓰는지 파악
→ 유저별 예산 한도 설정 가능
실전 7 — 플랜별 최적 전략 정리
Pro ($10/월, 1,500 크레딧) 최적 전략
목표: 1,500 크레딧으로 한 달 버티기
규칙:
1. 기본 모델 = GPT-5 mini (무료)
2. Chat은 짧고 구체적으로
3. 매일 새 Chat 창 시작
4. Agent 모드는 주 1~2회만
5. Code Review는 중요한 PR에만 수동 요청
6. $0 예산 설정 필수
현실적으로 가능한가?
→ Tab 자동완성 위주 + 가벼운 Chat 사용자: 충분
→ 에이전트 헤비 유저: Pro+로 업그레이드 필요
Pro+ ($39/월, 7,000 크레딧) 최적 전략
목표: 7,000 크레딧으로 에이전트 적극 사용
규칙:
1. 일상 Chat = Gemini 3 Flash 또는 GPT-5.4
2. 에이전트 세션 = Claude Sonnet 4.6 (Opus는 아껴서)
3. Opus는 월 5회 이하로 제한
4. 대화 컨텍스트 100K 토큰 넘으면 새 창
대략 계산:
- 일상 Chat (Sonnet) 하루 20회: 20 × 1 = 20 크레딧
- 에이전트 세션 주 3회: 3 × 100 = 300 크레딧
- 월 합계: 20 × 30 + 300 × 4 = 1,800 크레딧
→ 7,000 크레딧에서 충분히 여유
연간 플랜 사용자 주의사항
⚠️ 연간 Pro/Pro+ 사용자:
→ 아직 PRU 과금 체계 유지 (플랜 만료까지)
→ 단, 6월 1일부터 모델 멀티플라이어 인상됨
Claude Opus: 7.5x → 27x
GPT-5.4: 1x → 6x
→ Opus 사용 많았다면 지금 당장 줄이기
→ 플랜 만료 시 Free로 다운그레이드 → Pro 재가입 필요
(현재 Pro 신규 가입 중단 상태, 재개 시 가입)
실전 8 — 유형별 한 달 예산 시뮬레이션
케이스 A: 라이트 유저 (Tab + 간단 Chat)
하루 패턴:
- Tab 자동완성: 무제한 무료
- Chat 10회 (GPT-5 mini): 0 크레딧
- Chat 3회 (Gemini Flash): 3 × 0.2 = 0.6 크레딧
월 합계: 약 18 크레딧 ($0.18)
Pro 1,500 크레딧 → 83배 여유
결론: Pro $10으로 넘치게 충분
케이스 B: 중간 유저 (Chat + 간헐적 Agent)
하루 패턴:
- Chat 20회 (Sonnet): 20 × 1 = 20 크레딧
- Agent 세션 주 2회: 2 × 80 = 160 크레딧/주
월 합계: 20 × 30 + 160 × 4 = 1,240 크레딧
Pro 1,500 크레딧 → 260 크레딧 여유
결론: Pro로 딱 맞음, 여유 조금
케이스 C: 헤비 유저 (에이전트 매일)
하루 패턴:
- Chat 30회 (Sonnet): 30 크레딧
- Agent 세션 1회 (Opus): 300~400 크레딧
월 합계: 30 × 30 + 350 × 30 = 11,400 크레딧
Pro 1,500 → 9,900 초과 ← 폭탄
Pro+ 7,000 → 4,400 초과 ← 여전히 초과
결론: Max 플랜($100) 또는 Claude Code 직접 고려
마무리
우선순위 액션 효과
| 🔴 필수 | $0 추가 예산 설정 | 폭탄 원천 차단 |
| 🔴 필수 | 기본 모델 GPT-5 mini | 일상 Chat 크레딧 0 |
| 🟡 권장 | 작업별 모델 라우팅 | 크레딧 50~80% 절감 |
| 🟡 권장 | 대화창 작업마다 새로 | 컨텍스트 누적 차단 |
| 🟡 권장 | 80% 알림 설정 | 소진 전 미리 파악 |
| 🟢 선택 | Code Review 수동 전환 | Actions 분 절감 |
| 🟢 선택 | Self-hosted runner | Actions 분 면제 |
오늘 당장 할 것 딱 두 가지: $0 예산 설정 + 기본 모델 GPT-5 mini 고정. 이것만 해도 생각지 못한 청구서는 절대 안 나옵니다.
5편에서는 Claude Code, Copilot, Kiro — 세 툴을 직접 비교합니다. AI Credits 전환 이후 어떤 사람에게 뭐가 맞는지, 비용과 기능을 함께 놓고 봅니다.
관련 글
- GitHub Copilot 완전가이드 2편 — AI Credits 과금 구조 완전 해부
- GitHub Copilot 완전가이드 3편 — Chat/Agent/Coding Agent 실전