본문 바로가기

GPT

GitHub Copilot이 6월 1일부터 완전히 달라집니다 — AI Credit 과금 전환 완벽 분석

반응형

월 구독료를 냈는데 갑자기 "크레딧이 부족합니다"가 뜬다면 어떻게 될까요? 2026년 6월 1일, GitHub Copilot이 기존 요청(Request) 기반 과금을 완전히 버리고 토큰 소비량 기반의 AI Credit 시스템으로 전환합니다. 구독료는 그대로인데 과금 구조가 통째로 바뀝니다. 무엇이, 왜, 어떻게 달라지는지 — 실무 기준으로 정리했습니다.


이 포스트 한 줄 요약 → GitHub Copilot, 6월 1일부터 PRU → AI Credit 전환 → 1 AI Credit = $0.01, 토큰 소비량에 따라 차감 → 코드 자동완성·Next Edit Suggestions는 무제한 유지 → Chat·Agent Mode·Code Review가 크레딧 소진 대상 → Claude Opus 4.7 실효 비용 3.6~6배 급등 → GPT-5.3 Codex 사실상 '무료 기본 모델'에서 6배 모델로 전환 → 월간 플랜 자동 전환, 연간 플랜은 만료 시 전환 → Business/Enterprise 3개월 프로모션 크레딧 제공 (6/1~9/1) → 캐시 토큰 적극 활용 시 입력 비용 80~90% 절감 가능


왜 바꾸나 — GitHub이 더 이상 비용을 못 버티겠다는 신호

기존 PRU(Premium Request Units) 시스템은 "한 번의 요청 = 고정 비용"이었습니다. 간단한 문법 질문이나 수천 줄 리팩토링이나 같은 크레딧을 썼습니다. 문제는 Agent Mode의 보급입니다. 에이전트 세션은 파일을 열고, 도구를 호출하고, 다단계 추론을 반복하며 엄청난 양의 토큰을 소비합니다. 요청 하나에 소비되는 컨텍스트 규모가 완전히 달라진 것입니다.

GitHub CPO Mario Rodriguez는 이를 공식적으로 인정했습니다. "짧은 채팅 한 번과 수 시간의 자율 코딩 세션이 같은 비용으로 책정되는 구조는 지속 가능하지 않다." GitHub이 그동안 사용자 대신 추론 비용을 상당 부분 흡수해왔고, 이제 그 부분을 실제 사용량에 맞게 청구하겠다는 선언입니다.


새로운 과금 단위: GitHub AI Credit

핵심 공식: 1 AI Credit = $0.01 USD

상호작용 하나가 발생할 때 세 가지 토큰이 소비됩니다.

  • Input tokens: 모델에 전송되는 내용 (프롬프트, 컨텍스트, 파일)
  • Output tokens: 모델이 생성하는 내용 (코드, 답변)
  • Cached tokens: 모델이 재사용하거나 저장하는 컨텍스트 (가장 저렴)

사용한 토큰 수 × 모델별 단가 = 소비 크레딧. 플랜에 포함된 크레딧을 모두 소진하면 추가 예산을 설정해 계속 사용하거나, 다음 청구 사이클까지 사용이 차단됩니다.


플랜별 포함 크레딧

플랜 월 구독료 포함 AI Credit

Copilot Free 무료 일정량 제공 (코드 완성 2,000회 별도 무제한)
Copilot Pro $10/월 $10 상당
Copilot Pro+ $39/월 $39 상당
Copilot Business $19/user/월 $19/user (조직 풀링)
Copilot Enterprise $39/user/월 $39/user (조직 풀링)

Business·Enterprise 고객 한정: 전환 초기 3개월(6/1~9/1) 동안 프로모션 크레딧이 추가 지급됩니다. Business는 3,000 크레딧, Enterprise는 7,000 크레딧.


무엇이 크레딧을 소비하고, 무엇이 소비하지 않나

무제한 (크레딧 미소비)

  • 코드 자동완성 (Code Completions)
  • Next Edit Suggestions

크레딧 소비 대상

  • Chat (인라인, 사이드바, Copilot.com)
  • Agent Mode
  • Code Review (토큰 + GitHub Actions minutes 이중 청구)
  • 기타 AI 기반 기능

Code Review는 특히 주의가 필요합니다. 6월 1일부터 PR 코드 리뷰 한 건이 AI Credit(토큰 비용) + GitHub Actions minutes(인프라 비용) 두 가지를 동시에 소진합니다. private 리포지토리에서만 Actions minutes가 적용되며, 포함 분을 초과하면 표준 Actions 요금이 추가됩니다.


모델별 비용 — 어떤 모델이 얼마나 비싼가

모델마다 단가가 다르기 때문에 어떤 모델을 기본으로 쓰느냐가 월 비용을 결정합니다. 주요 모델 비용 구조입니다(1M 토큰 기준).

모델 입력 캐시 입력 출력

GPT-5.4 nano $0.20 $0.02 $1.25
GPT-5 mini 포함 모델
Claude Haiku 4.5 $1.00 $0.10 $5.00
Claude Sonnet 4.6 $3.00
Claude Opus 4.7 / 4.5 / 4.6 $5.00 $0.50 $25.00
Gemini 3.1 Pro 200K↑ 할증 적용

Pro 플랜 ($10 크레딧 기준, Claude Sonnet 4.6 Agent 사용 시) 약 110회 에이전트 실행 후 크레딧 소진이 예상됩니다. 복잡한 세션일수록 훨씬 빨리 줄어듭니다.


가장 타격받는 시나리오 — Claude Opus와 GPT-5.3 Codex 사용자

두 가지 케이스가 가장 큰 영향을 받습니다.

① Claude Opus 사용자

기존 PRU 시스템에서 Opus 4.7은 7.5배 멀티플라이어였습니다. 6월 1일 이후 실효 비용이 27배 수준으로 급등합니다. 에이전트 코딩 세션을 Opus로 돌리던 팀은 같은 사용량에 3.6~6배의 크레딧을 소비하게 됩니다.

② GPT-5.3 Codex 사용자

Codex는 이전에 1배(사실상 포함 모델 수준)였습니다. "기본 모델"로 인식되어 많은 팀이 기본값으로 사용해왔습니다. 6월 1일부터 6배 수준으로 전환됩니다. Microsoft가 그동안 실제 비용을 조용히 흡수해왔다는 의미입니다.


연간 플랜 사용자는 어떻게 되나

월간 플랜: 6월 1일 자동 전환, 별도 조치 불필요.

연간 플랜: 자동 갱신되지 않습니다. 만료 전에 월간 플랜으로 전환하거나(잔여 가치 비례 환불 처리), 아니면 만료 시 Copilot Free로 전환됩니다. 다만 연간 플랜 유지 중에는 기존 PRU 방식이 적용되되, 6월 1일부터 일부 모델 멀티플라이어가 상향 조정됩니다.


실무 비용 최적화 전략

# 모델 라우팅 전략 예시

일상 작업 (코드 설명, 간단한 질문)
→ GPT-5 mini, Grok Code Fast, Gemini 3 Flash
→ 크레딧 소비 최소화

중간 복잡도 (함수 단위 생성, 버그 수정)
→ Claude Sonnet 4.6, GPT-5.5
→ 품질·비용 균형점

복잡한 작업 (대규모 리팩토링, 아키텍처 설계)
→ Claude Opus 4.7, GPT-5.3 Codex
→ 필요할 때만 사용

캐시 토큰 활용이 핵심입니다. 동일한 파일이나 컨텍스트를 반복 참조하는 에이전트 세션에서 캐시 입력 단가는 일반 입력의 10% 수준입니다. 긴 세션에서 80~90% 입력 비용 절감이 가능합니다.

예산 설정을 반드시 하세요. 추가 예산 허용 시 크레딧 소진 이후에도 사용이 계속되며 초과분이 청구됩니다. 팀 단위에서는 사용자별 예산 상한을 설정해 예상치 못한 과금을 차단할 수 있습니다.

Code Review 빈도를 조정하세요. 모든 PR에 자동 코드 리뷰를 걸어두면 AI Credit + Actions minutes가 이중으로 소비됩니다. 복잡도 높은 PR에 선별 적용하는 정책이 필요합니다.


커뮤니티 반응 — "같은 돈에 더 적게 받는다"

개발자 커뮤니티의 반응은 엇갈립니다. 가장 많이 제기된 불만은 예측 가능성 저하입니다. PRU 방식은 월별 요청 횟수가 고정되어 예산 계획이 명확했지만, 토큰 기반은 세션의 성격에 따라 소비량이 크게 달라집니다.

일부 사용자는 이미 대안을 검토하고 있습니다. Cursor + 직접 API, Cline + OpenRouter, Claude Code 같은 조합은 동일한 모델을 더 낮은 실효 단가로 활용할 수 있는 옵션입니다. 특히 에이전트 집약적 워크플로를 운영하는 팀에게는 구독 모델보다 BYOK(Bring Your Own Key) 방식이 비용 효율적일 수 있습니다.

반면 코드 자동완성 위주의 라이트 사용자에게는 사실상 영향이 없습니다. 코드 완성과 Next Edit Suggestions는 여전히 무제한이기 때문입니다.


✅ 결론

항목 평가

과금 구조 투명성 ✅ 토큰 단위로 정확히 추적 가능
비용 예측 가능성 ❌ 세션 성격에 따라 편차 큼
라이트 사용자 영향 ✅ 코드 완성 무제한 유지
에이전트 헤비 유저 영향 ❌ Opus/Codex 실효 비용 3~6배
팀 예산 관리 ✅ 사용자별·조직별 예산 설정 가능
연간 플랜 전환 처리 ⚠️ 만료 전 선택 필요

6월 1일까지 남은 시간이 얼마 없습니다. 지금 해야 할 세 가지는 명확합니다. ① 현재 사용량 CSV 다운로드로 전환 후 예상 비용 확인, ② 기본 모델 라우팅 전략 수립, ③ 조직 단위라면 사용자별 예산 상한 설정. 에이전트 워크플로를 많이 사용하는 팀일수록 지금 당장 시뮬레이션이 필요합니다.

 

반응형