Claude Code, Codex CLI 다음 세 번째 선수가 왔습니다. xAI가 2026년 5월 14일 공개한 Grok Build CLI는 터미널 기반 에이전트 코딩 도구로, 병렬 서브에이전트와 Git worktree 격리라는 구조적 차별점을 앞세웠습니다. 얼리 베타, 최고 구독 티어 전용, SWE-Bench 70.8%라는 조건 아래 — 지금 실제로 어떤 도구인지, 어떻게 설정하고 쓰는지, 어디서 강하고 어디서 약한지 정리했습니다.
이 포스트 한 줄 요약 → 출시일: 2026년 5월 14일 (얼리 베타) → 기반 모델: grok-build-0.1 (5월 20일 출시, 256K 컨텍스트) → API 가격: 입력 $1.00 / 출력 $2.00 / 캐시 입력 $0.20 per 1M tokens → 접근 조건: SuperGrok Heavy 구독 필수 ($299/월, 6개월 프로모 $99/월) → 핵심 기능: Plan Mode, 최대 8개 병렬 서브에이전트, Git worktree 격리 → MCP·ACP·AGENTS.md·플러그인 기본 지원 → 헤드리스 모드(-p 플래그)로 CI/CD 파이프라인 연동 가능 → SWE-Bench Verified 70.8% — Opus 4.7(87.6%) 대비 17pt 낮음 ⚠️ 자체 하네스 → 구독 티어 혼동 주의: SuperGrok $300/년 ≠ SuperGrok Heavy $300/월
Grok Build가 등장한 맥락
2026년 터미널 기반 에이전트 코딩 시장은 Claude Code가 개발자 마인드셰어를 장악하고, OpenAI가 Codex CLI로 추격하는 구도였습니다. xAI는 5월 14일 세 번째로 이 레이스에 진입했습니다.
타이밍이 흥미롭습니다. SpaceX와 xAI의 합병(2026년 2월) 이후 Cursor에 대한 $60B 인수 옵션이 공개됐고, Colossus 2 GPU 클러스터 공동 활용 계획이 알려졌습니다. Grok Build는 단독 제품이 아니라 xAI의 수직 통합 전략 중 하나의 퍼즐 조각입니다. Bloomberg는 xAI 내부에서 Claude 코딩 성능에 맞추는 것을 최우선 목표로 삼았다고 보도했습니다.
핵심 스펙
항목 사양
| 출시일 | 2026년 5월 14일 (얼리 베타) |
| 기반 모델 | grok-build-0.1 (5/20 출시) |
| 컨텍스트 윈도우 | 256K tokens |
| 입력 가격 | $1.00 / 1M tokens |
| 출력 가격 | $2.00 / 1M tokens |
| 캐시 입력 가격 | $0.20 / 1M tokens |
| 병렬 서브에이전트 | 최대 8개 |
| 접근 조건 | SuperGrok Heavy ($299/월, 프로모 $99/월) |
| SWE-Bench Verified | 70.8% ⚠️ xAI 자체 하네스 |
모델 히스토리 주의: 초기 발표 시 grok-code-fast-1이 언급됐으나, 5월 15일 deprecated 처리됐고 8월 15일 완전 retire 예정입니다. 현재 기준 모델은 grok-build-0.1입니다.
설치 및 초기 설정
설치 (단일 명령)
curl -fsSL https://x.ai/cli/install.sh | bash
⚠️ 프로덕션 머신에서는 파이프 실행 전 스크립트를 먼저 확인하세요. curl -fsSL https://x.ai/cli/install.sh -o install.sh && less install.sh
인증 방법 1: 브라우저 OAuth (인터랙티브 세션)
# 리포 디렉토리 안에서 실행
cd your-project
grok
# → 브라우저가 열리며 SuperGrok Heavy 계정으로 로그인
인증 방법 2: API 키 (헤드리스·CI 환경)
export GROK_CODE_XAI_API_KEY="xai-your-api-key-here"
grok -p "인증 모듈의 JWT 만료 처리 버그를 찾아 수정해줘."
config.toml 기본 설정
# ~/.grok/config.toml
[agent]
model = "grok-build-0.1"
max_subagents = 4 # 기본 4, 최대 8
worktree_isolation = true # 서브에이전트 Git worktree 격리
[plan]
auto_approve = false # Plan Mode 수동 승인 (권장)
show_diff = true
[mcp]
servers = [
{ name = "github", url = "http://localhost:3001" },
{ name = "postgres", url = "http://localhost:3002" }
]
핵심 기능 실전 사용
① Plan Mode — 실행 전 반드시 승인
Grok Build의 가장 중요한 안전장치입니다. 파일에 손대기 전에 반드시 계획을 먼저 보여주고 승인을 받습니다.
# 인터랙티브 Plan Mode (기본)
grok
> /plan "결제 모듈 전체를 Stripe v4 API로 마이그레이션해줘."
# Grok Build가 계획 제시:
# 1. stripe_client.ts 리팩토링
# 2. payment_service.ts 엔드포인트 업데이트
# 3. 테스트 파일 수정
# 4. 환경변수 마이그레이션 가이드 생성
#
# [A]pprove / [E]dit / [R]eject ?
계획을 수정하거나 거부할 수 있습니다. 승인 이후에는 변경된 모든 파일이 클린 diff로 표시됩니다.
② 병렬 서브에이전트 + Git worktree 격리
Grok Build의 구조적 차별점입니다. 대규모 작업을 받으면 전문화된 서브에이전트를 최대 8개까지 병렬로 생성하고, 각 에이전트가 독립된 Git worktree에서 작업합니다.
grok
> "전체 API 엔드포인트에 에러 핸들링을 추가하고,
동시에 기존 테스트 커버리지를 80% 이상으로 끌어올려줘."
# Grok Build 내부 동작:
# 오케스트레이터가 태스크를 분해 →
# 서브에이전트 A (worktree: feat/error-handling): API 엔드포인트 수정
# 서브에이전트 B (worktree: feat/test-coverage): 테스트 파일 작성
# 서브에이전트 C (worktree: feat/integration): 통합 테스트
# → 병렬 실행 후 오케스트레이터가 결과 머지
Claude Code와의 핵심 차이: Claude Code의 서브에이전트(Task 툴)는 동일한 워크스페이스에서 동작합니다. Grok Build 서브에이전트는 각자 격리된 worktree에서 작업하므로 충돌 없이 병렬 탐색이 가능합니다.
③ 헤드리스 모드 — CI/CD 통합
# -p 플래그: 인터랙티브 프롬프트 없이 실행
grok -p "PR #142의 변경사항을 분석하고 잠재적 버그를 리포트해줘." \
--output-format streaming-json
# GitHub Actions 예시
# .github/workflows/ai-review.yml
- name: Grok Build Code Review
env:
GROK_CODE_XAI_API_KEY: ${{ secrets.XAI_API_KEY }}
run: |
grok -p "이 PR의 보안 취약점을 분석하고 JSON으로 리포트해줘." \
--output-format streaming-json > review.json
streaming-json 출력 구조:
{
"type": "agent_result",
"files_modified": ["src/api/auth.ts", "tests/auth.test.ts"],
"commands_run": ["npm test", "npm run lint"],
"summary": "JWT 만료 처리 로직 수정 완료. 테스트 3개 추가.",
"issues_found": []
}
④ MCP 서버 연동
기존에 Claude Code에서 쓰던 MCP 서버 설정을 그대로 재사용할 수 있습니다.
# 기존 MCP 서버가 있다면 config.toml에 추가만 하면 됩니다
grok
> /mcp list # 연결된 MCP 서버 확인
> "Postgres DB 스키마를 분석해서 N+1 쿼리 문제를 찾아줘."
# → postgres MCP 서버를 통해 실제 DB 스키마 조회 후 분석
⑤ AGENTS.md 프로젝트 컨벤션
리포 루트에 AGENTS.md를 두면 Grok Build가 자동으로 읽어 프로젝트 컨벤션을 따릅니다.
<!-- AGENTS.md -->
# 프로젝트 컨벤션
## 코드 스타일
- TypeScript strict 모드 필수
- ESLint + Prettier 설정 준수
- 함수형 컴포넌트만 사용 (클래스 컴포넌트 금지)
## 테스트
- 모든 새 함수에 단위 테스트 필수
- Jest + Testing Library 사용
## 커밋 메시지
- Conventional Commits 형식 준수
- feat/fix/chore/docs 접두사 사용
구독 가격 — 혼동하기 쉬운 티어 구조
xAI 가격 페이지에서 연간 결제 토글을 켜면 "$300 USD/year"가 표시됩니다. Grok Build에 필요한 SuperGrok Heavy의 $300/월과 완전히 다릅니다. 커뮤니티에서 이 혼동으로 인한 계정 관련 문제가 보고됐습니다.
티어 가격 Grok Build
| X Premium | 별도 | ❌ |
| SuperGrok | ~$30/월 | ❌ |
| SuperGrok Heavy | $299/월 (프로모 $99/월 × 6개월) | ✅ |
API 직접 사용은 SuperGrok Heavy 없이도 가능합니다. grok-build-0.1 모델을 xAI API로 호출하면 $1.00/$2.00 per 1M tokens 요금제로 사용할 수 있습니다.
Claude Code vs Grok Build vs Codex CLI 비교
항목 Grok Build Claude Code Codex CLI
| 출시 상태 | 얼리 베타 | 안정 버전 | 안정 버전 |
| SWE-Bench | 70.8% ⚠️ | 79.6% (Sonnet 4.6) | — |
| 병렬 서브에이전트 | ✅ 8개, worktree 격리 | ⚠️ 공유 워크스페이스 | ❌ |
| Plan Mode | ✅ 내장 | ✅ (별도 설정) | ✅ |
| MCP 지원 | ✅ | ✅ | ✅ |
| AGENTS.md | ✅ | ✅ | ✅ |
| 헤드리스 CI | ✅ (-p 플래그) | ✅ | ✅ |
| ACP 지원 | ✅ | ❌ | ❌ |
| 커뮤니티·생태계 | 🔴 초기 단계 | 🟢 풍부 | 🟡 성장 중 |
| 접근 조건 | SuperGrok Heavy | 유료 플랜 | OpenAI 유료 |
주의해야 할 세 가지
① 얼리 베타의 한계를 현실적으로 봐야 합니다
xAI 공식 문서에서 직접 인정한 내용입니다. 일부 명령이 아직 작동하지 않고, 헤드리스 모드와 ACP 관련 문서가 불완전합니다. 프로덕션 크리티컬 워크플로에 바로 투입하기보다는 실험적 사용과 병렬 운영이 현실적입니다.
② SWE-Bench 70.8%는 자체 하네스 수치입니다
Claude Code(Sonnet 4.6 기반) 79.6%, GPT-5.5 88.7% 대비 약 10~18pt 낮습니다. 이 수치 자체도 xAI 내부 하네스로 측정된 것이라 독립 검증이 없습니다. 복잡한 코드 수정 태스크에서는 실제 품질 차이가 느껴질 수 있습니다.
③ SuperGrok Heavy $99 프로모 조건 확인
6개월 이후 $299/월로 자동 전환됩니다. 구독 전 xAI 콘솔에서 현재 프로모 조건과 자동 갱신 정책을 반드시 확인하세요.
✅ 결론
항목 평가
| 병렬 서브에이전트 아키텍처 | ✅ worktree 격리로 경쟁사 대비 구조적 우위 |
| Plan Mode UX | ✅ 깔끔한 승인 플로우 |
| MCP·AGENTS.md 호환성 | ✅ Claude Code 설정 재사용 가능 |
| ACP 오케스트레이션 지원 | ✅ 에이전트 인프라로 활용 가능 |
| 코딩 품질 (SWE-Bench) | ❌ Claude Code·Codex 대비 10~18pt 낮음 |
| 생태계·문서·커뮤니티 | ❌ 아직 초기 단계 |
| 가격 접근성 | ❌ SuperGrok Heavy 전용, 가격 혼동 위험 |
| 안정성 | ⚠️ 얼리 베타, 일부 기능 미완성 |
Grok Build는 병렬 서브에이전트 + Git worktree 격리라는 명확한 차별점을 갖춘 도구입니다. 대규모 리팩토링이나 멀티 스트림 탐색 작업에서는 이 아키텍처가 실질적인 이점을 줄 수 있습니다. 다만 지금 시점은 얼리 베타입니다. SuperGrok Heavy를 이미 구독 중이거나 병렬 에이전트 실험에 관심이 있다면 시도해볼 만하고, 그렇지 않다면 안정화 이후가 합리적인 진입 시점입니다.
'AI 개발' 카테고리의 다른 글
| WebMCP 2편: Declarative·Imperative API 직접 구현해보기 (0) | 2026.05.26 |
|---|---|
| 브라우저가 에이전트를 위한 API 레이어가 된다 — WebMCP 1편: 표준의 탄생 (0) | 2026.05.26 |
| Antigravity SDK 심화편—Managed Agents API·GCP 엔터프라이즈 연동·CI/CD 파이프라인 실전 구축: Antigravity 2.0 (0) | 2026.05.23 |
| K8s AI 워크로드 4편—프로덕션 관찰가능성·카나리 배포·비용 최적화, 운영에서 살아남는 법 (0) | 2026.05.23 |
| K8s AI 워크로드 3편—KEDA 스케일링과 멀티테넌시, HPA가 LLM에 왜 안 되는지부터 (0) | 2026.05.23 |