본문 바로가기

GPT

Codex Mobile 3편: vs Claude Code Remote Control — 비동기 에이전트 제어 도구 완전 비교

반응형

시리즈 1·2편으로 Codex Mobile을 완전히 익혔다면 자연스럽게 이 질문이 온다. "Claude Code도 폰으로 제어할 수 있다던데, 뭐가 다른 거야?" 결론부터 말하면 둘은 같은 카테고리처럼 보이지만 설계 철학이 완전히 다르다. 선택이 틀리면 매주 생산성이 눈에 띄게 달라진다.


핵심 요약

→ Anthropic는 2026년 2월에 Claude Code Remote Control을 출시 — Codex Mobile보다 4개월 앞서 모바일 에이전트 제어 기능을 먼저 선보임
→ 가장 핵심적인 차이 한 줄: Claude Code는 로컬 실행, Codex는 클라우드 샌드박스 실행 — 이 차이가 나머지 모든 차이를 만든다
→ Codex Mobile은 주기적으로 체크인하는 위임형 태스크에 강하고, Claude Code Remote Control은 여러 병렬 세션을 능동적으로 조종하는 워크플로우에 강하다
→ 벤치마크: SWE-bench Verified는 GPT-5.5(88.7%) > Opus 4.7(87.6%), SWE-bench Pro는 Opus 4.7(64.3%) > GPT-5.5(58.6%) — 실제 프로덕션 코드베이스에선 Claude Code 우세
→ Hooks 세분화: Claude Code는 PreToolUse·PostToolUse·PreCompact 등 이벤트별 세밀한 제어, Codex는 라이프사이클 단위 제어
→ 2026년 많은 팀이 둘 다 쓴다 — Claude Code로 인터랙티브 세션·디버깅, Codex로 배치 피처 작업·테스트 생성
→ 보안: Codex는 OS 커널 레벨 샌드박스(Seatbelt/Landlock/seccomp), Claude Code는 애플리케이션 레벨 26개 Hooks 이벤트 — 강한 경계 vs 세밀한 제어의 트레이드오프


1. 아키텍처 — 이 차이가 전부다

# 실행 환경 비교

Codex (+ Codex Mobile)
├── 실행: OpenAI 클라우드 격리 샌드박스
├── 파일 접근: 샌드박스 내 복사본 (로컬 파일시스템 직접 접근 없음)
├── 폰 역할: 클라우드 태스크 승인·모니터링
└── 비유: 원격 직원에게 일 맡기고 결과 보고받기

Claude Code (+ Remote Control)
├── 실행: 내 Mac/서버 (로컬 프로세스)
├── 파일 접근: 실제 파일시스템 직접 읽기·쓰기
├── 폰 역할: 로컬에서 돌아가는 세션 원격 조종
└── 비유: 내 책상에 앉은 페어 프로그래머를 폰으로 지시

이 차이가 나머지를 결정한다.

# 파일 보안 관점

Codex
→ 코드가 OpenAI 서버로 전송됨
→ 샌드박스로 격리 — 로컬 자격증명·DB·외부 서비스 직접 접근 불가
→ 장점: 실수로 프로덕션 건드릴 위험 없음
→ 단점: 로컬 환경 의존 태스크(docker, DB 마이그레이션)는 별도 설정 필요

Claude Code Remote Control
→ 코드가 로컬에 있음 — Anthropic 서버로는 대화 내용만 전송
→ 실제 로컬 파일·Docker·DB·환경변수 직접 접근
→ 장점: 로컬 환경 그대로 활용, 보안 민감 코드도 로컬 처리
→ 단점: 에이전트 실수가 실제 파일에 즉시 반영

2. 모바일 기능 상세 비교

항목 Codex Mobile Claude Code Remote Control

출시 시점 2026년 5월 14일 2026년 2월 (4개월 앞서)
접근 방법 ChatGPT 앱 내 Codex 탭 Claude.ai 모바일 또는 전용 앱
실행 위치 OpenAI 클라우드 내 로컬 머신
세션 지속 클라우드에서 상시 로컬 프로세스 살아있어야 함
새 태스크 시작 ✅ 폰에서 바로 ✅ 폰에서 바로
병렬 세션 관리 ✅ 멀티 스레드 ✅ Agent Teams와 연동
로컬 파일 접근 ❌ (샌드박스만) ✅ 직접
폰 잠금 상태 실행 ✅ (클라우드) ✅ (Locked Computer Use)
Windows 호스트 ⏳ 출시 예정 ✅ 지원
무료 플랜

3. Goal Mode 비교 — /goal 동작 방식의 차이

Goal Mode는 Codex CLI를 터미널 기반 코딩 에이전트 중 최초로 목표 수준 자율성을 가진 도구로 만들었다 — AutoGPT의 원래 비전에 가깝지만 적절한 샌드박스·토큰 예산·거버넌스 가드레일을 갖춤.

# /goal 명령어 동작 비교

Codex /goal
├── 목표를 클라우드 샌드박스에서 자율 실행
├── 세션 종료 후에도 목표 상태 유지 (클라우드 퍼시스턴스)
├── 토큰 예산 설정으로 비용 폭주 방지
└── 폰으로 중간 체크인, 승인, 재방향 지시

Claude Code /goal (2026년 5월 12일 v2.1.139 추가)
├── 완료 조건 설정 → 조건 달성까지 멀티턴 자율 실행
├── 로컬에서 실행 — 실제 파일·DB·도커 직접 조작
├── interactive 모드, -p 플래그, Remote Control 모두 지원
└── 세션 간 퍼시스턴스는 아직 Codex 대비 약함

# 핵심 차이
Codex: "클라우드에서 목표 달성까지 알아서 해, 결과 보고해줘"
Claude Code: "내 로컬에서 내 파일·환경으로 목표 달성까지 해줘"

4. Hooks 세분화 비교

# Hooks 이벤트 비교

Claude Code Hooks (더 세밀)        Codex Hooks (라이프사이클 단위)
──────────────────────             ──────────────────────────────
PreToolUse                         PreToolUse
PostToolUse                        PostToolUse
PreCompact      ← Codex 없음       (없음)
UserPromptSubmit← Codex 없음       (없음)
UserPromptExpansion                (없음)
SessionStart                       SessionStart
SessionStop                        SessionStop
Notification                       Notification
Setup           ← Codex 없음

# 실전 의미
Claude Code: 도구 호출 전/후 + 컨텍스트 압축 전 개입 가능
             → 세밀한 거버넌스, 규제 환경에 유리

Codex: 라이프사이클 주요 지점에서 개입
        → 단순하고 설정하기 쉬움
# Claude Code에만 있는 PreCompact Hook 활용 예시
# 컨텍스트 압축 전 중요 정보 보존

# ~/.claude/hooks/pre-compact.sh
#!/bin/bash
# 컨텍스트 압축 직전 현재 상태 스냅샷 저장

TIMESTAMP=$(date +%Y%m%d_%H%M%S)
mkdir -p ~/.claude/snapshots

# 현재 작업 중인 파일 목록 보존
echo "$1" > ~/.claude/snapshots/context_$TIMESTAMP.txt

echo "컨텍스트 스냅샷 저장됨: context_$TIMESTAMP.txt"
exit 0

5. 벤치마크 — 어느 모델이 더 잘 짜나

# 2026년 5월 기준 코딩 벤치마크

SWE-bench Verified (단일 이슈 해결 — 표준 벤치)
GPT-5.5 (Codex)    88.7% ← 1위
Opus 4.7 (Claude)  87.6% ← 2위 (1.1%p 차이)

SWE-bench Pro (멀티 언어·대형 리포 — 실전 프로덕션)
Opus 4.7 (Claude)  64.3% ← 1위
GPT-5.5 (Codex)    58.6% ← 2위 (5.7%p 차이)

Terminal-Bench 2.0 (터미널 기반 에이전트 작업)
Qwen 3.7 Max       69.7%
GPT-5.5            67.2%
Opus 4.7           65.8%

# 해석
→ 표준 단일 이슈: Codex(GPT-5.5) 약간 우세
→ 실제 프로덕션 코드베이스 멀티파일 작업: Claude Code 명확히 우세
→ 긴 리팩토링, 레거시 코드 분석: Claude Code가 더 적합

6. 요금 비교

# 2026년 5월 기준 요금

Codex Mobile 사용 가능 플랜
├── Free: 제한적 사용 가능 (미리보기 기간 중)
├── Go: $8/월
├── Plus: $20/월
└── Pro: $100/월 (GPT-5.5 Pro, 5× Plus 사용량)

Claude Code Remote Control 사용 가능 플랜
├── Pro: $20/월 (Claude Code 기본 포함)
├── Max 5×: $100/월
├── Max 20×: $200/월
└── ⚠️ 2026년 6월 15일부터 -p 플래그·Agent SDK 사용은
         별도 Agent SDK 크레딧 풀로 분리 과금

# 같은 $20/월 기준 비교
ChatGPT Plus: Codex + 더 많은 세션
Claude Pro: Claude Code + Max/Opus 4.7 접근
→ 요금은 비슷, 워크플로우에 맞게 선택

7. 상황별 선택 가이드

# Codex Mobile이 맞는 경우

✅ 태스크를 위임하고 결과만 받고 싶다
   "이슈 234 고쳐줘" → 나중에 결과 확인
✅ 여러 독립적인 태스크를 동시에 돌리고 싶다
   (각 태스크가 서로 다른 리포에서 격리 실행)
✅ ChatGPT 생태계 이미 사용 중
   (GitHub PR 생성, Slack 연동 네이티브)
✅ 프로덕션 환경을 건드릴 위험을 최소화하고 싶다
   (샌드박스 격리)
✅ 명확한 스펙과 완료 조건이 있는 태스크

# Claude Code Remote Control이 맞는 경우

✅ 에이전트를 실시간으로 방향 조정하며 작업하고 싶다
   ("이 방식 아니야, 저쪽으로 바꿔줘" 가 잦은 경우)
✅ 로컬 Docker, DB, 환경변수가 태스크에 필요하다
✅ 실제 파일시스템에 즉시 반영돼야 한다
✅ 데이터 보안 민감 환경 (코드가 외부 서버에 올라가면 안 됨)
✅ 복잡한 레거시 코드베이스 리팩토링 (SWE-bench Pro 우세)
✅ Hooks로 세밀한 거버넌스가 필요한 규제 환경

# 둘 다 쓰는 경우 (2026년 많은 팀의 실제 선택)
Codex: 배치 피처 구현, 테스트 코드 생성, 독립 이슈 병렬 처리
Claude Code: 아키텍처 탐색, 디버깅, 레거시 리팩토링, 인터랙티브 세션

8. 실전 조합 워크플로우

# 하이브리드 워크플로우 예시

오전 출근길 (폰에서)
├── Claude Code Remote Control
│   → 어제 밤 돌린 리팩토링 세션 결과 확인
│   → "이 부분 다시 짜줘, 패턴이 틀렸어" 지시
│
└── Codex Mobile
    → 3개 이슈 병렬 처리 중 상태 확인
    → 이슈 #241 커맨드 승인

오후 (Mac에서)
├── Claude Code: 복잡한 인증 모듈 리팩토링 (로컬 DB 필요)
└── Codex: 단순 CRUD 엔드포인트 5개 생성 (격리 태스크)

퇴근 전 (폰에서)
├── Codex /goal: "남은 3개 이슈 처리해줘" 설정 후 퇴근
└── 다음날 아침 알림 수신

✅ 결론

Codex Mobile — 위임·위임·위임. 잘 정의된 태스크를 맡기고 결과 받기
Claude Code Remote Control — 함께 일하기. 로컬 환경에서 실시간 방향 조정
둘 다 — 2026년 프로덕션 팀의 현실적인 선택, 태스크 성격에 따라 분배

❌ "어느 게 더 나은가"는 잘못된 질문 — 워크플로우 스타일의 차이
❌ 보안 민감 코드 + Codex = 코드가 OpenAI 서버에 올라감, 확인 필요
❌ 로컬 환경 의존 태스크 + Codex만 = 샌드박스 제한으로 막힐 수 있음


관련 글

 

 

반응형