본문 바로가기

Gemini

Google Antigravity 완전 가이드 3편 — 브라우저 서브에이전트, 2M 토큰 인덱싱, Google Cloud 직접 배포

반응형

다른 IDE는 코드 짜고 끝입니다. Antigravity는 에이전트가 직접 앱을 실행하고, 클릭하고, 영상으로 검증합니다. 3편은 Cursor·Claude Code에 없는 Antigravity만의 기능 세 가지를 다룹니다.

[3편 핵심 요약]
→ 브라우저 서브에이전트: 메인 에이전트와 별도 모델 — 직접 클릭·스크롤·폼 입력
→ 서브에이전트 도구: DOM 캡처, 스크린샷, 영상 녹화, 콘솔 로그 읽기
→ 브라우저 확장 프로그램 설치 필요 (Chrome 전용)
→ 서브에이전트 실행 중 파란 테두리 오버레이 표시 — 사용자 조작 차단
→ 2M 토큰 컨텍스트: Cursor(200K) 대비 10배 — 전체 코드베이스 인덱싱
→ Progressive Disclosure: 코드베이스 전체 로드 대신 필요한 부분만 로드
→ .gemini/antigravity/brain/: 세션 간 아키텍처 결정 자동 저장
→ Google Cloud 배포: GCS·Cloud Run·BigQuery·Pub/Sub 직접 연동

브라우저 서브에이전트 — 에이전트가 직접 앱을 테스트한다

Antigravity의 가장 독특한 기능입니다. 에이전트가 UI 기능을 구현하면, 별도의 브라우저 서브에이전트가 자동으로 앱을 열고 직접 클릭해서 검증합니다.

[메인 에이전트 vs 브라우저 서브에이전트]

메인 에이전트:
→ 사용자가 선택한 모델 (Gemini Pro, Claude 등)
→ 코드 작성, 파일 수정, 계획 수립

브라우저 서브에이전트:
→ 별도의 브라우저 특화 모델 (자동 선택)
→ 메인 에이전트가 필요 시 자동 호출
→ Chrome 전용 확장 프로그램으로 동작
→ 메인 에이전트와 독립적으로 실행

브라우저 서브에이전트가 할 수 있는 것

[브라우저 서브에이전트 도구 목록]

페이지 조작:
→ 클릭 (버튼, 링크, 체크박스)
→ 스크롤 (페이지, 특정 엘리먼트)
→ 타이핑 (폼 입력, 검색)
→ 드래그 앤 드롭

페이지 읽기:
→ DOM 캡처 — 전체 HTML 구조 분석
→ 스크린샷 — 현재 UI 상태 이미지
→ 마크다운 파싱 — 텍스트 컨텐츠 추출
→ 콘솔 로그 읽기 — JS 에러, 네트워크 요청

영상 기록:
→ 전체 인터랙션 세션 영상 녹화
→ 동적 상태 변화 캡처 (로딩 스피너, 애니메이션)
→ Before/After 스크린샷 자동 생성

브라우저 서브에이전트 설치 및 실행

[최초 설정 — Chrome 확장 프로그램 설치]

1. Agent Manager에서 새 대화 시작
2. 프롬프트 입력: "antigravity.google 에 가줘"
3. 에이전트가 브라우저 확장 프로그램 설치 안내
4. Chrome 확장 프로그램 설치
5. 이후 모든 브라우저 작업 자동화 가능

주의:
→ 서브에이전트 실행 중 파란 테두리 오버레이 표시
→ 오버레이 상태에서 해당 탭 조작 불가
→ 다른 탭은 자유롭게 사용 가능 (서브에이전트가 비포커스 탭도 조작 가능)

실전 — 로그인 플로우 자동 검증

[프롬프트]
"로그인 기능 구현하고 직접 테스트해줘.
 이메일/비밀번호 입력 → 로그인 → 대시보드 이동 확인"

[Antigravity 실행 흐름]

1. 메인 에이전트: 로그인 코드 구현
2. 메인 에이전트: 앱 서버 실행 (터미널)
   $ npm run dev → localhost:3000

3. 브라우저 서브에이전트 자동 호출:
   → localhost:3000 접속
   → 이메일 입력: "test@example.com"
   → 비밀번호 입력: "password123"
   → 로그인 버튼 클릭
   → 스피너 대기
   → 대시보드 URL 확인 (/dashboard)
   → 콘솔 에러 없음 확인

4. Browser Recording Artifact 생성:
   → 전체 플로우 영상 (10~30초)
   → Before: 로그인 페이지 스크린샷
   → After: 대시보드 스크린샷
   → 콘솔 로그 요약

5. 사용자는 영상만 확인하면 됨
   → "직접 실행해서 확인해봐" 필요 없음
[브라우저 서브에이전트 보안 설정]

JS 실행 정책 (1편에서 설정):
→ 비활성화: 보안 민감 환경 (금융, 의료)
→ 검토 요청: 일반 권장 — JS 실행 전 승인
→ 항상 실행: 최대 자율성, 보안 위험 높음

주의 사항:
→ 서브에이전트가 실제 Chrome 제어 — 실수로 폼 제출 가능
→ 프로덕션 URL 대신 localhost 환경에서만 사용 권장
→ 민감한 데이터(실제 카드 번호 등) 폼에 입력하지 말 것

2M 토큰 코드베이스 인덱싱 — 전체 코드베이스를 한 번에

[컨텍스트 윈도우 비교]
Cursor:        ~200K 토큰
Claude Code:   ~200K 토큰
Antigravity:   2,000K 토큰 (Gemini 3.1 Pro 기준)

→ 10배 차이
→ 중간 규모 전체 코드베이스를 인덱싱 가능
→ 파일 간 의존성, 네이밍 컨벤션, 아키텍처 패턴 전체 파악

Progressive Disclosure — 스마트 로딩 방식

2M 토큰이라도 모든 파일을 한 번에 로드하면 비효율적입니다. Antigravity는 Progressive Disclosure 방식으로 필요한 부분만 로드합니다.

[Progressive Disclosure 동작 방식]

일반 IDE:
→ 열린 파일만 컨텍스트에 포함
→ 다른 파일 참조 필요 시 수동으로 열어야 함

Antigravity Progressive Disclosure:
→ 프로젝트 구조 먼저 스캔 (파일명, 디렉토리)
→ 태스크 관련 파일 자동 식별
→ 의존성 그래프 추적해서 연관 파일 자동 포함
→ Skills 프레임워크로 도메인 지식 모듈화 (4편에서 상세)
→ 필요 시에만 전체 파일 로드

실제 효과:
→ "auth 모듈 리팩토링해줘" 입력 시:
   1. 파일 구조 스캔
   2. auth/ 관련 파일 자동 식별
   3. auth와 의존 관계 있는 파일 추가 로드
   4. 전체 코드베이스 컨텍스트 기반으로 일관된 패턴 적용

.gemini/antigravity/brain/ — 세션 간 기억

[brain/ 디렉토리 구조]
.gemini/
└── antigravity/
    └── brain/
        ├── architecture.md      # 아키텍처 결정 기록
        ├── conventions.md       # 코딩 컨벤션
        ├── decisions/           # 주요 기술 결정
        │   ├── 2026-05-auth.md  # JWT 방식 선택 이유
        │   └── 2026-05-db.md    # PostgreSQL 선택 이유
        └── knowledge-items/     # KI: 세션별 학습 내용
            ├── ki-001/
            │   ├── metadata.json
            │   └── artifacts/
            └── ki-002/
[Knowledge Items (KI) 자동 생성]

세션 종료 시:
→ Knowledge Subagent가 대화 내용 분석
→ 핵심 정보 KI로 추출·저장

다음 세션 시작 시:
→ KI 요약 자동 로드
→ "지난번에 JWT refresh token 방식으로 변경했음" 자동 인식
→ 중복 분석 없이 바로 이어서 작업

팀 협업 시:
→ brain/ 디렉토리 git 커밋
→ 새 팀원이 프로젝트 컨텍스트 즉시 습득
→ "왜 이렇게 설계했지?" → brain/decisions/ 확인

Google Cloud 직접 배포 — 에이전트가 인프라까지

Antigravity의 Google Cloud 통합은 코드 작성부터 배포까지 한 번에 처리합니다.

실전 — 서버리스 파이프라인 배포

Google Codelabs 공식 예제 기반입니다.

[배포 전 준비]
→ Google Cloud 프로젝트 (빌링 활성화)
→ gcloud CLI 설치 및 로그인
→ Agent Manager에서 Review Policy: "Asks for Review" 설정
→ Terminal: "Request Review" 설정 (배포 전 확인용)
→ 모델: Gemini Pro (High) 권장
[Agent Manager 프롬프트]

"GCS에 파일 업로드되면 자동으로 처리하는
 서버리스 파이프라인 만들어줘.

 구조:
 - GCS 버킷에 파일 업로드
 - Pub/Sub 이벤트 트리거
 - Cloud Run으로 Gemini API 호출해서 처리
 - 결과를 BigQuery에 저장

 내 GCP 프로젝트 ID: my-project-123
 리전: asia-northeast3 (서울)
 Python/Flask 기반으로 만들어줘."

에이전트가 자동으로 생성하는 것들:

[Task List Artifact]
□ GCS 버킷 생성 (gs://my-project-123-docs)
□ Pub/Sub 토픽 생성 (doc-processing-topic)
□ BigQuery 데이터셋 생성 (documents)
□ Python/Flask Cloud Run 앱 구현
□ Dockerfile 작성
□ GCS → Pub/Sub 알림 설정
□ Cloud Run 배포
□ 엔드투엔드 테스트

[Implementation Plan Artifact]
인프라:
  - GCS 버킷: asia-northeast3, Uniform ACL
  - Pub/Sub: doc-processing-topic, 7일 보존
  - BigQuery: documents.processed_files 테이블
    (id, filename, content, gemini_summary, created_at)

앱:
  - Flask + Gemini API (vertexai 패키지)
  - requirements.txt, Dockerfile
  - Cloud Run: 최소 1 인스턴스, 512MB

→ 인라인 코멘트로 수정 요청 가능
→ "리전 asia-northeast1으로 바꿔줘" 코멘트 → 에이전트 반영

에이전트가 실제로 실행하는 배포 명령들:

# 에이전트가 터미널에서 실행 (검토 후 승인)

# 인프라 생성
gcloud storage buckets create gs://my-project-123-docs \
  --location=asia-northeast3

gcloud pubsub topics create doc-processing-topic

bq mk --dataset my-project-123:documents

# Cloud Run 배포
gcloud run deploy doc-processor \
  --source . \
  --region asia-northeast3 \
  --platform managed \
  --allow-unauthenticated

# GCS → Pub/Sub 연결
gcloud storage buckets notifications create \
  gs://my-project-123-docs \
  --topic=doc-processing-topic \
  --event-types=OBJECT_FINALIZE
[Walkthrough Artifact — 배포 후 검증]

에이전트가 자동 생성:
→ GCS에 테스트 파일 업로드
→ Pub/Sub 메시지 발행 확인
→ Cloud Run 로그에서 처리 확인
→ BigQuery에 결과 저장 확인
→ 전체 흐름 스크린샷 + 요약

개발자가 확인하는 것:
→ Walkthrough Artifact 읽기
→ BigQuery 결과 쿼리 한 번 확인
→ 완료
[Antigravity + Google Cloud 통합 범위]
지원:
→ Cloud Run (서버리스 컨테이너)
→ Cloud Functions (FaaS)
→ GCS (스토리지)
→ Pub/Sub (메시징)
→ BigQuery (데이터웨어하우스)
→ Firebase (앱 백엔드)
→ Vertex AI (Gemini API)
→ Cloud SQL (PostgreSQL, MySQL)

아직 제한:
→ GKE (Kubernetes) — 복잡도 높음
→ 프로덕션 배포 — 내부 정책상 제한 (2026년 초 기준)
→ 멀티 클라우드 — GCP 전용

마무리

✅ 3편 기능이 빛나는 경우
→ UI 구현하고 직접 실행 테스트가 귀찮을 때 (브라우저 서브에이전트)
→ 대형 레거시 코드베이스 전체 파악이 필요할 때 (2M 토큰)
→ 오래된 프로젝트인데 "왜 이렇게 했지?" 맥락 잃었을 때 (brain/)
→ GCP 스택 쓰는 팀의 서버리스 배포 자동화 (Google Cloud 통합)

❌ 주의해야 하는 경우
→ 브라우저 서브에이전트: 프로덕션 URL에서 실행 금지
→ 2M 토큰: Gemini 3.1 Pro 필요 — Flash에서는 제한됨
→ Google Cloud 배포: 아직 프로덕션 환경 공식 지원 전
→ brain/: git에 커밋 시 민감한 아키텍처 정보 노출 주의

관련 글

 

반응형