본문 바로가기

Gemini

(24)

Gemini 3.5 Flash Thought Preservation 완전분석 — 멀티턴 추론이 자동으로 이어지는 것, 비용은 어떻게 올라가나 Thought Preservation은 Gemini 3.5 Flash 출시와 함께 기본값으로 켜졌습니다. API 설정 변경도 없고, 공지도 조용했습니다. 그리고 수많은 팀의 청구서가 예상보다 50~80% 높아졌습니다.핵심 요약 → Thought Preservation: 이전 턴의 추론 토큰(Thought Tokens)을 다음 턴 입력에 자동 포함 → Gemini 3.5 Flash 출시와 함께 기본값 ON — API 변경 없이 자동 적용 → 효과: 멀티턴 에이전트 루프에서 맥락 일관성·품질 향상 → 비용: 10턴 에이전트 루프 입력 토큰 50~80% 증가 → Antigravity 쿼터 사태의 숨겨진 주범 — 단가 3배 × 토큰 소비 증가 = 5.6배 청구서 → GenerateContent API: thou..

Gemini Omni vs Veo 3.1 — Google이 비디오 모델을 두 개 운영하는 이유 I/O 2026에서 Gemini Omni Flash가 발표된 직후 가장 많이 나온 질문이 하나 있습니다. "그러면 Veo 3.1은 이제 버려지는 건가요?" 정답은 아닙니다. 두 모델은 같은 회사에서 나왔지만 완전히 다른 문제를 풀고 있습니다.핵심 요약 → Gemini Omni Flash: 2026.05.19 출시, 텍스트·이미지·오디오·비디오 멀티모달 입력 → 영상 출력 → Veo 3.1: 2025.10.15 출시, 텍스트·이미지 입력 → 네이티브 오디오 동기화 8초 영상 → Omni 강점: 대화형 편집, 멀티모달 입력, 4초~10초 가변 클립 → Veo 강점: 오디오 립싱크 정확도, 씬 익스텐션(최대 148초), GA API 안정성 → Gemini 앱 기본값: Omni Flash로 교체 (소비자) → ..

Gemini 3.5 Flash + Interactions API로 MCP 에이전트 만들기 — 완전 실전 가이드 지난 편에서 Interactions API의 구조와 브레이킹 체인지를 다뤘습니다. 이번 편은 코드만 남습니다. MCP 서버를 Flash에 연결하고, 멀티툴 체인을 구성하고, 에이전트 루프를 프로덕션에서 돌리는 전 과정입니다.핵심 요약 → 이전 편 복습: Interactions API = 서버사이드 히스토리, previous_interaction_id 패턴 → 이번 편: MCP 서버 연결 → 멀티툴 체인 → 에이전트 루프 → 비용 최적화 → 에러 핸들링 → Gemini SDK의 MCP 통합: ClientSession을 tools= 파라미터에 전달하면 자동 루프 실행 → Flash MCP Atlas 83.6% = 6번에 1번은 도구 호출 실패 — 재시도 로직 필수 → thinking_level: Low가 에..

Gemini Interactions API 완전분석 — OpenAI Responses API의 대항마, 서버사이드 히스토리 관리의 실체 Gemini API에 조용히 새로운 표준이 생겼습니다. generateContent는 이제 구식입니다. Google은 모든 새 프로젝트에 Interactions API를 권장하고, 6월 8일엔 기존 스키마를 완전 제거합니다. 핵심 요약 → Interactions API: Gemini 3.5 Flash와 함께 베타 출시, 모든 신규 프로젝트 기본 권장 → 핵심 기능: previous_interaction_id — 대화 히스토리를 클라이언트가 아닌 Google 서버가 관리 → OpenAI Responses API의 서버사이드 히스토리 패턴과 동일한 개념 → 브레이킹 체인지: outputs 배열 → steps 배열 (5월 26일 기본값, 6월 8일 레거시 완전 제거) → 상태 저장: 유료 플랜 55일, 무료 ..

Gemini 3.5 Flash 출시 9일 — 실제 사용자들은 뭐라고 했나 벤치마크는 완벽했습니다. 현실은 달랐습니다. 출시 9일 동안 무슨 일이 있었는지 실제 반응만 모았습니다.핵심 요약 → 2026년 5월 19일 GA 출시, 출시 직후 Antigravity 유료 사용자들의 쿼터가 1시간 내 소진 → Reddit 실측: 동일 벤치마크 실행 비용 $278(3 Flash) → $1,552(3.5 Flash) — 5.6배 → 원인: thinking 기본값 high로 출시 + 에이전트 루프가 생각보다 훨씬 많은 토큰 소비 → Google 대응: 쿼터 9배 증가 → default thinking high → medium 변경 → Flash Low 신규 출시 → 무료 티어 사용자: "즉시 갈아타라" 압도적 긍정 → API 개발자: "thinking_level 기본값 변경 + 브레이킹 체..

Gemini 3.5 Flash 가격 3배 인상의 전략적 의미 — Google이 Flash를 프리미엄으로 올린 이유 Gemini 3.5 Flash는 $0.50에서 $1.50으로 올랐습니다. 단순한 가격 인상이 아닙니다. Google이 AI 수익 구조 전체를 다시 설계하는 신호입니다.핵심 요약 → Gemini 3 Flash Preview $0.50/$3 → Gemini 3.5 Flash $1.50/$9 — 입출력 모두 정확히 3배 → Flash-Lite 기준으로 보면 6배 인상 ($0.25/$1.50 → $1.50/$9) → 단, 실제 성능 기준 태스크당 비용은 Gemini 3.1 Pro 대비 ~25% 저렴 → Artificial Analysis: 벤치마크 전체 실행 비용은 이전 Flash 대비 5.5배 증가 → 업계 동시 인상: GPT-5.5(2배), Claude Opus 4.7(1.46배) — 3대 랩이 동시에 가격..

텍스트·이미지·오디오로 영상을 만든다 — Gemini Omni 완전 분석 "프롬프트 하나로 영상을 뽑고, 대화하듯 수정한다." Google이 I/O 2026에서 공개한 Gemini Omni는 AI 영상 생성의 패러다임을 바꿨다. Veo 시리즈가 "생성 전문 모델"이었다면, Omni는 텍스트·이미지·오디오·기존 영상을 모두 입력으로 받아 영상을 출력하는 "멀티모달 통합 모델"이다. Seedance 2.0, Kling 3.0, Sora 2와 어떻게 다른지 구조부터 실전 활용까지 전부 정리했다.핵심 요약→ Gemini Omni는 텍스트·이미지·오디오·기존 영상을 입력받아 물리 법칙을 반영한 영상을 출력하는 Google DeepMind의 새 멀티모달 모델 패밀리 — 5월 19일 I/O 2026에서 공개, 첫 번째 모델 Omni Flash 즉시 출시→ Veo를 Gemini 앱 내에서 ..

Flash가 Pro를 이겼다는 게 정말 맞나 — 벤치마크 신뢰성 5가지 논점 "Flash 티어 모델이 Pro 티어를 벤치마크에서 이겼다." Google I/O 2026에서 나온 이 주장이 개발자 커뮤니티를 달궜습니다. Gemini 3.5 Flash가 Terminal-Bench 2.1에서 Gemini 3.1 Pro를 5.9pt 앞섰고, MCP Atlas에서 Claude Opus 4.7마저 4.5pt 차로 넘어섰다는 수치들. 그런데 그 숫자들이 어떻게 측정됐는지 들여다보면 이야기가 달라집니다. SWE-bench Verified는 이미 오염 선언이 났고, 벤치마크 측정에 쓴 thinking level은 프로덕션 기본값이 아닙니다. 벤더가 자체 설계한 하네스로 측정한 수치도 섞여 있습니다. 무엇을 믿고 무엇을 의심해야 하는지, 다섯 가지 논점으로 정리했습니다.이 포스트 한 줄 요약 → ..

이전 1 2 3 다음

티스토리툴바