본문 바로가기

AI Development

(55)

Veo 3.1 Lite 완전 가이드 — Gemini API로 AI 영상 생성 OpenAI가 Sora를 종료한 2026년. 구글 Veo가 AI 영상 생성 시장을 사실상 독점하고 있습니다. 그 중 가장 저렴한 Veo 3.1 Lite를 실전 코드로 정리했습니다.[핵심 요약]→ 출시: 2026년 3월 31일 (Gemini API + Google AI Studio)→ 모델 ID: veo-3.1-lite-generate-preview→ 가격: Veo 3.1 Fast 대비 50% 이하 — 가장 저렴한 Veo 티어→ 입력: 텍스트 프롬프트 + 이미지 (JPEG, PNG)→ 출력: 영상 + 네이티브 오디오 (별도 합성 불필요)→ 해상도: 720p, 1080p (4K 미지원 — Pro 티어만 가능)→ 비율: 16:9 (가로), 9:16 (세로 — Shorts/Reels/TikTok)→ 길이: 최대..

Gemini 3.1 Flash TTS 완전 가이드 — 자연어로 AI 목소리를 연출하는 법 "긴장감 있게 읽어줘", "여기서 잠깐 멈춰", "속삭이듯이". 이제 이 말 한 마디로 AI 목소리를 연출할 수 있습니다.[핵심 요약]→ 출시: 2026년 4월 15일 (Google, 프리뷰)→ 핵심: SSML 없이 자연어로 음성 스타일 제어→ 오디오 태그: 200개+ ([excitement], [whispers], [slow] 등)→ 멀티 스피커: 단일 API 호출로 여러 화자 동시 생성→ 언어: 70개+ 지원→ 벤치마크: Artificial Analysis TTS Elo 1,211 — 공개 TTS 최고점→ 가격: 입력 $1/1M 토큰, 출력 $20/1M 토큰 / AI Studio 무료 체험 가능→ 모델 ID: gemini-3.1-flash-tts-preview기존 TTS와 뭐가 다른가TTS는 오랫동안..

Gemini Enterprise Agent Platform 완전 분석 — Vertex AI가 에이전트 플랫폼으로 진화한 이유 Google이 Vertex AI를 접었습니다. 대신 에이전트 시대를 위한 새로운 플랫폼을 들고 나왔습니다.[핵심 요약]→ 발표: 2026년 4월 22일, Google Cloud Next '26 (라스베가스)→ 정체: Vertex AI의 진화판 — 에이전트 빌드/스케일/거버넌스/최적화 통합 플랫폼→ 모델: 200개+ 접근 (Gemini 3.1 Pro, Gemma 4, Lyria 3, Claude Opus/Sonnet/Haiku 포함)→ ADK: 그래프 기반 서브에이전트 네트워크로 업그레이드→ 보안: Agent Identity (암호화 ID), Agent Gateway, Agentic Defense 신설→ 인프라: 8세대 TPU, Axion CPU 함께 발표→ 대상: 에이전트를 수백~수천 개 규모로 운영할 ..

Claude Code가 멍청해진 이유 — Anthropic이 직접 밝힌 3가지 원인과 수정 내역 지난 한 달간 Claude Code가 이상하다고 느끼셨다면, 착각이 아니었습니다. Anthropic이 공식 포스트모템을 발행했습니다.[핵심 요약]→ 기간: 2026년 3월 4일 ~ 4월 20일→ 영향 범위: Claude Code, Claude Agent SDK, Claude Cowork→ API는 영향 없음→ 원인 1: 기본 추론 노력을 High → Medium으로 낮춤 (3월 4일)→ 원인 2: 캐싱 버그로 매 턴마다 Thinking이 삭제됨 (3월 26일)→ 원인 3: 시스템 프롬프트에 응답 길이 제한 추가 (4월 16일)→ 현재: v2.1.116 이상에서 전부 수정 완료→ 보상: 전 구독자 사용량 한도 리셋 (4월 23일)배경 — "Claude가 멍청해졌다"는 신호들3월부터 GitHub, X, Re..

Continue.dev 완전 가이드 — GitHub Copilot 대신 쓰는 무료 오픈소스 AI 코딩 어시스턴트 GitHub Copilot 월 $10~19 내고 있나요Continue.dev는 똑같은 기능인데 무료예요. 오픈소스고, 어떤 LLM이든 연결 가능해요.GitHub Copilot:→ 월 $10 (개인) ~ $19 (Business)→ GPT/Claude 고정→ 코드가 GitHub 서버 통과→ 커스터마이징 불가Continue.dev:→ 완전 무료 (Apache 2.0)→ Claude, GPT, Gemini, Ollama 전부 가능→ 로컬 모델 연결하면 코드 외부 유출 0→ VS Code, JetBrains 지원→ GitHub 스타 25,000+뭘 할 수 있냐1. 탭 자동완성 → 코드 작성 중 Tab 누르면 완성 → Copilot이랑 완전히 똑같은 UX2. 채팅 → "이 함수 뭐 하는 건지 설명해줘"..

LiteLLM 완전 가이드 — Claude, GPT, Gemini 100개+ LLM을 코드 한 줄로 전환하기 LLM을 여러 개 쓰다 보면 이런 문제가 생겨요.# Claude 쓸 때import anthropicclient = anthropic.Anthropic()response = client.messages.create( model="claude-sonnet-4-6", max_tokens=1024, messages=[{"role": "user", "content": "안녕"}])text = response.content[0].text # 이렇게 꺼냄# GPT 쓸 때 → SDK 다르고, 응답 형식 다름from openai import OpenAIclient = OpenAI()response = client.chat.completions.create( model="gpt-5.4", me..

LLM 추상화 레이어 — 48시간마다 새 모델이 나오는 시대에 살아남는 법 48시간마다 새 모델이 출시돼요.GPT-5.4 나옴 → "오 이게 최고네" → 갈아타고 싶음근데 코드 전체가 Anthropic SDK로 짜여있음갈아타려면:- SDK 교체- API 형식 전부 수정- 프롬프트 재조정- 테스트 전부 재실행- 2주짜리 작업이게 벤더 락인이에요.반대로 추상화 레이어가 있으면:# 이것만 바꾸면 끝MODEL = "openai/gpt-5.4" # 전에는 "anthropic/claude-sonnet-4-6"코드 한 줄. 2주가 1초가 돼요.왜 지금 이게 중요한가실제로 일어난 일들:- DALL-E 3 2026년 5월 지원 종료 → 수주 안에 마이그레이션- GPT-4 요금 갑자기 30% 인상 → 단가 모델 붕괴- Anthropic API 6시간 다운 → 서비스 전체 중단- 경쟁사가 10배..

GitHub Copilot Agent Mode 실전 가이드 — VS Code에서 자율 코딩 에이전트 쓰는 법 GitHub Copilot을 인라인 자동완성 도구로만 쓰고 있다면 절반도 못 쓰고 있는 거예요.2026년 기준 Copilot에는 4가지 에이전트가 있어요.1. Local Agent — 실시간, VS Code 안에서 동작2. Plan Agent — 실행 전 계획 먼저 세우기3. Background — 백그라운드에서 병렬 작업4. Cloud Agent — GitHub 서버에서 비동기 실행 → PR 자동 생성오늘은 이 4가지를 실전에서 어떻게 쓰는지 다 다뤄요.사전 준비필요한 것:✅ VS Code 1.99 이상✅ GitHub Copilot Pro ($19/월) 이상✅ GitHub Copilot + GitHub Copilot Chat 확장 설치무료 플랜은 Agent Mode 미포함→ 인..

이전 1 2 3 4 5 6 7 다음

티스토리툴바