본문 바로가기

반응형

AI Development

(55)
Gemini Embedding 2 완전 가이드 — 텍스트, 이미지, 비디오, 오디오를 하나의 벡터 공간에 지금까지 멀티모달 RAG를 만들려면 텍스트 임베딩 모델, 이미지 임베딩 모델, 비디오 처리기를 따로 연결해야 했습니다. Gemini Embedding 2는 이걸 API 호출 하나로 끝냅니다.[핵심 요약]→ 출시: 2026년 3월 10일 (Public Preview), 4월 22일 GA→ 모델 ID: gemini-embedding-2 (GA), gemini-embedding-2-preview→ 정체: Google 최초 네이티브 멀티모달 임베딩 모델→ 지원 입력: 텍스트, 이미지(최대 6개), 비디오(120초), 오디오(180초), PDF(6페이지)→ 벡터 크기: 3072차원 (기본값), Matryoshka로 축소 가능→ 언어: 100개+ 지원→ 핵심: 5가지 모달리티를 단일 임베딩 공간에 매핑→ 가격: 텍..
Claude Code Auto Mode 완전 가이드 — 장시간 작업 자동화하는 법 3시간 동안 리팩토링하면서 승인 버튼을 137번 눌렀습니다. 매번 읽지도 않고 클릭했습니다. 이게 안전한 게 아니라는 걸 Anthropic도 알았습니다. 그래서 Auto Mode를 만들었습니다.[핵심 요약]→ 출시: 2026년 3월 24일 (Team 플랜 리서치 프리뷰)→ 현재: Max, Team, Enterprise, API 전체 GA→ 정체: AI 분류기가 권한 결정을 대신하는 Claude Code 새 권한 모드→ 목적: --dangerously-skip-permissions의 안전한 대안→ 원리: 2단계 분류 파이프라인 → 안전 액션은 자동 실행, 위험 액션만 사람에게 요청→ 모델: Claude Sonnet 4.6 / Opus 4.6 지원→ 비용: 분류기 추가 실행으로 토큰 약 10~15% 증가→ ..
Cursor SDK 완전 가이드 — TypeScript 몇 줄로 Cursor 에이전트를 CI/CD 파이프라인에 박아넣는 법 Cursor는 IDE였습니다. 4월 29일부터 인프라입니다. npm install 하나로 Cursor 에이전트를 코드 어디서든 호출할 수 있습니다.[핵심 요약]→ 출시: 2026년 4월 29일 (Public Beta)→ 설치: npm install @cursor/sdk→ 정체: Cursor IDE/CLI/Web과 동일한 에이전트 런타임을 TypeScript API로 노출→ 기본 모델: Composer 2 ($0.50/M input, $2.50/M output) → Opus 4.7 대비 10배 저렴→ 실행 모드: 로컬 / Cursor 클라우드 VM / 셀프호스트→ 내장 기능: 코드베이스 인덱싱, MCP 서버, Skills, Hooks, 서브에이전트→ 가격: 토큰 기반 (좌석/월정액 아님)→ 이미 사용 중:..
n8n MCP 서버 완전 가이드 — Claude Code로 자연어 한 줄에 n8n 워크플로우 만들기 "매일 오전 7시에 날씨 예보 이메일 보내줘." 이 한 줄로 워크플로우가 n8n에 직접 생성됩니다. JSON 복붙도 없고, 에러 디버깅도 AI가 알아서 합니다.[핵심 요약]→ 출시: 2026년 4월 29일 (n8n 공식 블로그)→ 버전: n8n 2.18.4 이상 필요→ 정체: 자연어 → n8n 워크플로우 자동 생성/수정/실행/디버깅→ 기존 MCP와 차이: 이전엔 기존 워크플로우 실행만 → 이제 생성+수정까지→ 지원 클라이언트: Claude Code, Claude Desktop, ChatGPT, Cursor, Windsurf→ 라이센스: n8n Cloud, Enterprise, 무료 Self-hosted 전부 포함→ 내부 테스트: n8n 팀이 이미 실무에서 매일 사용 중→ 상태: Public Preview..
Vite + React + Supabase + Cloudflare Pages 완전 가이드 — 서비스 무료로 무중단 배포부터 SEO까지 한 번에 Next.js 없이도 됩니다. Vite + Cloudflare Pages 조합으로 더 빠르고 더 저렴하게 SaaS를 배포하는 법, 직접 겪으면서 정리했습니다.[핵심 요약]→ 스택: Vite + React (TypeScript) + Supabase + Cloudflare Pages→ 장점: Next.js보다 빠른 빌드, Cloudflare 글로벌 CDN 무료→ 함정 1: Vite 환경변수는 VITE_ 접두사 필수 (CRA와 다름)→ 함정 2: SPA 라우팅 직접 접속 시 404 → _redirects 파일로 해결→ 함정 3: Supabase 무료 티어 7일 미접속 시 일시정지 → GitHub Actions로 해결→ 추가: 구글 서치 콘솔 사이트명 오인식 문제 → JSON-LD 구조화 데이터로 해결→ 비용:..
OpenAI Advanced Account Security 완전 가이드 — 패스키, 보안 키, 세션 관리로 ChatGPT·Codex 계정 요새화 ChatGPT 계정에 민감한 업무 정보가 쌓이고 있습니다. 피싱 공격자도 그걸 알고 있습니다. OpenAI가 처음으로 하드웨어 보안 키 수준의 보호를 도입했습니다.[핵심 요약]→ 출시: 2026년 4월 30일→ 대상: ChatGPT + Codex 계정 (동일 로그인)→ 방식: 옵트인 (선택 가입) — 일반 사용자 자발적 설정→ 의무화: "Trusted Access for Cyber" 프로그램 멤버 → 2026년 6월 1일부터 필수→ 핵심 기능 4가지: 패스워드리스 로그인, 강화된 계정 복구, 세션 관리, 학습 자동 제외→ 파트너: Yubico (YubiKey C NFC, YubiKey C Nano 공동 번들)→ 중요: 등록 후 OpenAI 지원팀이 계정 복구 불가 → 사용자 책임→ 주요 대상: 기자, 연..
OpenAI × AWS 완전 분석 — GPT-5.5, Codex, Managed Agents가 Amazon Bedrock에 상륙한 이유 Microsoft 독점이 끝난 다음 날, AWS가 움직였습니다. $50B 투자, OpenAI 모델 전체를 Bedrock으로.[핵심 요약]→ 발표: 2026년 4월 28일 (AWS "What's Next" 이벤트, 샌프란시스코)→ 배경: Microsoft-OpenAI 독점 계약 종료 다음 날 발표→ 투자: Amazon → OpenAI $50B ($15B 즉시 + $35B 조건부)→ 3가지 출시: OpenAI 모델 on Bedrock + Codex on Bedrock + Managed Agents→ 모델: GPT-5.5, GPT-5.4 포함 (한정 프리뷰)→ 코딩: Codex CLI, 데스크탑 앱, VS Code 익스텐션 → AWS 자격증명으로 인증→ 에이전트: Amazon Bedrock Managed Ag..
OpenAI 저지연 음성 AI 인프라 완전 분석 — WebRTC 아키텍처를 뜯어고친 이유와 개발자 적용 가이드 900M 주간 사용자에게 300ms 이하 음성 응답을 전달하는 인프라. OpenAI가 내부 아키텍처를 공개했습니다.[핵심 요약]→ 발행: 2026년 5월 4일 (OpenAI 엔지니어링 블로그)→ 저자: Yi Zhang, William McDonald (OpenAI 실시간 AI 팀)→ 핵심 문제: Kubernetes에서 WebRTC 대규모 서빙이 안 됨→ 해결: Split Relay + Transceiver 아키텍처→ 목표 레이턴시: E2E 300~500ms (자연스러운 대화 기준)→ 규모: 주간 활성 사용자 9억명+ 대상→ 함께 출시: gpt-realtime-mini (지시 따르기 +18.6%p, 툴 호출 +12.9%p)→ 개발자 시사: 음성 에이전트 아키텍처 설계 기준이 바뀜왜 이 글이 중요한가Open..

반응형