'2026/04/24 글 목록

Gemini 3.1 Flash TTS 완전 가이드 — 자연어로 AI 목소리를 연출하는 법

"긴장감 있게 읽어줘", "여기서 잠깐 멈춰", "속삭이듯이". 이제 이 말 한 마디로 AI 목소리를 연출할 수 있습니다.[핵심 요약]→ 출시: 2026년 4월 15일 (Google, 프리뷰)→ 핵심: SSML 없이 자연어로 음성 스타일 제어→ 오디오 태그: 200개+ ([excitement], [whispers], [slow] 등)→ 멀티 스피커: 단일 API 호출로 여러 화자 동시 생성→ 언어: 70개+ 지원→ 벤치마크: Artificial Analysis TTS Elo 1,211 — 공개 TTS 최고점→ 가격: 입력 $1/1M 토큰, 출력 $20/1M 토큰 / AI Studio 무료 체험 가능→ 모델 ID: gemini-3.1-flash-tts-preview기존 TTS와 뭐가 다른가TTS는 오랫동안..

AI 개발 2026.04.24

OpenAI Privacy Filter 완전 가이드 — LLM에 개인정보 넣기 전에 로컬에서 자동 마스킹하는 법

고객 데이터를 Claude나 GPT API에 넣기 전에 개인정보를 자동으로 지워야 합니다. 클라우드로 보내지 않고, 로컬에서, 코드 3줄로 해결합니다.[핵심 요약]→ 정체: 텍스트 안의 개인정보를 자동 탐지/마스킹하는 오픈소스 모델→ 크기: 1.5B 파라미터 (50M 활성) — 노트북에서 실행 가능→ 라이센스: Apache 2.0 — 상업 이용 무료→ 컨텍스트: 128K 토큰 — 긴 문서/이메일 스레드 한 번에 처리→ 탐지 범주: 이름, 주소, 이메일, 전화번호, URL, 날짜, 계좌번호, 비밀번호/API 키→ 성능: PII-Masking-300k F1 97.43%→ 핵심: 데이터가 외부 서버로 나가지 않음왜 필요한가LLM API를 쓰다 보면 개인정보가 섞인 데이터를 넣게 되는 상황이 자주 생깁니다.흔한..

LLM 2026.04.24

Gemini Enterprise Agent Platform 완전 분석 — Vertex AI가 에이전트 플랫폼으로 진화한 이유

Google이 Vertex AI를 접었습니다. 대신 에이전트 시대를 위한 새로운 플랫폼을 들고 나왔습니다.[핵심 요약]→ 발표: 2026년 4월 22일, Google Cloud Next '26 (라스베가스)→ 정체: Vertex AI의 진화판 — 에이전트 빌드/스케일/거버넌스/최적화 통합 플랫폼→ 모델: 200개+ 접근 (Gemini 3.1 Pro, Gemma 4, Lyria 3, Claude Opus/Sonnet/Haiku 포함)→ ADK: 그래프 기반 서브에이전트 네트워크로 업그레이드→ 보안: Agent Identity (암호화 ID), Agent Gateway, Agentic Defense 신설→ 인프라: 8세대 TPU, Axion CPU 함께 발표→ 대상: 에이전트를 수백~수천 개 규모로 운영할 ..

AI 개발 2026.04.24

Claude Code가 멍청해진 이유 — Anthropic이 직접 밝힌 3가지 원인과 수정 내역

지난 한 달간 Claude Code가 이상하다고 느끼셨다면, 착각이 아니었습니다. Anthropic이 공식 포스트모템을 발행했습니다.[핵심 요약]→ 기간: 2026년 3월 4일 ~ 4월 20일→ 영향 범위: Claude Code, Claude Agent SDK, Claude Cowork→ API는 영향 없음→ 원인 1: 기본 추론 노력을 High → Medium으로 낮춤 (3월 4일)→ 원인 2: 캐싱 버그로 매 턴마다 Thinking이 삭제됨 (3월 26일)→ 원인 3: 시스템 프롬프트에 응답 길이 제한 추가 (4월 16일)→ 현재: v2.1.116 이상에서 전부 수정 완료→ 보상: 전 구독자 사용량 한도 리셋 (4월 23일)배경 — "Claude가 멍청해졌다"는 신호들3월부터 GitHub, X, Re..

AI 개발 2026.04.24

오픈소스 코딩 모델 3파전 — Qwen3.6-27B vs Gemma 4 31B vs GLM-5.1

각자 다른 대륙, 다른 철학. 그런데 전부 프론티어급입니다. 뭘 골라야 할지 완전히 정리해드립니다.[핵심 요약]→ Qwen3.6-27B: 코딩 에이전트 최강, RTX 4090 한 장, Apache 2.0→ Gemma 4 31B: 수학/추론 최강, 멀티모달(비전+오디오), Apache 2.0→ GLM-5.1: SWE-bench Pro 1위, 6000+ 툴 호출 지속, MIT 라이센스→ 공통점: 전부 Apache 2.0 / MIT, 상업 이용 무료→ 결론: 용도에 따라 다름 — 이 글이 그 기준을 정리합니다세 모델이 동시에 나온 이유2026년 4월은 오픈소스 AI 역사상 가장 경쟁이 치열한 달입니다. Alibaba, Google, Z.AI(Zhipu AI)가 수주 안에 모두 출시했습니다.출시 타임라인:→ G..

LLM 2026.04.24

Qwen3.6-27B로 로컬 코딩 에이전트 만들기 — Aider, Continue.dev, Cursor, Qwen Code 완전 연동 가이드

API 비용 0원, 코드 외부 전송 없음. RTX 4090 한 장으로 프론티어급 코딩 에이전트를 로컬에서 돌립니다.[핵심 요약]→ 이번 글에서 다루는 것:→ 1단계: vLLM로 로컬 서버 띄우기→ 2단계: Aider 연동 — CLI 코딩 에이전트→ 3단계: Continue.dev 연동 — VS Code 인라인 어시스턴트→ 4단계: Cursor 연동 — 에이전트 모드→ 5단계: Qwen Code 연동 — Claude Code 대안→ CUDA 13.2 버그, Thinking 모드, Ollama 미지원 주의사항 포함 왜 로컬인가클라우드 API 방식:→ Claude Opus 4.7: 입력 $5, 출력 $25 / 1M tokens→ GPT-5.5: 입력 $5, 출력 $30 / 1M tokens→ 코드가 외부 서버..

LLM 2026.04.24

Qwen3.6-27B vs 35B-A3B — Dense vs MoE

같은 Qwen3.6 패밀리인데 아키텍처가 완전히 다릅니다. 뭘 골라야 할지 헷갈리는 분들을 위해 정리했습니다.[핵심 요약]→ 27B: Dense 모델 — 모든 파라미터 항상 활성, 성능 우선→ 35B-A3B: MoE 모델 — 3B만 활성, 속도 우선→ 벤치마크: 27B가 전 항목에서 앞섬→ 속도: 35B-A3B가 3~5배 빠름 (같은 하드웨어 기준)→ VRAM: 27B ~16.8GB vs 35B-A3B ~21GB (Q4 기준)→ 결론: 코딩 에이전트 → 27B / 빠른 인터랙티브 → 35B-A3BDense vs MoE — 뭐가 다른가같은 Qwen3.6 패밀리지만 내부 구조가 근본적으로 다릅니다.Dense (27B):→ 27B 파라미터 전부 항상 활성→ 모든 토큰에 27B 파라미터가 계산에 참여→ 토큰당 ..

LLM 2026.04.24

Qwen3.6-27B 완전 분석 — 27B 모델이 397B MoE 능가

RTX 4090 하나로 프론티어급 코딩 에이전트를 돌릴 수 있는 시대가 왔습니다.[핵심 요약]→ 출시: 2026년 4월 22일, Alibaba Qwen Team→ 라이센스: Apache 2.0 (상업 사용 가능)→ 파라미터: 27B dense (이전 플래그십 Qwen3.5-397B 대비 1/14 크기)→ VRAM: Q4_K_M 기준 ~16.8GB — RTX 4090 한 장으로 구동→ SWE-bench Verified 77.2% — Claude Opus 4.6 (80.8%)과 3.6점 차→ Terminal-Bench 2.0 59.3% — Claude 4.5 Opus와 동점→ SkillsBench 48.2% — 397B MoE (30.0%) 대비 60% 향상→ 주의: CUDA 13.2 버그 있음, CUDA ..

LLM 2026.04.24

GPT-5.5 비싸다 — GPT-5.4 대비 2배

출력 토큰 가격이 2배 올랐습니다. 에이전트 돌리는 개발자라면 이번 달 청구서가 달라집니다.[핵심 요약]→ GPT-5.5 가격: 입력 $5/1M, 출력 $30/1M→ GPT-5.4 대비: 입력 2배, 출력 2배 인상→ Claude Opus 4.7 대비: 입력 동일, 출력 20% 비쌈→ 함정: Claude Opus 4.7 새 토크나이저로 실질 비용 20~35% 추가→ 결론: 워크로드별로 모델 라우팅 전략이 필수얼마나 올랐나GPT-5.4가 나온 지 6주 만에 GPT-5.5가 나왔습니다. 성능은 올랐는데 가격도 같이 올랐습니다.GPT-5.4 (6주 전):→ 입력: $2.50 / 1M tokens→ 출력: $15.00 / 1M tokens→ 272K 이상 컨텍스트: 입력 $5.00으로 2배 (함정)GPT-5.5..

LLM 2026.04.24

GPT-5.5 출시 완전 분석 — Claude Opus 4.7에 일주일 만에 날린 OpenAI의 반격

6주 만에 새 모델이 나왔습니다. AI 코딩 툴 전쟁, 이제 속도전입니다.[핵심 요약]→ GPT-5.5: 2026년 4월 23일 출시, GPT-5.4 이후 6주 만→ 핵심: 에이전트 코딩 특화, 다단계 작업 자율 처리→ 포지셔닝: Claude Opus 4.7 출시 일주일 만에 나온 직접 맞불→ 배포: Plus, Pro, Business, Enterprise 우선 / Free 미정→ 동반 출시: Privacy Filter (개인정보 자동 마스킹)→ OpenAI 현황: 주간 활성 사용자 9억 명, 유료 구독자 5,000만 명GPT-5.5가 나온 배경OpenAI가 4월 23일(현지시간) GPT-5.5를 공식 출시했습니다. GPT-5.4 출시 이후 불과 6주 만입니다. 업계에서는 이 속도 자체가 메시지라는 평가..

LLM 2026.04.24

CELL AI DEVLOG

2026/04/24 10

티스토리툴바

« 2026/04 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30