본문 바로가기

반응형

전체 글

OpenAI Privacy Filter 완전 가이드 — LLM에 개인정보 넣기 전에 로컬에서 자동 마스킹하는 법 고객 데이터를 Claude나 GPT API에 넣기 전에 개인정보를 자동으로 지워야 합니다. 클라우드로 보내지 않고, 로컬에서, 코드 3줄로 해결합니다.[핵심 요약]→ 정체: 텍스트 안의 개인정보를 자동 탐지/마스킹하는 오픈소스 모델→ 크기: 1.5B 파라미터 (50M 활성) — 노트북에서 실행 가능→ 라이센스: Apache 2.0 — 상업 이용 무료→ 컨텍스트: 128K 토큰 — 긴 문서/이메일 스레드 한 번에 처리→ 탐지 범주: 이름, 주소, 이메일, 전화번호, URL, 날짜, 계좌번호, 비밀번호/API 키→ 성능: PII-Masking-300k F1 97.43%→ 핵심: 데이터가 외부 서버로 나가지 않음왜 필요한가LLM API를 쓰다 보면 개인정보가 섞인 데이터를 넣게 되는 상황이 자주 생깁니다.흔한.. 더보기
Gemini Enterprise Agent Platform 완전 분석 — Vertex AI가 에이전트 플랫폼으로 진화한 이유 Google이 Vertex AI를 접었습니다. 대신 에이전트 시대를 위한 새로운 플랫폼을 들고 나왔습니다.[핵심 요약]→ 발표: 2026년 4월 22일, Google Cloud Next '26 (라스베가스)→ 정체: Vertex AI의 진화판 — 에이전트 빌드/스케일/거버넌스/최적화 통합 플랫폼→ 모델: 200개+ 접근 (Gemini 3.1 Pro, Gemma 4, Lyria 3, Claude Opus/Sonnet/Haiku 포함)→ ADK: 그래프 기반 서브에이전트 네트워크로 업그레이드→ 보안: Agent Identity (암호화 ID), Agent Gateway, Agentic Defense 신설→ 인프라: 8세대 TPU, Axion CPU 함께 발표→ 대상: 에이전트를 수백~수천 개 규모로 운영할 .. 더보기
Claude Code가 멍청해진 이유 — Anthropic이 직접 밝힌 3가지 원인과 수정 내역 지난 한 달간 Claude Code가 이상하다고 느끼셨다면, 착각이 아니었습니다. Anthropic이 공식 포스트모템을 발행했습니다.[핵심 요약]이번 품질 저하는 2026년 3월 4일부터 4월 20일까지 약 47일간 지속됐으며, 영향 범위는 Claude Code, Claude Agent SDK, Claude Cowork였습니다. API 직접 사용자는 영향을 받지 않았습니다. 원인은 세 가지로 정리됩니다. 첫째, 기본 추론 노력을 High에서 Medium으로 낮춘 것(3월 4일), 둘째, 캐싱 버그로 매 턴마다 Thinking이 삭제된 것(3월 26일), 셋째, 시스템 프롬프트에 응답 길이 제한이 추가된 것(4월 16일)입니다. 현재는 v2.1.116 이상에서 전부 수정 완료됐으며, 전 구독자 사용량 한도.. 더보기
오픈소스 코딩 모델 3파전 — Qwen3.6-27B vs Gemma 4 31B vs GLM-5.1 각자 다른 대륙, 다른 철학. 그런데 전부 프론티어급입니다. 뭘 골라야 할지 완전히 정리해드립니다.[핵심 요약]→ Qwen3.6-27B: 코딩 에이전트 최강, RTX 4090 한 장, Apache 2.0→ Gemma 4 31B: 수학/추론 최강, 멀티모달(비전+오디오), Apache 2.0→ GLM-5.1: SWE-bench Pro 1위, 6000+ 툴 호출 지속, MIT 라이센스→ 공통점: 전부 Apache 2.0 / MIT, 상업 이용 무료→ 결론: 용도에 따라 다름 — 이 글이 그 기준을 정리합니다세 모델이 동시에 나온 이유2026년 4월은 오픈소스 AI 역사상 가장 경쟁이 치열한 달입니다. Alibaba, Google, Z.AI(Zhipu AI)가 수주 안에 모두 출시했습니다.출시 타임라인:→ G.. 더보기
Qwen3.6-27B로 로컬 코딩 에이전트 만들기 — Aider, Continue.dev, Cursor, Qwen Code 완전 연동 가이드 API 비용 0원, 코드 외부 전송 없음. RTX 4090 한 장으로 프론티어급 코딩 에이전트를 로컬에서 돌립니다.[핵심 요약]이 글에서는 vLLM으로 로컬 서버를 띄우고, Aider(CLI 코딩 에이전트), Continue.dev(VS Code 인라인 어시스턴트), Cursor(에이전트 모드), Qwen Code(Claude Code 대안) 순서로 연동하는 방법을 다룹니다. CUDA 13.2 버그, Thinking 모드 제어, Ollama 미지원 주의사항까지 포함합니다.왜 로컬인가클라우드 API 방식은 토큰당 비용이 누적됩니다. Claude Opus 4.7은 입력 $5, 출력 $25 per 1M tokens이고, GPT-5.5는 입력 $5, 출력 $30입니다. 비용 외에도 코드가 외부 서버로 전송된다는.. 더보기
Qwen3.6-27B vs 35B-A3B — Dense vs MoE 같은 Qwen3.6 패밀리인데 아키텍처가 완전히 다릅니다. 뭘 골라야 할지 헷갈리는 분들을 위해 정리했습니다.[핵심 요약]→ 27B: Dense 모델 — 모든 파라미터 항상 활성, 성능 우선→ 35B-A3B: MoE 모델 — 3B만 활성, 속도 우선→ 벤치마크: 27B가 전 항목에서 앞섬→ 속도: 35B-A3B가 3~5배 빠름 (같은 하드웨어 기준)→ VRAM: 27B ~16.8GB vs 35B-A3B ~21GB (Q4 기준)→ 결론: 코딩 에이전트 → 27B / 빠른 인터랙티브 → 35B-A3BDense vs MoE — 뭐가 다른가같은 Qwen3.6 패밀리지만 내부 구조가 근본적으로 다릅니다.Dense (27B):→ 27B 파라미터 전부 항상 활성→ 모든 토큰에 27B 파라미터가 계산에 참여→ 토큰당 .. 더보기
Qwen3.6-27B 완전 분석 — 27B 모델이 397B MoE 능가 RTX 4090 한 장으로 프론티어급 코딩 에이전트를 돌릴 수 있는 시대가 왔습니다. 2026년 4월 22일 Alibaba Qwen Team이 공개한 Qwen3.6-27B는 27B dense 모델인데, 이전 플래그십이었던 397B MoE 모델 Qwen3.5-397B-A17B를 코딩 벤치마크 전 항목에서 앞질렀습니다. 라이센스는 Apache 2.0이라 상업적 사용에도 제약이 없습니다.핵심 요약출시는 2026년 4월 22일 Alibaba Qwen Team이 진행했으며, 라이센스는 Apache 2.0으로 상업 사용이 가능합니다. 파라미터는 27B dense로 이전 플래그십 Qwen3.5-397B 대비 약 14분의 1 크기입니다. VRAM은 Q4_K_M 양자화 기준 약 16.8GB로 RTX 4090 한 장으로 .. 더보기
GPT-5.5 출시 완전 분석 — Claude Opus 4.7에 일주일 만에 날린 OpenAI의 반격 6주 만에 새 모델이 나왔습니다. AI 코딩 툴 전쟁, 이제 속도전입니다.[핵심 요약]→ GPT-5.5: 2026년 4월 23일 출시, GPT-5.4 이후 6주 만→ 핵심: 에이전트 코딩 특화, 다단계 작업 자율 처리→ 포지셔닝: Claude Opus 4.7 출시 일주일 만에 나온 직접 맞불→ 배포: Plus, Pro, Business, Enterprise 우선 / Free 미정→ 동반 출시: Privacy Filter (개인정보 자동 마스킹)→ OpenAI 현황: 주간 활성 사용자 9억 명, 유료 구독자 5,000만 명GPT-5.5가 나온 배경OpenAI가 4월 23일(현지시간) GPT-5.5를 공식 출시했습니다. GPT-5.4 출시 이후 불과 6주 만입니다. 업계에서는 이 속도 자체가 메시지라는 평가.. 더보기

반응형