반응형

2026/04/16 7

AI 코딩 툴 보안 실전 — Claude Code 소스 유출 이후 달라진 공격 지형

2026년 3월 31일, Claude Code 소스코드가 npm에 실수로 노출됐어요.유출 규모:→ 51만 2천 줄 TypeScript→ 1,906개 파일→ 24시간 만에 GitHub 포크 41,500개공격자들의 반응 속도:→ 유출 24시간 이내: 악성 "leaked Claude Code" GitHub 레포 등장→ 구글 검색 상위에 악성 레포 노출→ 25개 이상 소프트웨어 브랜드 사칭 캠페인 즉시 시작근데 이건 시작에 불과해요. 진짜 문제는 공격자들이 이제 Claude Code의 내부 동작 원리를 알게 됐다는 거예요.공격 유형 1 — Slopsquatting (슬롭스쿼팅)AI가 환각으로 만든 패키지명을 공격자가 선점하는 공격이에요.어떻게 작동하나:1. 연구자들이 LLM에게 576,000개 코드 샘플 생성 ..

AI 개발 2026.04.16

AI 수익의 74%를 상위 20% 기업이 독식한다 — PwC 2026 AI 성과 연구

2026년 4월 13일, PwC가 충격적인 보고서를 냈어요.전 세계 25개 산업, 1,217명 임원 대상 조사 결과:AI가 만들어내는 경제적 가치의 74%→ 상위 20% 기업이 가져감나머지 80% 기업이 나눠갖는 건 26%AI에 다들 투자하는데, 돈 버는 곳은 극소수예요.왜 이렇게 차이가 나는가직관적으로는 이렇게 생각해요."상위 20%는 돈이 많아서""더 좋은 모델 접근권이 있어서""AI 전문가를 더 많이 고용해서"PwC 데이터는 다른 이유를 지목해요.상위 20%와 나머지 80%의 차이:나머지 80%:→ AI로 비용 절감→ AI로 업무 효율화→ 파일럿 프로젝트 계속 진행→ "AI로 기존 일을 더 빠르게"상위 20%:→ AI로 새로운 수익 창출→ AI로 비즈니스 모델 재발명→ 산업 경계를 넘어 새 시장 진..

AI 개발 2026.04.16

GLM-5.1 vs Claude Opus 4.6 vs GPT-5.4

2026년 4월 7일, Z.ai(구 Zhipu AI)가 GLM-5.1을 공개했어요.공개 즉시 SWE-bench Pro 1위를 차지했어요.SWE-bench Pro (실제 GitHub 이슈 해결):GLM-5.1: 58.4% ← 1위GPT-5.4: 57.7%Claude Opus 4.6: 57.3%Gemini 3.1 Pro: 55.1%오픈소스 모델이 GPT-5.4와 Opus 4.6을 모두 제쳤어요.근데 벤치마크 숫자보다 더 주목할 게 있어요.Z.ai가 뭔가원래 이름: Zhipu AI (智谱 AI)배경: 칭화대학교 스핀오프국제 브랜드: Z.ai2026년 1월 8일: 홍콩 증시 IPO→ 약 HKD 43.5억 ($5.58억) 조달→ 시가총액: $528억→ 세계 최초 상장 파운데이션 모델 기업IP..

LLM 2026.04.16

Stanford AI Index 2026 핵심 요약

매년 스탠퍼드 HAI(인간중심 AI 연구소)가 내놓는 AI 연간 보고서. 423페이지, 마케팅 없는 독립 데이터. 2026년판이 4월 13일 공개됐어요.AI 랩들이 만드는 보고서가 아니라는 게 포인트예요. 가장 믿을 수 있는 AI 현황 데이터예요.1. AI는 멈추지 않았다2025년 내내 "AI 성능 정체" 얘기가 많았어요. 데이터는 반대예요.SWE-bench Verified (실제 GitHub 이슈 해결):2024년: 60%2025년: ~100%→ 1년 만에 인간 수준 달성Humanity's Last Exam (박사급 전문가 문제):2025년: 8.8%2026년: 38.3%2026년 4월 기준 (Opus 4.6, Gemini 3.1 Pro): 50%+수학 올림피아드:Gemini Deep Think → 금..

AI 개발 2026.04.16

Anthropic Claude Opus 4.7 + AI 디자인 툴 이번주 출시 예정 — Figma, Wix 주가 폭락한 이유

2026년 4월 14일, The Information이 단독 보도를 냈어요."Anthropic이 이번 주 두 가지를 출시할 예정:1. Claude Opus 4.72. 웹사이트/프레젠테이션 생성 AI 디자인 툴"보도 직후 시장이 즉각 반응했어요.Figma: -6.0%Wix: -4.8%Adobe: -2.7%GoDaddy: -4.4%단 한 건의 미확인 단독 보도에 이 정도 반응.→ 시장은 이미 이 움직임을 예상하고 있었다는 뜻Claude Opus 4.7 — 뭐가 달라지나Opus 4.6이 2026년 2월 출시됐어요. 2개월 만에 4.7이에요.Opus 4.6 주요 스펙:- 1M 토큰 컨텍스트 윈도우 (베타)- SWE-bench Verified: 80%+- Terminal-Bench 2.0: 65.4..

LLM 2026.04.16

Anthropic Claude Code Routines 출시 — PR 리뷰, 배포 검증, 문서 관리 완전 자동화

2026년 4월 14일, Anthropic이 조용하게 큰 걸 내놨어요.기존 Claude Code:터미널 열고 → 프롬프트 입력 → 결과 확인→ 사람이 앉아있어야 함Claude Code Routines:한번 설정 → 자동 실행→ 노트북 꺼도 Anthropic 서버에서 계속 돌아감단순한 편의 기능이 아니에요. AI 코딩 도구가 대화 상대에서 자율 실행 에이전트로 바뀌는 전환점이에요.Routines가 뭔가Routine = 프롬프트 + 레포지토리 + 커넥터 + 트리거한번 설정해두면:- 매일 밤 2시에 실행- API 호출 받으면 실행- PR 올라오면 자동 실행→ Anthropic 클라우드 인프라에서 실행→ 내 노트북 상태와 무관3가지 트리거 타입1. 스케줄 트리거# CLI에서 설정/schedule 매일 밤 2시에..

AI 개발 2026.04.16

RAG 청킹 전략 완전 정리

RAG 시스템이 엉터리 답변을 내놓을 때 대부분 이렇게 생각해요."임베딩 모델 바꿔볼까?""프롬프트 더 정교하게 써야겠다""LLM을 더 좋은 걸로 바꾸면 되겠지"근데 실제로 RAG 실패의 80%는 청킹 문제예요.잘못 자른 청크가 들어가면 아무리 좋은 LLM도 엉터리 답변을 낼 수밖에 없어요.청킹이 뭔가RAG는 문서를 통째로 넣을 수 없어요. 임베딩 모델의 입력 한계가 있고, 벡터 검색 정확도도 떨어져요.원문 (10,000 토큰):"회사 규정 전체 문서..."청킹:청크 1: "출근 시간은 오전 9시..." (512토큰)청크 2: "연차 사용 규정은..." (512토큰)청크 3: "복리후생 제도는..." (512토큰)...질문: "연차 며칠이야?"→ 청크 2만 검색됨→ 관련 내용만 LLM에 전달→ 정확한 답..

RAG 2026.04.16
반응형