CELL AI DEVLOG

AI 에이전트 트래픽 7,851% 폭증 — 바뀌어야 하는 서버 설계, 방어 전략

2025년, 조용히 인터넷이 바뀌었어요.HUMAN Security가 1경(10^15) 개 이상의 디지털 상호작용을 분석한 결과:2025년 트래픽 증가율:AI 에이전트 브라우저 트래픽: +7,851%AI 봇 전체: +187%사람: +3.1%자동화 트래픽 성장속도 = 사람의 8배Cloudflare CEO 매튜 프린스가 2026년 3월 SXSW에서 한 말:"2027년이면 봇 트래픽이 사람 트래픽을 추월한다.COVID 때처럼 반짝 스파이크가 아니다.멈출 기미가 없다."2024년 이미 자동화 트래픽이 전체 웹 트래픽의 51%를 넘겼어요. 인터넷 역사상 처음이에요.문제는 대부분의 서버와 API가 여전히 사람 트래픽 기준으로 설계되어 있다는 거..

AI 개발 2026.04.20

Spec-Driven Development — Vibe Coding 다음 단계, AI 에이전트 개발 방법론

Claude Code, Cursor, Copilot 다 있어요. 근데 왜 아직도 버그가 나고 코드가 망가질까요.개발자: "알림 시스템 추가해줘"에이전트: 토스트 메시지 컴포넌트 생성개발자: "아니, 백엔드 알림이 필요해"에이전트: 이메일 알림 서비스 생성개발자: "SMS도 지원해야 해"에이전트: SMS 프로바이더 추가개발자: "재시도 로직은?"에이전트: 지수 백오프 추가...10번의 반복...→ 처음 의도와 다른 코드베이스→ 일관성 없는 패턴→ 아무도 전체를 이해 못 함이게 Vibe Coding의 한계예요. 500줄 넘어가면 무너지기 시작해요.Spec-Driven Development가 뭔가Vibe Coding:아이디어 → 프롬프트 → 코드 → 문제 → 재프롬프트 → ...Spec-Driven Devel..

AI 개발 2026.04.17

Claude Opus 4.7 출시 — SWE-bench Pro 1위, GPT-5.4 완전히 제쳤다

2026년 4월 17일 오늘, Anthropic이 Claude Opus 4.7을 공식 출시했어요.예고된 대로 나왔고, 개발자들이 기다리던 업그레이드가 맞아요.한 줄 요약:코딩 에이전트 벤치마크에서 GPT-5.4와 Gemini 3.1 Pro를 제쳤어요.가격은 Opus 4.6과 동일. ($5/$25 per M tokens)벤치마크 비교SWE-bench Pro (실제 GitHub 이슈 해결):Opus 4.7: 64.3% ← 1위GPT-5.4: 57.7%Gemini 3.1: 54.2%Opus 4.6: 53.4%→ Opus 4.6 대비 +11%p, GPT-5.4보다 +6.6%pSWE-bench Verified:Opus 4.7: 87.6%Gemini 3.1: 80.6..

LLM 2026.04.17

OpenAI Codex 대규모 업데이트 — 컴퓨터를 대신 써주는 AI 코딩 도구

2026년 4월 16일, OpenAI가 Codex 데스크탑 앱을 완전히 뒤집었어요.기존 Codex:코드 작성, 디버깅, 리팩토링→ 채팅 인터페이스 안에서만 동작새로운 Codex:내 맥북 앱 전체를 직접 조작→ 보고, 클릭하고, 타이핑→ 내가 다른 작업하는 동안 백그라운드에서 동시에TechCrunch가 직접 이렇게 썼어요."OpenAI와 Anthropic 사이에 저강도 전쟁이 있다.지금까지는 Anthropic이 이기고 있었다.이번 업데이트는 OpenAI의 반격이다."핵심 1 — 백그라운드 컴퓨터 사용Codex가 맥OS 앱을 직접 조작해요. 내가 일하는 동안 백그라운드에서.작동 방식:1. Codex에게 지시: "Figma에서 이 컴포넌트 수정하고 Slack에 결과 보고해줘"2. Codex가 별도 커서로 Fi..

AI 개발 2026.04.17

AI 코딩 툴 보안 실전 — Claude Code 소스 유출 이후 달라진 공격 지형

2026년 3월 31일, Claude Code 소스코드가 npm에 실수로 노출됐어요.유출 규모:→ 51만 2천 줄 TypeScript→ 1,906개 파일→ 24시간 만에 GitHub 포크 41,500개공격자들의 반응 속도:→ 유출 24시간 이내: 악성 "leaked Claude Code" GitHub 레포 등장→ 구글 검색 상위에 악성 레포 노출→ 25개 이상 소프트웨어 브랜드 사칭 캠페인 즉시 시작근데 이건 시작에 불과해요. 진짜 문제는 공격자들이 이제 Claude Code의 내부 동작 원리를 알게 됐다는 거예요.공격 유형 1 — Slopsquatting (슬롭스쿼팅)AI가 환각으로 만든 패키지명을 공격자가 선점하는 공격이에요.어떻게 작동하나:1. 연구자들이 LLM에게 576,000개 코드 샘플 생성 ..

AI 개발 2026.04.16

AI 수익의 74%를 상위 20% 기업이 독식한다 — PwC 2026 AI 성과 연구

2026년 4월 13일, PwC가 충격적인 보고서를 냈어요.전 세계 25개 산업, 1,217명 임원 대상 조사 결과:AI가 만들어내는 경제적 가치의 74%→ 상위 20% 기업이 가져감나머지 80% 기업이 나눠갖는 건 26%AI에 다들 투자하는데, 돈 버는 곳은 극소수예요.왜 이렇게 차이가 나는가직관적으로는 이렇게 생각해요."상위 20%는 돈이 많아서""더 좋은 모델 접근권이 있어서""AI 전문가를 더 많이 고용해서"PwC 데이터는 다른 이유를 지목해요.상위 20%와 나머지 80%의 차이:나머지 80%:→ AI로 비용 절감→ AI로 업무 효율화→ 파일럿 프로젝트 계속 진행→ "AI로 기존 일을 더 빠르게"상위 20%:→ AI로 새로운 수익 창출→ AI로 비즈니스 모델 재발명→ 산업 경계를 넘어 새 시장 진..

AI 개발 2026.04.16

Stanford AI Index 2026 핵심 요약

매년 스탠퍼드 HAI(인간중심 AI 연구소)가 내놓는 AI 연간 보고서. 423페이지, 마케팅 없는 독립 데이터. 2026년판이 4월 13일 공개됐어요.AI 랩들이 만드는 보고서가 아니라는 게 포인트예요. 가장 믿을 수 있는 AI 현황 데이터예요.1. AI는 멈추지 않았다2025년 내내 "AI 성능 정체" 얘기가 많았어요. 데이터는 반대예요.SWE-bench Verified (실제 GitHub 이슈 해결):2024년: 60%2025년: ~100%→ 1년 만에 인간 수준 달성Humanity's Last Exam (박사급 전문가 문제):2025년: 8.8%2026년: 38.3%2026년 4월 기준 (Opus 4.6, Gemini 3.1 Pro): 50%+수학 올림피아드:Gemini Deep Think → 금..

AI 개발 2026.04.16

Anthropic Claude Opus 4.7 + AI 디자인 툴 이번주 출시 예정 — Figma, Wix 주가 폭락한 이유

2026년 4월 14일, The Information이 단독 보도를 냈어요."Anthropic이 이번 주 두 가지를 출시할 예정:1. Claude Opus 4.72. 웹사이트/프레젠테이션 생성 AI 디자인 툴"보도 직후 시장이 즉각 반응했어요.Figma: -6.0%Wix: -4.8%Adobe: -2.7%GoDaddy: -4.4%단 한 건의 미확인 단독 보도에 이 정도 반응.→ 시장은 이미 이 움직임을 예상하고 있었다는 뜻Claude Opus 4.7 — 뭐가 달라지나Opus 4.6이 2026년 2월 출시됐어요. 2개월 만에 4.7이에요.Opus 4.6 주요 스펙:- 1M 토큰 컨텍스트 윈도우 (베타)- SWE-bench Verified: 80%+- Terminal-Bench 2.0: 65.4..

LLM 2026.04.16

Anthropic Claude Code Routines 출시 — PR 리뷰, 배포 검증, 문서 관리 완전 자동화

2026년 4월 14일, Anthropic이 조용하게 큰 걸 내놨어요.기존 Claude Code:터미널 열고 → 프롬프트 입력 → 결과 확인→ 사람이 앉아있어야 함Claude Code Routines:한번 설정 → 자동 실행→ 노트북 꺼도 Anthropic 서버에서 계속 돌아감단순한 편의 기능이 아니에요. AI 코딩 도구가 대화 상대에서 자율 실행 에이전트로 바뀌는 전환점이에요.Routines가 뭔가Routine = 프롬프트 + 레포지토리 + 커넥터 + 트리거한번 설정해두면:- 매일 밤 2시에 실행- API 호출 받으면 실행- PR 올라오면 자동 실행→ Anthropic 클라우드 인프라에서 실행→ 내 노트북 상태와 무관3가지 트리거 타입1. 스케줄 트리거# CLI에서 설정/schedule 매일 밤 2시에..

AI 개발 2026.04.16

RAG 청킹 전략 완전 정리

RAG 시스템이 엉터리 답변을 내놓을 때 대부분 이렇게 생각해요."임베딩 모델 바꿔볼까?""프롬프트 더 정교하게 써야겠다""LLM을 더 좋은 걸로 바꾸면 되겠지"근데 실제로 RAG 실패의 80%는 청킹 문제예요.잘못 자른 청크가 들어가면 아무리 좋은 LLM도 엉터리 답변을 낼 수밖에 없어요.청킹이 뭔가RAG는 문서를 통째로 넣을 수 없어요. 임베딩 모델의 입력 한계가 있고, 벡터 검색 정확도도 떨어져요.원문 (10,000 토큰):"회사 규정 전체 문서..."청킹:청크 1: "출근 시간은 오전 9시..." (512토큰)청크 2: "연차 사용 규정은..." (512토큰)청크 3: "복리후생 제도는..." (512토큰)...질문: "연차 며칠이야?"→ 청크 2만 검색됨→ 관련 내용만 LLM에 전달→ 정확한 답..

RAG 2026.04.16

CELL AI DEVLOG

전체 글 356

티스토리툴바

« 2026/06 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30