본문 바로가기

반응형

전체 글

(172)
Anthropic Claude Code Routines 출시 — PR 리뷰, 배포 검증, 문서 관리 완전 자동화 2026년 4월 14일, Anthropic이 조용하게 큰 걸 내놨어요.기존 Claude Code:터미널 열고 → 프롬프트 입력 → 결과 확인→ 사람이 앉아있어야 함Claude Code Routines:한번 설정 → 자동 실행→ 노트북 꺼도 Anthropic 서버에서 계속 돌아감단순한 편의 기능이 아니에요. AI 코딩 도구가 대화 상대에서 자율 실행 에이전트로 바뀌는 전환점이에요.Routines가 뭔가Routine = 프롬프트 + 레포지토리 + 커넥터 + 트리거한번 설정해두면:- 매일 밤 2시에 실행- API 호출 받으면 실행- PR 올라오면 자동 실행→ Anthropic 클라우드 인프라에서 실행→ 내 노트북 상태와 무관3가지 트리거 타입1. 스케줄 트리거# CLI에서 설정/schedule 매일 밤 2시에..
RAG 청킹 전략 완전 정리 RAG 시스템이 엉터리 답변을 내놓을 때 대부분 이렇게 생각해요."임베딩 모델 바꿔볼까?""프롬프트 더 정교하게 써야겠다""LLM을 더 좋은 걸로 바꾸면 되겠지"근데 실제로 RAG 실패의 80%는 청킹 문제예요.잘못 자른 청크가 들어가면 아무리 좋은 LLM도 엉터리 답변을 낼 수밖에 없어요.청킹이 뭔가RAG는 문서를 통째로 넣을 수 없어요. 임베딩 모델의 입력 한계가 있고, 벡터 검색 정확도도 떨어져요.원문 (10,000 토큰):"회사 규정 전체 문서..."청킹:청크 1: "출근 시간은 오전 9시..." (512토큰)청크 2: "연차 사용 규정은..." (512토큰)청크 3: "복리후생 제도는..." (512토큰)...질문: "연차 며칠이야?"→ 청크 2만 검색됨→ 관련 내용만 LLM에 전달→ 정확한 답..
LLM 모델 라우팅 완전 가이드 — 분류기, 캐스케이딩, 시맨틱 캐시 실전 LLM을 프로덕션에 올리면 첫 달 청구서가 이렇게 나와요.예상: $300/월실제: $2,400/월원인 분석해보면 이래요.고객: "배송 얼마나 걸려요?"→ Claude Opus 4.6 응답 ($0.015/1K토큰)고객: "안녕하세요"→ Claude Opus 4.6 응답 ($0.015/1K토큰)고객: "취소 어떻게 해요?"→ Claude Opus 4.6 응답 ($0.015/1K토큰)모든 요청에 제일 비싼 모델을 쓰고 있어요.모델별 비용 현실2026년 4월 기준 (Anthropic):Claude Haiku 4.5:입력 $1/M토큰 | 출력 $5/M토큰→ 빠름, 저렴, 단순 작업에 충분Claude Sonnet 4.6:입력 $3/M토큰 | 출력 $15/M토큰→ 중간, 대부분 작업에 적합Claude Opus 4.6..
AI 에이전트 옵저버빌리티 완전 가이드 — 에이전트가 뭘 하는지 추적하는 법 AI 에이전트를 프로덕션에 배포하면 이런 일이 생겨요.새벽 3시 알람:"월간 LLM 비용 $2,000 초과"원인 파악 시도:- 로그 확인 → "에러 없음"- API 응답 확인 → "200 OK"- 에이전트 출력 확인 → "정상처럼 보임"실제 원인:에이전트가 무한 루프에 빠져서매 반복마다 더 긴 컨텍스트로 LLM 호출→ 2시간 동안 아무도 몰랐음기존 모니터링으로는 에이전트를 감시할 수 없어요. 에이전트 전용 옵저버빌리티가 필요해요.왜 기존 모니터링으로 부족한가기존 APM(Application Performance Monitoring)이 답하는 질문:✅ 서버 살아있나?✅ 응답 시간 얼마나 걸렸나?✅ 에러 발생했나?에이전트에서 필요한 질문:❌ 에이전트가 왜 이 결정을 내렸나?❌ 어느 툴 호출이 잘못됐나?❌ 어..
Claude Code Agent Teams 실전 가이드 — 병렬 에이전트 설정부터 실전 시나리오까지 2026년 2월, Claude Opus 4.6과 함께 Agent Teams가 출시됐어요.기존:Claude Code 1개 → 순서대로 처리API 레이어 → DB 레이어 → 테스트 → 문서화(순차 실행)Agent Teams:Claude Code 여러 개 → 동시에 처리Agent 1: API 레이어Agent 2: DB 레이어 → 동시 실행Agent 3: 테스트 작성Agent 4: 코드 리뷰단순히 여러 창을 띄우는 게 아니에요. 에이전트들이 서로 소통하고 조율해요.Agent Teams vs Subagents — 뭐가 다른가헷갈리기 쉬운 개념이에요.Subagents:→ 메인 세션이 작업 위임→ 서브에이전트는 결과만 보고→ 서브에이전트끼리 직접 소통 불가→ 단순 병렬 처리Agent Teams:→ 에이전트..
Claude Code로 레거시 코드 리팩토링하기 — 실전 워크플로우 레거시 코드베이스가 있어요.- 500줄짜리 함수- 테스트 없음- 작성자 퇴사- 아무도 건드리기 싫어함Claude Code의 100만 토큰 컨텍스트 윈도우로 이 문제를 어떻게 해결하는지 정리합니다.왜 레거시 리팩토링이 어려운가문제 1: 코드를 이해하는 데 시간이 너무 걸림 → 500줄 함수 읽고 로직 파악하는 데 하루문제 2: 테스트가 없어서 건드리기 무서움 → 뭘 고쳐도 다른 게 터질 것 같음문제 3: 한 번에 다 고치려다 폭발 → 완전 재작성 시도 → 3개월 후 포기Claude Code로 이 세 가지를 순서대로 해결해요.1단계 — 코드 이해 (탐색)리팩토링 전에 Claude Code가 코드를 먼저 분석하게 해요.> 이 레포지토리의 전체 구조를 분석해줘. 핵심 모듈, 의존성, 코드 스멜을 파..
CLAUDE.md 잘 쓰는 법 — 세션마다 시니어 개발자를 고용하는 효과 Claude Code를 처음 쓰면 이런 일이 반복돼요.세션 1: "우리 프로젝트는 TypeScript 씁니다"세션 2: 또 "TypeScript 써요"세션 3: 또또 "TypeScript요..."Claude Code는 매 세션마다 기억을 초기화하고 시작해요.아무것도 모르는 신입이 매일 아침 처음 출근하는 것과 같아요.CLAUDE.md는 이걸 해결해요. 매 세션 시작 때 자동으로 읽히는 파일이에요.CLAUDE.md가 뭔가.├── src/├── package.json└── CLAUDE.md ← 여기프로젝트 루트에 놓으면 Claude Code가 세션 시작마다 자동으로 읽어요.신입 개발자에게 주는 온보딩 문서라고 생각하면 돼요. 단, 이 신입은 매일 아침 기억을 지우고 출근해요. 그래서 CLAUDE.md에..
Claude Code 한도 자꾸 걸리는 이유와 요금제 선택 가이드 2026 Claude Code를 처음 써보려는 개발자들이 공통으로 겪는 일이 있어요."오 Claude Code $20/월이네. 써볼까?"→ 가입→ 하루 이틀 쓰다가→ 한도 초과→ "????"2026년 4월 기준으로 Claude Code 요금 구조를 완전히 정리합니다.요금제 구조Pro: $20/월Max 5x: $100/월 ← 실제 전문 개발자 진입점Max 20x: $200/월Team Premium: $100/시트/월 (최소 5시트)Enterprise: 협의주의: Free 플랜은 Claude Code 미포함$20 Pro 플랜의 현실공식 홍보는 $20/월이에요. 근데 커뮤니티 반응이 다릅니다."Pro 플랜은 하루 2~3시간 쓰면 한도 초과""큰 코드베이스에서 plan mode 3번이면 5시간 한..

반응형