'분류 전체보기' 카테고리의 글 목록 (37 Page)

본문 바로가기

분류 전체보기

Anthropic Claude Opus 4.7 + AI 디자인 툴 이번주 출시 예정 — Figma, Wix 주가 폭락한 이유 2026년 4월 14일, The Information이 단독 보도를 냈어요."Anthropic이 이번 주 두 가지를 출시할 예정:1. Claude Opus 4.72. 웹사이트/프레젠테이션 생성 AI 디자인 툴"보도 직후 시장이 즉각 반응했어요.Figma: -6.0%Wix: -4.8%Adobe: -2.7%GoDaddy: -4.4%단 한 건의 미확인 단독 보도에 이 정도 반응.→ 시장은 이미 이 움직임을 예상하고 있었다는 뜻Claude Opus 4.7 — 뭐가 달라지나Opus 4.6이 2026년 2월 출시됐어요. 2개월 만에 4.7이에요.Opus 4.6 주요 스펙:- 1M 토큰 컨텍스트 윈도우 (베타)- SWE-bench Verified: 80%+- Terminal-Bench 2.0: 65.4.. 더보기

Anthropic Claude Code Routines 출시 — PR 리뷰, 배포 검증, 문서 관리 완전 자동화 2026년 4월 14일, Anthropic이 조용하게 큰 걸 내놨어요.기존 Claude Code:터미널 열고 → 프롬프트 입력 → 결과 확인→ 사람이 앉아있어야 함Claude Code Routines:한번 설정 → 자동 실행→ 노트북 꺼도 Anthropic 서버에서 계속 돌아감단순한 편의 기능이 아니에요. AI 코딩 도구가 대화 상대에서 자율 실행 에이전트로 바뀌는 전환점이에요.Routines가 뭔가Routine = 프롬프트 + 레포지토리 + 커넥터 + 트리거한번 설정해두면:- 매일 밤 2시에 실행- API 호출 받으면 실행- PR 올라오면 자동 실행→ Anthropic 클라우드 인프라에서 실행→ 내 노트북 상태와 무관3가지 트리거 타입1. 스케줄 트리거# CLI에서 설정/schedule 매일 밤 2시에.. 더보기

RAG 청킹 전략 완전 정리 RAG 시스템이 엉터리 답변을 내놓을 때 대부분 이렇게 생각해요."임베딩 모델 바꿔볼까?""프롬프트 더 정교하게 써야겠다""LLM을 더 좋은 걸로 바꾸면 되겠지"근데 실제로 RAG 실패의 80%는 청킹 문제예요.잘못 자른 청크가 들어가면 아무리 좋은 LLM도 엉터리 답변을 낼 수밖에 없어요.청킹이 뭔가RAG는 문서를 통째로 넣을 수 없어요. 임베딩 모델의 입력 한계가 있고, 벡터 검색 정확도도 떨어져요.원문 (10,000 토큰):"회사 규정 전체 문서..."청킹:청크 1: "출근 시간은 오전 9시..." (512토큰)청크 2: "연차 사용 규정은..." (512토큰)청크 3: "복리후생 제도는..." (512토큰)...질문: "연차 며칠이야?"→ 청크 2만 검색됨→ 관련 내용만 LLM에 전달→ 정확한 답.. 더보기

LLM 모델 라우팅 완전 가이드 — 분류기, 캐스케이딩, 시맨틱 캐시 실전 LLM을 프로덕션에 올리면 첫 달 청구서가 이렇게 나와요.예상: $300/월실제: $2,400/월원인 분석해보면 이래요.고객: "배송 얼마나 걸려요?"→ Claude Opus 4.6 응답 ($0.015/1K토큰)고객: "안녕하세요"→ Claude Opus 4.6 응답 ($0.015/1K토큰)고객: "취소 어떻게 해요?"→ Claude Opus 4.6 응답 ($0.015/1K토큰)모든 요청에 제일 비싼 모델을 쓰고 있어요.모델별 비용 현실2026년 4월 기준 (Anthropic):Claude Haiku 4.5:입력 $1/M토큰 | 출력 $5/M토큰→ 빠름, 저렴, 단순 작업에 충분Claude Sonnet 4.6:입력 $3/M토큰 | 출력 $15/M토큰→ 중간, 대부분 작업에 적합Claude Opus 4.6.. 더보기

AI 에이전트 옵저버빌리티 완전 가이드 — 에이전트가 뭘 하는지 추적하는 법 AI 에이전트를 프로덕션에 배포하면 이런 일이 생겨요.새벽 3시 알람:"월간 LLM 비용 $2,000 초과"원인 파악 시도:- 로그 확인 → "에러 없음"- API 응답 확인 → "200 OK"- 에이전트 출력 확인 → "정상처럼 보임"실제 원인:에이전트가 무한 루프에 빠져서매 반복마다 더 긴 컨텍스트로 LLM 호출→ 2시간 동안 아무도 몰랐음기존 모니터링으로는 에이전트를 감시할 수 없어요. 에이전트 전용 옵저버빌리티가 필요해요.왜 기존 모니터링으로 부족한가기존 APM(Application Performance Monitoring)이 답하는 질문:✅ 서버 살아있나?✅ 응답 시간 얼마나 걸렸나?✅ 에러 발생했나?에이전트에서 필요한 질문:❌ 에이전트가 왜 이 결정을 내렸나?❌ 어느 툴 호출이 잘못됐나?❌ 어.. 더보기

CLAUDE.md 잘 쓰는 법 — 세션마다 시니어 개발자를 고용하는 효과 Claude Code를 처음 쓰면 이런 일이 반복돼요.세션 1: "우리 프로젝트는 TypeScript 씁니다"세션 2: 또 "TypeScript 써요"세션 3: 또또 "TypeScript요..."Claude Code는 매 세션마다 기억을 초기화하고 시작해요.아무것도 모르는 신입이 매일 아침 처음 출근하는 것과 같아요.CLAUDE.md는 이걸 해결해요. 매 세션 시작 때 자동으로 읽히는 파일이에요.CLAUDE.md가 뭔가.├── src/├── package.json└── CLAUDE.md ← 여기프로젝트 루트에 놓으면 Claude Code가 세션 시작마다 자동으로 읽어요.신입 개발자에게 주는 온보딩 문서라고 생각하면 돼요. 단, 이 신입은 매일 아침 기억을 지우고 출근해요. 그래서 CLAUDE.md에.. 더보기

AI가 짠 코드 43%가 프로덕션에서 터진다 — Lightrun 200개 기업 조사 2026년 4월 14일, AI 코딩 붐에 찬물을 끼얹는 보고서가 나왔습니다.Lightrun이 미국, 영국, EU 대기업의 SRE와 DevOps 리더 200명을 대상으로 조사한 결과예요.핵심 수치:AI 생성 코드 변경의 43% →QA와 스테이징 통과 후에도 프로덕션에서 디버깅 필요"AI를 믿고 배포할 수 있다"고 답한 엔지니어링 리더: 0%숫자로 보는 현실88%:AI 생성 수정사항이 실제로 작동하는지 확인하는 데수동 재배포 2~3회 필요43%:QA/스테이징 통과했는데 프로덕션에서 디버깅 필요38%:개발자가 매주 디버깅, 검증, 트러블슈팅에 쓰는 시간(주 2일 낭비)97%:"AI SRE가 프로덕션에서 실제 무슨 일이 일어나는지제대로 보지 못한다"고 답한 엔지니어링 리더0%:"AI 생성 코드가 배포 후 올바르.. 더보기

SGLang B300 GPU (SM103)에서 Qwen3.5 서빙 — Attention Backend B300 GPU에서 SGLang으로 Qwen3.5를 서빙하면서 어텐션 백엔드 설정을 이것저것 해봤습니다.환경GPU: NVIDIA B300 (SM103, Blackwell 계열)모델: Qwen3.5-4B (head_dim=256)프레임워크: SGLang (CUDA 12.9+)1차 시도 — FA4 + trtllm_mha--prefill-attention-backend fa4 \--attention-backend trtllm_mha에러:AssertionError: (head_dim, head_dim_v)=(256, 256) is not supported on SM100/SM110.head_dim must be between 8 and 128FA4는 head_dim 128까지만 지원해요. Qwen3.5는 256.. 더보기

이전 1 ··· 34 35 36 37 38 39 40 ··· 46 다음

티스토리툴바