'2026/05/21 글 목록

Policy-as-Code 실전 — AI가 짠 코드도 에이전트 행동도 자동으로 검사하는 법

AI가 Terraform 코드 뽑아줬는데, S3 버킷이 퍼블릭으로 열려있어도 아무도 몰랐던 경험 있으시죠?핵심 요약→ AI 코딩툴 속도 ↑ → 배포 빈도 ↑ → 수동 보안 리뷰 병목 → 자동화 필수→ OWASP Agentic App Top 10 (2026): Agent Goal Hijacking이 최대 리스크 1위→ Policy-as-Code: 보안·컴플라이언스 규칙을 Rego 코드로 → CI/CD에서 자동 차단→ OPA (Open Policy Agent): Netflix·Goldman Sachs·Pinterest 프로덕션 사용 중→ 용도 1: AI 생성 Terraform 코드 → 배포 전 정책 검사 → 위반 시 PR 차단→ 용도 2: AI 에이전트 툴 호출 → OPA가 허용/거부 결정 → 에이전트가 못..

AI 개발 2026.05.21

AI 에이전트 Durable Execution 실전 2편 — Human-in-the-Loop·멀티에이전트·Serverless

1편에서 기본 Workflow/Activity 구조를 잡았다면, 2편은 프로덕션에서 실제로 필요한 고급 패턴입니다.핵심 요약→ Signal: 실행 중 워크플로우에 외부에서 이벤트 주입 — 인간 승인 대기 구현→ wait_condition: 조건 충족 전까지 컴퓨팅 자원 0 소비하며 무한 대기→ 승인 대기 중 서버 죽어도 → 재시작 후 대기 상태 그대로 복구→ Child Workflow: 서브에이전트를 독립 워크플로우로 분리 → 병렬 실행→ asyncio.gather로 여러 Child Workflow 동시 시작 → 전체 완료까지 대기→ Workflow Streams (Replay 2026): LLM 토큰 스트리밍을 Durable하게 처리→ Serverless Workers (Replay 2026): AWS..

AI Agent 2026.05.21

AI 에이전트 Durable Execution 실전 1편 — 에이전트가 죽어도 이어지는 워크플로우 설계

LLM 20번 호출하다 17번째에서 서버 죽으면? 처음부터 다시? 그 돈 다 날리는 거 맞습니다.핵심 요약→ Temporal Replay 2026 (5월): Netflix·NVIDIA·Stripe·Cursor 모두 사용 중, 고객 3,000+→ 핵심 문제: 에이전트 47단계 중 실패 → 1단계부터 재시작 → 토큰 비용 폭탄→ Durable Execution: 각 단계를 Event History에 저장 → 실패 지점부터 자동 재개→ 핵심 규칙: Workflow = 결정론적 오케스트레이터 / Activity = 비결정론적 실제 작업→ LLM 호출·툴 실행·API 요청 → 전부 Activity에 넣어야 함→ Workflow 안에서 random, datetime.now(), 직접 API 호출 금지→ Activi..

AI Agent 2026.05.21

OpenTelemetry로 LLM 모니터링 — 블랙박스 에이전트를 투명하게 만드는 법

Kubernetes 파드엔 대시보드 있고, DB엔 슬로우 쿼리 로그 있는데, LLM은 블랙박스죠? 그 시대가 끝났습니다.핵심 요약→ OTel GenAI Semantic Convention 2026년 표준화 — LLM 트레이싱 공식 규격 등장→ gen_ai.* 속성으로 모델명·토큰 수·비용·레이턴시 전부 추적 가능→ Datadog v1.37, Grafana 모두 native 지원 시작 — 벤더 종속 없이 계측 1회→ 일반 APM의 한계: 결정론적 코드 가정 → LLM 비결정성·토큰 과금 구조와 충돌→ 에이전트 트레이싱: LLM 호출 → 툴 실행 → 검색 → 응답 전 과정이 단일 트레이스→ 핵심 메트릭 3가지: gen_ai.client.operation.duration / token.usage / 오류율→ ..

AI Agent 2026.05.21

AI 에이전트 품질 관리 전략 — 프로덕션 킬러 1위가 품질인 이유

에이전트 만들었는데 데모에선 완벽하고 프로덕션에선 이상하게 돌아가는 경험, 다들 있으시죠?핵심 요약→ LangChain 2026: 프로덕션 에이전트 팀의 32%가 품질을 최대 장벽으로 꼽음→ 63%의 에이전트가 복잡한 다단계 태스크에서 실패 — 데모는 통과해도→ 에이전트 평가 ≠ 일반 LLM 평가 — 비결정성·도구 체인·궤적이 핵심→ 3계층 평가: L1 결과(맞냐?) → L2 도구 호출(올바른 툴?) → L3 궤적(효율적?)→ LLM-as-Judge: 인간 평가자와 85% 일치 — 인간끼리 일치율보다 높음→ CLEAR 프레임워크: Cost·Latency·Effectiveness·Accuracy·Reliability 5축 평가→ 황금 케이스 50~100개 수작업 → 프로덕션 트레이스 500개+ 확보 필수→..

AI Agent 2026.05.21

LLM 에이전트 Capacity Engineering — 프로덕션 오류의 1/3이 rate limit인 이유

에이전트 배포했더니 툭하면 429 터지고, backoff 넣었더니 오히려 더 심해진 경험 있으시죠?핵심 요약→ 2026년 3월 Datadog 분석: LLM 오류의 1/3이 rate limit (840만 건)→ Exponential Backoff는 단일 요청엔 유효, 시스템 전체엔 무력→ 에이전트는 호출 10~20개를 연속으로 쏨 → 기존 REST 인프라로 감당 불가→ Token Bucket: 요청 수가 아닌 '토큰 수' 기준으로 속도 제어→ Priority Lane: 사용자 응답(P0) / API(P1) / 배치(P2) 분리 필수→ Circuit Breaker: 429 임계치 초과시 즉시 차단, 빠른 복구→ Load Shedding: 한도 초과 시 낮은 우선순위 요청 드롭→ 핵심 원칙: Reactive(..

AI Agent 2026.05.21

Claude Code 고급 워크플로우 — Anthropic 엔지니어가 실제로 쓰는 CLAUDE.md·Hooks·병렬 에이전트·Skills 완전 가이드

[핵심 요약]→ Boris Cherny (Claude Code 제품 리드): 10~15 병렬 세션 — 터미널 5개 + claude.ai/code 5~10개 + iPhone→ 핵심 원칙: CLAUDE.md(헌법) + Hooks(결정론적 자동화) + Skills(재사용) + Subagents(컨텍스트 격리)→ Git Worktree: 2026년 2월 20일 CLI 지원 — 병렬 에이전트의 인프라 기반→ 컨텍스트 관리: 50%에서 /compact / 태스크 전환 시 /clear / Plan→Execute→Verify 사이클→ v2.1.101 (2026년 4월 11일): 커스텀 슬래시 명령이 Skills로 통합→ v2.1.142 (2026년 5월 15일): 현재 최신, Agent View, /goal 추가→ 설..

AI 개발 2026.05.21

Docker 기본 - 기본 명령어 정리 치트시트

자주 쓰는 것, 알아두면 좋은 것, 실무에서 많이 찾는 것 전부 정리📊 1. 리소스 모니터링# 전체 컨테이너 실시간 모니터링docker stats# 특정 컨테이너만docker stats # 한 번만 출력하고 종료 (실시간 X)docker stats --no-stream# 커스텀 포맷 출력docker stats --format "table {{.Name}}\t{{.CPUPerc}}\t{{.MemUsage}}\t{{.MemPerc}}"# CPU limit 확인 (stats에는 없음, inspect로 봐야 함)docker inspect | grep -E "NanoCpus|CpuShares|CpuQuota"# 전체 컨테이너 limit 한 번에 확인docker inspect $(docker ps -q) \ ..

카테고리 없음 2026.05.21

Docker 기본 - 리소스 제한 완전 정복

컨테이너 생성 시 CPU·메모리·GPU·디스크·네트워크·프로세스 등 모든 리소스 제한 옵션 총정리1. CPU 제한--cpus — CPU 코어 수 제한 (가장 많이 씀)docker run --cpus="4" 물리 코어 수와 관계없이 논리적으로 사용할 코어 수를 제한--cpus="1.5" → 1.5개 코어 분량 사용 가능docker stats에서 최대 400%(4코어)까지 올라감--cpu-shares — CPU 가중치 (상대적 우선순위)docker run --cpu-shares=512 기본값: 1024절대 제한이 아닌 상대적 비율 — CPU 경합 시 우선순위 결정1024 : 512 = 2:1 비율로 CPU 분배CPU가 여유 있을 때는 제한 없이 다 씀--cpu-period + --cpu-quota — CFS..

카테고리 없음 2026.05.21

Docker 기본 - 용량 완전 정복

컨테이너·이미지·볼륨·빌드캐시가 디스크를 어떻게 차지하는지, 어떻게 확인하고 줄이는지 전부 정리1. 도커 전체 디스크 사용량 한눈에 보기# 요약 보기docker system df# 상세 보기 (항목별 전부)docker system df -v출력 예시TYPE TOTAL ACTIVE SIZE RECLAIMABLEImages 12 3 18.5GB 14.2GB (76%)Containers 5 2 1.2GB 800MB (66%)Local Volumes 8 3 45GB 30GB (66%)Build Cache - - 3.1GB 3.1GB..

카테고리 없음 2026.05.21

CELL AI DEVLOG

2026/05/21 17

티스토리툴바

« 2026/05 »
일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31