에이전트 배포했더니 툭하면 429 터지고, backoff 넣었더니 오히려 더 심해진 경험 있으시죠?핵심 요약→ 2026년 3월 Datadog 분석: LLM 오류의 1/3이 rate limit (840만 건)→ Exponential Backoff는 단일 요청엔 유효, 시스템 전체엔 무력→ 에이전트는 호출 10~20개를 연속으로 쏨 → 기존 REST 인프라로 감당 불가→ Token Bucket: 요청 수가 아닌 '토큰 수' 기준으로 속도 제어→ Priority Lane: 사용자 응답(P0) / API(P1) / 배치(P2) 분리 필수→ Circuit Breaker: 429 임계치 초과시 즉시 차단, 빠른 복구→ Load Shedding: 한도 초과 시 낮은 우선순위 요청 드롭→ 핵심 원칙: Reactive(..