TurboQuant 소개 글은 이미 나왔습니다. 이 글은 그 다음 단계입니다. 알고리즘 내부 구조, 기존 KV 캐시 압축 기법과의 정확한 비교, 그리고 공식 코드 전에 커뮤니티 구현체로 지금 당장 프로덕션에 배포하는 방법까지 다룹니다.[핵심 요약 — 심화편]→ TurboQuant = PolarQuant(키 압축) + QJL(값 압축) 두 알고리즘의 조합→ PolarQuant: 키 벡터를 크기(scalar) + 방향(unit hypersphere)으로 분해 후 압축→ QJL: Johnson-Lindenstrauss 변환 기반 값 벡터 압축→ 핵심 혁신: Randomized Hadamard Transform으로 이상치 분포 제거 후 압축→ 압축 비트: TQ3(3bit, 6배) / TQ4(4bit, 3.8배)..