반응형

Kimi K2.6 4

Kimi K2.6 API 실전 가이드 2편 — Thinking 모드, preserve_thinking, 함수 호출, 프리픽스 캐싱 완전정리

K2.6 아키텍처와 벤치마크를 알았으니 이제 실제로 씁니다. API 키 발급부터 Thinking 모드, 함수 호출, 프리픽스 캐싱 최적화까지 — 코드 그대로 쓸 수 있게 정리합니다.핵심 요약→ 엔드포인트: https://api.moonshot.ai/v1 — OpenAI SDK 완전 호환→ 모델 ID: kimi-k2.6 (Instant), kimi-k2.6-thinking (Thinking 모드)→ 기존 K2/K2.5 시리즈는 2026년 5월 25일 종료 — 신규 프로젝트는 K2.6 직접 사용→ Thinking 모드: temperature 고정 1.0, reasoning_content 스트리밍→ preserve_thinking: 멀티턴에서 추론 맥락 유지 — 기본값 off, 에이전트 루프에 필수→ 함수 호..

LLM 2026.06.01

Kimi K2.6 완전분석 1편 — 1조 파라미터 MoE 아키텍처, Agent Swarm 300개, 벤치마크 실체

오픈소스 모델이 클로즈드 API에 정면으로 도전한 적이 있었나요? Kimi K2.6는 그냥 도전이 아닙니다. SWE-bench Pro 58.6%로 GPT-5.4를 넘고, Claude Opus 4.6와 0.6포인트 차이입니다. 가격은 80% 저렴하고, 가중치는 공개되어 있습니다.그리고 Cerebras가 이 모델을 초당 981 토큰으로 돌렸습니다.무슨 일이 일어나고 있는지 처음부터 정리합니다.핵심 요약→ 출시: 2026년 4월 20일, Moonshot AI (베이징), Modified MIT 라이선스→ 아키텍처: MoE 1조 파라미터 / 토큰당 활성 32B — "1T 품질, 32B 비용"→ 전문가 구성: 384개 전문가, 토큰마다 8개 선택 + 공유 전문가 1개→ 컨텍스트: 256K (262,144 토큰),..

LLM 2026.06.01

중국 오픈소스 코딩 모델 17일 대공세 — GLM-5.1·MiniMax M2.7·Kimi K2.6·DeepSeek V4 완전 비교

2026년 4월, 중국 AI 랩 4곳이 17일 만에 오픈소스 코딩 모델을 연달아 출시했습니다. 가격은 Claude Opus 4.7의 25~250분의 1. 성능은 프론티어 수준.핵심 요약 → 2026년 4월 7~24일, 17일 간격으로 GLM-5.1·MiniMax M2.7·Kimi K2.6·DeepSeek V4 연속 출시 → 4개 모델 모두 MIT 또는 Modified MIT 라이선스 — 상업적 사용 가능 → GLM-5.1: SWE-Bench Pro 58.4% (GPT-5.4·Claude Opus 4.6 추월), 8시간 자율 실행 지원 → MiniMax M2.7: "자기 자신을 스스로 개선"한 최초 모델, $0.30/1M input → Kimi K2.6: Artificial Analysis Intellig..

LLM 2026.05.28

Kimi K2.6 완전 분석 — 오픈소스가 GPT-5.4를 이기고 Claude 비용의 10%로 돌아간다

300개 서브 에이전트, 12시간 자율 실행, 가격은 Claude Opus 4.7의 10분의 1. 중국 오픈소스 모델이 또 판을 뒤집었습니다.[핵심 요약]→ 출시: 2026년 4월 20일 (Moonshot AI), 오픈웨이트 공개→ 라이센스: Modified MIT — 상업 이용 가능→ 구조: 1T 총 파라미터 / 32B 활성 / 384 전문가 (MoE)→ 컨텍스트: 262K 토큰 (자동 압축으로 12시간 세션 지속)→ SWE-bench Verified: 80.2% (Claude Opus 4.6: 80.8%)→ SWE-bench Pro: 58.6% — GPT-5.4(57.7%), GLM-5.1(58.4%) 압도→ Terminal-Bench 2.0: 66.7% — GPT-5.4(65.4%) 앞섬→ Agen..

LLM 2026.04.28
반응형