반응형

Granite 4.1 2

IBM Granite 4.1 완전 분석 1편 — 8B 모델이 32B MoE를 이긴 이유

오픈소스 LLM 시장의 구도가 단순해 보여요."성능 순위: Claude > GPT-5.5 > Llama > DeepSeek > 기타"근데 이 구도에서 빠진 게 있어요. 누가 실제로 엔터프라이즈 프로덕션에 배포되는가예요.금융·보험·헬스케어 팀은 "SWE-bench 몇 %"보다 이걸 먼저 물어봐요."ISO 인증 있어? 암호화 서명 돼? 데이터 거버넌스 컴플라이언스 통과해?"2026년 4월 29일 IBM이 출시한 Granite 4.1은 이 질문에 답하는 모델이에요. 그리고 핵심 수치가 하나 있어요 — 8B 모델이 32B MoE를 이겼어요.🔑 핵심 요약IBM Granite 4.1 언어 모델 핵심 → 2026.04.29 출시, Apache 2.0 오픈소스 → 언어 모델: 3B / 8B / 30B (base + ..

LLM 2026.06.02

IBM Granite 4.1 완전 분석 — 8B가 32B MoE를 이긴 이유, 파라미터보다 훈련이 중요하다

IBM이 "더 크게 만들기" 대신 "더 잘 훈련하기"를 선택했습니다. 8B 모델이 이전 32B MoE를 벤치마크 전 항목에서 앞섰습니다.[핵심 요약]→ 출시: 2026년 4월 29일 (IBM Research)→ 라이센스: Apache 2.0 — 상업 이용 무료→ 모델: 3B, 8B, 30B dense decoder-only transformer→ 컨텍스트: 128K (프로덕션), 512K (확장)→ 핵심: 8B dense가 이전 32B MoE(Granite 4.0-H-Small)를 전 벤치마크에서 앞섬→ 툴 호출 (BFCL V3): 8B 68.3 vs 32B MoE 64.7→ 훈련 데이터: 15조 토큰, 5단계 훈련→ 함께 출시: Granite Vision 4.1, Speech 4.1 (2B), Guar..

LLM 2026.05.06
반응형