IBM이 "더 크게 만들기" 대신 "더 잘 훈련하기"를 선택했습니다. 8B 모델이 이전 32B MoE를 벤치마크 전 항목에서 앞섰습니다.[핵심 요약]→ 출시: 2026년 4월 29일 (IBM Research)→ 라이센스: Apache 2.0 — 상업 이용 무료→ 모델: 3B, 8B, 30B dense decoder-only transformer→ 컨텍스트: 128K (프로덕션), 512K (확장)→ 핵심: 8B dense가 이전 32B MoE(Granite 4.0-H-Small)를 전 벤치마크에서 앞섬→ 툴 호출 (BFCL V3): 8B 68.3 vs 32B MoE 64.7→ 훈련 데이터: 15조 토큰, 5단계 훈련→ 함께 출시: Granite Vision 4.1, Speech 4.1 (2B), Guar..