'IBM Granite' 태그의 글 목록

IBM Granite 4.1 완전 분석 — 8B가 32B MoE를 이긴 이유, 파라미터보다 훈련이 중요하다

IBM이 "더 크게 만들기" 대신 "더 잘 훈련하기"를 선택했습니다. 8B 모델이 이전 32B MoE를 벤치마크 전 항목에서 앞섰습니다.[핵심 요약]→ 출시: 2026년 4월 29일 (IBM Research)→ 라이센스: Apache 2.0 — 상업 이용 무료→ 모델: 3B, 8B, 30B dense decoder-only transformer→ 컨텍스트: 128K (프로덕션), 512K (확장)→ 핵심: 8B dense가 이전 32B MoE(Granite 4.0-H-Small)를 전 벤치마크에서 앞섬→ 툴 호출 (BFCL V3): 8B 68.3 vs 32B MoE 64.7→ 훈련 데이터: 15조 토큰, 5단계 훈련→ 함께 출시: Granite Vision 4.1, Speech 4.1 (2B), Guar..

LLM 2026.05.06

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

CELL AI DEVLOG

IBM Granite 1

티스토리툴바