'Gemma4' 태그의 글 목록

Gemma4 4

오픈소스 코딩 모델 3파전 — Qwen3.6-27B vs Gemma 4 31B vs GLM-5.1

각자 다른 대륙, 다른 철학. 그런데 전부 프론티어급입니다. 뭘 골라야 할지 완전히 정리해드립니다.[핵심 요약]→ Qwen3.6-27B: 코딩 에이전트 최강, RTX 4090 한 장, Apache 2.0→ Gemma 4 31B: 수학/추론 최강, 멀티모달(비전+오디오), Apache 2.0→ GLM-5.1: SWE-bench Pro 1위, 6000+ 툴 호출 지속, MIT 라이센스→ 공통점: 전부 Apache 2.0 / MIT, 상업 이용 무료→ 결론: 용도에 따라 다름 — 이 글이 그 기준을 정리합니다세 모델이 동시에 나온 이유2026년 4월은 오픈소스 AI 역사상 가장 경쟁이 치열한 달입니다. Alibaba, Google, Z.AI(Zhipu AI)가 수주 안에 모두 출시했습니다.출시 타임라인:→ G..

LLM 2026.04.24

Gemma 4 파인튜닝 Unsloth로 30분에 끝내기 — API 비용 0원, 도메인 특화 모델

GPT-4급 성능을 API 비용 없이. 내 도메인 데이터로 특화된 모델을.Gemma 4는 2026년 4월 2일 Google DeepMind가 출시한 오픈소스 모델이에요. Apache 2.0 라이선스 — 상업적 사용, 재배포, 수정 모두 자유예요.파인튜닝이 필요한 이유:프롬프트 엔지니어링: "항상 JSON으로 응답해줘" → 30% 실패율RAG: 지식 주입엔 좋지만 스타일/형식 제어 어려움파인튜닝: 99% 이상 일관된 출력, 도메인 특화 지식언제 파인튜닝이 답인가:→ 출력 형식이 항상 일정해야 할 때→ 특정 도메인 용어/스타일이 필요할 때→ 프롬프트가 너무 길어서 비용 문제가 될 때→ API 없이 로컬/온프레미스 배포가 필요할 때Unsloth가 뭔가HuggingFace 기본 방식 대비:속도: 2배 빠른 ..

LLM 2026.04.21

SLM 실전 가이드 — Gemma 4, Qwen3.5, Phi-4로 API 비용 95% 줄이는 법

Claude API 쓰다 보면 월말에 이런 청구서가 날아와요.API 비용: $3,200예산: $500원인은 단순해요. 모든 요청에 수천억 파라미터 모델을 쓰고 있어서예요.고객이 "배송 얼마나 걸려요?"라고 물어봐도 Claude Opus가 답하고 있어요.SLM(Small Language Model)은 이걸 해결해요.SLM이 뭔가LLM: 100B ~ 1T+ 파라미터SLM: 500M ~ 10B 파라미터LLM:→ H100 GPU 여러 장 필요→ API 비용 높음→ 응답 느림SLM:→ RTX 4070 노트북 1대로 가능→ 로컬 실행 시 비용 거의 0→ 응답 빠름2026년 기준으로 프로덕션 AI 업무의 80%는 SLM으로 충분해요.2026년 주요 SLM 정리Microsoft Phi-4 Mini (3.8B)특징:- ..

LLM 2026.04.15

구글 Gemma 4 완전 분석 — 오픈소스 AI의 판을 바꾼 모델

4월 2일, 구글 딥마인드가 조용히 모델 하나를 공개했어요. 그런데 AI 커뮤니티가 발칵 뒤집혔습니다."자기 사이즈보다 20배 큰 모델을 이긴다."이게 Gemma 4예요. 오픈소스 AI 역사상 가장 충격적인 성능 도약이 나왔어요. 이번 글에서는 Gemma 4가 뭔지, 어떻게 실행하는지, 실전에서 어떻게 쓰는지 완전 정리해 드릴게요.Gemma 4가 왜 난리났나오픈소스 AI는 항상 이런 딜레마가 있었어요."무료로 쓰려면 성능을 포기해야 한다."GPT-4나 Claude 같은 유료 모델과 오픈소스 모델 사이에는 항상 눈에 띄는 품질 격차가 있었어요. 오픈소스를 쓰면 돈은 절약되지만 결과물이 아쉬웠죠.Gemma 4는 이 공식을 깨버렸어요.31B 모델이 오픈소스 모델 세계 3위에 랭크됐고, 26B MoE 모델은 실..

LLM 2026.04.08

CELL AI DEVLOG

AI 에이전트 만듭니다

AI 에이전트, LLM, openai codex, Rag, AWS Kiro, 바이브코딩, MCP, Gemini 3.5 Flash, claude code, SGLANG, AI agent, Claude Opus 4.8, 오픈소스llm, github copilot, LLM as a judge, LLM서빙, Gemini, Claude, 클로드코드, 멀티에이전트,

Today :
Yesterday :

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Gemma4 4

티스토리툴바