본문 바로가기

LLM

(51)

Grok 5 완전 정리 — 6조 파라미터, AGI 10%, 역대 최대 AI의 진실 일론 머스크가 또 큰소리를 쳤어요."모든 지표에서 압도적으로 세계 최고의 AI."Grok 5. 6조 파라미터. AGI 달성 10% 확률. Q1 2026 출시 예고.근데 Q1이 지났어요. 아직 안 나왔어요.이번 글에서는 Grok 5가 진짜 뭔지, 머스크의 주장이 얼마나 믿을 만한지, 그리고 실제로 어떤 의미가 있는지 정리해 드릴게요.Grok 5가 뭔가xAI는 일론 머스크가 2023년 설립한 AI 회사예요. OpenAI에서 나온 연구자들을 중심으로 구성됐고, Tesla와 X(트위터) 데이터에 접근할 수 있다는 게 경쟁사 대비 독특한 강점이에요.Grok 1 → Grok 2 → Grok 3 → Grok 4 → Grok 4.20까지 빠른 속도로 업데이트해왔어요. 그리고 다음 세대가 Grok 5예요.스펙 — 뭘 주..

Anthropic이 숨기려 했던 AI — Claude Mythos 유출 사건 완전 정리 2026년 3월 26일 밤, 보안 연구원 두 명이 인터넷에서 이상한 걸 발견했어요.공개 검색이 가능한 서버에 Anthropic의 미공개 블로그 포스트 수천 개가 올라와 있었어요. 그 안에는 아직 세상에 공개된 적 없는 AI 모델 이야기가 담겨 있었어요."지금까지 우리가 만든 것 중 가장 강력한 모델."이게 Claude Mythos 유출 사건의 시작이에요.어떻게 유출됐나Anthropic의 CMS(콘텐츠 관리 시스템) 설정 오류가 원인이었어요. 미공개 초안 블로그 포스트 약 3,000개가 공개 검색 가능한 데이터 캐시에 노출됐어요.LayerX Security의 Roy Paz와 케임브리지 대학의 Alexandre Pauwels가 이 데이터를 발견했어요. Fortune이 내용을 검토한 뒤 Anthropic에 통..

13조 원 투자한 파트너 대체하는 Microsoft의 AI 독립 선언 2026년 4월 2일, Microsoft가 조용히 폭탄을 투하했어요.자체 개발 AI 모델 3종을 동시 출시했어요. OpenAI 이름이 어디에도 없는 모델들이에요. 13조 원을 투자한 파트너의 기술을 대체하는 모델들이요.이게 왜 충격적인지, 진짜 무슨 일이 벌어지고 있는지 정리해 드릴게요.배경 — Microsoft와 OpenAI의 관계Microsoft는 2019년부터 OpenAI에 총 13조 원($13B) 을 투자했어요. 그 대가로 OpenAI 모델을 Azure에 독점 공급받고, Copilot과 모든 Microsoft 제품에 GPT를 탑재했죠.관계가 너무 깊었어요.OpenAI가 Microsoft에서 차지하는 비중:- Azure 클라우드 백로그의 45%- Copilot의 핵심 엔진- Microsoft 365..

GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 — 2026년 AI 3대장 완전 비교 2026년 3월, 역대 가장 치열한 AI 모델 전쟁이 벌어졌어요.OpenAI가 GPT-5.4를 쏘고, Anthropic이 Claude Opus 4.6을 올리고, 구글이 Gemini 3.1 Pro를 꺼냈어요. 단 한 달 안에 세 개의 플래그십 모델이 동시에 출격했어요.이제 어떤 걸 써야 할까요? 벤치마크 숫자만 보면 답이 안 나와요. 무엇을 하느냐에 따라 최고의 모델이 달라집니다.한줄 요약모델 한줄 요약GPT-5.4컴퓨터를 직접 조작하는 첫 번째 AI. 지식 업무 최강Claude Opus 4.6코딩과 에이전트 작업 최강. 인간이 선호하는 글쓰기Gemini 3.1 Pro추론 최강, 가격 최저. 멀티모달 가장 넓음스펙 비교항목 GPT-5.4 Claude Opus 4.6 Gemini 3.1 Pro출시일2026...

구글 Gemma 4 완전 분석 — 오픈소스 AI의 판을 바꾼 모델 4월 2일, 구글 딥마인드가 조용히 모델 하나를 공개했어요. 그런데 AI 커뮤니티가 발칵 뒤집혔습니다."자기 사이즈보다 20배 큰 모델을 이긴다."이게 Gemma 4예요. 오픈소스 AI 역사상 가장 충격적인 성능 도약이 나왔어요. 이번 글에서는 Gemma 4가 뭔지, 어떻게 실행하는지, 실전에서 어떻게 쓰는지 완전 정리해 드릴게요.Gemma 4가 왜 난리났나오픈소스 AI는 항상 이런 딜레마가 있었어요."무료로 쓰려면 성능을 포기해야 한다."GPT-4나 Claude 같은 유료 모델과 오픈소스 모델 사이에는 항상 눈에 띄는 품질 격차가 있었어요. 오픈소스를 쓰면 돈은 절약되지만 결과물이 아쉬웠죠.Gemma 4는 이 공식을 깨버렸어요.31B 모델이 오픈소스 모델 세계 3위에 랭크됐고, 26B MoE 모델은 실..

구글의 딥시크: 터보퀀트(TurboQuant) 완전 분석 — 메모리 6배 절감이 반도체 주가를 흔든 이유 3월 24일, 구글 리서치가 조용히 블로그 하나를 올렸어요. 그런데 이틀 뒤 삼성전자가 4.7% 떨어지고, SK하이닉스가 6.2% 급락하고, 마이크론이 3% 빠졌습니다.논문 하나가 글로벌 반도체 시장을 흔든 거예요.이번 글에서는 터보퀀트가 정확히 뭔지, 왜 주가가 떨어졌는지, 그리고 이게 진짜 위기인지 아닌지까지 정리해 드릴게요.터보퀀트가 뭔가요 — 쉽게 설명KV 캐시가 뭔지부터LLM이 대화할 때 이전에 처리한 내용을 다시 계산하지 않으려고 임시로 저장해두는 공간이 있어요. 이걸 KV 캐시(Key-Value Cache) 라고 해요.쉽게 비유하면 이렇게요.친구와 1시간 대화했다고 해봐요. 새로운 말을 할 때마다 "우리가 1시간 동안 나눈 대화 전체"를 다시 읽어야 한다면 엄청 느리겠죠. KV 캐시는 그 대..

[기초] LLM이 더 똑똑하게 생각하게 만드는 법 — CoT, ToT, Self-Consistency 완전 비교 LLM을 쓰다 보면 이런 상황이 생겨요."분명히 풀 수 있는 문제인데 틀린 답을 내놓네. 어떻게 하면 더 정확하게 추론하게 만들지?"모델을 바꾸거나 파인튜닝하지 않아도 추론 방식을 바꾸는 것만으로 정확도를 크게 올릴 수 있어요. 이번 글에서는 세 가지 핵심 추론 기법 — Chain-of-Thought, Tree-of-Thought, Self-Consistency — 을 원리부터 실전 적용까지 비교해 드릴게요.왜 추론 기법이 필요한가LLM은 기본적으로 다음 토큰을 예측하는 모델이에요. 바로 답을 내놓으라고 하면 중간 과정 없이 확률적으로 그럴듯한 답을 생성해요. 복잡한 문제에서는 이게 틀릴 확률이 높아요.# 바로 답하기 — 틀리기 쉬움질문: "농부가 닭 17마리와 양 10마리를 키운다. 다리는 총 몇 개인..

[기초] LLM이 도구를 직접 호출한다 — Function Calling 원리와 구현 완전 정리 AI 에이전트를 만들다 보면 이런 상황이 생깁니다."LLM한테 날씨 알려달라고 했는데, 학습 데이터에 없는 오늘 날씨를 어떻게 알려주지?"LLM은 학습 데이터 기반으로만 답하기 때문에 실시간 정보나 외부 시스템과 연동이 안 돼요. 이걸 해결하는 게 Function Calling입니다. 이번 글에서는 Function Calling이 뭔지, 어떻게 동작하는지, 실제로 어떻게 구현하는지 정리해 드릴게요.Function Calling이란?Function Calling은 LLM이 응답을 생성할 때 "이 질문은 내가 직접 답하는 게 아니라 이 함수를 호출해야 한다" 고 판단해서 함수 호출 정보를 반환하는 기능이에요.중요한 건 LLM이 함수를 직접 실행하는 게 아니라는 점이에요. LLM은 "어떤 함수를 어떤 인자로 ..

이전 1 ··· 3 4 5 6 7 다음

티스토리툴바