본문 바로가기

전체 글

(172)

스마트폰에서 AI를 돌리는 법 — 온디바이스 LLM 개발 입문 가이드 앱에 AI 기능을 붙이려면 항상 클라우드 API를 써야 할까요?아니에요. 2026년 지금은 스마트폰 자체에서 LLM을 돌릴 수 있어요. 인터넷 없이, API 비용 없이, 사용자 데이터가 서버로 나가지 않게요.이번 글에서는 온디바이스 AI가 뭔지, 왜 필요한지, 그리고 Android·iOS·Flutter로 실제로 어떻게 구현하는지 코드와 함께 정리해 드릴게요.왜 온디바이스 AI인가클라우드 AI의 문제점이 네 가지예요.레이턴시 — 클라우드 API를 호출하면 네트워크 왕복 시간이 수백 밀리초 추가돼요. 실시간 느낌이 깨져요.프라이버시 — 사용자 데이터가 서버로 전송돼요. 의료, 금융, 개인 메모 같은 민감한 데이터를 다루는 앱은 이게 치명적이에요.비용 — API 호출마다 돈이 나가요. 사용자가 많아질수록 서버..

Grok 5 완전 정리 — 6조 파라미터, AGI 10%, 역대 최대 AI의 진실 일론 머스크가 또 큰소리를 쳤어요."모든 지표에서 압도적으로 세계 최고의 AI."Grok 5. 6조 파라미터. AGI 달성 10% 확률. Q1 2026 출시 예고.근데 Q1이 지났어요. 아직 안 나왔어요.이번 글에서는 Grok 5가 진짜 뭔지, 머스크의 주장이 얼마나 믿을 만한지, 그리고 실제로 어떤 의미가 있는지 정리해 드릴게요.Grok 5가 뭔가xAI는 일론 머스크가 2023년 설립한 AI 회사예요. OpenAI에서 나온 연구자들을 중심으로 구성됐고, Tesla와 X(트위터) 데이터에 접근할 수 있다는 게 경쟁사 대비 독특한 강점이에요.Grok 1 → Grok 2 → Grok 3 → Grok 4 → Grok 4.20까지 빠른 속도로 업데이트해왔어요. 그리고 다음 세대가 Grok 5예요.스펙 — 뭘 주..

Anthropic이 숨기려 했던 AI — Claude Mythos 유출 사건 완전 정리 2026년 3월 26일 밤, 보안 연구원 두 명이 인터넷에서 이상한 걸 발견했어요.공개 검색이 가능한 서버에 Anthropic의 미공개 블로그 포스트 수천 개가 올라와 있었어요. 그 안에는 아직 세상에 공개된 적 없는 AI 모델 이야기가 담겨 있었어요."지금까지 우리가 만든 것 중 가장 강력한 모델."이게 Claude Mythos 유출 사건의 시작이에요.어떻게 유출됐나Anthropic의 CMS(콘텐츠 관리 시스템) 설정 오류가 원인이었어요. 미공개 초안 블로그 포스트 약 3,000개가 공개 검색 가능한 데이터 캐시에 노출됐어요.LayerX Security의 Roy Paz와 케임브리지 대학의 Alexandre Pauwels가 이 데이터를 발견했어요. Fortune이 내용을 검토한 뒤 Anthropic에 통..

13조 원 투자한 파트너 대체하는 Microsoft의 AI 독립 선언 2026년 4월 2일, Microsoft가 조용히 폭탄을 투하했어요.자체 개발 AI 모델 3종을 동시 출시했어요. OpenAI 이름이 어디에도 없는 모델들이에요. 13조 원을 투자한 파트너의 기술을 대체하는 모델들이요.이게 왜 충격적인지, 진짜 무슨 일이 벌어지고 있는지 정리해 드릴게요.배경 — Microsoft와 OpenAI의 관계Microsoft는 2019년부터 OpenAI에 총 13조 원($13B) 을 투자했어요. 그 대가로 OpenAI 모델을 Azure에 독점 공급받고, Copilot과 모든 Microsoft 제품에 GPT를 탑재했죠.관계가 너무 깊었어요.OpenAI가 Microsoft에서 차지하는 비중:- Azure 클라우드 백로그의 45%- Copilot의 핵심 엔진- Microsoft 365..

GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 — 2026년 AI 3대장 완전 비교 2026년 3월, 역대 가장 치열한 AI 모델 전쟁이 벌어졌어요.OpenAI가 GPT-5.4를 쏘고, Anthropic이 Claude Opus 4.6을 올리고, 구글이 Gemini 3.1 Pro를 꺼냈어요. 단 한 달 안에 세 개의 플래그십 모델이 동시에 출격했어요.이제 어떤 걸 써야 할까요? 벤치마크 숫자만 보면 답이 안 나와요. 무엇을 하느냐에 따라 최고의 모델이 달라집니다.한줄 요약모델 한줄 요약GPT-5.4컴퓨터를 직접 조작하는 첫 번째 AI. 지식 업무 최강Claude Opus 4.6코딩과 에이전트 작업 최강. 인간이 선호하는 글쓰기Gemini 3.1 Pro추론 최강, 가격 최저. 멀티모달 가장 넓음스펙 비교항목 GPT-5.4 Claude Opus 4.6 Gemini 3.1 Pro출시일2026...

구글 Gemma 4 완전 분석 — 오픈소스 AI의 판을 바꾼 모델 4월 2일, 구글 딥마인드가 조용히 모델 하나를 공개했어요. 그런데 AI 커뮤니티가 발칵 뒤집혔습니다."자기 사이즈보다 20배 큰 모델을 이긴다."이게 Gemma 4예요. 오픈소스 AI 역사상 가장 충격적인 성능 도약이 나왔어요. 이번 글에서는 Gemma 4가 뭔지, 어떻게 실행하는지, 실전에서 어떻게 쓰는지 완전 정리해 드릴게요.Gemma 4가 왜 난리났나오픈소스 AI는 항상 이런 딜레마가 있었어요."무료로 쓰려면 성능을 포기해야 한다."GPT-4나 Claude 같은 유료 모델과 오픈소스 모델 사이에는 항상 눈에 띄는 품질 격차가 있었어요. 오픈소스를 쓰면 돈은 절약되지만 결과물이 아쉬웠죠.Gemma 4는 이 공식을 깨버렸어요.31B 모델이 오픈소스 모델 세계 3위에 랭크됐고, 26B MoE 모델은 실..

구글의 딥시크: 터보퀀트(TurboQuant) 완전 분석 — 메모리 6배 절감이 반도체 주가를 흔든 이유 3월 24일, 구글 리서치가 조용히 블로그 하나를 올렸어요. 그런데 이틀 뒤 삼성전자가 4.7% 떨어지고, SK하이닉스가 6.2% 급락하고, 마이크론이 3% 빠졌습니다.논문 하나가 글로벌 반도체 시장을 흔든 거예요.이번 글에서는 터보퀀트가 정확히 뭔지, 왜 주가가 떨어졌는지, 그리고 이게 진짜 위기인지 아닌지까지 정리해 드릴게요.터보퀀트가 뭔가요 — 쉽게 설명KV 캐시가 뭔지부터LLM이 대화할 때 이전에 처리한 내용을 다시 계산하지 않으려고 임시로 저장해두는 공간이 있어요. 이걸 KV 캐시(Key-Value Cache) 라고 해요.쉽게 비유하면 이렇게요.친구와 1시간 대화했다고 해봐요. 새로운 말을 할 때마다 "우리가 1시간 동안 나눈 대화 전체"를 다시 읽어야 한다면 엄청 느리겠죠. KV 캐시는 그 대..

AI 에이전트가 기억하는 법 — 단기/장기 메모리 아키텍처와 MemGPT 완전 정리 AI 에이전트를 쓰다 보면 이런 답답함이 생겨요."지난주에 분명히 말했는데 또 처음부터 설명해야 하네."LLM은 기본적으로 상태가 없어요(stateless). 대화가 끝나면 모든 걸 잊어요. 컨텍스트 창 안에 있는 것만 기억하고, 창 밖으로 밀려나면 사라져요.이걸 해결하는 게 에이전트 메모리 아키텍처예요. 이번 글에서는 메모리 타입 4가지, MemGPT 구조 분석, 실전 구현 방법까지 정리해 드릴게요.메모리가 없으면 뭐가 문제인가메모리 없는 에이전트는 세 가지 한계가 있어요.세션 간 기억 불가 — 오늘 대화와 어제 대화가 완전히 단절돼요. 사용자가 매번 컨텍스트를 다시 설명해야 해요.컨텍스트 창 한계 — 대화가 길어지면 앞부분이 잘려나가요. 1시간 전에 한 결정을 에이전트가 기억 못 해요.개인화 불가 —..

이전 1 ··· 15 16 17 18 19 20 21 22 다음

티스토리툴바