본문 바로가기

반응형

분류 전체보기

LLMWiki 완전 가이드 — Karpathy가 제안한 AI가 스스로 관리하는 지식 베이스 RAG는 매번 같은 문서를 처음부터 다시 읽습니다. 지난주에 이미 분석한 논문을 오늘 또 읽고, 내일 또 읽습니다. 아무것도 쌓이지 않습니다. Karpathy가 2026년 4월 GitHub Gist에 올린 패턴은 이걸 뒤집습니다. LLM이 문서를 읽는 게 아니라 위키를 직접 만들고 유지합니다.[핵심 요약]→ LLMWiki: Karpathy가 2026년 4월 GitHub Gist로 공개한 AI-native 지식 관리 패턴→ 핵심 차이: RAG(매번 원문 재검색) → LLMWiki(한 번 컴파일 → 구조화된 위키 영구 저장)→ 컴파일 비유: 소스코드(원문) → 컴파일러(LLM) → 바이너리(위키) → 실행(쿼리)→ 핵심 3단계: Ingest(소화) → Query(질문) → Lint(위키 건강 검사)→ Kar.. 더보기
WebLLM 완전 가이드 — 서버 없이 브라우저에서 LLM 실행하기 API 키 없고, 서버 없고, 토큰 비용 없습니다. Llama·Gemma·Phi가 사용자 브라우저 GPU에서 직접 돌아갑니다. 프롬프트가 외부로 나가지 않습니다. 2026년 기준 브라우저가 AI 추론 런타임이 됐습니다.[핵심 요약]→ WebLLM: MLC AI(Carnegie Mellon·SJTU·NVIDIA)가 만든 오픈소스 브라우저 LLM 라이브러리→ 동작 원리: WebGPU로 GPU 직접 접근 → 네이티브 수준 추론 속도→ OpenAI API 호환: chat.completions.create() 그대로 사용→ 지원 모델: Llama 3.2, Phi-3.5, Gemma 2, Mistral, Qwen 등→ 브라우저 지원: Chrome·Edge·Firefox·Safari 기본 활성화 (2025년 말부터).. 더보기
Google Antigravity 완전 가이드 4편 — Skills, Rules, Workflows, GEMINI.md로 에이전트를 내 팀원으로 만드는 법 에이전트한테 매번 "TypeScript strict 모드 써줘", "테스트는 Jest로 해줘"를 반복 입력하고 있다면 하네스를 제대로 안 쓰고 있는 겁니다. 4편은 Antigravity를 진짜 팀원처럼 동작하게 만드는 설정 레이어를 다룹니다.핵심 요약GEMINI.md는 에이전트의 두뇌 역할을 하며 프로젝트 전반에 항상 로드되는 규칙입니다. Rules는 글로벌·프로젝트·에이전트별 3계층으로 우선순위가 나뉘고, Workflows는 슬래시 명령으로 반복 태스크를 원클릭 실행하게 해줍니다. Skills는 필요할 때만 로드되는 도메인 지식 모듈로 SKILL.md 형식을 따릅니다. GEMINI.md와 AGENTS.md는 혼용이 가능하지만 충돌이 생기면 GEMINI.md가 우선합니다. GEMINI.md는 500토큰 .. 더보기
Google Antigravity 완전 가이드 3편 — 브라우저 서브에이전트, 2M 토큰 인덱싱, Google Cloud 직접 배포 다른 IDE는 코드 짜고 끝이에요. Antigravity는 한 발 더 나가서 에이전트가 직접 앱을 실행하고, 클릭하고, 영상으로 검증까지 해줘요. 3편에서는 Cursor나 Claude Code에는 없는 Antigravity만의 기능 세 가지를 다뤄볼게요. 메인 에이전트와는 별도로 동작하는 브라우저 서브에이전트가 직접 클릭하고 스크롤하고 폼을 입력할 수 있고, DOM 캡처와 스크린샷, 영상 녹화, 콘솔 로그 읽기까지 지원하는데 Chrome 확장 프로그램 설치가 필요해요.서브에이전트가 실행되는 동안에는 파란 테두리 오버레이가 떠서 해당 탭 조작이 차단돼요. 컨텍스트 측면에서는 Cursor의 200K 토큰 대비 10배인 2M 토큰을 지원해서 전체 코드베이스를 인덱싱할 수 있는데, Progressive Disc.. 더보기
Google Antigravity 완전 가이드 2편 — Agent Manager로 멀티 에이전트 오케스트레이션 실전 에이전트 하나 쓰면 Cursor랑 다를 게 없습니다. Antigravity의 진짜 힘은 Agent Manager에서 사용자가 직접 에이전트를 세팅하고 동시에 돌리는 것입니다.[2편 핵심 요약]→ Agent Manager: Ctrl+Shift+A — 에이전트 생성·모니터링·전환 허브→ 에이전트는 자동 생성 안 됨 — 사용자가 직접 역할 정의 후 스폰→ AgentKit 2.0 (3월 2026): Frontend·Backend·Testing·DevOps 16개 전문 에이전트→ 에이전트 간 직접 통신 없음 — 사용자가 코디네이터→ 에이전트별 다른 모델 할당 가능 (비용·성능 최적화)→ 동일 파일 동시 수정 금지 — 에이전트마다 파일 소유권 명시 필요→ Artifacts: Task List → Implementa.. 더보기
Google Antigravity 완전 가이드 1편 — 탄생 배경과 설치, 첫 세팅까지 Windsurf가 갑자기 사라졌습니다. 2025년 7월 Google이 Codeium(Windsurf 개발사)을 24억 달러에 인수했고, 4개월 만에 Antigravity를 출시했습니다. IDE 시장이 하룻밤에 재편됐습니다. 기존 Windsurf 사용자는 마이그레이션해야 하고, 나머지는 새로운 선택지를 평가해야 합니다. Antigravity는 Google이 Windsurf 팀을 인수한 뒤 2025년 11월에 내놓은 에이전트 퍼스트 IDE예요. VS Code를 포크해서 만들어졌기 때문에 기존에 쓰던 익스텐션과 키바인딩, 테마를 그대로 사용할 수 있고, AI 모델로는 2M 토큰 컨텍스트를 지원하는 Gemini 3.1 Pro와 함께 Claude Sonnet 4.6, Opus 4.6까지 지원해요. 핵심 구조는 코.. 더보기
EU AI Act 개발자 실전 가이드 — 2026년 8월부터 AI 앱 만들때 주의 "우리 서비스는 한국에 있으니까 EU 법이랑 상관없겠지." 아닙니다. EU 사용자가 한 명이라도 있으면 적용됩니다. GDPR이 그랬듯, AI Act도 전 세계 개발자에게 영향을 미칩니다. 8월 2일이 77일 남았습니다.[핵심 요약]→ EU AI Act: 세계 최초 포괄적 AI 규제 법안 (Regulation EU 2024/1689)→ 시행일 타임라인: ✅ 2025년 2월 2일: 금지 AI 관행 즉시 적용 ✅ 2025년 8월 2일: GPAI(범용AI) 모델 규칙 적용 ⚠️ 2026년 8월 2일: 고위험 AI 시스템 주요 규정 적용 (D-77) 📅 2028년 8월 2일: 규제 제품 내장 AI 시스템 (Omnibus 개정)→ 적용 범위: EU 사용자에게 서비스하는 모든 개발자 (역외 적용, G.. 더보기
uv + Ruff 완전 가이드 — OpenAI가 인수한 Python 툴링의 새 표준 pip install 10초, flake8 + black + isort 따로 실행, 가상환경 관리는 또 따로. Python 개발자가 매일 하던 일들입니다. Astral이 이걸 전부 Rust로 다시 만들었고, OpenAI가 3월 19일 인수했습니다. 이제 Python 생태계의 기본 툴링이 바뀝니다.[핵심 요약]→ Astral: uv + Ruff + ty를 Rust로 만든 스타트업 (2023년 창업)→ OpenAI 인수: 2026년 3월 19일 발표, Codex 팀에 합류→ 규모: uv 월간 다운로드 1억 2,600만회 / Ruff GitHub 34,000+ 스타→ uv: pip + virtualenv + pyenv + pipx + pip-tools 전부 대체 — 10~100배 빠름→ Ruff: flake8.. 더보기

반응형