반응형

2026/04/21 6

GitHub Copilot Agent Mode 실전 가이드 — VS Code에서 자율 코딩 에이전트 쓰는 법

GitHub Copilot을 인라인 자동완성 도구로만 쓰고 있다면 절반도 못 쓰고 있는 거예요.2026년 기준 Copilot에는 4가지 에이전트가 있어요.1. Local Agent — 실시간, VS Code 안에서 동작2. Plan Agent — 실행 전 계획 먼저 세우기3. Background — 백그라운드에서 병렬 작업4. Cloud Agent — GitHub 서버에서 비동기 실행 → PR 자동 생성오늘은 이 4가지를 실전에서 어떻게 쓰는지 다 다뤄요.사전 준비필요한 것:✅ VS Code 1.99 이상✅ GitHub Copilot Pro ($19/월) 이상✅ GitHub Copilot + GitHub Copilot Chat 확장 설치무료 플랜은 Agent Mode 미포함→ 인..

AI 개발 2026.04.21

smolagents 시작 가이드 — HuggingFace 초경량 에이전트 30분에 완성

LangGraph는 너무 복잡하고, CrewAI는 설정이 많고.그냥 빠르게 에이전트 하나 만들고 싶을 때 있잖아요.smolagents가 그 자리예요. HuggingFace가 만든 초경량 에이전트 라이브러리예요.pip install smolagents설치 끝. 이게 다예요.다른 프레임워크랑 뭐가 다른가일반 에이전트 vs smolagents Code Agent일반 에이전트 (ReAct 방식):LLM → "search_tool 호출해줘" → 실행 → LLM으로 결과 전달→ LLM → "calculate 호출해줘" → 실행 → LLM으로 결과 전달→ LLM → "format 호출해줘" → 실행 → 최종 답변LLM 호출: 4회smolagents Code Agent:LLM → Python 코드 작성 → 한 번에 실..

AI Agent 2026.04.21

markitdown-ocr 플러그인 — 스캔 PDF, 이미지 속 텍스트까지 뽑아내는 법

지난 글에서 markitdown 기본 사용법을 다뤘어요.근데 이런 파일이 오면 기본 markitdown이 손을 들어요.기본 markitdown이 못 하는 것들:❌ 스캔해서 만든 PDF (이미지로만 구성)❌ PDF 안에 박힌 차트/표 이미지❌ PPT 슬라이드 안의 스크린샷❌ Word 문서에 붙여넣은 이미지❌ 손으로 쓴 필기 문서이런 파일을 기본 markitdown으로 변환하면:# 보고서[이미지][이미지]## 결론이미지가 전부 [이미지] 플레이스홀더로 대체돼요. 안에 뭐가 있는지 모름.markitdown-ocr 플러그인이 이 문제를 해결해요. LLM 비전 모델로 이미지 속 텍스트를 실제로 읽어냅니다.설치# markitdown 기본 설치pip install 'markitdown[all]'# OCR 플러그인 추..

AI 개발 2026.04.21

markitdown 완전 가이드 — PDF, Word, PPT를 LLM이 읽는 형식으로 자동 변환

RAG 파이프라인을 만들다 보면 항상 이 벽에 부딪혀요."이 PDF 분석해줘"→ LLM: ????이유:PDF는 렌더링용 포맷텍스트, 이미지, 표가 뒤섞인 이진 파일LLM이 직접 이해하기 어려움그래서 보통 이렇게 함:PDF → PyPDF2로 텍스트 추출 → 근데 표/이미지 날아감Word → python-docx → 복잡한 파싱 코드 작성PPT → 슬라이드 하나씩 수동 처리Excel → pandas로 읽고 또 변환→ 포맷마다 다른 라이브러리→ 포맷마다 다른 코드→ 복잡하고 유지보수 힘듦Microsoft가 이 문제를 해결하는 도구를 오픈소스로 냈어요. markitdown이에요.pip install 'markitdown[all]'markitdown 문서.pdf끝.GitHub 별 5만개+. MIT 라이선스.뭘 지..

AI 개발 2026.04.21

Gemini CLI 가이드 — Claude Code 대신 $0에 쓰는 법

Claude Code Pro는 월 $20이에요. Gemini CLI는 $0이에요.Google 계정만 있으면 됩니다.무료 한도:- 분당 60 요청- 하루 1,000 요청- 1M 토큰 컨텍스트 윈도우- Gemini 3 모델 (최신 버전)- API 키 설정 불필요뭘 할 수 있나코딩 어시스턴트:→ 레포지토리 전체 분석→ 버그 찾고 수정→ 파일 읽기/쓰기/수정→ 테스트 생성터미널 자동화:→ 셸 명령 실행→ Git 작업→ 파일 시스템 탐색외부 연결 (MCP):→ GitHub PR/이슈 관리→ 데이터베이스 쿼리→ Slack, Notion, Google Drive기타:→ 웹 검색 (Google Search 내장)→ 웹페이지 fetch→ 세션 체크포인트 저장/복원1단계 — 설치# Node.js 18+ 필요 (없으면 먼저..

AI 개발 2026.04.21

Gemma 4 파인튜닝 Unsloth로 30분에 끝내기 — API 비용 0원, 도메인 특화 모델

GPT-4급 성능을 API 비용 없이. 내 도메인 데이터로 특화된 모델을.Gemma 4는 2026년 4월 2일 Google DeepMind가 출시한 오픈소스 모델이에요. Apache 2.0 라이선스 — 상업적 사용, 재배포, 수정 모두 자유예요.파인튜닝이 필요한 이유:프롬프트 엔지니어링: "항상 JSON으로 응답해줘" → 30% 실패율RAG: 지식 주입엔 좋지만 스타일/형식 제어 어려움파인튜닝: 99% 이상 일관된 출력, 도메인 특화 지식언제 파인튜닝이 답인가:→ 출력 형식이 항상 일정해야 할 때→ 특정 도메인 용어/스타일이 필요할 때→ 프롬프트가 너무 길어서 비용 문제가 될 때→ API 없이 로컬/온프레미스 배포가 필요할 때Unsloth가 뭔가HuggingFace 기본 방식 대비:속도: 2배 빠른 ..

LLM 2026.04.21
반응형