본문 바로가기

반응형

전체 글

(172)
LangFlow 완전 가이드 1편 — 개요, 핵심 개념, 환경 세팅 LangFlow가 뭔가AI 파이프라인을 코드로 짜면 이렇게 돼요.from langchain.document_loaders import PyPDFLoaderfrom langchain.text_splitter import RecursiveCharacterTextSplitterfrom langchain.embeddings import OpenAIEmbeddingsfrom langchain.vectorstores import Chromafrom langchain.chains import RetrievalQAfrom langchain.chat_models import ChatAnthropicfrom langchain.memory import ConversationBufferMemory# ... 계속loader =..
LLM 추상화 레이어 — 48시간마다 새 모델이 나오는 시대에 살아남는 법 48시간마다 새 모델이 출시돼요.GPT-5.4 나옴 → "오 이게 최고네" → 갈아타고 싶음근데 코드 전체가 Anthropic SDK로 짜여있음갈아타려면:- SDK 교체- API 형식 전부 수정- 프롬프트 재조정- 테스트 전부 재실행- 2주짜리 작업이게 벤더 락인이에요.반대로 추상화 레이어가 있으면:# 이것만 바꾸면 끝MODEL = "openai/gpt-5.4" # 전에는 "anthropic/claude-sonnet-4-6"코드 한 줄. 2주가 1초가 돼요.왜 지금 이게 중요한가실제로 일어난 일들:- DALL-E 3 2026년 5월 지원 종료 → 수주 안에 마이그레이션- GPT-4 요금 갑자기 30% 인상 → 단가 모델 붕괴- Anthropic API 6시간 다운 → 서비스 전체 중단- 경쟁사가 10배..
OpenRouter 완전 가이드 — API 키 하나로 GPT, Claude, Gemini, Llama 200개+ 모델 전부 쓰기 모델마다 API 키 따로 관리하는 거 지쳐있죠.Anthropic API 키 따로OpenAI API 키 따로Google API 키 따로각각 다른 SDK각각 다른 요금 청구서OpenRouter가 이걸 하나로 합쳐줘요.OpenRouter API 키 하나→ 200개+ 모델 전부→ OpenAI SDK 그대로 사용→ 모델명만 바꾸면 끝1단계 — 가입 및 API 키 발급1. openrouter.ai 접속2. 우상단 "Sign In" → Google 또는 GitHub 로그인3. 좌측 메뉴 "Keys" 클릭4. "Create Key" 버튼5. 이름 입력 (예: my-project) → Create6. API 키 복사 (sk-or-v1-xxxxx 형태) → 한 번만 보여줌. 반드시 저장크레딧 충전:좌측 메뉴 "Cred..
GitHub Copilot Agent Mode 실전 가이드 — VS Code에서 자율 코딩 에이전트 쓰는 법 GitHub Copilot을 인라인 자동완성 도구로만 쓰고 있다면 절반도 못 쓰고 있는 거예요.2026년 기준 Copilot에는 4가지 에이전트가 있어요.1. Local Agent — 실시간, VS Code 안에서 동작2. Plan Agent — 실행 전 계획 먼저 세우기3. Background — 백그라운드에서 병렬 작업4. Cloud Agent — GitHub 서버에서 비동기 실행 → PR 자동 생성오늘은 이 4가지를 실전에서 어떻게 쓰는지 다 다뤄요.사전 준비필요한 것:✅ VS Code 1.99 이상✅ GitHub Copilot Pro ($19/월) 이상✅ GitHub Copilot + GitHub Copilot Chat 확장 설치무료 플랜은 Agent Mode 미포함→ 인..
smolagents 시작 가이드 — HuggingFace 초경량 에이전트 30분에 완성 LangGraph는 너무 복잡하고, CrewAI는 설정이 많고.그냥 빠르게 에이전트 하나 만들고 싶을 때 있잖아요.smolagents가 그 자리예요. HuggingFace가 만든 초경량 에이전트 라이브러리예요.pip install smolagents설치 끝. 이게 다예요.다른 프레임워크랑 뭐가 다른가일반 에이전트 vs smolagents Code Agent일반 에이전트 (ReAct 방식):LLM → "search_tool 호출해줘" → 실행 → LLM으로 결과 전달→ LLM → "calculate 호출해줘" → 실행 → LLM으로 결과 전달→ LLM → "format 호출해줘" → 실행 → 최종 답변LLM 호출: 4회smolagents Code Agent:LLM → Python 코드 작성 → 한 번에 실..
markitdown-ocr 플러그인 — 스캔 PDF, 이미지 속 텍스트까지 뽑아내는 법 지난 글에서 markitdown 기본 사용법을 다뤘어요.근데 이런 파일이 오면 기본 markitdown이 손을 들어요.기본 markitdown이 못 하는 것들:❌ 스캔해서 만든 PDF (이미지로만 구성)❌ PDF 안에 박힌 차트/표 이미지❌ PPT 슬라이드 안의 스크린샷❌ Word 문서에 붙여넣은 이미지❌ 손으로 쓴 필기 문서이런 파일을 기본 markitdown으로 변환하면:# 보고서[이미지][이미지]## 결론이미지가 전부 [이미지] 플레이스홀더로 대체돼요. 안에 뭐가 있는지 모름.markitdown-ocr 플러그인이 이 문제를 해결해요. LLM 비전 모델로 이미지 속 텍스트를 실제로 읽어냅니다.설치# markitdown 기본 설치pip install 'markitdown[all]'# OCR 플러그인 추..
markitdown 완전 가이드 — PDF, Word, PPT를 LLM이 읽는 형식으로 자동 변환 RAG 파이프라인을 만들다 보면 항상 이 벽에 부딪혀요."이 PDF 분석해줘"→ LLM: ????이유:PDF는 렌더링용 포맷텍스트, 이미지, 표가 뒤섞인 이진 파일LLM이 직접 이해하기 어려움그래서 보통 이렇게 함:PDF → PyPDF2로 텍스트 추출 → 근데 표/이미지 날아감Word → python-docx → 복잡한 파싱 코드 작성PPT → 슬라이드 하나씩 수동 처리Excel → pandas로 읽고 또 변환→ 포맷마다 다른 라이브러리→ 포맷마다 다른 코드→ 복잡하고 유지보수 힘듦Microsoft가 이 문제를 해결하는 도구를 오픈소스로 냈어요. markitdown이에요.pip install 'markitdown[all]'markitdown 문서.pdf끝.GitHub 별 5만개+. MIT 라이선스.뭘 지..
Gemini CLI 가이드 — Claude Code 대신 $0에 쓰는 법 Claude Code Pro는 월 $20이에요. Gemini CLI는 $0이에요.Google 계정만 있으면 됩니다.무료 한도:- 분당 60 요청- 하루 1,000 요청- 1M 토큰 컨텍스트 윈도우- Gemini 3 모델 (최신 버전)- API 키 설정 불필요뭘 할 수 있나코딩 어시스턴트:→ 레포지토리 전체 분석→ 버그 찾고 수정→ 파일 읽기/쓰기/수정→ 테스트 생성터미널 자동화:→ 셸 명령 실행→ Git 작업→ 파일 시스템 탐색외부 연결 (MCP):→ GitHub PR/이슈 관리→ 데이터베이스 쿼리→ Slack, Notion, Google Drive기타:→ 웹 검색 (Google Search 내장)→ 웹페이지 fetch→ 세션 체크포인트 저장/복원1단계 — 설치# Node.js 18+ 필요 (없으면 먼저..

반응형