전체 글 썸네일형 리스트형 OpenRouter 완전 가이드 — API 키 하나로 GPT, Claude, Gemini, Llama 200개+ 모델 전부 쓰기 모델마다 API 키 따로 관리하는 거 지쳐있죠.Anthropic API 키 따로OpenAI API 키 따로Google API 키 따로각각 다른 SDK각각 다른 요금 청구서OpenRouter가 이걸 하나로 합쳐줘요.OpenRouter API 키 하나→ 200개+ 모델 전부→ OpenAI SDK 그대로 사용→ 모델명만 바꾸면 끝1단계 — 가입 및 API 키 발급1. openrouter.ai 접속2. 우상단 "Sign In" → Google 또는 GitHub 로그인3. 좌측 메뉴 "Keys" 클릭4. "Create Key" 버튼5. 이름 입력 (예: my-project) → Create6. API 키 복사 (sk-or-v1-xxxxx 형태) → 한 번만 보여줌. 반드시 저장크레딧 충전:좌측 메뉴 "Cred.. 더보기 GitHub Copilot Agent Mode 실전 가이드 — VS Code에서 자율 코딩 에이전트 쓰는 법 GitHub Copilot을 인라인 자동완성 도구로만 쓰고 있다면 절반도 못 쓰고 있는 거예요.2026년 기준 Copilot에는 4가지 에이전트가 있어요.1. Local Agent — 실시간, VS Code 안에서 동작2. Plan Agent — 실행 전 계획 먼저 세우기3. Background — 백그라운드에서 병렬 작업4. Cloud Agent — GitHub 서버에서 비동기 실행 → PR 자동 생성오늘은 이 4가지를 실전에서 어떻게 쓰는지 다 다뤄요.사전 준비필요한 것:✅ VS Code 1.99 이상✅ GitHub Copilot Pro ($19/월) 이상✅ GitHub Copilot + GitHub Copilot Chat 확장 설치무료 플랜은 Agent Mode 미포함→ 인.. 더보기 markitdown-ocr 플러그인 — 스캔 PDF, 이미지 속 텍스트까지 뽑아내는 법 지난 글에서 markitdown 기본 사용법을 다뤘어요.근데 이런 파일이 오면 기본 markitdown이 손을 들어요.기본 markitdown이 못 하는 것들:❌ 스캔해서 만든 PDF (이미지로만 구성)❌ PDF 안에 박힌 차트/표 이미지❌ PPT 슬라이드 안의 스크린샷❌ Word 문서에 붙여넣은 이미지❌ 손으로 쓴 필기 문서이런 파일을 기본 markitdown으로 변환하면:# 보고서[이미지][이미지]## 결론이미지가 전부 [이미지] 플레이스홀더로 대체돼요. 안에 뭐가 있는지 모름.markitdown-ocr 플러그인이 이 문제를 해결해요. LLM 비전 모델로 이미지 속 텍스트를 실제로 읽어냅니다.설치# markitdown 기본 설치pip install 'markitdown[all]'# OCR 플러그인 추.. 더보기 markitdown 완전 가이드 — PDF, Word, PPT를 LLM이 읽는 형식으로 자동 변환 RAG 파이프라인을 만들다 보면 항상 이 벽에 부딪혀요."이 PDF 분석해줘"→ LLM: ????이유:PDF는 렌더링용 포맷텍스트, 이미지, 표가 뒤섞인 이진 파일LLM이 직접 이해하기 어려움그래서 보통 이렇게 함:PDF → PyPDF2로 텍스트 추출 → 근데 표/이미지 날아감Word → python-docx → 복잡한 파싱 코드 작성PPT → 슬라이드 하나씩 수동 처리Excel → pandas로 읽고 또 변환→ 포맷마다 다른 라이브러리→ 포맷마다 다른 코드→ 복잡하고 유지보수 힘듦Microsoft가 이 문제를 해결하는 도구를 오픈소스로 냈어요. markitdown이에요.pip install 'markitdown[all]'markitdown 문서.pdf끝.GitHub 별 5만개+. MIT 라이선스.뭘 지.. 더보기 Gemini CLI 가이드 — Claude Code 대신 $0에 쓰는 법 Claude Code Pro는 월 $20이에요. Gemini CLI는 $0이에요.Google 계정만 있으면 됩니다.무료 한도:- 분당 60 요청- 하루 1,000 요청- 1M 토큰 컨텍스트 윈도우- Gemini 3 모델 (최신 버전)- API 키 설정 불필요뭘 할 수 있나코딩 어시스턴트:→ 레포지토리 전체 분석→ 버그 찾고 수정→ 파일 읽기/쓰기/수정→ 테스트 생성터미널 자동화:→ 셸 명령 실행→ Git 작업→ 파일 시스템 탐색외부 연결 (MCP):→ GitHub PR/이슈 관리→ 데이터베이스 쿼리→ Slack, Notion, Google Drive기타:→ 웹 검색 (Google Search 내장)→ 웹페이지 fetch→ 세션 체크포인트 저장/복원1단계 — 설치# Node.js 18+ 필요 (없으면 먼저.. 더보기 Gemma 4 파인튜닝 Unsloth로 30분에 끝내기 — API 비용 0원, 도메인 특화 모델 요즘 사내 챗봇이나 코딩 어시스턴트 만들 때 다들 GPT나 Claude API부터 붙이고 보는데, 막상 매달 청구서 보면 정신이 아득해지죠. 저도 처음엔 프롬프트만 잘 짜면 되는 줄 알았는데, 출력 형식이 자꾸 흔들려서 결국 파인튜닝까지 손댄 케이스예요. 그래서 오늘은 Gemma 4를 Unsloth로 30분 만에 파인튜닝해서 API 없이 도메인 특화 모델 만드는 법을 정리해봤어요.Gemma 4는 2026년 4월 2일 Google DeepMind가 출시한 오픈소스 모델인데, Apache 2.0 라이선스라서 상업적 사용이나 재배포, 수정까지 전부 자유롭게 할 수 있어요.파인튜닝이 왜 필요한지부터 짚어볼게요. 프롬프트 엔지니어링만으로 "항상 JSON으로 응답해줘"라고 시켜도 실제로는 30% 정도 실패율이 나오.. 더보기 LLM 사설 평가셋 50개 만들고 모델 비교하기 — 벤치마크를 믿지 마세요 48시간마다 새 모델이 나와요. 모두 "SWE-bench 1위", "GPQA 최고점"을 주장해요.근데 그게 내 서비스에서도 최고일까요.공개 벤치마크의 현실:MMLU: 상위 모델 88% 이상 → 이미 포화SWE-bench: 에이전트 코딩 특화 → 일반 서비스와 무관GPQA: 박사급 과학 문제 → 실제 업무와 거리 멀어데이터 오염 문제:- 훈련 데이터에 이미 벤치마크 문제가 포함됨- GSM8K 점수 vs GSM1K(새 문제) 점수 차이: 최대 16%p- 모델이 실제로 못 풀어도 고점 가능진짜 답은 내 서비스에 맞는 사설 평가셋을 직접 만드는 것이에요.50개면 충분히 시작할 수 있어요. 오늘 만들어봅시다.왜 50개인가너무 적으면 (10개 미만):→ 통계적으로 의미 없음→ 우연에 의한 결과 가능너무 많으면 (5.. 더보기 Opus 4.7 에이전트 비용 제어 실전 — effort + Task Budget 완전 가이드 에이전트를 Opus 4.7로 돌리면 비용이 예측 불가예요.왜 예측이 안 되냐:→ 에이전트 루프: 생각 + 툴 호출 + 툴 결과 + 출력이 쌓임→ xhigh 기본값: 더 많이 생각함→ 새 토크나이저: 같은 텍스트도 최대 35% 토큰 증가→ 언제 끝날지 모름 = 비용도 모름Opus 4.7은 이걸 잡는 두 가지 도구를 줬어요.1. effort 파라미터: 추론 깊이 조절2. Task Budget: 에이전트 루프 전체 토큰 예산 설정하나씩 실제로 써볼게요.effort 파라미터5단계 레벨 이해low → 빠르고 싸다. 복잡한 추론 없음medium → 균형high → 기본값 (API 기본값)xhigh → high와 max 사이 (Claude Code 기본값)max → 최대 품질, 최고 비용비용 대비 성.. 더보기 이전 1 ··· 32 33 34 35 36 37 38 ··· 46 다음