반응형

전체 글 356

Qwen3.6-27B vs 35B-A3B — Dense vs MoE

같은 Qwen3.6 패밀리인데 아키텍처가 완전히 다릅니다. 뭘 골라야 할지 헷갈리는 분들을 위해 정리했습니다.[핵심 요약]→ 27B: Dense 모델 — 모든 파라미터 항상 활성, 성능 우선→ 35B-A3B: MoE 모델 — 3B만 활성, 속도 우선→ 벤치마크: 27B가 전 항목에서 앞섬→ 속도: 35B-A3B가 3~5배 빠름 (같은 하드웨어 기준)→ VRAM: 27B ~16.8GB vs 35B-A3B ~21GB (Q4 기준)→ 결론: 코딩 에이전트 → 27B / 빠른 인터랙티브 → 35B-A3BDense vs MoE — 뭐가 다른가같은 Qwen3.6 패밀리지만 내부 구조가 근본적으로 다릅니다.Dense (27B):→ 27B 파라미터 전부 항상 활성→ 모든 토큰에 27B 파라미터가 계산에 참여→ 토큰당 ..

LLM 2026.04.24

Qwen3.6-27B 완전 분석 — 27B 모델이 397B MoE 능가

RTX 4090 한 장으로 프론티어급 코딩 에이전트를 돌릴 수 있는 시대가 왔습니다. 2026년 4월 22일 Alibaba Qwen Team이 공개한 Qwen3.6-27B는 27B dense 모델인데, 이전 플래그십이었던 397B MoE 모델 Qwen3.5-397B-A17B를 코딩 벤치마크 전 항목에서 앞질렀습니다. 라이센스는 Apache 2.0이라 상업적 사용에도 제약이 없습니다.핵심 요약출시는 2026년 4월 22일 Alibaba Qwen Team이 진행했으며, 라이센스는 Apache 2.0으로 상업 사용이 가능합니다. 파라미터는 27B dense로 이전 플래그십 Qwen3.5-397B 대비 약 14분의 1 크기입니다. VRAM은 Q4_K_M 양자화 기준 약 16.8GB로 RTX 4090 한 장으로 ..

LLM 2026.04.24

GPT-5.5 출시 완전 분석 — Claude Opus 4.7에 일주일 만에 날린 OpenAI의 반격

6주 만에 새 모델이 나왔습니다. AI 코딩 툴 전쟁, 이제 속도전입니다.[핵심 요약]→ GPT-5.5: 2026년 4월 23일 출시, GPT-5.4 이후 6주 만→ 핵심: 에이전트 코딩 특화, 다단계 작업 자율 처리→ 포지셔닝: Claude Opus 4.7 출시 일주일 만에 나온 직접 맞불→ 배포: Plus, Pro, Business, Enterprise 우선 / Free 미정→ 동반 출시: Privacy Filter (개인정보 자동 마스킹)→ OpenAI 현황: 주간 활성 사용자 9억 명, 유료 구독자 5,000만 명GPT-5.5가 나온 배경OpenAI가 4월 23일(현지시간) GPT-5.5를 공식 출시했습니다. GPT-5.4 출시 이후 불과 6주 만입니다. 업계에서는 이 속도 자체가 메시지라는 평가..

LLM 2026.04.24

Strands Agents 완전 가이드 2편 — 실전 튜토리얼

1편에서 Strands Agents의 개요와 철학을 다뤘어요.이번 편은 실제로 손으로 만들어봐요.이번 편에서 만드는 것:1. 설치 및 환경 설정2. 첫 번째 에이전트 (5분)3. 커스텀 툴 만들기4. Anthropic API 직접 연결 (AWS 없이)5. 멀티에이전트 구성6. MCP 서버 연결7. Lambda 배포 1단계 — 설치# Python 3.10 이상 필요python --version# 가상환경 생성python -m venv strands-envsource strands-env/bin/activate # Mac/Linux# strands-env\Scripts\activate # Windows# 기본 설치pip install strands-agents strands-agents-tools#..

AI Agent 2026.04.23

LiteLLM 완전 가이드 — Claude, GPT, Gemini 100개+ LLM을 코드 한 줄로 전환하기

LLM을 여러 개 쓰다 보면 이런 문제가 생겨요.# Claude 쓸 때import anthropicclient = anthropic.Anthropic()response = client.messages.create( model="claude-sonnet-4-6", max_tokens=1024, messages=[{"role": "user", "content": "안녕"}])text = response.content[0].text # 이렇게 꺼냄# GPT 쓸 때 → SDK 다르고, 응답 형식 다름from openai import OpenAIclient = OpenAI()response = client.chat.completions.create( model="gpt-5.4", me..

AI 개발 2026.04.23

Dify 완전 가이드 — 노코드로 RAG 챗봇, AI 에이전트, 워크플로우 한 번에

LangFlow랑 비슷한데 더 완성도 높은 플랫폼이에요.GitHub 스타: 137,000+ (2026년 4월 기준)라이선스: 오픈소스 (MIT)출시: 2023년투자: $3,000만 ($1.8억 밸류에이션)개발자뿐 아니라 기획자, 마케터도 쓸 수 있을 정도로 UI가 잘 돼있어요.LangFlow vs Dify — 뭐가 다른가둘 다 드래그앤드롭으로 AI 파이프라인 만드는 도구예요. 근데 느낌이 달라요.LangFlow:→ 개발자 친화적→ Python 커스텀 컴포넌트 강력→ 파이프라인 설계 중심→ 기술적 자유도 높음Dify:→ 비개발자도 쉽게 사용 가능→ 앱 배포까지 올인원→ 프롬프트 관리, 버전 관리 내장→ 팀 협업, 사용량 모니터링 기본 제공→ 앱 타입 구분 (챗봇/에이전트/워크..

AI Agent 2026.04.23

LangFlow 완전 가이드 4편 — 심화 튜토리얼 2 : 멀티 에이전트, MCP, 프로덕션 배포

3편에서 에이전트, 메모리, 커스텀 컴포넌트를 다뤘어요.이번 편은 시리즈 마지막이에요.이번 편에서 다루는 것:1. 멀티 에이전트 파이프라인2. MCP 서버 연결 (클라이언트)3. LangFlow를 MCP 서버로 노출 (Claude Desktop 연결)4. 프로덕션 배포 (Docker + PostgreSQL)5. 모니터링과 트레이싱 실전 1 — 멀티 에이전트 파이프라인에이전트가 다른 에이전트를 툴로 써요. 복잡한 작업을 역할별로 분담해요.구조 설계[사용자 질문] ↓[총괄 에이전트] ── 판단 ├── 리서치 필요? ──→ [리서치 에이전트] (웹 검색 전문) ├── 코드 필요? ──→ [코딩 에이전트] (코딩 전문) └── 직접 답변 가능 ──→ 바로 응답컴포넌트 ..

AI Agent 2026.04.23

LangFlow 완전 가이드 3편 — 심화 튜토리얼 : 에이전트, 메모리, 커스텀 컴포넌트

2편에서 기본 챗봇과 PDF RAG를 만들었어요.이번 편은 진짜 쓸만한 걸 만들어요.이번 편에서 만드는 것:1. 대화 메모리 챗봇 — 이전 대화 기억2. 웹 검색 에이전트 — 실시간 정보 검색3. 툴 조합 에이전트 — 검색 + 계산 + URL 읽기4. 커스텀 Python 컴포넌트 — 내가 원하는 기능 직접 만들기5. 조건 분기 플로우 — If/Else 로직실전 1 — 대화 메모리 챗봇기본 챗봇의 문제점:사용자: 내 이름은 셀이야Claude: 안녕하세요, 셀님!사용자: 내 이름이 뭐야?Claude: 죄송합니다. 이전 대화 내용을 기억하지 못합니다.메모리를 붙이면 해결돼요.방법 1 — Agent 컴포넌트 사용 (가장 간단)Agent 컴포넌트는 메모리가 기본으로 내장돼 있어요.컴포넌트:1. Chat Input..

AI Agent 2026.04.23

LangFlow 완전 가이드 2편 — 기본 튜토리얼 : 챗봇부터 PDF RAG까지

1편에서 LangFlow 설치와 개념을 다뤘어요.이번 편은 실제로 손으로 만들어봐요.이번 편에서 만드는 것:1. 기본 챗봇2. 시스템 프롬프트 챗봇3. PDF RAG 챗봇4. REST API 배포 + Python/JS 연동1편 설치 안 하신 분:pip install langflowlangflow run# http://localhost:7860 접속준비 — API 키 등록첫 번째 플로우 만들기 전에 API 키부터 등록해요.우상단 프로필 아이콘 클릭→ Settings→ Global Variables→ + Add Variable이름: ANTHROPIC_API_KEY값: sk-ant-xxxxxType: Credential→ SaveClaude 대신 OpenAI 쓸 경우:이름: OPENAI_API_KEY값: ..

AI Agent 2026.04.23

LangFlow 완전 가이드 1편 — 개요, 핵심 개념, 환경 세팅

LangFlow가 뭔가AI 파이프라인을 코드로 짜면 이렇게 돼요.from langchain.document_loaders import PyPDFLoaderfrom langchain.text_splitter import RecursiveCharacterTextSplitterfrom langchain.embeddings import OpenAIEmbeddingsfrom langchain.vectorstores import Chromafrom langchain.chains import RetrievalQAfrom langchain.chat_models import ChatAnthropicfrom langchain.memory import ConversationBufferMemory# ... 계속loader =..

AI Agent 2026.04.23
반응형