AI Agent

n8n AI 에이전트 워크플로우 실전 — 코드 없이 에이전트 만드는 법

cell-devlog 2026. 6. 10. 14:42
반응형

LangGraph, CrewAI 보다가 "이거 코드 너무 많이 써야 하는데" 싶었던 적 있으면 n8n이 답입니다. AI Agent 노드 하나에 LLM, 메모리, 툴 연결하면 에이전트가 완성됩니다. 실제로 동작하는 워크플로우 두 개 만들어보겠습니다.


핵심 요약

→ n8n은 오픈소스 워크플로우 자동화 플랫폼 — Zapier 셀프호스팅 버전이라 보면 됨
→ AI Agent 노드가 핵심 — LangChain 기반으로 LLM 추론·툴 호출·메모리를 시각적으로 연결
→ 지원 LLM: OpenAI GPT-5.5, Claude Fable 5/Opus 4.8/Sonnet, Gemini 3.5 Flash, Ollama 로컬 모델
→ 코드 없이 만들 수 있지만 HTTP Request 노드로 어떤 API든 붙일 수 있음
→ 메모리 타입 3가지 — Window Memory(기본), Buffer Memory, Vector Store Memory
→ MCP Server Trigger 노드로 n8n 워크플로우를 Claude Desktop·Cursor·VS Code에 MCP 툴로 노출 가능
→ n8n cloud 무료 트라이얼 있음 — 셀프호스팅은 Docker 한 줄
→ LangGraph 대비 배포 속도 압도적으로 빠름 — 복잡한 멀티에이전트는 Python이 더 유리
→ 에이전트는 "판단이 필요한 단계"에만 쓸 것 — 나머지는 그냥 워크플로우 자동화로
→ 비용 폭탄 주의 — 툴 호출 루프가 예상보다 많이 돌면 토큰 급증


실전 1 — n8n 설치

옵션 A: n8n Cloud (가장 빠름)

n8n.io에서 무료 트라이얼 시작. 서버 세팅 없이 바로 시작됩니다.

옵션 B: Docker 셀프호스팅

docker run -it --rm \
  --name n8n \
  -p 5678:5678 \
  -v ~/.n8n:/home/node/.n8n \
  n8nio/n8n

브라우저에서 http://localhost:5678 접속하면 끝입니다.


실전 2 — AI 에이전트 기본 구조

n8n AI 에이전트 워크플로우는 항상 4개 레이어로 구성됩니다.

[Trigger 노드]          ← 에이전트를 언제 실행할지
      ↓
[AI Agent 노드]         ← LLM 추론 + 툴 선택 + 루프
      ├── [Chat Model]  ← LLM 연결 (Claude, GPT, Gemini 등)
      ├── [Memory]      ← 대화 컨텍스트 유지
      └── [Tools]       ← 에이전트가 호출할 수 있는 기능들
      ↓
[Output 노드]           ← 결과를 어디로 보낼지

개념 박스 — 에이전트 vs 워크플로우 일반 n8n 워크플로우는 순서가 고정됩니다. A → B → C를 항상 이 순서로 실행합니다. AI 에이전트는 다릅니다. 목표를 주면 어떤 툴을 어떤 순서로 쓸지 LLM이 직접 판단합니다. 판단이 필요 없는 단순 자동화는 그냥 워크플로우로 만드는 게 빠르고 저렴합니다.


실전 3 — 웹 리서치 에이전트 만들기

주제를 주면 웹 검색 후 요약 리포트를 슬랙으로 보내는 에이전트입니다.

노드 구성:

[Webhook Trigger]
      ↓
[AI Agent]
  ├── Chat Model: Claude Sonnet 4.6
  ├── Memory: Window Buffer Memory (마지막 10개 메시지)
  └── Tools:
        ├── SerpAPI (웹 검색)
        └── HTTP Request (URL 내용 가져오기)
      ↓
[Slack 노드] → #research 채널로 전송

AI Agent 노드 시스템 프롬프트:

당신은 리서치 에이전트입니다.
사용자가 주제를 주면:
1. SerpAPI로 최신 정보 검색
2. 상위 3개 URL 내용 가져오기
3. 핵심 내용 3~5개 불릿으로 요약
4. 출처 URL 포함해서 마크다운으로 작성

한국어로 답변하세요.

Webhook으로 트리거하는 법:

curl -X POST https://your-n8n.com/webhook/research \
  -H "Content-Type: application/json" \
  -d '{"topic": "Claude Fable 5 성능 분석"}'

실전 4 — 고객 지원 봇 with 메모리

이전 대화를 기억하면서 답변하는 챗봇입니다. 메모리 타입 선택이 핵심입니다.

[Chat Trigger]          ← n8n 내장 챗 UI 또는 외부 연결
      ↓
[AI Agent]
  ├── Chat Model: GPT-5.5 Instant (빠른 응답)
  ├── Memory: Window Buffer Memory
  │     └── Window Size: 10 (마지막 10턴 유지)
  └── Tools:
        ├── Postgres (고객 DB 조회)
        ├── HTTP Request (내부 API 호출)
        └── Gmail (이메일 발송)

개념 박스 — 메모리 타입 3가지

타입 특징 언제 쓰나
Window Buffer Memory 마지막 N개 메시지만 유지 대부분의 경우 (기본 추천)
Buffer Memory 전체 대화 저장 짧은 세션, 완전한 컨텍스트 필요 시
Vector Store Memory 임베딩으로 관련 기억만 검색 대화가 매우 길어지는 경우

프로덕션에서 Window Buffer Memory를 가장 많이 씁니다. Buffer Memory는 대화가 길어지면 토큰이 폭발합니다.


실전 5 — MCP 서버로 Claude Desktop에 연결

n8n 워크플로우를 MCP 툴로 노출하면 Claude Desktop이나 Cursor에서 직접 호출할 수 있습니다.

[MCP Server Trigger 노드]
      ↓
[원하는 워크플로우 로직]
      ↓
[Respond to MCP 노드]

Claude Desktop claude_desktop_config.json에 추가:

{
  "mcpServers": {
    "n8n-agent": {
      "command": "npx",
      "args": [
        "mcp-remote",
        "https://your-n8n.com/mcp/your-workflow-id/sse"
      ]
    }
  }
}

이렇게 하면 Claude Desktop에서 "n8n으로 슬랙 보내줘"라고 하면 n8n 워크플로우가 바로 실행됩니다.


실전 6 — 비용 관리

에이전트 루프에서 토큰이 생각보다 많이 나옵니다.

❌ 비용 폭탄 패턴
  - 시스템 프롬프트에 필요 없는 컨텍스트 잔뜩 넣기
  - 툴을 10개 이상 연결해두기 (툴 목록 자체가 토큰 소모)
  - Buffer Memory로 무한정 대화 누적

✅ 비용 절감 패턴
  - 모델 라우팅: 단순 분류는 GPT-4.1 mini, 복잡한 추론만 Claude Sonnet
  - 툴은 3~5개로 제한
  - Window Memory + 적절한 window size 설정
  - 프롬프트 캐싱 지원 모델 사용 (Claude 계열)

모델별 비용 비교 (n8n에서 선택 가능):

모델 입력 출력 추천 용도

GPT-4.1 mini $0.40 $1.60 단순 분류, 라우팅
Gemini 3.5 Flash $1.50 $9 빠른 일반 작업
Claude Sonnet 4.6 $3 $15 균형형
GPT-5.5 Instant $5 $30 고성능 필요 시

n8n vs LangGraph 한 줄 비교

n8n LangGraph

시작 속도 30분 이내 수 시간
코드 필요 여부 거의 없음 필수
커스터마이징 제한적 완전 자유
멀티에이전트 단순 구조 복잡한 그래프 가능
디버깅 시각적으로 바로 보임 코드 레벨
추천 상황 MVP·내부 툴·빠른 프로토타입 프로덕션 복잡한 에이전트

✅ n8n 에이전트가 잘 맞는 경우

✅ 코드 없이 빠르게 에이전트 프로토타입 검증
✅ Slack·Gmail·Notion·DB 같은 SaaS 연동이 많은 워크플로우
✅ 개발자가 아닌 팀원도 워크플로우를 수정해야 할 때
✅ MCP로 Claude Desktop이나 Cursor에 사내 툴 연결

❌ 다른 걸 써야 하는 경우

❌ 복잡한 멀티에이전트 오케스트레이션 (LangGraph 추천)
❌ 에이전트 내부 로직을 세밀하게 제어해야 할 때
❌ 고성능 배치 처리 파이프라인

 

반응형