본문 바로가기

전체 글

(172)

OpenAI Advanced Account Security 완전 가이드 — 패스키, 보안 키, 세션 관리로 ChatGPT·Codex 계정 요새화 ChatGPT 계정에 민감한 업무 정보가 쌓이고 있습니다. 피싱 공격자도 그걸 알고 있습니다. OpenAI가 처음으로 하드웨어 보안 키 수준의 보호를 도입했습니다.[핵심 요약]→ 출시: 2026년 4월 30일→ 대상: ChatGPT + Codex 계정 (동일 로그인)→ 방식: 옵트인 (선택 가입) — 일반 사용자 자발적 설정→ 의무화: "Trusted Access for Cyber" 프로그램 멤버 → 2026년 6월 1일부터 필수→ 핵심 기능 4가지: 패스워드리스 로그인, 강화된 계정 복구, 세션 관리, 학습 자동 제외→ 파트너: Yubico (YubiKey C NFC, YubiKey C Nano 공동 번들)→ 중요: 등록 후 OpenAI 지원팀이 계정 복구 불가 → 사용자 책임→ 주요 대상: 기자, 연..

OpenAI × AWS 완전 분석 — GPT-5.5, Codex, Managed Agents가 Amazon Bedrock에 상륙한 이유 Microsoft 독점이 끝난 다음 날, AWS가 움직였습니다. $50B 투자, OpenAI 모델 전체를 Bedrock으로.[핵심 요약]→ 발표: 2026년 4월 28일 (AWS "What's Next" 이벤트, 샌프란시스코)→ 배경: Microsoft-OpenAI 독점 계약 종료 다음 날 발표→ 투자: Amazon → OpenAI $50B ($15B 즉시 + $35B 조건부)→ 3가지 출시: OpenAI 모델 on Bedrock + Codex on Bedrock + Managed Agents→ 모델: GPT-5.5, GPT-5.4 포함 (한정 프리뷰)→ 코딩: Codex CLI, 데스크탑 앱, VS Code 익스텐션 → AWS 자격증명으로 인증→ 에이전트: Amazon Bedrock Managed Ag..

OpenAI 저지연 음성 AI 인프라 완전 분석 — WebRTC 아키텍처를 뜯어고친 이유와 개발자 적용 가이드 900M 주간 사용자에게 300ms 이하 음성 응답을 전달하는 인프라. OpenAI가 내부 아키텍처를 공개했습니다.[핵심 요약]→ 발행: 2026년 5월 4일 (OpenAI 엔지니어링 블로그)→ 저자: Yi Zhang, William McDonald (OpenAI 실시간 AI 팀)→ 핵심 문제: Kubernetes에서 WebRTC 대규모 서빙이 안 됨→ 해결: Split Relay + Transceiver 아키텍처→ 목표 레이턴시: E2E 300~500ms (자연스러운 대화 기준)→ 규모: 주간 활성 사용자 9억명+ 대상→ 함께 출시: gpt-realtime-mini (지시 따르기 +18.6%p, 툴 호출 +12.9%p)→ 개발자 시사: 음성 에이전트 아키텍처 설계 기준이 바뀜왜 이 글이 중요한가Open..

OpenAI Symphony 완전 가이드 — Linear 이슈 트래커를 에이전트 컨트롤 플레인으로 만드는 법 이슈 하나당 에이전트 하나. 사람은 결과만 리뷰. OpenAI 내부팀 PR 500% 증가. 오픈소스로 공개됐습니다.[핵심 요약]→ 출시: 2026년 4월 27일 (OpenAI 오픈소스)→ 라이센스: Apache 2.0→ GitHub: github.com/openai/symphony→ 정체: 이슈 트래커(Linear) → 코딩 에이전트 자동 오케스트레이터→ 핵심: 이슈 하나 = 에이전트 하나 = 독립 워크스페이스 = PR 하나→ 효과: OpenAI 내부 팀 PR 3주 만에 500% 증가→ 구현: Elixir 레퍼런스 구현 포함 (다른 언어 포팅 가능)→ 주의: Claude Code + GitHub Issues 포트 버전도 이미 등장→ 한계: 복잡한 판단이 필요한 작업 → 대화형 세션이 여전히 적합 왜 Sy..

5개국 "에이전트 AI 보안 가이드" 완전 분석 — 정부가 경고한 AI 에이전트 5가지 위험과 개발자 체크리스트 CISA, NSA, 영국, 호주, 캐나다, 뉴질랜드가 함께 경고했습니다. AI 에이전트는 이미 핵심 인프라에서 돌아가고 있고, 대부분의 조직이 아무도 실시간으로 감사할 수 없을 만큼 많은 권한을 줬다고.[핵심 요약]→ 발표: 2026년 5월 1일 (Five Eyes 6개 기관 공동)→ 발행처: CISA, NSA (미국), ASD ACSC (호주), CCCS (캐나다), NCSC-NZ (뉴질랜드), NCSC (영국)→ 문서: "Careful Adoption of Agentic AI Services" (28페이지)→ 대상: 정부, 핵심 인프라, 기업 (규모 무관)→ 핵심 메시지: "에이전트 AI를 점진적으로 배포하라. 저위험 작업부터"→ 위험 5가지: 권한, 설계/구성, 행동, 구조, 책임→..

OpenCode 완전 가이드 — 자체 API 키로 Claude Code 대신 쓰는 오픈소스 터미널 에이전트 Claude Code는 월 $20입니다. OpenCode는 오픈소스에 자체 API 키를 씁니다. 같은 Claude Opus 4.7을 쓰면서 구독료가 없습니다.[핵심 요약]→ 정체: 오픈소스 터미널 기반 AI 코딩 에이전트→ 개발: Anomaly (SST 팀, terminal.shop 개발자)→ 라이센스: MIT — 완전 무료, 소스 공개→ GitHub: 150,000개 스타, 850명 기여자, 6.5M 월간 사용자→ 핵심: BYOK (Bring Your Own Key) — 자체 API 키로 75개+ 모델 사용→ 실행: TUI (터미널), 데스크탑 앱, IDE 익스텐션 (VS Code, Cursor, Zed)→ 특징: Plan/Build 모드, 멀티 에이전트, LSP 통합, MCP 지원, 세션 관리→ 비용..

IBM Granite 4.1 완전 분석 — 8B가 32B MoE를 이긴 이유, 파라미터보다 훈련이 중요하다 IBM이 "더 크게 만들기" 대신 "더 잘 훈련하기"를 선택했습니다. 8B 모델이 이전 32B MoE를 벤치마크 전 항목에서 앞섰습니다.[핵심 요약]→ 출시: 2026년 4월 29일 (IBM Research)→ 라이센스: Apache 2.0 — 상업 이용 무료→ 모델: 3B, 8B, 30B dense decoder-only transformer→ 컨텍스트: 128K (프로덕션), 512K (확장)→ 핵심: 8B dense가 이전 32B MoE(Granite 4.0-H-Small)를 전 벤치마크에서 앞섬→ 툴 호출 (BFCL V3): 8B 68.3 vs 32B MoE 64.7→ 훈련 데이터: 15조 토큰, 5단계 훈련→ 함께 출시: Granite Vision 4.1, Speech 4.1 (2B), Guar..

임베딩 모델 완전 가이드 — text-embedding 선택과 RAG 적용 RAG를 만들었는데 검색 품질이 나쁩니다. 청킹도 바꿔보고 프롬프트도 바꿨는데 여전합니다. 임베딩 모델이 문제일 수 있습니다. 선택 기준부터 실전 적용까지 정리했습니다.[핵심 요약]→ 임베딩: 텍스트를 의미 기반 숫자 벡터로 변환하는 것→ 역할: RAG에서 "관련 문서를 찾는" 핵심 엔진→ 모델 선택이 RAG 품질의 40~60%를 결정→ 주요 모델: Qwen3-Embedding, OpenAI, Cohere, bge-m3, Voyage AI→ 한국어: Qwen3-Embedding-8B, bge-m3, Cohere multilingual 추천→ 평가: MTEB 벤치마크 기준 + 실제 도메인 테스트 필수→ 비용: 로컬(무료) vs API(편리) — 볼륨에 따라 선택임베딩이 뭔지 30초 정리# 임베딩 = 텍스트..

이전 1 2 3 4 5 ··· 22 다음

티스토리툴바