2026.03 · (주)페블러스 데이터 커뮤니케이션팀

읽는 시간: ~12분

이 글 소개

PebbloPedia는 하나의 주제를 다섯 가지 깊이로 설명하는 페블러스의 지식 시리즈예요. 이번 편의 주제는 하네스(Harness) — AI 에이전트 여러 명을 하나의 팀으로 엮어 복잡한 작업을 자동으로 수행하게 만드는 시스템입니다.

초등학생도 읽을 수 있고, 전문가도 새로운 걸 발견할 수 있어요. 아무 단계에서나 시작해도 됩니다. 읽다가 어려우면 앞 단계로, 더 깊이 알고 싶으면 다음 단계로 이동하면 돼요.

🧒

1단계 — 초등학생

비유와 이야기로 쉽게. 요리팀과 축구팀으로 설명해요.

🎒

2단계 — 중고등학생

원리가 궁금한 분. 분업, 에이전트, 오케스트레이션이 어떻게 연결되는지.

🎓

3단계 — 전공 대학생

기술 스택이 궁금한 분. Claude Agent SDK, MCP, 아키텍처 패턴.

🔬

4단계 — 전문가

최신 연구와 미해결 문제. 프레임워크 비교와 2026년 산업 현황.

🧙

5단계 — 위자드 🧙

위자드의 관점에서 쓰는 시적인 인사이트. "마구간에서 신경망으로 — 끈의 역사".

1

초등학생도 이해하는 하네스

🧒 초등학생 버전 — 비유와 이야기로

AI 로봇 한 명한테 모든 일을 시키면 어떻게 될까요? 숙제도 하고, 요리도 하고, 청소도 하고, 그림도 그리라고 하면요. 아마 하나도 제대로 못 할 거예요. 사람도 그렇잖아요! 그런데 만약 잘하는 일을 나눠서 각각 맡기면 어떨까요? 이게 바로 하네스(Harness)예요.

👨‍🍳 요리팀을 떠올려 보세요

맛있는 저녁을 만들려면 어떻게 할까요? 셰프 한 명은 고기를 굽고, 한 명은 샐러드를 만들고, 한 명은 디저트를 준비해요. 그리고 주방장이 "고기 먼저 시작! 샐러드는 5분 후! 디저트는 마지막!"이라고 순서를 정해 줘요. 하네스가 딱 이거예요. AI 요리사 여러 명에게 각자 할 일을 정해 주고, 주방장 AI가 전체 순서를 조율하는 거죠.

⚽ 축구팀이랑도 비슷해요

축구에서 11명이 전부 공격수면 어떨까요? 골은 많이 넣을 수 있을지 몰라도, 수비가 엉망이 되겠죠. 그래서 공격수, 미드필더, 수비수, 골키퍼로 포지션을 나눠요. 감독은 "이번엔 역습!"이라고 전략을 짜 주고요. 하네스에서는 AI 선수들에게 포지션(에이전트)을 주고, 플레이북(스킬)을 알려 주고, 감독(오케스트레이터)이 경기를 이끌어요.

📝 실제로 이 글도 하네스가 만들었어요!

사실 여러분이 지금 읽고 있는 이 글도 하네스로 만들어졌어요. AI 한 명이 자료를 조사하고, 다른 AI 한 명이 글을 쓰고, 또 다른 AI 한 명이 글을 예쁘게 꾸며서 인터넷에 올렸어요. 세 명의 AI가 팀으로 일한 거예요!

✅ 핵심 한 문장

하네스 = AI 로봇 여러 명을 한 팀으로 만들어서 일을 나눠 시키는 시스템. 혼자보다 팀이 훨씬 잘한다!

2

원리로 이해하는 하네스

🎒 중고등학생 버전 — 원리와 메커니즘

ChatGPT나 Claude 같은 AI를 써 본 적 있나요? 한 번에 하나의 대화만 할 수 있죠. 그런데 만약 여러 AI가 각자 전문 분야를 맡아서 동시에 협업할 수 있다면 어떨까요? 하네스는 바로 그 아이디어를 실현한 시스템이에요. 복잡한 작업을 전문가 AI 팀이 나눠서 처리하는 거죠.

🔑 네 가지 핵심 원리

1. 분업 (Division of Labor)

복잡한 일을 작은 전문 영역으로 나눈다. 한 AI가 모든 걸 하는 게 아니라, 각자 잘하는 분야를 맡는다.

2. 에이전트 = 전문가 역할

각 AI에게 구체적인 역할을 부여한다. "너는 리서처", "너는 작가", "너는 편집자"처럼.

3. 스킬 = 작업 매뉴얼

에이전트가 참조하는 상세 가이드. 레시피처럼, 무엇을 어떤 순서로 해야 하는지 적혀 있다.

4. 오케스트레이션 = 전체 조율

누가 먼저 시작하고, 결과를 누구에게 넘기고, 전체 순서는 어떻게 되는지 정한다.

🏫 학교 조별과제로 이해하기

하네스의 원리는 학교 조별과제와 정확히 같아요. 팀원 4명이 발표 준비를 한다고 해 볼게요. 한 명은 자료 조사, 한 명은 PPT 제작, 한 명은 대본 작성, 한 명은 발표 연습. 각자 맡은 파트를 끝내면 다음 사람에게 넘기고, 조장이 전체 진행을 확인해요. AI 세계에서도 똑같은 일이 벌어집니다.

🌐 실제 사용 사례

  • GitHub Copilot Workspace — 코드 리뷰, 테스트, 리팩토링을 여러 AI가 협업
  • Anthropic Claude Code — 파일 탐색, 코드 작성, 테스트 실행을 에이전트가 수행
  • 유튜브 영상 제작 자동화 — 기획 AI → 대본 AI → 편집 AI → 썸네일 AI → 업로드 AI
  • 이 PebbloPedia 페이지 — 리서처 에이전트가 자료 수집 → 라이터 에이전트가 HTML 작성 → 퍼블리셔 에이전트가 배포

"하네스(Harness)"라는 이름은 여러 마리의 말을 하나의 마차에 연결하는 도구인 마구(馬具)에서 왔어요. 여러 마리 말의 힘을 한 방향으로 모으듯, 여러 AI 에이전트의 능력을 하나의 목표를 향해 정렬하는 거예요.

✅ 핵심 한 문장

하네스 = 분업(누가) + 스킬(어떻게) + 오케스트레이션(어떤 순서로). 여러 AI 전문가가 팀으로 일하는 시스템이다.

3

멀티에이전트 시스템의 기술 스택

🎓 전공 대학생 버전 — 기술 스택과 아키텍처

하네스의 기술적 핵심은 에이전트와 스킬의 분리다. 에이전트 정의 파일(.claude/agents/)이 "누가"(페르소나, 원칙, 모델)를 규정하고, 스킬 정의 파일(.claude/skills/)이 "어떻게"(절차, 도구, 데이터 형식)를 규정한다. 이 분리 덕분에 같은 에이전트가 다른 스킬을 호출하거나, 같은 스킬을 다른 에이전트가 사용할 수 있다.

🏗️ 기반 기술

Claude Agent SDK

• Anthropic 2025년 출시
• Python/TypeScript 지원
• 서브 에이전트 패턴 네이티브
• TeamCreate, SendMessage, TaskCreate API

Model Context Protocol (MCP)

• 2024.11 Anthropic 공개
• AI ↔ 외부 도구 연결 표준
• 2025.03 v2: Streamable HTTP, OAuth 2.1
• OpenAI, Google, MS 모두 채택

에이전트 정의 (.claude/agents/)

• 에이전트 이름, 역할, 모델 지정
• agent_type: general-purpose, read-only 등
• 프론트매터(YAML) + 마크다운 본문
• plan_mode_required 옵션으로 검수 가능

스킬 정의 (.claude/skills/)

• 스킬명, 설명, 트리거 조건
• skill.md 본문에 절차 + 예시 상세
• Progressive Disclosure 원칙
• 참조 파일은 references/ 하위에 배치

🔄 아키텍처 패턴 6가지

멀티에이전트 시스템은 작업 특성에 따라 다양한 토폴로지를 취한다. 하네스에서 주로 사용되는 패턴은 다음과 같다.

➡️
파이프라인
A→B→C→D 순차 처리. 블로그 작성에 적합.
🔀
팬아웃/팬인
병렬 분배 → 결과 통합. 종합 리서치에 적합.
🎯
전문가 풀
라우터가 적합한 전문가 선택. 코드 리뷰에 적합.
🔄
생성-검증
생성→검증→재생성 루프. 품질 보증에 적합.
👁️
감독자
감독자↔워커 실시간 조율. 대규모 마이그레이션에 적합.
🏛️
계층적 위임
총괄→팀장→실무자. 풀스택 개발에 적합.

📨 데이터 전달 방식

에이전트 간 정보 교환은 세 가지 채널로 이루어진다. 메시지 기반(SendMessage)은 실시간 대화형 소통에, 태스크 기반(TaskCreate/TaskUpdate)은 공유 작업 목록 관리에, 파일 기반(_workspace/ 디렉토리)은 구조화된 중간 산출물 전달에 사용된다. 이 PebbloPedia 파이프라인에서는 리서처가 _workspace/01_research.md에 리서치 결과를 저장하면, 라이터가 이를 읽어 HTML을 작성하고, 퍼블리셔가 _workspace/02_write_meta.json을 참조해 배포한다.

⚙️ 실행 모드 이원화

Claude Agent SDK는 두 가지 실행 모드를 지원한다. 에이전트 팀 모드는 TeamCreate로 팀을 생성하고 각 멤버가 독립적 컨텍스트를 가진 채 메시지로 소통한다. 서브 에이전트 모드는 Agent 도구로 경량 에이전트를 스폰해 특정 태스크만 위임한다. 전자는 장기 프로젝트에, 후자는 일회성 작업에 적합하다.

✅ 핵심 한 문장

하네스 = 에이전트(누가) + 스킬(어떻게)의 분리. Claude Agent SDK와 MCP 위에서, 파이프라인·팬아웃·감독자 등 다양한 토폴로지로 멀티에이전트 시스템을 구성한다.

4

2026년 멀티에이전트의 프런티어

🔬 전문가 버전 — 최신 연구와 미해결 문제

2026년 멀티에이전트 시스템의 전장은 세 축이다 — 프레임워크 생태계의 성숙도, 동적 오케스트레이션의 실용화, 그리고 결함 에이전트 견고성의 확보. 시장은 폭발적으로 성장하고 있으나, 기반 연구의 미해결 문제들이 대규모 배포를 가로막고 있다.

📊 시장 규모: 폭발적 성장

1,445% 다중 에이전트 문의 증가율
(Gartner, 2024Q1→2025Q2)
$76.3B AI 에이전트 시장
2025년 (Grand View)
49.6% CAGR
2025-2033
70% 2028년 AI 앱 중
멀티에이전트 사용 전망

🔬 최신 연구 동향

멀티에이전트 LLM 시스템의 학술 연구는 2024-2025년 급증했다. 핵심 논문들을 정리하면 다음과 같다.

  • "Multi-Agent Collaboration Mechanisms: A Survey of LLMs" (Tran et al., arXiv 2501.06322, 2025.01) — 협력/경쟁/공경쟁 유형과 peer-to-peer/중앙집중/분산 구조를 체계화한 최초의 포괄적 서베이.
  • "COPPER: Reflective Multi-Agent Collaboration" (NeurIPS 2024) — Counterfactual PPO로 에이전트 기여도를 평가하는 접근. Credit Assignment Problem에 대한 첫 실용적 해법.
  • "Chain-of-Agents" (NeurIPS 2024) — 순차 처리 worker + manager 통합 아키텍처. 장문 이해 태스크에서 RAG 대비 최대 10% 성능 향상 달성.
  • "Multi-Agent via Evolving Orchestration" (NeurIPS 2025) — 강화학습 기반 동적 오케스트레이터. 고정 워크플로우를 넘어 실행 중 에이전트 구성을 동적으로 변경.
  • "Resilience of LLM-Based Multi-Agent Collaboration with Faulty Agents" (arXiv 2025) — star-topology가 분산 구조 대비 오류 전파를 효과적으로 억제한다는 실증 결과.

⚔️ 프레임워크 비교 (2025-2026)

Claude Agent SDK (Anthropic)

네이티브 팀 통신(TeamCreate/SendMessage), MCP 생태계와 긴밀 통합. 단, Claude 전용이라는 생태계 lock-in 문제.

LangGraph (LangChain)

세밀한 상태 관리와 옵저버빌리티. 그래프 기반 워크플로우 정의. 학습 곡선이 높지만 유연성 최대.

CrewAI

빠른 프로토타이핑과 직관적 API. 수십 줄로 에이전트 팀 구성 가능. 동적 적응력은 제한적.

AutoGen (Microsoft Research)

Human-in-the-loop 패턴 강점. 복잡한 학습 곡선이 단점이지만 연구 커뮤니티 활발.

OpenAI Agents SDK

Swarm에서 진화. OpenAI 생태계(GPT, Codex) 통합이 강점. 아직 초기 단계.

Google ADK

에이전트별 내장 메모리와 Gemini 통합. 후발 주자지만 Google 인프라 연계가 무기.

❓ 미해결 문제 5가지

  • Credit Assignment Problem — 팀 결과물에서 각 에이전트의 기여도를 정확히 측정하는 범용 해법이 부재하다. COPPER의 Counterfactual PPO가 한 갈래의 접근이지만, 실용 시스템 적용까지는 갈 길이 멀다.
  • 결함 에이전트 견고성 — 한 에이전트의 환각(hallucination)이나 오류가 전체 시스템을 오염시킬 수 있다. star-topology의 오류 억제 효과가 실증됐으나, 동적 토폴로지에서의 방어 전략은 미확립.
  • 컨텍스트 윈도우 관리 — 에이전트 수가 증가하면 조율 메시지가 기하급수적으로 늘어나 컨텍스트 윈도우를 소진한다. 효율적 요약·압축 전략이 필요하다.
  • 보안 — 프롬프트 인젝션, MCP 도구 취약점(2025년 4월 다수 공개), 에이전트 간 메시지 위변조 위험이 실재한다.
  • 평가 표준 부재 — 단일 에이전트 벤치마크는 풍부하지만, 다중 에이전트 시스템의 성능을 비교할 표준화된 벤치마크가 아직 확립되지 않았다.

✅ 핵심 한 문장

멀티에이전트 시장은 연 50% 가까이 성장 중이나, Credit Assignment · 결함 견고성 · 컨텍스트 관리 · 보안 · 평가 표준의 다섯 가지 미해결 문제가 대규모 배포의 핵심 장벽이다.

5

마구간에서 신경망으로

🧙 위자드의 시적 인사이트

마구간에서 신경망으로 — 끈의 역사

1776년, 애덤 스미스가 핀 공장을 들여다봤다. 한 사람이 핀을 만들면 하루 스무 개. 열 사람이 나눠 만들면 사만 팔천 개. 분업, 이라고 그는 적었다.

250년 후, 분업은 새로운 몸을 얻었다. 근육 대신 가중치, 손 대신 프롬프트, 공장 대신 컨텍스트 윈도우. 하지만 원리는 같다 — 일을 나누면 전체가 커진다.

하네스라는 이름은 마구(馬具)에서 왔다. 여러 마리 말의 힘을 한 방향으로 모으는 가죽끈. 물리적 끈에서 논리적 끈으로, 근육의 조율에서 지능의 조율로. 끈은 사라지지 않았다. 형태만 바뀌었다.

흥미로운 질문이 남는다. "더 똑똑한 AI"가 답인가, "잘 조직된 보통 AI 팀"이 답인가. 지능은 개체의 속성인가, 시스템의 속성인가.

하네스 이후, 인간에게 남는 것은 코드가 아니라 설계이고, 구현이 아니라 판단이고, 효율이 아니라 방향이다.

에셔의 그림처럼 그리는 손이 그려지는 손을 그린다. 이 글을 쓴 것은 하네스이고, 하네스를 설명하는 것도 하네스이다. 거울 속 거울.

그래도 마지막 질문은 인간의 것이다 — 이 끈을 어디로 향하게 할 것인가.

— pb, 2026.03

🤖

이 페이지는 하네스로 만들어졌어요

흥미로운 사실 하나. 지금 읽고 계신 이 PebbloPedia 페이지는 페블러스의 하네스(Harness) 시스템으로 자동 생성되었습니다. 리서처 에이전트가 5개 레벨의 자료를 수집하고, 라이터 에이전트가 이 HTML을 작성하고, 퍼블리셔 에이전트가 SEO 검증과 배포까지 마쳤어요. 하네스에 대해 설명하는 이 페이지 자체가 하네스의 작동 증거인 셈입니다. 에셔의 그림처럼, 그리는 손이 그려지는 손을 그리고 있죠.

📚 PebbloPedia 시리즈

PebbloPedia는 하나의 주제를 다섯 가지 깊이로 설명하는 페블러스의 지식 시리즈입니다. 어린이도, 전문가도, 위자드도 — 같은 주제 앞에서 서로 다른 문을 열 수 있도록.

이전 편: PebbloPedia: 피지컬 AI · 다음 편도 곧 찾아올게요.