페블러스 투자 유치 제안서

Physical AI 시대를 위한
데이터 그린하우스 전략
(주)페블러스 - CONFIDENTIAL

암호가 올바르지 않습니다. 다시 시도해 주세요.

CONFIDENTIAL

Physical AI 시대를 위한
데이터 그린하우스 전략

"Green Data로 Physical AI 시장을 선점한다"

2025.10 · (주)페블러스

CONFIDENTIAL · English

Executive Summary

AI 기술이 범용화되며 시장은 명확히 양분되고 있습니다. IT 기업이 자체 개발하는 '범용 AI' 시장은 레드오션이 된 반면, AI 자체 구축 역량이 부족하지만 도입 수요는 폭발적인 'Non-IT 기간산업' 분야에서 거대한 블루오션이 열리고 있습니다.

Physical AI(로보틱스, 자율주행, 스마트팩토리, 조선, 국방)의 성공은 모델이 아닌 데이터에 달려있습니다. Physical AI의 3대 데이터 병목은 희소성(현실에 존재하지 않는 데이터), 보안성(On-Premise 환경 필수), 복잡성(멀티모달 데이터의 실시간 처리)입니다.

페블러스는 이 특화된 시장을 선점하기 위해 '데이터 그린하우스(Data Greenhouse)'를 비전으로 제시합니다. GTM 전략은 Mobility-First로, 현대자동차그룹 레퍼런스에서 글로벌 모빌리티 진출, 조선/국방 시장 선점으로 Physical AI 시대의 그린 데이터 공급자로 성장합니다.

1. Physical AI 패러다임: 왜 지금인가?

AI 시장의 양분화

GenAI와 LLM의 발전은 AI 기술의 '상향 평준화'를 가져왔습니다. IT 역량이 높은 기업은 AI 솔루션을 구매하지 않고 자체 개발합니다. 이는 '범용 AI 솔루션' 시장의 종말이자, AI를 자체 구축할 수 없지만 도입이 절실한 'Non-IT' 기간산업 (제조, 조선, 국방)이라는 거대한 블루오션의 개막입니다.

Physical AI의 시장 기회

  • 로보틱스: 범용 로보틱스의 ChatGPT 모멘트 도래
  • 자율주행: 물리적 세계를 이해하는 AI 시스템
  • 제조/조선/국방: AI 자체 구축 불가능한 기간산업

"Physical AI는 지각하고, 추론하고, 계획하고, 행동할 수 있는 AI입니다. 범용 로보틱스의 ChatGPT 모멘트가 곧 도래할 것입니다."
-- Jensen Huang, NVIDIA CEO, CES 2025 [6]

국가 전략의 중심

대한민국 정부는 'Physical AI 1등 국가 도약'을 국가 AI 대전환을 위한 15대 선도 프로젝트의 핵심 목표로 명시했습니다.[1]

정부 15대 선도 프로젝트 주요 목표

  • 휴머노이드 산업: 3대 강국 진입 ('30)
  • 자율주행차: 상용화 ('27)
  • 데이터 시장: 50조원 규모 달성 ('30)

로보틱스, 자율주행, 스마트팩토리는 국가 제조업 경쟁력과 직결되며, 관련 예산과 정책적 지원이 집중되어 시장의 폭발적 성장이 예상됩니다.

모델 중심에서 데이터 중심으로의 전환

파운데이션 모델의 보편화로 AI 개발 패러다임이 전환되고 있습니다. '데이터의 품질과 확보'가 기업의 핵심 경쟁력이 되었습니다.[2]

Data-Centric AI의 핵심 요소

  • 데이터 품질: 정확성, 일관성, 완전성 확보
  • 데이터 라벨링: 고품질 주석 및 메타데이터
  • 데이터 다양성: Edge Case 및 Long-tail 시나리오 커버

특히 Physical AI는 물리적 세계 기반 데이터로, 일반 웹 스크래핑으로 확보 불가능합니다. 데이터의 가치가 극대화되는 영역입니다.

2. 핵심 문제: Physical AI 데이터 병목

Problem #1

데이터 기근 (Data Scarcity)

Physical AI가 실제 환경에서 작동하려면 Long-tail 데이터가 필수적입니다. 그러나 희귀 불량 사례, 로봇 예외 동작, 자율주행 위험 상황 등은 현실에서 거의 발생하지 않아 획득이 불가능합니다.

현실의 데이터 기근 사례

  • 스마트팩토리: 연간 발생률 0.001% 미만의 희귀 불량 패턴
  • 자율주행: 실제 도로에서 위험 상황 재현 불가
  • 로보틱스: 예외 상황 발생 시 시스템 중단, 데이터 미수집

결과적으로 AI 모델은 엣지 케이스와 예외 상황에 대한 대응력이 부족하여 실전 배포가 어렵습니다.

Problem #2

보안 & 거버넌스 제약

제조, 조선, 국방 산업의 데이터는 핵심 기술 자산이자 국가 안보와 직결됩니다. 이러한 데이터는 클라우드 반출이 절대 불가능하며, 모든 처리가 On-Premise 환경에서 이루어져야 합니다.

On-Premise 필수 산업

  • 현대자동차: 차량 설계/제조 데이터 외부 반출 금지
  • 조선업: 선박 도면 및 건조 공정 기밀
  • 국방산업: 무기체계 및 군사 시설 데이터 보안등급 최상

더 나아가, 데이터 품질 관리와 통제를 위한 내부 규정(Data Governance) 역시 보안이 필요합니다. 데이터 수집/가공/활용 정책, 품질 기준, 접근 권한 체계 등은 기업의 AI 경쟁력과 직결된 핵심 노하우이며, 외부 유출 시 경쟁 우위를 상실하게 됩니다.

결과적으로 클라우드 기반 AI 도구 사용이 제한되고, 데이터 처리 및 AI 개발의 효율성이 크게 저하되며, 거버넌스 구축 자체가 장벽이 됩니다.

Problem #3

멀티모달 데이터 복잡성

Physical AI는 물리적 세계를 이해하기 위해 이질적인 멀티모달 데이터를 실시간으로 통합해야 합니다. 센서, 비전 카메라, 시계열 로그, 3D 공간 데이터 등 서로 다른 형식과 주기를 가진 데이터의 동기화와 처리는 극도로 복잡합니다.

멀티모달 데이터 통합 과제

  • 센서 융합: LiDAR, 레이더, IMU, GPS 등 다양한 센서 데이터 동기화
  • 시계열 정렬: 서로 다른 샘플링 주기를 가진 데이터의 시간 정렬
  • 실시간 처리: 밀리초 단위 지연으로 대용량 데이터 스트림 처리

대부분의 기업은 데이터 파이프라인 구축에 실패하여 AI 프로젝트 자체가 좌초됩니다.

핵심 인사이트

Physical AI 시대의 진정한 해자(Moat)는 모델이 아닙니다. 희소하고, 보안이 필요하며, 복잡한 데이터를 수집/정제/생성하는 '데이터 파이프라인' 그 자체가 가장 큰 경쟁력입니다.

이 파이프라인을 구축하고 운영할 수 있는 기업만이 Physical AI 시장에서 살아남을 수 있습니다.

3. 페블러스 솔루션: 데이터 그린하우스

페블러스의 '데이터 그린하우스'는 Physical AI 데이터의 3가지 핵심 문제를 1:1로 해결하는 End-to-End 플랫폼입니다.

이는 기존 '데이터 클리닉' 비전이 GenAI, Agentic AI, 규제 대응 등 최신 기술과 결합하여 완성된 구체적인 솔루션입니다.

3.1. 솔루션 구성 요소

Solution #1

Hyper-Synthetic Data

해결하는 문제: Problem #1 데이터 기근 (Data Scarcity)

GenAI와 CG 기술을 결합하여, 현실에 존재하지 않거나 극히 드문 데이터를 초고품질 '하이퍼-합성데이터(Green Data)'로 생성합니다.

Hyper-Synthetic Data 생성 사례

  • 휴머노이드: 다양한 동작 패턴 및 예외 상황 데이터
  • 스마트팩토리: 희귀 불량 사례 및 로봇 용접 시뮬레이션
  • 국방/조선: 해무 속 적군 객체, 위험 상황 시나리오

이는 단순한 데이터 증강(Augmentation)이 아닌, 존재하지 않는 데이터의 '창조(Creation)'입니다.

Solution #2

Agentic Data Clinic (On-Premise)

해결하는 문제: Problem #2 보안 & 거버넌스 제약

최신 'Agentic AI' 기술을 탑재한 AI 에이전트가 고객사의 내부망(On-Premise)에서 보안 데이터를 자율적으로 진단, 정제, 개선합니다.

Agentic Clinic의 자율 작업

  • 자동 진단: 데이터 품질 문제 자동 탐지 및 분석
  • 자율 정제: 노이즈 제거, 이상치 처리, 라벨 보정
  • AI-Ready 변환: 모델 학습에 최적화된 형식으로 자동 변환

'On-Premise' 요건을 완벽히 충족하면서도 데이터 품질(Problem #1의 Quality) 문제도 함께 해결합니다.

Solution #3

PebbloScope

해결하는 문제: Problem #3 멀티모달 데이터 복잡성

복잡한 멀티모달 데이터를 3D로 시각화하여 AI 전문가가 아닌 'Non-IT' 현업 담당자가 직관적으로 데이터를 이해하고 소통하게 합니다.

PebbloScope의 주요 기능

  • 3D 시각화: 센서, 비전, 로그 데이터를 3D 공간에 통합 표시
  • 직관적 인터페이스: 공장 관리자, 조선소 현장소장도 쉽게 사용
  • 소통 도구: 현장 니즈를 AI 개발에 정확히 반영

이는 현장과 AI 개발팀 간 "소통과 해석의 벽"을 허무는 핵심 소통 도구입니다.

3.2. 핵심 아키텍처: Edge-to-Core

'데이터 그린하우스'는 Physical AI 환경에 최적화된 'Edge-to-Core' 아키텍처를 기반으로 작동합니다. Physical AI를 위한 데이터 파이프라인은 현장에서의 실시간 반응(Edge)과 중앙에서의 대규모 학습(Core)이 동시에 요구되는 고유한 과제를 안고 있습니다.[8]

At the Edge (현장)

엣지 컴퓨팅에 최적화된 '데이터렌즈(DataLens)'가 공장, 로봇, 차량 등 현장에서 발생하는 방대한 실시간 멀티모달 데이터를 수집하고 경량화하여 Core로 전송합니다.

  • 현장에서의 즉각적인 데이터 품질 검증
  • 실시간 데이터 경량화 및 전처리
  • 네트워크 대역폭 최적화

At the Core (On-Premise)

고객사 내부망(서버실)의 '데이터 클리닉(Data Clinic)'이 Edge에서 전송된 데이터를 받아 복잡하고 무거운 연산을 수행합니다.

  • Agentic AI 진단: 자율적 데이터 품질 분석 및 개선
  • Hyper-Synthetic 생성: 고품질 합성 데이터 대량 생성
  • PebbloScope 시각화: 3D 멀티모달 데이터 통합 표시
  • 대규모 모델 학습 및 분석 작업 수행

3.3. 통합 AI 거버넌스

'데이터 그린하우스'는 단순히 데이터를 처리하는 것을 넘어, AI 규제 및 거버넌스 요소를 통합 관리합니다.

준수하는 글로벌 AI 규제 및 표준

  • EU AI Act: 유럽 AI 규제 대응
  • ISO/IEC 42001: AI 경영 시스템 표준[4]
  • ISO/IEC 5259: 데이터 품질 표준
  • ISO/IEC 42119: AI 시험평가 표준

강화되는 글로벌 규제에 대응하여 데이터의 수명주기, 품질, 편향성을 추적하고 감사 리포트를 자동 생성합니다.

이는 Problem #2에서 언급한 데이터 거버넌스 구축 장벽을 해결하며, 기업이 AI를 책임감 있게 도입하고 운영할 수 있는 기반을 제공합니다.

솔루션 요약

페블러스의 '데이터 그린하우스'는 Physical AI의 3대 데이터 병목을 해결하는 완전한 플랫폼입니다:

  • Hyper-Synthetic로 데이터 기근 해결
  • Agentic Clinic으로 보안 & 거버넌스 대응
  • PebbloScope로 복잡성 문제 해결
  • Edge-to-Core 아키텍처로 실시간성과 확장성 확보
  • 통합 거버넌스로 글로벌 규제 준수

4. 고객 가치 입증: 산업별 ROI 시나리오

페블러스의 '데이터 그린하우스'가 실제 산업 현장에 적용되었을 때의 구체적인 효과와 투자 대비 수익(ROI)을 세 가지 시나리오를 통해 입증합니다.

Scenario #1

모빌리티 - 현대자동차 스마트팩토리 용접 불량 검출

핵심 정보

  • 산업: 모빌리티 (Automotive)
  • 고객: 현대자동차 광명공장
  • 문제: 데이터 기근

기대 ROI

투자: $1M (13억원)

ROI: 8,150%+

회수 기간: 1.8개월

Scenario #2

조선 - 한국 조선소 건조 일정 예측 & 최적화

핵심 정보

  • 산업: 조선 (Shipbuilding)
  • 고객: 한국 주요 조선소
  • 문제: 멀티모달 데이터 복잡성

기대 ROI

투자: $2M (26억원)

ROI: 1,725%+

회수 기간: 8개월

Scenario #3

국방 - 해병대 전술 훈련 합성 데이터 생성

핵심 정보

  • 산업: 국방 (Defense & Military)
  • 고객: 대한민국 해병대
  • 문제: 데이터 기근 + 보안 제약

기대 ROI

투자: $2M (26억원)

ROI: 1,650%+

회수 기간: 8.3개월

종합 요약

시나리오 도메인 투자 ROI 회수 기간
#1 모빌리티 $1M 8,150%+ 1.8개월
#2 조선 $2M 1,725%+ 8개월
#3 국방 $2M 1,650%+ 8.3개월

핵심 메시지

페블러스의 '데이터 그린하우스'는 단순한 AI 도구가 아닌, Physical AI 시대의 필수 인프라입니다.

  • 모든 시나리오에서 1년 이내 투자 회수
  • 연간 1,650% ~ 8,150% ROI 달성
  • 데이터 생성 기간을 수년에서 2주로 단축
  • On-Premise 보안 완벽 준수

5. GTM 전략: Mobility-First

현대차 플래그십 레퍼런스를 기반으로 글로벌 모빌리티 시장을 선점하고, 조선/국방으로 확장하는 단계적 시장 진출 전략입니다.

Phase 1

현대차 플래그십 (2026)

현대자동차그룹과의 협업을 'On-Prem 데이터 그린하우스' 플래그십 레퍼런스로 확립

Phase 2

글로벌 모빌리티 (2027)

레퍼런스 기반 글로벌 모빌리티 시장 진출 (BMW, Toyota 등)

Phase 3

조선/국방 확장 (2027-2028)

데이터 기근과 AI 개발 수요가 가장 큰 조선 및 국방 시장 선점

6. 투자 계획

투자 규모

투자 유치 금액 20억원
Post-money 밸류에이션 200억원

자금 배분

투자금 사용 계획

On-Prem 제품화 40% (8억원)

Data Clinic On-Prem 버전 개발 및 최적화

GTM 실행 40% (8억원)

현대차 레퍼런스 확보 및 글로벌 영업 조직 구축

운영 안정화 20% (4억원)

조직 운영비 및 기술 인프라 유지

참고문헌

[1] 과학기술정보통신부 (2025). "AI/디지털 혁신성장 전략: 로봇 및 자율시스템 분야 육성 방안."

[2] Andrew Ng (2022). "Andrew Ng: Unbiggen AI." IEEE Spectrum.

[3] McKinsey & Company (2024). "The State of AI in 2024: Generative AI's Breakout Year."

[4] ISO/IEC 42001:2023. "Information technology -- Artificial intelligence -- Management system."

[5] Stanford HAI (2024). "Artificial Intelligence Index Report 2024."

[6] NVIDIA (2025). "CES 2025: Jensen Huang on Physical AI and Robotics."

[7] Pebblous Blog (2025). "데이터 스타트업이 Physical AI에 올라타는 법."

[8] Pebblous Blog (2025). "Physical AI를 위한 데이터 파이프라인: Edge-to-Core 아키텍처."

[9] 페블러스 (2025). "페블러스 투자제안서 (v22.0)." (별첨)

[10] S&P Global (2025). "AI in the Automotive Industry."

[11] UnitX Labs (2025). "ROI of Automated Visual Inspection Systems."

[12] Beamo.ai (2024). "Digital Twin Solutions for Shipbuilding."

[13] Military Embedded Systems (2024). "Challenges of Military Training Simulation."

[14] SKY ENGINE AI (2024). "Security and Defence Use Cases."

PDF 다운로드

투자 제안서 PDF 버전을 다운로드하실 수 있습니다.

Physical AI 데이터 그린하우스

Physical AI 시대를 위한 데이터 그린하우스 전략 (본 웹페이지의 PDF 컴패니언)

페블러스 투자제안서 (기존버전)

데이터 클리닉 SaaS와 합성데이터 중심의 투자 제안서 (v21.4)

PDF 보기