Pebblous

페블러스 투자 유치 제안서

CONFIDENTIAL - 투자사 전용

비밀번호가 올바르지 않습니다.

본 문서는 페블러스 투자자 전용 자료입니다.
비밀번호는 담당자를 통해 전달받으셨습니다.

🔒 CONFIDENTIAL
페블러스 투자 유치 제안서

Physical AI 시대를 위한 데이터 그린하우스 전략

"Green Data로 Physical AI 시장을 선점한다"

작성일: 2025년 10월 23일 | (주)페블러스

Executive Summary

AI 기술이 범용화되며 시장은 명확히 양분되고 있습니다. IT 기업이 자체 개발하는 '범용 AI' 시장은 레드오션이 된 반면, AI 자체 구축 역량이 부족하지만 도입 수요는 폭발적인 'Non-IT 기간산업' 분야에서 거대한 블루오션이 열리고 있습니다.

Physical AI(로보틱스, 자율주행, 스마트팩토리, 조선, 국방)의 성공은 모델이 아닌 데이터에 달려있습니다.

Physical AI의 3대 데이터 병목

  • 희소성: 현실에 존재하지 않는 데이터 (불량 사례, 위험 상황)
  • 보안성: On-Premise 환경 필수 (핵심 기술 자산)
  • 복잡성: 멀티모달 데이터의 실시간 처리

페블러스는 이 특화된 시장을 선점하기 위해 '데이터 그린하우스(Data Greenhouse)'를 비전으로 제시합니다. AI-Ready 데이터를 능동적으로 생성하고 재배하는 차세대 데이터 파이프라인입니다.

우리의 GTM 전략은 Mobility-First입니다. 현대자동차그룹 레퍼런스 → 글로벌 모빌리티 진출 → 조선/국방 시장 선점으로 Physical AI 시대의 그린 데이터 공급자로 성장합니다.

1. Physical AI 패러다임: 왜 지금인가?

🎯 AI 시장의 양분화

GenAI와 LLM의 발전은 AI 기술의 '상향 평준화'를 가져왔습니다. IT 역량이 높은 기업은 AI 솔루션을 구매하지 않고 자체 개발합니다. 이는 '범용 AI 솔루션' 시장의 종말이자, AI를 자체 구축할 수 없지만 도입이 절실한 'Non-IT' 기간산업 (제조, 조선, 국방) 이라는 거대한 블루오션의 개막입니다.

Physical AI의 시장 기회

  • 로보틱스: 범용 로보틱스의 ChatGPT 모멘트 도래
  • 자율주행: 물리적 세계를 이해하는 AI 시스템
  • 제조/조선/국방: AI 자체 구축 불가능한 기간산업

"Physical AI는 지각하고, 추론하고, 계획하고, 행동할 수 있는 AI입니다. 범용 로보틱스의 ChatGPT 모멘트가 곧 도래할 것입니다."
— Jensen Huang, NVIDIA CEO, CES 2025 [6]

🇰🇷 국가 전략의 중심

대한민국 정부는 'Physical AI 1등 국가 도약'을 국가 AI 대전환을 위한 15대 선도 프로젝트의 핵심 목표로 명시했습니다.[1]

정부 15대 선도 프로젝트 주요 목표

  • 휴머노이드 산업: 3대 강국 진입 ('30)
  • 자율주행차: 상용화 ('27)
  • 데이터 시장: 50조원 규모 달성 ('30)

로보틱스, 자율주행, 스마트팩토리는 국가 제조업 경쟁력과 직결되며, 관련 예산과 정책적 지원이 집중되어 시장의 폭발적 성장이 예상됩니다.

📊 모델 중심에서 데이터 중심으로의 전환

파운데이션 모델의 보편화로 AI 개발 패러다임이 전환되고 있습니다. '데이터의 품질과 확보'가 기업의 핵심 경쟁력이 되었습니다.[2]

Data-Centric AI의 핵심 요소

  • 데이터 품질: 정확성, 일관성, 완전성 확보
  • 데이터 라벨링: 고품질 주석 및 메타데이터
  • 데이터 다양성: Edge Case 및 Long-tail 시나리오 커버

특히 Physical AI는 물리적 세계 기반 데이터로, 일반 웹 스크래핑으로 확보 불가능합니다. 데이터의 가치가 극대화되는 영역입니다.

2. 핵심 문제: Physical AI 데이터 병목

Problem #1

데이터 기근 (Data Scarcity)

Physical AI가 실제 환경에서 작동하려면 Long-tail 데이터가 필수적입니다. 그러나 희귀 불량 사례, 로봇 예외 동작, 자율주행 위험 상황 등은 현실에서 거의 발생하지 않아 획득이 불가능합니다.

현실의 데이터 기근 사례

  • 스마트팩토리: 연간 발생률 0.001% 미만의 희귀 불량 패턴
  • 자율주행: 실제 도로에서 위험 상황 재현 불가
  • 로보틱스: 예외 상황 발생 시 시스템 중단, 데이터 미수집

결과적으로 AI 모델은 엣지 케이스와 예외 상황에 대한 대응력이 부족하여 실전 배포가 어렵습니다.

Problem #2

보안 & 거버넌스 제약

제조, 조선, 국방 산업의 데이터는 핵심 기술 자산이자 국가 안보와 직결됩니다. 이러한 데이터는 클라우드 반출이 절대 불가능하며, 모든 처리가 On-Premise 환경에서 이루어져야 합니다.

On-Premise 필수 산업

  • 현대자동차: 차량 설계/제조 데이터 외부 반출 금지
  • 조선업: 선박 도면 및 건조 공정 기밀
  • 국방산업: 무기체계 및 군사 시설 데이터 보안등급 최상

더 나아가, 데이터 품질 관리와 통제를 위한 내부 규정(Data Governance) 역시 보안이 필요합니다. 데이터 수집·가공·활용 정책, 품질 기준, 접근 권한 체계 등은 기업의 AI 경쟁력과 직결된 핵심 노하우이며, 외부 유출 시 경쟁 우위를 상실하게 됩니다.

결과적으로 클라우드 기반 AI 도구 사용이 제한되고, 데이터 처리 및 AI 개발의 효율성이 크게 저하되며, 거버넌스 구축 자체가 장벽이 됩니다.

Problem #3

멀티모달 데이터 복잡성

Physical AI는 물리적 세계를 이해하기 위해 이질적인 멀티모달 데이터를 실시간으로 통합해야 합니다. 센서, 비전 카메라, 시계열 로그, 3D 공간 데이터 등 서로 다른 형식과 주기를 가진 데이터의 동기화와 처리는 극도로 복잡합니다.

멀티모달 데이터 통합 과제

  • 센서 융합: LiDAR, 레이더, IMU, GPS 등 다양한 센서 데이터 동기화
  • 시계열 정렬: 서로 다른 샘플링 주기를 가진 데이터의 시간 정렬
  • 실시간 처리: 밀리초 단위 지연으로 대용량 데이터 스트림 처리

대부분의 기업은 데이터 파이프라인 구축에 실패하여 AI 프로젝트 자체가 좌초됩니다.

💡 핵심 인사이트

Physical AI 시대의 진정한 해자(Moat)는 모델이 아닙니다. 희소하고, 보안이 필요하며, 복잡한 데이터를 수집·정제·생성하는 '데이터 파이프라인' 그 자체가 가장 큰 경쟁력입니다.

이 파이프라인을 구축하고 운영할 수 있는 기업만이 Physical AI 시장에서 살아남을 수 있습니다.

3. 페블러스 솔루션: 데이터 그린하우스

페블러스의 '데이터 그린하우스'는 Physical AI 데이터의 3가지 핵심 문제를 1:1로 해결하는 End-to-End 플랫폼입니다.

이는 기존 '데이터 클리닉' 비전이 GenAI, Agentic AI, 규제 대응 등 최신 기술과 결합하여 완성된 구체적인 솔루션입니다.

3.1. 솔루션 구성 요소

Solution #1

Hyper-Synthetic Data

해결하는 문제: Problem #1 데이터 기근 (Data Scarcity)

GenAI와 CG 기술을 결합하여, 현실에 존재하지 않거나 극히 드문 데이터를 초고품질 '하이퍼-합성데이터(Green Data)'로 생성합니다.

Hyper-Synthetic Data 생성 사례

  • 휴머노이드: 다양한 동작 패턴 및 예외 상황 데이터
  • 스마트팩토리: 희귀 불량 사례 및 로봇 용접 시뮬레이션
  • 국방/조선: 해무 속 적군 객체, 위험 상황 시나리오

이는 단순한 데이터 증강(Augmentation)이 아닌, 존재하지 않는 데이터의 '창조(Creation)'입니다.

Solution #2

Agentic Data Clinic (On-Premise)

해결하는 문제: Problem #2 보안 & 거버넌스 제약

최신 'Agentic AI' 기술을 탑재한 AI 에이전트가 고객사의 내부망(On-Premise)에서 보안 데이터를 자율적으로 진단, 정제, 개선합니다.

Agentic Clinic의 자율 작업

  • 자동 진단: 데이터 품질 문제 자동 탐지 및 분석
  • 자율 정제: 노이즈 제거, 이상치 처리, 라벨 보정
  • AI-Ready 변환: 모델 학습에 최적화된 형식으로 자동 변환

'On-Premise' 요건을 완벽히 충족하면서도 데이터 품질(Problem #1의 Quality) 문제도 함께 해결합니다.

Solution #3

PebbloScope

해결하는 문제: Problem #3 멀티모달 데이터 복잡성

복잡한 멀티모달 데이터를 3D로 시각화하여 AI 전문가가 아닌 'Non-IT' 현업 담당자가 직관적으로 데이터를 이해하고 소통하게 합니다.

PebbloScope의 주요 기능

  • 3D 시각화: 센서, 비전, 로그 데이터를 3D 공간에 통합 표시
  • 직관적 인터페이스: 공장 관리자, 조선소 현장소장도 쉽게 사용
  • 소통 도구: 현장 니즈를 AI 개발에 정확히 반영

이는 현장과 AI 개발팀 간 "소통과 해석의 벽"을 허무는 핵심 소통 도구입니다.

3.2. 핵심 아키텍처: Edge-to-Core

'데이터 그린하우스'는 Physical AI 환경에 최적화된 'Edge-to-Core' 아키텍처를 기반으로 작동합니다. Physical AI를 위한 데이터 파이프라인은 현장에서의 실시간 반응(Edge)과 중앙에서의 대규모 학습(Core)이 동시에 요구되는 고유한 과제를 안고 있습니다.[8]

📍 At the Edge (현장)

엣지 컴퓨팅에 최적화된 '데이터렌즈(DataLens)'가 공장, 로봇, 차량 등 현장에서 발생하는 방대한 실시간 멀티모달 데이터를 수집하고 경량화하여 Core로 전송합니다.

  • 현장에서의 즉각적인 데이터 품질 검증
  • 실시간 데이터 경량화 및 전처리
  • 네트워크 대역폭 최적화

🏢 At the Core (On-Premise)

고객사 내부망(서버실)의 '데이터 클리닉(Data Clinic)'이 Edge에서 전송된 데이터를 받아 복잡하고 무거운 연산을 수행합니다.

  • Agentic AI 진단: 자율적 데이터 품질 분석 및 개선
  • Hyper-Synthetic 생성: 고품질 합성 데이터 대량 생성
  • PebbloScope 시각화: 3D 멀티모달 데이터 통합 표시
  • 대규모 모델 학습 및 분석 작업 수행

3.3. 통합 AI 거버넌스

'데이터 그린하우스'는 단순히 데이터를 처리하는 것을 넘어, AI 규제 및 거버넌스 요소를 통합 관리합니다.

준수하는 글로벌 AI 규제 및 표준

  • EU AI Act: 유럽 AI 규제 대응
  • ISO/IEC 42001: AI 경영 시스템 표준[4]
  • ISO/IEC 5259: 데이터 품질 표준
  • ISO/IEC 42119: AI 시험평가 표준

강화되는 글로벌 규제에 대응하여 데이터의 수명주기, 품질, 편향성을 추적하고 감사 리포트를 자동 생성합니다.

이는 Problem #2에서 언급한 데이터 거버넌스 구축 장벽을 해결하며, 기업이 AI를 책임감 있게 도입하고 운영할 수 있는 기반을 제공합니다.

💡 솔루션 요약

페블러스의 '데이터 그린하우스'는 Physical AI의 3대 데이터 병목을 해결하는 완전한 플랫폼입니다:

  • Hyper-Synthetic로 데이터 기근 해결
  • Agentic Clinic으로 보안 & 거버넌스 대응
  • PebbloScope로 복잡성 문제 해결
  • Edge-to-Core 아키텍처로 실시간성과 확장성 확보
  • 통합 거버넌스로 글로벌 규제 준수

4. 고객 가치 입증: 산업별 ROI 시나리오

페블러스의 '데이터 그린하우스'가 실제 산업 현장에 적용되었을 때의 구체적인 효과와 투자 대비 수익(ROI)을 세 가지 시나리오를 통해 입증합니다.

Scenario #1

모빌리티 - 현대자동차 스마트팩토리 용접 불량 검출

핵심 정보

  • 산업: 모빌리티 (Automotive)
  • 고객: 현대자동차 광명공장
  • 문제: 데이터 기근

기대 ROI

투자: $1M (13억원)

ROI: 8,150%+

회수 기간: 1.8개월

Scenario #2

조선 - 한국 조선소 건조 일정 예측 & 최적화

핵심 정보

  • 산업: 조선 (Shipbuilding)
  • 고객: 한국 주요 조선소
  • 문제: 멀티모달 데이터 복잡성

기대 ROI

투자: $2M (26억원)

ROI: 1,725%+

회수 기간: 8개월

Scenario #3

국방 - 해병대 전술 훈련 합성 데이터 생성

핵심 정보

  • 산업: 국방 (Defense & Military)
  • 고객: 대한민국 해병대
  • 문제: 데이터 기근 + 보안 제약

기대 ROI

투자: $2M (26억원)

ROI: 1,650%+

회수 기간: 8.3개월

종합 요약

시나리오 도메인 해결 문제 투자 연간 절감액 ROI 회수 기간
#1 모빌리티 데이터 기근 $1M $82.5M - $257M 8,150%+ 1.8개월
#2 조선 멀티모달 복잡성 $2M $36.5M - $95M 1,725%+ 8개월
#3 국방 데이터 기근 + 보안 $2M $35M - $43.75M 1,650%+ 8.3개월

핵심 메시지

페블러스의 '데이터 그린하우스'는 단순한 AI 도구가 아닌, Physical AI 시대의 필수 인프라입니다.

  • 모든 시나리오에서 1년 이내 투자 회수
  • 연간 1,650% ~ 8,150% ROI 달성
  • 데이터 생성 기간을 수년 → 2주로 단축
  • On-Premise 보안 완벽 준수
  • Non-IT 현장 담당자도 직관적으로 활용 가능

이러한 구체적인 ROI 시나리오는 페블러스가 '이론'이 아닌 '실전'에서 입증 가능한 솔루션임을 보여줍니다.

5. GTM 전략: Mobility-First

현대차 플래그십 레퍼런스를 기반으로 글로벌 모빌리티 시장을 선점하고, 조선·국방으로 확장하는 단계적 시장 진출 전략입니다.

Phase 1

현대차 플래그십 (2026)

현대자동차그룹과의 협업을 'On-Prem 데이터 그린하우스' 플래그십 레퍼런스로 확립

Phase 2

글로벌 모빌리티 (2027)

레퍼런스 기반 글로벌 모빌리티 시장 진출 (BMW, Toyota 등)

Phase 3

조선/국방 확장 (2027-2028)

데이터 기근과 AI 개발 수요가 가장 큰 조선 및 국방 시장 선점

6. 투자 계획

투자 규모

투자 유치 금액 20억원
Post-money 밸류에이션 200억원

자금 배분

투자금 사용 계획

On-Prem 제품화 40% (8억원)

Data Clinic On-Prem 버전 개발 및 최적화

GTM 실행 40% (8억원)

현대차 레퍼런스 확보 및 글로벌 영업 조직 구축

운영 안정화 20% (4억원)

조직 운영비 및 기술 인프라 유지

참고문헌

[1] 과학기술정보통신부 (2025). "AI·디지털 혁신성장 전략: 로봇 및 자율시스템 분야 육성 방안." https://www.msit.go.kr

[2] Andrew Ng (2022). "Andrew Ng: Unbiggen AI." IEEE Spectrum. https://spectrum.ieee.org/andrew-ng-data-centric-ai

[3] McKinsey & Company (2024). "The State of AI in 2024: Generative AI's Breakout Year." https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai

[4] ISO/IEC 42001:2023 (2023). "Information technology — Artificial intelligence — Management system." https://www.iso.org/standard/81230.html

[5] Stanford Institute for Human-Centered AI (2024). "Artificial Intelligence Index Report 2024." https://hai.stanford.edu/ai-index

[6] NVIDIA (2025). "CES 2025: AI Advancing at 'Incredible Pace' — Jensen Huang on Physical AI and Robotics." NVIDIA Blog. https://blogs.nvidia.com/blog/ces-2025-jensen-huang/

[7] Pebblous Blog (2025). "데이터 스타트업이 Physical AI에 올라타는 법: AI 범용화 시대의 생존 전략." https://blog.pebblous.ai/project/PhysicalAI/data-startup-physical-ai-01.html

[8] Pebblous Blog (2025). "Physical AI를 위한 데이터 파이프라인: Edge-to-Core 아키텍처의 중요성." https://blog.pebblous.ai/project/PhysicalAI/data-pipeline-for-physical-ai-01.html

[9] 페블러스(Pebblous) (2025). "페블러스 투자제안서 (v22.0)." (별첨)

[10] S&P Global (2025). "AI in the Automotive Industry: Trends, Benefits & Use Cases." S&P Global Automotive Insights. https://www.spglobal.com/automotive-insights/en/blogs/2025/07/ai-in-automotive-industry

[11] UnitX Labs (2025). "How to Calculate the ROI of Automated Visual Inspection Systems." UnitX Labs Resources. https://www.unitxlabs.com/resources/roi-automated-visual-inspection-2025/

[12] Beamo.ai (2024). "Innovative Digital Twin Solutions for South Korea's Shipbuilding Industry." Beamo Blog. https://www.beamo.ai/blog/innovative-digital-twin-solutions-for-south-koreas-shipbuilding-industry

[13] Military Embedded Systems (2024). "Addressing the Challenges of Military Training Simulation." Military Embedded Systems Magazine. https://militaryembedded.com/avionics/synthetic-vision/addressing-the-challenges-of-military-training-simulation

[14] SKY ENGINE AI (2024). "Security and Defence Use Cases." SKY ENGINE AI. https://www.skyengine.ai/use-cases/security-and-defence

📄 PDF 다운로드

투자 제안서 PDF 버전을 다운로드하실 수 있습니다.

Physical AI 데이터 그린하우스

Physical AI 시대를 위한 데이터 그린하우스 전략 (본 웹페이지의 PDF 컴패니언)

페블러스 투자제안서 (기존버전)

데이터 클리닉 SaaS와 합성데이터 중심의 투자 제안서 (v21.4)

PDF 보기