페블러스 투자 검토 보고서

Investment Review 2026
(주)페블러스 - CONFIDENTIAL

암호가 올바르지 않습니다. 다시 시도해 주세요.

Executive Summary

+115.7%
매출 성장률
2024 → 2025
-81.5%
영업손실 감소
14.12억 → 2.61억
100%
매출총이익률
매출원가 0원
32.3억
2026 파이프라인
확정 22억 + 예정 10.3억

페블러스는 AI 학습 데이터 품질 관리에서 피지컬 AI 데이터 인프라로 확장하는 버티컬 통합 전략을 실행 중입니다. 누적 투자금 31억으로 매출 115% 성장, 손실 81% 감소를 달성했으며, 이는 업계 최고 수준의 자본 효율성입니다.

5개 매출 스트림(DataClinic, B2G, 합성데이터, 인증, 글로벌 SaaS)과 삼각형 CAC=0 모델로 매출총이익률 100% 구조를 구현했습니다. Data Greenhouse 플랫폼을 통해 프로젝트 기반 매출에서 SaaS 반복매출로의 전환을 추진하고 있습니다.

4개 시나리오 프로젝션에서 Base 108억(자체 성장) ~ Maximum 1,000억(글로벌 확장) 경로를 제시합니다. 현대차 제로원이 동일 밸류에이션으로 투자를 확정했으며, Applied Intuition/Snowflake/Databricks가 걸어온 궤적과 동일한 성장 경로에 진입했습니다.

1. 왜 지금인가 — 시장 변곡점과 구조적 기회

데이터 품질 관리 시장은 구조적 전환점에 도달했습니다. 수평 플랫폼(Anomalo, Shelf.io 등)이 ARR $50M에서 성장이 정체되는 현상은 우연이 아닙니다. 이들의 실패는 시장에 진입하려는 후발주자에게 오히려 명확한 기회를 제시합니다.

수평 플랫폼의 3가지 구조적 실패 원인

  • 1 가치 창출 한계: "데이터에 문제가 있다"는 알림만 전달할 뿐, 실제로 문제를 해결하지 못합니다. 모니터링은 필요 조건이지 충분 조건이 아닙니다.
  • 2 Alert Fatigue: 범용 규칙이 만들어내는 수백 개의 알림은 결국 무시됩니다. 산업 컨텍스트 없는 모니터링은 잡음에 불과합니다.
  • 3 단위 경제성 붕괴: 낮은 ARPU($2~5K/월)에 높은 CAC($50K+)를 결합하면 LTV/CAC < 3x가 되어 스케일이 불가합니다.

규제 윈도우가 열리고 있다

EU AI Act이 2026년 8월 전면 시행되고, 한국 AI 기본법이 2026년 1월 발효되었습니다. 두 규제 모두 고위험 AI 시스템의 학습 데이터 품질 관리 체계를 의무화합니다. 규제가 만들어내는 수요는 선택이 아닌 강제이며, 이 윈도우는 최초 진입자에게 압도적 우위를 부여합니다.

TAM과 거시 경제 변화

글로벌 데이터 관리 소프트웨어 시장(TAM)은 $155.6B에 달합니다. 페블러스의 1천억 매출 목표는 이 시장의 0.03%에 불과합니다. 거시 경제적으로, "성장지상주의 SaaS 모델의 종말"이라는 시대적 전환이 진행 중입니다. 2021~2023년의 제로 금리 시대에 작동했던 "돈을 태워 성장하는" 모델은 더 이상 투자자의 지지를 받지 못합니다. 자본 효율성이 새로운 경쟁력입니다.

핵심 논거: 수평 플랫폼의 $50M 천장, 규제 의무화, 자본 효율성 시대가 동시에 도래한 지금이 버티컬 데이터 인프라의 최적 진입 시점입니다.

2. 역발상 — 버티컬 통합과 피지컬 AI

시장이 수평 확장에 실패하는 동안, 페블러스는 정반대 전략을 선택했습니다. 범용 모니터링이 아닌 산업 핵심 가치사슬에 수직 침투하는 것입니다. 이 접근은 Veeva Systems(제약), Procore(건설)가 증명한 버티컬 SaaS 성공 공식과 동일합니다.

피지컬 AI: 새로운 데이터 프론티어

피지컬 AI란 로봇, 자율주행, 디지털 트윈 등 물리적 세계와 상호작용하는 AI 시스템을 말합니다. 이 영역의 데이터는 비정형(비디오, 3D 포인트클라우드, 센서 스트림)이며, 기존 텍스트/표 중심 데이터 품질 도구로는 관리가 불가합니다. NVIDIA의 Jensen Huang이 "AI의 다음 물결은 Physical AI"라고 선언한 것은 이 시장의 폭발적 성장을 예고합니다.

온프레미스의 전략적 회귀

클라우드 만능론의 시대가 저물고 있습니다. 데이터 중력(Data Gravity) 법칙에 따라, 대규모 데이터는 이동하기보다 생성된 곳에서 처리되어야 합니다. 제조, 국방, 의료 등 데이터 주권이 중요한 산업에서는 온프레미스 배포가 필수입니다. 유럽의 소버린 AI 트렌드도 이 방향을 강화합니다.

클라우드 벤더와의 관계: 경쟁자가 아닌 보완재

AWS, Azure, GCP는 인프라 레이어에 집중합니다. 페블러스는 이 인프라 위에서 동작하는 Core Plugin으로 포지셔닝합니다. 클라우드 벤더의 마켓플레이스를 통한 배포는 CAC를 추가로 낮추는 채널이 됩니다. 모니터링을 넘어, 진단에서 생성, 관리, 증적까지 통합하는 것이 페블러스의 차별화입니다.

전략 요약: 수평에서 버티컬로, 텍스트에서 피지컬로, 클라우드 전용에서 하이브리드로 — 세 가지 축의 전환이 페블러스의 성장 공간을 규정합니다.

3. 솔루션 포트폴리오

페블러스의 4개 핵심 제품은 데이터 생애주기의 전 단계를 커버합니다. 개별 제품이 독립적 가치를 제공하면서도, 결합 시 시너지가 극대화되는 플랫폼 구조입니다.

Core

DataClinic

AI 학습 데이터 품질 진단 및 개선 플랫폼. 시간당 10만 장 처리, 데이터 플라이휠 효과로 사용할수록 정확도 향상.

  • Data Imaging: 데이터셋 건강 상태 시각화
  • ISO/IEC 5259 기반 품질 인증
  • Agentic 자동 정제 파이프라인
Viz

PebbloScope

데이터-모델 성능 시각화 및 설명가능성(XAI) 플랫폼. EU AI Act 투명성 의무 충족을 위한 감사 추적 기능 내장.

  • 모델 성능-데이터 품질 상관관계 분석
  • EU AI Act Article 11 준수 증적
  • 인터랙티브 데이터 탐색 대시보드
Sim

PebbloSim

디지털 트윈 기반 합성데이터 생성. Neuro-Symbolic Hybrid World Model로 Physical Hallucination이 없는 데이터 생성.

  • 물리 법칙 준수 합성 시나리오
  • 희귀 이벤트(코너 케이스) 대량 생성
  • 자율주행/로봇/제조 시뮬레이션
Platform

Data Greenhouse

5계층 Agentic AI 데이터 운영체제. Observe - Orchestrate - Action - Govern 순환 구조.

  • DataClinic + PebbloScope + PebbloSim 통합
  • 자율형 데이터 파이프라인 오케스트레이션
  • 온프레미스/하이브리드 클라우드 배포

AADS 2단계: 산업 확장

과기부 글로벌 빅테크 육성 사업(AADS)의 2단계에서는 산업 특화 VLM(Vision-Language Model), Reasoning Router, 소버린 배포 모듈을 개발합니다. KISTI 공동연구로 진행되는 이 과제는 페블러스의 기술 스택을 산업별 수직 솔루션으로 확장하는 핵심 엔진입니다.

4. 비즈니스 모델

페블러스의 비즈니스 모델은 전통적 SaaS와 근본적으로 다릅니다. 마케팅에 1원도 쓰지 않고 매출을 만드는 삼각형 CAC=0 모델이 그 핵심입니다.

5개 매출 스트림

스트림 구분 단가 특성 2026 전망
A. DataClinic PoC + 라이선스 2.5억+/건 온프렘 프리미엄 8~10억
B. B2G R&D 정부 과제 과제당 5~20억 CAC=0, 레퍼런스 확보 12~15억
C. 합성데이터 PebbloSim 1~5억/프로젝트 고마진, 반복 수요 3~5억
D. 인증 KOLAS 품질인증 500만~3천만/건 규제 의무, 반복 2~3억
E. 글로벌 SaaS Data Greenhouse 5억+/엔터프라이즈 ARR 전환 목표 2~3억(초기)

삼각형 CAC=0 모델

일반적인 B2B SaaS는 영업인력과 마케팅 비용으로 고객을 획득합니다. 페블러스는 이 구조를 3개의 삼각형으로 대체합니다. 정부 R&D 과제가 곧 세일즈 활동이 되어, 과제 수행 과정에서 자연스럽게 엔터프라이즈 고객이 확보됩니다. 삼성E&A, 현대차, LG전자 모두 이 경로로 고객이 되었습니다.

3축 매출 포트폴리오

  • 앵커(PoC 커스터마이징): 중~고마진. 고객 요구에 맞춘 파일럿으로 신뢰 구축 후 확대.
  • 성장엔진(라이선스/유지보수): 80%+ 마진. PoC 이후 연간 계약으로 전환. 반복 매출의 핵심.
  • R&D(컨설팅/정부과제): 중간 마진이지만 기술 개발과 레퍼런스를 동시에 확보하는 전략적 매출.

트로이 목마 전략: PoC에서 플랫폼 락인까지

PoC 커스터마이징으로 고객의 핵심 데이터 파이프라인에 진입한 후, DataClinic이 해당 파이프라인의 필수 구성요소로 자리잡으면 라이선스와 유지보수 계약이 자연스럽게 뒤따릅니다. 온프레미스 프리미엄은 SaaS 대비 5배 — DataClinic 2.5억+, Data Greenhouse 5억+입니다.

번들 사례 — 육군 프로젝트: DataClinic + PebbloScope + PebbloSim 번들로 초기 계약 6.5~7억, 연간 유지보수 1.3억. 5년 LTV 15~17억. 단일 고객에서 이 수준의 LTV가 가능한 것은 버티컬 통합의 힘입니다.

5. 자본 효율성의 증명

2024년에서 2025년으로의 재무 변화는 단순한 실적 개선이 아니라, 비즈니스 모델의 구조적 효율성이 입증된 전환점입니다. 아래 표는 핵심 재무 지표의 변화를 보여줍니다.

지표 2024년 2025년 변화
매출 2.92억 6.31억 +115.7%
매출총이익률 100% 100% 유지
판관비 17.04억 8.92억 -47.7%
영업손실 -14.12억 -2.61억 -81.5%
인건비 11.76억 7.17억 -39.0%
R&D 보조금 2.41억 5.95억 +147%

미국 SaaS 번 레이트 역설

미국 SaaS 기업의 평균적인 ARR 창출 비용은 $1 ARR당 $2~3의 마케팅/세일즈 비용을 소각하는 구조입니다. 반면 페블러스의 CAC는 사실상 0에 수렴합니다. 정부 R&D가 세일즈를 대체하고, 대기업 PoC가 자연스럽게 레퍼런스 마케팅이 되기 때문입니다. 이 구조는 번 레이트를 구조적으로 억제합니다.

데이터 플라이휠

DataClinic이 처리하는 수백 개 데이터셋은 Agentic AI 자동화의 학습 데이터가 됩니다. 프로젝트를 수행할수록 자동화 정확도가 올라가고, 인당 처리량이 구조적으로 향상됩니다. 이 플라이휠이 매출총이익률 100%를 유지하면서도 판관비를 줄일 수 있는 비결입니다.

아래 차트는 2024~2025년 매출과 영업손실의 변화를 보여줍니다.

6. 2025년 매출 해부

2025년 총 매출 630,678,271원의 구성을 분석하면, 페블러스의 고객 포트폴리오와 시장 침투 전략이 명확하게 드러납니다. 데이터 가공 매출이 93.4%, 라이선스 및 기술자문이 6.6%를 차지합니다.

거래처별 매출 상세

거래처 매출액(원) 프로젝트
[데이터 가공 매출] 588,860,091원
삼성E&A 173,788,000 산업AI Auto Routing
대구디지털혁신진흥원 135,693,636 데이터 품질진단
LG전자 99,000,000 PebbloScope 시각화
전북대 88,333,000 피지컬AI 정제
한화비전 30,000,000 DataClinic PoC
현대차/기아 25,000,000 강화학습 제로원 PoC
한국전자통신연구원 11,545,455 합성데이터 패턴
씨에이에스 10,000,000 남부발전 AI Ready Data
한국전력공사 전력연구원 9,000,000 IoT 품질평가
뉴럴워크랩 6,500,000 데이터 가시화 교육
[라이선스 및 기술자문] 41,818,180원
자이언트스텝 41,818,180 기술자문
총 합계 630,678,271

핵심 시사점: 매출의 93.3%가 삼성E&A, LG전자, 현대차/기아 등 대기업 및 공공기관에서 발생합니다. 이는 페블러스의 기술이 이미 엔터프라이즈 수준의 검증을 통과했으며, 버티컬 인프라로서의 포지셔닝이 시장에 안착하고 있음을 의미합니다. 특히 삼성E&A(산업AI), LG전자(시각화), 현대차(피지컬AI)로의 제품 다각화가 주목됩니다.

7. 4개 시나리오 프로젝션

매출 프로젝션은 4개 시나리오로 구성됩니다. 모든 시나리오는 2024~2025년의 실적 데이터를 기반으로 하며, 각각 상이한 성장 드라이버와 투자 규모를 전제합니다.

  • Base (108억, 2030): 추가 투자 없이 자체 성장만으로 달성. 국내 시장 집중, 기존 고객 확대.
  • Accelerated (237억, 2030): 브리지 + 시리즈A 투자로 세일즈팀 확대, 신규 산업 진출.
  • Maximum C-1 (1,000억, 2030): 글로벌 확장 + 대형 전략적 파트너십(NVIDIA, 클라우드 벤더 등).
  • Maximum C-2 (430억, 2030): 보수적 글로벌 확장. 아시아 중심 성장 후 구미 진출.

아래 차트는 4개 시나리오별 매출 성장 경로를 보여줍니다. (단위: 백만 원)

글로벌 벤치마크 비교

1천억 매출 달성은 전례 없는 목표가 아닙니다. 유사한 B2B 데이터 인프라 기업들의 실적과 비교하면, 페블러스의 목표는 오히려 보수적입니다.

기업 설립 1천억 도달 소요 기간 현재 가치
Applied Intuition 2017 2025 8년 $150억
Snowflake 2012 2023 11년 $530억
Databricks 2013 2025 12년 $1,340억
페블러스 (목표) 2021 2030~33 9~12년 1조+

추가 투자 유무에 따른 2030년 매출 격차를 시각화하면, 투자의 레버리지 효과가 분명합니다.

8. Unit Economics

2030년 목표 시점의 제품별 단위 경제성을 분석합니다. 6개 제품 모두 LTV/CAC 16x 이상을 달성하며, 이는 B2B SaaS 업계 평균(3~5x)의 3배 이상입니다.

제품 고객수 ARPU(백만) 매출(백만) CAC(백만) 회수(월) LTV/CAC
데이터클리닉 95 74 7,000 12 2 18.5x
페블로스코프 120 17 2,000 3 2 17.0x
데이터 그린하우스 35 143 5,000 25 3 17.2x
페블로심 50 110 5,500 20 3 16.5x
KOLAS 인증 250 11 2,800 2 1 30+
AI Greenhouse+신규 40 35 1,400 8 3

모듈화/자동화 영업 레버리지

Data Greenhouse 플랫폼의 자동화가 진행될수록, 영업과 온보딩에 소요되는 인적 자원이 극적으로 줄어듭니다. 이것이 린 조직으로도 수백 개 고객을 관리할 수 있는 구조적 기반입니다.

지표 2026년 2030년 개선율
온보딩 기간 4주 1일 96% 단축
고객당 도입비 15백만 0.5백만 97% 절감
1인당 관리 고객 5사 100사 20배

9. 투자 개요

페블러스는 2026년 브리지 라운드를 통해 20억 규모의 투자를 유치합니다. 현대차 제로원이 동일 밸류에이션 조건으로 투자를 확정했으며, 이는 전략적 파트너십의 시작입니다.

투자금 사용 계획

항목 금액 내용
세일즈 확장 8억 엔터프라이즈 세일즈팀 구축, 산업별 PoC 파이프라인 확대
PebbloSim 개발 5억 합성데이터 엔진 고도화, 산업별 시뮬레이션 템플릿
SaaS 전환 3억 Data Greenhouse 클라우드 버전, 셀프서브 온보딩
인증 확대 2억 KOLAS 인증 자동화, ISO/IEC 5259 국제 인증
예비비 2억 전략적 기회 대응, 운영 버퍼
합계 20억

투자 타임라인

2026 브리지 라운드

20억 규모. 현대차 제로원 확정. 세일즈팀 확장 + PebbloSim 개발 가속.

2027 시리즈 A

50~100억 규모. Data Greenhouse SaaS 론칭, 글로벌 파일럿 시작.

2028 시리즈 B/C

글로벌 시장 본격 진출. 클라우드 벤더 마켓플레이스 입점, 전략적 파트너십 확대.

2029~30 프리 IPO

매출 100억+ 달성. IPO 준비 또는 전략적 M&A 검토.

2030~33 IPO

1천억 매출 달성 시나리오에서 코스닥/나스닥 상장.

투자 논거 요약

  1. 검증된 자본 효율성: 누적 31억 투자로 매출 115% 성장, 손실 81% 감소 달성
  2. 구조적 해자: 버티컬 통합 + 데이터 플라이휠 + 온프레미스 프리미엄의 3중 방어
  3. 규제 테일윈드: EU AI Act + AI 기본법이 만드는 의무적 수요
  4. 엔터프라이즈 검증: 삼성E&A, LG전자, 현대차 등 대기업 고객 포트폴리오
  5. 플랫폼 전환: 프로젝트에서 SaaS 반복매출로의 경로가 Data Greenhouse에 의해 가시화
  6. 전략적 투자자: 현대차 제로원의 참여가 피지컬 AI 시장 진출의 가속기
  7. 글로벌 벤치마크: Applied Intuition, Snowflake와 동일한 성장 궤적
  8. 팀 역량: 데이터 품질 분야 15년+ 경험의 창업팀, KISTI 공동연구 역량

한 줄 요약: 페블러스는 "돈을 태우는 성장"이 아닌 "돈을 버는 성장"의 궤적 위에 있습니다. 추가 투자는 이 궤적의 속도를 가속하는 연료이며, 투자 없이도 생존하는 구조가 이미 입증되었습니다.

FAQ — 투자자 핵심 질문

투자 검토 과정에서 가장 빈번하게 제기되는 질문과 답변입니다.

Q1. 매출총이익률 100%가 지속 가능한가요?
지속 가능합니다. 페블러스의 매출은 소프트웨어 라이선스와 기술 컨설팅으로 구성되어 있어 물리적 원재료가 필요 없습니다. 매출 규모가 커지면 서버 인프라 비용이 일부 발생하지만, 이는 매출 대비 한 자릿수 비율에 머물 것으로 전망됩니다. SaaS 전환 시에도 90%+ 매출총이익률을 유지할 수 있는 구조입니다.
Q2. B2G 의존도가 높은 것은 리스크가 아닌가요?
현재 B2G 매출 비중이 높은 것은 의도된 전략입니다. 정부 R&D는 (1) CAC 없이 매출을 만들고, (2) 기술을 고도화하고, (3) 레퍼런스를 확보하는 3중 효과가 있습니다. 2027년 이후 Data Greenhouse SaaS 론칭과 함께 B2B 직접 매출 비중을 50% 이상으로 끌어올릴 계획이며, KOLAS 인증 매출은 규제 의무에 의한 반복 수요로 안정적입니다.
Q3. 합성데이터 시장에서 Datagen/Synthesis AI가 실패한 이유는? 페블러스는 어떻게 다른가요?
Datagen과 Synthesis AI는 범용 합성데이터 생성에 집중하다가 실패했습니다. 핵심 문제는 (1) 물리적 정확성(Physical Hallucination) 미보장, (2) 산업별 도메인 지식 부재, (3) 데이터 품질 검증 체계 부재였습니다. PebbloSim은 Neuro-Symbolic Hybrid World Model로 물리 법칙을 준수하는 합성데이터를 생성하고, DataClinic으로 품질을 검증하는 폐쇄 루프를 갖추고 있습니다. 또한 이들에게 부재했던 '워크플로우 임베딩'과 '반복매출 구조'를 Data Greenhouse가 해결합니다.
Q4. Data Greenhouse가 Snowflake/Databricks와 경쟁하는 것인가요?
아닙니다. Snowflake와 Databricks는 데이터를 저장하고 처리하는 인프라입니다. Data Greenhouse는 그 위에서 동작하는 데이터 품질 관리 및 자율 운영 계층(Data OS)입니다. 오히려 Snowflake/Databricks의 마켓플레이스에서 Core Plugin으로 배포되는 것이 목표이며, 이는 보완 관계입니다. NVIDIA가 GPU를 제공하지만 데이터 품질 레이어가 없는 것과 같은 구조적 공백을 메웁니다.
Q5. 1천억 매출이 현실적인가요?
글로벌 데이터 관리 SW 시장(TAM $155.6B)에서 1천억 원은 0.03%에 불과합니다. Applied Intuition은 설립 8년 만에, Snowflake는 11년 만에 이 수준을 달성했습니다. Maximum C-1 시나리오(2030년 1천억)는 글로벌 확장과 전략적 파트너십을 전제하며, Base 시나리오(108억)는 국내 시장만으로도 달성 가능한 보수적 목표입니다. 핵심은 2028년 변곡점에서 글로벌 SaaS와 PebbloSim이 동시 폭발하는 구조입니다.
Q6. 현대차 제로원 투자의 전략적 의미는?
현대차 제로원은 현대자동차그룹의 CVC입니다. 이 투자는 (1) 현대차 자율주행/로봇 사업부와의 기술 협업 기회, (2) 현대차 공급망 내 DataClinic 확산 경로, (3) 글로벌 OEM 레퍼런스 확보를 의미합니다. 동일 밸류에이션(프리 180억)으로 투자를 확정한 것은 페블러스의 기술력과 성장 잠재력에 대한 전략적 검증입니다.
Q7. EU AI Act가 실제로 매출에 기여하나요?
이미 기여하고 있습니다. LG전자의 PebbloScope 도입은 EU AI Act Article 11(기술 문서화 의무)에 대한 대응이 주요 동기였습니다. 2026년 8월 전면 시행 이후, 고위험 AI 시스템을 운영하는 모든 기업이 데이터 품질 관리 체계를 갖추어야 하며, 이는 KOLAS 인증 수요 폭발과 DataClinic 도입 가속으로 직결됩니다. 과징금 리스크(최대 3,500만 유로 또는 글로벌 매출 7%)가 도입 동기를 구조적으로 만듭니다.
Q8. 글로벌 진출 타이밍과 전략은?
2027년 시리즈 A 이후 본격화합니다. 1단계(2027~28)는 기존 고객의 해외 법인을 통한 간접 진출, 2단계(2028~29)는 AWS/Azure 마켓플레이스를 통한 SaaS 직접 판매입니다. EU AI Act 대응 수요가 가장 큰 유럽이 핵심 타겟이며, Data Greenhouse의 소버린 배포 모듈이 차별화 무기입니다. 델라웨어 법인(2026 H1)이 글로벌 준비의 첫 단추입니다.
Q9. BEP(손익분기) 달성 시점은?
Accelerated 시나리오에서 2026년 하반기에 월간 BEP 달성을 전망합니다. 현재 영업손실이 2.61억(연간)까지 줄어든 상태이며, 2026년 파이프라인 32.3억이 실현되면 연간 BEP 달성이 가능합니다. 매출총이익률 100% 구조이므로, BEP 이후 매출 증가분이 거의 그대로 이익으로 전환됩니다. 2030년 Accelerated 기준 영업이익률 54%를 전망합니다.
Q10. 14명의 린 조직으로 스케일업이 가능한가요?
Data Greenhouse 플랫폼의 자동화가 이 한계를 해소합니다. 현재 1인당 5사를 관리하지만, 2030년에는 셀프서브 온보딩과 Agentic 자동화로 1인당 100사 관리가 목표입니다. 온보딩 기간도 4주에서 1일로 단축됩니다. Agentic AI 시대에는 대규모 개발 인력보다 산업 도메인 전문가와 고객 교육이 핵심이며, 이것이 린 조직이 약점이 아닌 구조적 강점인 이유입니다.