Executive Summary
페블러스는 AI 학습 데이터 품질 관리에서 피지컬 AI 데이터 인프라로 확장하는 버티컬 통합 전략을 실행 중입니다. 누적 투자금 31억으로 매출 115% 성장, 손실 81% 감소를 달성했으며, 이는 업계 최고 수준의 자본 효율성입니다.
5개 매출 스트림(DataClinic, B2G, 합성데이터, 인증, 글로벌 SaaS)과 삼각형 CAC=0 모델로 매출총이익률 100% 구조를 구현했습니다. Data Greenhouse 플랫폼을 통해 프로젝트 기반 매출에서 SaaS 반복매출로의 전환을 추진하고 있습니다.
4개 시나리오 프로젝션에서 Base 108억(자체 성장) ~ Maximum 1,000억(글로벌 확장) 경로를 제시합니다. 현대차 제로원이 동일 밸류에이션으로 투자를 확정했으며, Applied Intuition/Snowflake/Databricks가 걸어온 궤적과 동일한 성장 경로에 진입했습니다.
1. 왜 지금인가 — 시장 변곡점과 구조적 기회
데이터 품질 관리 시장은 구조적 전환점에 도달했습니다. 수평 플랫폼(Anomalo, Shelf.io 등)이 ARR $50M에서 성장이 정체되는 현상은 우연이 아닙니다. 이들의 실패는 시장에 진입하려는 후발주자에게 오히려 명확한 기회를 제시합니다.
수평 플랫폼의 3가지 구조적 실패 원인
- 1 가치 창출 한계: "데이터에 문제가 있다"는 알림만 전달할 뿐, 실제로 문제를 해결하지 못합니다. 모니터링은 필요 조건이지 충분 조건이 아닙니다.
- 2 Alert Fatigue: 범용 규칙이 만들어내는 수백 개의 알림은 결국 무시됩니다. 산업 컨텍스트 없는 모니터링은 잡음에 불과합니다.
- 3 단위 경제성 붕괴: 낮은 ARPU($2~5K/월)에 높은 CAC($50K+)를 결합하면 LTV/CAC < 3x가 되어 스케일이 불가합니다.
규제 윈도우가 열리고 있다
EU AI Act이 2026년 8월 전면 시행되고, 한국 AI 기본법이 2026년 1월 발효되었습니다. 두 규제 모두 고위험 AI 시스템의 학습 데이터 품질 관리 체계를 의무화합니다. 규제가 만들어내는 수요는 선택이 아닌 강제이며, 이 윈도우는 최초 진입자에게 압도적 우위를 부여합니다.
TAM과 거시 경제 변화
글로벌 데이터 관리 소프트웨어 시장(TAM)은 $155.6B에 달합니다. 페블러스의 1천억 매출 목표는 이 시장의 0.03%에 불과합니다. 거시 경제적으로, "성장지상주의 SaaS 모델의 종말"이라는 시대적 전환이 진행 중입니다. 2021~2023년의 제로 금리 시대에 작동했던 "돈을 태워 성장하는" 모델은 더 이상 투자자의 지지를 받지 못합니다. 자본 효율성이 새로운 경쟁력입니다.
핵심 논거: 수평 플랫폼의 $50M 천장, 규제 의무화, 자본 효율성 시대가 동시에 도래한 지금이 버티컬 데이터 인프라의 최적 진입 시점입니다.
2. 역발상 — 버티컬 통합과 피지컬 AI
시장이 수평 확장에 실패하는 동안, 페블러스는 정반대 전략을 선택했습니다. 범용 모니터링이 아닌 산업 핵심 가치사슬에 수직 침투하는 것입니다. 이 접근은 Veeva Systems(제약), Procore(건설)가 증명한 버티컬 SaaS 성공 공식과 동일합니다.
피지컬 AI: 새로운 데이터 프론티어
피지컬 AI란 로봇, 자율주행, 디지털 트윈 등 물리적 세계와 상호작용하는 AI 시스템을 말합니다. 이 영역의 데이터는 비정형(비디오, 3D 포인트클라우드, 센서 스트림)이며, 기존 텍스트/표 중심 데이터 품질 도구로는 관리가 불가합니다. NVIDIA의 Jensen Huang이 "AI의 다음 물결은 Physical AI"라고 선언한 것은 이 시장의 폭발적 성장을 예고합니다.
온프레미스의 전략적 회귀
클라우드 만능론의 시대가 저물고 있습니다. 데이터 중력(Data Gravity) 법칙에 따라, 대규모 데이터는 이동하기보다 생성된 곳에서 처리되어야 합니다. 제조, 국방, 의료 등 데이터 주권이 중요한 산업에서는 온프레미스 배포가 필수입니다. 유럽의 소버린 AI 트렌드도 이 방향을 강화합니다.
클라우드 벤더와의 관계: 경쟁자가 아닌 보완재
AWS, Azure, GCP는 인프라 레이어에 집중합니다. 페블러스는 이 인프라 위에서 동작하는 Core Plugin으로 포지셔닝합니다. 클라우드 벤더의 마켓플레이스를 통한 배포는 CAC를 추가로 낮추는 채널이 됩니다. 모니터링을 넘어, 진단에서 생성, 관리, 증적까지 통합하는 것이 페블러스의 차별화입니다.
전략 요약: 수평에서 버티컬로, 텍스트에서 피지컬로, 클라우드 전용에서 하이브리드로 — 세 가지 축의 전환이 페블러스의 성장 공간을 규정합니다.
3. 솔루션 포트폴리오
페블러스의 4개 핵심 제품은 데이터 생애주기의 전 단계를 커버합니다. 개별 제품이 독립적 가치를 제공하면서도, 결합 시 시너지가 극대화되는 플랫폼 구조입니다.
DataClinic
AI 학습 데이터 품질 진단 및 개선 플랫폼. 시간당 10만 장 처리, 데이터 플라이휠 효과로 사용할수록 정확도 향상.
- •Data Imaging: 데이터셋 건강 상태 시각화
- •ISO/IEC 5259 기반 품질 인증
- •Agentic 자동 정제 파이프라인
PebbloScope
데이터-모델 성능 시각화 및 설명가능성(XAI) 플랫폼. EU AI Act 투명성 의무 충족을 위한 감사 추적 기능 내장.
- •모델 성능-데이터 품질 상관관계 분석
- •EU AI Act Article 11 준수 증적
- •인터랙티브 데이터 탐색 대시보드
PebbloSim
디지털 트윈 기반 합성데이터 생성. Neuro-Symbolic Hybrid World Model로 Physical Hallucination이 없는 데이터 생성.
- •물리 법칙 준수 합성 시나리오
- •희귀 이벤트(코너 케이스) 대량 생성
- •자율주행/로봇/제조 시뮬레이션
Data Greenhouse
5계층 Agentic AI 데이터 운영체제. Observe - Orchestrate - Action - Govern 순환 구조.
- •DataClinic + PebbloScope + PebbloSim 통합
- •자율형 데이터 파이프라인 오케스트레이션
- •온프레미스/하이브리드 클라우드 배포
AADS 2단계: 산업 확장
과기부 글로벌 빅테크 육성 사업(AADS)의 2단계에서는 산업 특화 VLM(Vision-Language Model), Reasoning Router, 소버린 배포 모듈을 개발합니다. KISTI 공동연구로 진행되는 이 과제는 페블러스의 기술 스택을 산업별 수직 솔루션으로 확장하는 핵심 엔진입니다.
4. 비즈니스 모델
페블러스의 비즈니스 모델은 전통적 SaaS와 근본적으로 다릅니다. 마케팅에 1원도 쓰지 않고 매출을 만드는 삼각형 CAC=0 모델이 그 핵심입니다.
5개 매출 스트림
| 스트림 | 구분 | 단가 | 특성 | 2026 전망 |
|---|---|---|---|---|
| A. DataClinic | PoC + 라이선스 | 2.5억+/건 | 온프렘 프리미엄 | 8~10억 |
| B. B2G R&D | 정부 과제 | 과제당 5~20억 | CAC=0, 레퍼런스 확보 | 12~15억 |
| C. 합성데이터 | PebbloSim | 1~5억/프로젝트 | 고마진, 반복 수요 | 3~5억 |
| D. 인증 | KOLAS 품질인증 | 500만~3천만/건 | 규제 의무, 반복 | 2~3억 |
| E. 글로벌 SaaS | Data Greenhouse | 5억+/엔터프라이즈 | ARR 전환 목표 | 2~3억(초기) |
삼각형 CAC=0 모델
일반적인 B2B SaaS는 영업인력과 마케팅 비용으로 고객을 획득합니다. 페블러스는 이 구조를 3개의 삼각형으로 대체합니다. 정부 R&D 과제가 곧 세일즈 활동이 되어, 과제 수행 과정에서 자연스럽게 엔터프라이즈 고객이 확보됩니다. 삼성E&A, 현대차, LG전자 모두 이 경로로 고객이 되었습니다.
3축 매출 포트폴리오
- ▲ 앵커(PoC 커스터마이징): 중~고마진. 고객 요구에 맞춘 파일럿으로 신뢰 구축 후 확대.
- ▲ 성장엔진(라이선스/유지보수): 80%+ 마진. PoC 이후 연간 계약으로 전환. 반복 매출의 핵심.
- ▲ R&D(컨설팅/정부과제): 중간 마진이지만 기술 개발과 레퍼런스를 동시에 확보하는 전략적 매출.
트로이 목마 전략: PoC에서 플랫폼 락인까지
PoC 커스터마이징으로 고객의 핵심 데이터 파이프라인에 진입한 후, DataClinic이 해당 파이프라인의 필수 구성요소로 자리잡으면 라이선스와 유지보수 계약이 자연스럽게 뒤따릅니다. 온프레미스 프리미엄은 SaaS 대비 5배 — DataClinic 2.5억+, Data Greenhouse 5억+입니다.
번들 사례 — 육군 프로젝트: DataClinic + PebbloScope + PebbloSim 번들로 초기 계약 6.5~7억, 연간 유지보수 1.3억. 5년 LTV 15~17억. 단일 고객에서 이 수준의 LTV가 가능한 것은 버티컬 통합의 힘입니다.
5. 자본 효율성의 증명
2024년에서 2025년으로의 재무 변화는 단순한 실적 개선이 아니라, 비즈니스 모델의 구조적 효율성이 입증된 전환점입니다. 아래 표는 핵심 재무 지표의 변화를 보여줍니다.
| 지표 | 2024년 | 2025년 | 변화 |
|---|---|---|---|
| 매출 | 2.92억 | 6.31억 | +115.7% |
| 매출총이익률 | 100% | 100% | 유지 |
| 판관비 | 17.04억 | 8.92억 | -47.7% |
| 영업손실 | -14.12억 | -2.61억 | -81.5% |
| 인건비 | 11.76억 | 7.17억 | -39.0% |
| R&D 보조금 | 2.41억 | 5.95억 | +147% |
미국 SaaS 번 레이트 역설
미국 SaaS 기업의 평균적인 ARR 창출 비용은 $1 ARR당 $2~3의 마케팅/세일즈 비용을 소각하는 구조입니다. 반면 페블러스의 CAC는 사실상 0에 수렴합니다. 정부 R&D가 세일즈를 대체하고, 대기업 PoC가 자연스럽게 레퍼런스 마케팅이 되기 때문입니다. 이 구조는 번 레이트를 구조적으로 억제합니다.
데이터 플라이휠
DataClinic이 처리하는 수백 개 데이터셋은 Agentic AI 자동화의 학습 데이터가 됩니다. 프로젝트를 수행할수록 자동화 정확도가 올라가고, 인당 처리량이 구조적으로 향상됩니다. 이 플라이휠이 매출총이익률 100%를 유지하면서도 판관비를 줄일 수 있는 비결입니다.
아래 차트는 2024~2025년 매출과 영업손실의 변화를 보여줍니다.
6. 2025년 매출 해부
2025년 총 매출 630,678,271원의 구성을 분석하면, 페블러스의 고객 포트폴리오와 시장 침투 전략이 명확하게 드러납니다. 데이터 가공 매출이 93.4%, 라이선스 및 기술자문이 6.6%를 차지합니다.
거래처별 매출 상세
| 거래처 | 매출액(원) | 프로젝트 |
|---|---|---|
| [데이터 가공 매출] 588,860,091원 | ||
| 삼성E&A | 173,788,000 | 산업AI Auto Routing |
| 대구디지털혁신진흥원 | 135,693,636 | 데이터 품질진단 |
| LG전자 | 99,000,000 | PebbloScope 시각화 |
| 전북대 | 88,333,000 | 피지컬AI 정제 |
| 한화비전 | 30,000,000 | DataClinic PoC |
| 현대차/기아 | 25,000,000 | 강화학습 제로원 PoC |
| 한국전자통신연구원 | 11,545,455 | 합성데이터 패턴 |
| 씨에이에스 | 10,000,000 | 남부발전 AI Ready Data |
| 한국전력공사 전력연구원 | 9,000,000 | IoT 품질평가 |
| 뉴럴워크랩 | 6,500,000 | 데이터 가시화 교육 |
| [라이선스 및 기술자문] 41,818,180원 | ||
| 자이언트스텝 | 41,818,180 | 기술자문 |
| 총 합계 | 630,678,271 | |
핵심 시사점: 매출의 93.3%가 삼성E&A, LG전자, 현대차/기아 등 대기업 및 공공기관에서 발생합니다. 이는 페블러스의 기술이 이미 엔터프라이즈 수준의 검증을 통과했으며, 버티컬 인프라로서의 포지셔닝이 시장에 안착하고 있음을 의미합니다. 특히 삼성E&A(산업AI), LG전자(시각화), 현대차(피지컬AI)로의 제품 다각화가 주목됩니다.
7. 4개 시나리오 프로젝션
매출 프로젝션은 4개 시나리오로 구성됩니다. 모든 시나리오는 2024~2025년의 실적 데이터를 기반으로 하며, 각각 상이한 성장 드라이버와 투자 규모를 전제합니다.
- • Base (108억, 2030): 추가 투자 없이 자체 성장만으로 달성. 국내 시장 집중, 기존 고객 확대.
- • Accelerated (237억, 2030): 브리지 + 시리즈A 투자로 세일즈팀 확대, 신규 산업 진출.
- • Maximum C-1 (1,000억, 2030): 글로벌 확장 + 대형 전략적 파트너십(NVIDIA, 클라우드 벤더 등).
- • Maximum C-2 (430억, 2030): 보수적 글로벌 확장. 아시아 중심 성장 후 구미 진출.
아래 차트는 4개 시나리오별 매출 성장 경로를 보여줍니다. (단위: 백만 원)
글로벌 벤치마크 비교
1천억 매출 달성은 전례 없는 목표가 아닙니다. 유사한 B2B 데이터 인프라 기업들의 실적과 비교하면, 페블러스의 목표는 오히려 보수적입니다.
| 기업 | 설립 | 1천억 도달 | 소요 기간 | 현재 가치 |
|---|---|---|---|---|
| Applied Intuition | 2017 | 2025 | 8년 | $150억 |
| Snowflake | 2012 | 2023 | 11년 | $530억 |
| Databricks | 2013 | 2025 | 12년 | $1,340억 |
| 페블러스 (목표) | 2021 | 2030~33 | 9~12년 | 1조+ |
추가 투자 유무에 따른 2030년 매출 격차를 시각화하면, 투자의 레버리지 효과가 분명합니다.
8. Unit Economics
2030년 목표 시점의 제품별 단위 경제성을 분석합니다. 6개 제품 모두 LTV/CAC 16x 이상을 달성하며, 이는 B2B SaaS 업계 평균(3~5x)의 3배 이상입니다.
| 제품 | 고객수 | ARPU(백만) | 매출(백만) | CAC(백만) | 회수(월) | LTV/CAC |
|---|---|---|---|---|---|---|
| 데이터클리닉 | 95 | 74 | 7,000 | 12 | 2 | 18.5x |
| 페블로스코프 | 120 | 17 | 2,000 | 3 | 2 | 17.0x |
| 데이터 그린하우스 | 35 | 143 | 5,000 | 25 | 3 | 17.2x |
| 페블로심 | 50 | 110 | 5,500 | 20 | 3 | 16.5x |
| KOLAS 인증 | 250 | 11 | 2,800 | 2 | 1 | 30+ |
| AI Greenhouse+신규 | 40 | 35 | 1,400 | 8 | 3 | — |
모듈화/자동화 영업 레버리지
Data Greenhouse 플랫폼의 자동화가 진행될수록, 영업과 온보딩에 소요되는 인적 자원이 극적으로 줄어듭니다. 이것이 린 조직으로도 수백 개 고객을 관리할 수 있는 구조적 기반입니다.
| 지표 | 2026년 | 2030년 | 개선율 |
|---|---|---|---|
| 온보딩 기간 | 4주 | 1일 | 96% 단축 |
| 고객당 도입비 | 15백만 | 0.5백만 | 97% 절감 |
| 1인당 관리 고객 | 5사 | 100사 | 20배 |
9. 투자 개요
페블러스는 2026년 브리지 라운드를 통해 20억 규모의 투자를 유치합니다. 현대차 제로원이 동일 밸류에이션 조건으로 투자를 확정했으며, 이는 전략적 파트너십의 시작입니다.
투자금 사용 계획
| 항목 | 금액 | 내용 |
|---|---|---|
| 세일즈 확장 | 8억 | 엔터프라이즈 세일즈팀 구축, 산업별 PoC 파이프라인 확대 |
| PebbloSim 개발 | 5억 | 합성데이터 엔진 고도화, 산업별 시뮬레이션 템플릿 |
| SaaS 전환 | 3억 | Data Greenhouse 클라우드 버전, 셀프서브 온보딩 |
| 인증 확대 | 2억 | KOLAS 인증 자동화, ISO/IEC 5259 국제 인증 |
| 예비비 | 2억 | 전략적 기회 대응, 운영 버퍼 |
| 합계 | 20억 |
투자 타임라인
2026 브리지 라운드
20억 규모. 현대차 제로원 확정. 세일즈팀 확장 + PebbloSim 개발 가속.
2027 시리즈 A
50~100억 규모. Data Greenhouse SaaS 론칭, 글로벌 파일럿 시작.
2028 시리즈 B/C
글로벌 시장 본격 진출. 클라우드 벤더 마켓플레이스 입점, 전략적 파트너십 확대.
2029~30 프리 IPO
매출 100억+ 달성. IPO 준비 또는 전략적 M&A 검토.
2030~33 IPO
1천억 매출 달성 시나리오에서 코스닥/나스닥 상장.
투자 논거 요약
- 검증된 자본 효율성: 누적 31억 투자로 매출 115% 성장, 손실 81% 감소 달성
- 구조적 해자: 버티컬 통합 + 데이터 플라이휠 + 온프레미스 프리미엄의 3중 방어
- 규제 테일윈드: EU AI Act + AI 기본법이 만드는 의무적 수요
- 엔터프라이즈 검증: 삼성E&A, LG전자, 현대차 등 대기업 고객 포트폴리오
- 플랫폼 전환: 프로젝트에서 SaaS 반복매출로의 경로가 Data Greenhouse에 의해 가시화
- 전략적 투자자: 현대차 제로원의 참여가 피지컬 AI 시장 진출의 가속기
- 글로벌 벤치마크: Applied Intuition, Snowflake와 동일한 성장 궤적
- 팀 역량: 데이터 품질 분야 15년+ 경험의 창업팀, KISTI 공동연구 역량
한 줄 요약: 페블러스는 "돈을 태우는 성장"이 아닌 "돈을 버는 성장"의 궤적 위에 있습니다. 추가 투자는 이 궤적의 속도를 가속하는 연료이며, 투자 없이도 생존하는 구조가 이미 입증되었습니다.
FAQ — 투자자 핵심 질문
투자 검토 과정에서 가장 빈번하게 제기되는 질문과 답변입니다.