Executive Summary
청화대학교(Tsinghua University)가 개발하고 AAAI 2026에서 발표된 Kronos는 금융 캔들스틱(K-line) 데이터를 도메인 전용 이산 토큰으로 변환하는 Binary Spherical Quantization(BSQ) 아키텍처를 바탕으로, 범용 시계열 파운데이션 모델(TSFM) 대비 RankIC* +93%, 합성 생성 충실도** +22%라는 검증된 성능 격차를 실증했다. 12B+ K-line 관측치와 45개 이상 거래소에서 수집한 대규모 도메인 특화 코퍼스, 그리고 GPT 스타일 계층적 예측 구조가 이 격차의 구조적 원인이다. MIT 오픈소스로 공개된 Kronos는 GitHub 16.4K stars(2026-04-13 기준)를 기록하며 TSFM 생태계 최상위권에 올라 있다.
이 성과의 본질적 의미는 단순한 모델 성능 개선이 아니다. 금융 시계열이라는 도메인 고유의 "언어"를 기계가 배울 수 있다는 것, 그리고 그 학습의 질은 전적으로 학습 데이터의 품질에 달려 있다는 것을 실증적으로 증명했다. 범용 TSFM인 TimesFM(500M 파라미터)이 금융 데이터에서 R² = -2.80%를 기록한 반면, 금융 도메인에 특화된 Kronos는 동일한 과제에서 25개 베이스라인 모델을 모두 압도했다. "더 크고 범용적인 모델"이 아니라 "도메인에 맞는 표현 구조"가 승부를 결정짓는 시대가 왔음을 보여주는 가장 선명한 증거다.
페블러스는 이 전환에서 세 가지 접점을 갖는다. 첫째, Kronos의 BSQ codebook(2^20 어휘)이 학습 데이터 분포를 직접 반영하는 구조는 DataClinic의 시계열 이상치 탐지·결측값 처리·분포 진단 역량이 FM 성능을 업스트림에서 결정하는 근거가 된다. 둘째, Kronos의 합성 K-line 생성(+22% fidelity)은 DataGreenhouse가 제조 도메인에서 수행하려는 합성 센서 시계열 생성의 선행 증명이다. 셋째, "도메인 특화 FM 시대에 데이터 품질은 모델 자체의 구성 요소"라는 포지셔닝이 AI-Ready Data 전략의 핵심 논거가 된다. Gartner는 이미 경고했다 — "Through 2026, organizations will abandon 60% of AI projects unsupported by AI-ready data."
* RankIC (Rank Information Coefficient) — 모델이 예측한 종목별 수익률 순위와 실제 수익률 순위 간의 상관계수. +93%는 "25개 비교 모델 대비 순위 예측 정확도가 93% 더 높다"는 의미이며, 절대 수익률 93%가 아닙니다.
** 합성 생성 충실도 (Synthetic Fidelity) — 모델이 생성한 합성 K-line 데이터가 실제 시장 데이터의 통계적 분포(변동성, 추세, 상관구조)를 얼마나 정확하게 재현하는지 측정하는 지표. +22%는 범용 TSFM 대비 분포 재현 정확도가 22%p 높다는 의미입니다.
K-line을 언어로 — Kronos의 기술 혁신
시계열 예측 모델이 금융 데이터를 제대로 이해하지 못하는 이유는 무엇일까. 그 답은 "표현 방식"에 있다. 기존 범용 TSFM들은 시계열을 연속적인 숫자값의 나열로 처리했다. 온도가 23.4도에서 23.8도로 올랐다는 것과, 주가가 53,000원에서 54,200원으로 올랐다는 것을 동일한 방식으로 인코딩한다. 그러나 금융 데이터에는 범용 수치 표현으로 포착할 수 없는 고유한 구조가 있다. 캔들스틱(K-line)의 시가·고가·저가·종가·거래량·거래대금(OHLCVA)은 단순한 6개 숫자가 아니라, 시장 참가자들이 만들어낸 집단적 의사결정의 압축된 표현이다.
1.1 Binary Spherical Quantization — 금융의 언어를 이산 토큰으로
Kronos가 이 문제를 푼 방식은 근본적으로 다르다. 대형 언어 모델(LLM)이 텍스트를 "단어 토큰"으로 변환하듯, Kronos는 K-line을 "금융 토큰"으로 변환한다. 이 변환의 핵심 메커니즘이 Binary Spherical Quantization(BSQ)다. 3층 Transformer 대칭 오토인코더(dim=256, FF=512, heads=4)가 OHLCVA 6차원 연속값을 잠재 공간으로 압축한 뒤, 학습 가능한 초평면들에 그 잠재 벡터를 투영하여 k=20비트 이진 코드를 생성한다. 이 과정을 통해 각 K-line은 2^20 = 약 100만 크기의 어휘 공간(codebook)에서 하나의 정수 인덱스로 표현된다.
단순한 정수 변환이 아니다. Kronos는 이 어휘를 계층적으로 구성한다. 20비트를 coarse(상위 10비트, 2^10=1,024 엔트리)와 fine(하위 10비트, 2^10=1,024 엔트리)으로 분리하는 것이다. coarse 서브토큰은 가격 움직임의 주요 구조(상승/하락 방향, 거래량 레벨)를 포착하고, fine 서브토큰은 그 구조 안에서 잔차 정밀도(고가·저가의 세부 위치, 거래대금 변화)를 포착한다. 예측 시에는 coarse 서브토큰을 먼저 생성한 뒤, cross-attention을 통해 컨텍스트를 반영하여 fine 서브토큰을 조건부로 예측하는 순차적 방식을 취한다.
Ablation 수치가 말해주는 것: Kronos 원논문 Table 2의 제거 연구에서, 이산 토큰 방식(Kronos-small)의 RankIC는 0.0254였던 반면 연속값 직접 회귀 방식(Direct-AR)은 0.0149에 불과했다. 70% 이상의 우위다. 병렬 서브토큰 예측(0.0226) 대비 순차 예측(0.0254)도 유의미하게 높다. "왜 이산 토큰인가"에 대한 가장 직접적인 실증 답변이다.
1.2 예측기 아키텍처 — GPT처럼 다음 K-line을 생성한다
토크나이저가 K-line을 이산 토큰으로 변환하면, 예측기가 이 토큰 시퀀스를 입력받아 다음 토큰을 생성한다. Kronos의 예측기는 GPT 스타일의 디코더 전용 Transformer다. RoPE(Rotary Position Embedding) 위치 임베딩, RMSNorm 정규화, Causal masking을 채택했으며, 언어 모델이 다음 단어를 예측하듯 다음 캔들스틱 토큰을 자기회귀적으로 예측한다.
Kronos는 4종의 모델 패밀리로 제공된다. Mini(4.1M 파라미터, 2,048 컨텍스트 길이), Small(24.7M, 512), Base(102.3M, 512), Large(499.2M, 512)가 그것이다. Mini와 Small, Base 3종은 MIT 라이선스로 HuggingFace NeoQuasar 조직에서 공개적으로 다운로드할 수 있다. Large 모델은 기관 라이선싱 문의를 통해서만 접근 가능하다. 흥미롭게도 가장 긴 컨텍스트 길이(2,048)를 가진 모델은 파라미터가 가장 작은 Mini다 — 초단기 트레이딩과 실시간 예측 용도에 특화된 설계다.
시간 정보의 처리 방식도 독특하다. Kronos는 5종의 시간 임베딩을 사용한다. 분(minute), 시(hour), 요일(day of week), 일(day of month), 월(month)이다. 이 5종을 독립적으로 처리한 뒤 합산하는 방식으로, 금융 시장의 계절성과 주기성(장 개시/마감 효과, 월말 효과, 분기 리밸런싱 등)을 명시적으로 포착한다.
1.3 학습 데이터 규모 — 45개 거래소, 12B+ K-line
Kronos의 학습 데이터는 45개 이상의 거래소, 30개 이상의 국가에서 수집된 12B(120억) 이상의 K-line 관측치다. 분봉·시봉·일봉·주봉·월봉 등 7가지 시간 주기를 망라하며, 주식·선물·외환·암호화폐 등 다중 자산 클래스를 포함한다. 데이터 품질 필터링도 엄격하다 — 비유동성 자산과 가격 정체 구간은 제거하고, Z-score [-5, 5] 범위를 벗어나는 극단값은 클리핑한다. 이 규모와 다양성이 Kronos의 제로샷 일반화 능력의 근원이다.
Kronos와 범용 TSFM의 핵심 아키텍처 차이를 정리하면 아래와 같다. 두 접근법이 근본적으로 다른 전제에서 출발하고 있음을 확인할 수 있다.
| 항목 | TimesFM (범용) | Kronos (금융 특화) |
|---|---|---|
| 토큰화 방식 | 연속값 패치 기반 | 이산 K-line 토큰 (BSQ) |
| 컨텍스트 길이 | 최대 16,000 | 512 (Small/Base/Large), 2,048 (Mini) |
| 학습 데이터 | 범용 100B 시간점 (혼합) | 금융 특화 12B+ K-line (45개 거래소) |
| 어휘 크기 | 연속값 (어휘 없음) | 2^20 ≈ 100만 (coarse/fine 계층) |
| 금융 제로샷 R² | -2.80% (사실상 무용) | 25개 베이스라인 전체 압도 |
왜 금융에서 먼저 성공했나 — 성능 격차의 구조적 원인
범용 TSFM들이 금융 데이터에서 부진한 것은 우연이 아니다. arXiv:2511.18578 논문("Re(Visiting) Time Series Foundation Models in Finance")은 이 현상을 체계적으로 실증했다. TimesFM(500M 파라미터)의 금융 제로샷 예측 R²는 -2.80%였고, 수익률은 -1.47%에 불과했다. Chronos(large)도 R² = -1.37%로 사실상 무의미한 수준이었다. 이 모델들이 나쁜 것이 아니다. 애초에 금융 데이터를 위해 설계되지 않았을 뿐이다.
2.1 범용 TSFM이 금융에서 실패하는 네 가지 구조적 이유
학술 문헌이 공통적으로 지적하는 범용 TSFM의 금융 한계는 크게 네 가지다.
- • 낮은 신호 대 잡음비(SNR): 금융 시계열은 날씨·에너지 소비와 달리 잡음이 지배적이다. 범용 TSFM은 고SNR 환경을 전제로 최적화되어 있어, 금융 데이터에서는 잡음을 신호로 학습하는 역설이 발생한다.
- • 강한 비정상성(Non-stationarity): 금융 시장은 체제 전환(regime shifts)이 빈번하다. 양적완화 시기와 긴축 시기의 시계열 통계적 특성은 완전히 다르다. 고정된 패치 표현은 이런 체제 전환에 취약하다.
- • OHLCVA 다변량 구조: 캔들스틱의 6개 변수는 독립적이지 않다. 고가(High)는 반드시 저가(Low)보다 크고, 종가(Close)는 고가와 저가 사이에 위치한다. 범용 모델의 독립 시계열 가정은 이 구조적 제약을 무시한다.
- • 고차 의존성: 볼린저 밴드 돌파, 데드크로스/골든크로스, 헤드앤숄더 패턴 같은 기술적 분석의 핵심 신호는 여러 K-line에 걸쳐 형성되는 고차 패턴이다. 단순한 연속값 패치로는 이런 패턴을 포착할 수 없다.
2.2 Kronos의 해답 — 도메인 언어 설계
Kronos는 이 네 가지 문제를 모두 토큰화 단계에서 해결했다. BSQ codebook의 2^20 어휘는 12B+ K-line을 학습하면서 금융 데이터의 통계적 구조를 자연스럽게 반영한다. 높은 잡음 환경에서 반복적으로 등장하는 패턴들이 codebook의 고빈도 엔트리로, 드물게 등장하는 이상 패턴들이 저빈도 엔트리로 인코딩된다. OHLCVA 6차원을 단일 이산 토큰으로 압축함으로써 변수 간 구조적 제약도 자동으로 학습된다.
45개 거래소에 걸친 교차 자산 학습도 핵심이다. 서울 주식 시장의 패턴과 뉴욕 선물 시장의 패턴, 싱가포르 외환 시장의 패턴을 동시에 학습함으로써, 어느 한 시장의 특수성에 과적합되지 않는 범용적 금융 표현이 구성된다. 이것이 제로샷 일반화 능력의 근원이다.
2.3 벤치마크 결과 — 수치로 확인하는 격차
Kronos 원논문은 25개 베이스라인 모델을 4개 카테고리(제로샷 TSFM, Full-shot 학습 모델, 계량경제 변동성 모델, 생성형 모델)에서 비교한다. 핵심 지표별 결과는 아래와 같다.
| 지표 | Kronos 우위 | 비교 대상 |
|---|---|---|
| RankIC (방향 예측력) | +93% | 최강 범용 TSFM 대비 |
| RankIC (방향 예측력) | +87% | 최강 비사전학습 모델 대비 |
| MAE (변동성 예측) | -9% | Kronos-small 0.0384 vs Direct-AR 0.0565 |
| 합성 K-line fidelity | +22% | DiffusionTS, TimeVAE 대비 |
| 이산 vs 연속 Ablation | +70% | RankIC 0.0254 vs 0.0149 (Direct-AR) |
2.4 합성 K-line 생성 — 데이터 부족을 데이터로 해결
Kronos의 또 다른 핵심 기능은 합성 K-line 생성이다. 금융 실무에서 백테스팅은 실제 역사 데이터의 제약을 받는다 — 특히 일별 데이터는 수십 년이라는 긴 시간이 필요하고, 특정 시장 조건(강세장/약세장/횡보장)의 데이터는 자연스럽게 불균형하게 분포된다. Kronos는 학습된 codebook을 역방향으로 사용하여 새로운 K-line 시퀀스를 생성할 수 있다.
이 합성 데이터의 충실도는 Discriminative Score와 TSTR(Train-on-Synthetic, Test-on-Real) 프로토콜로 검증된다. Kronos는 DiffusionTS와 TimeVAE 대비 +22%의 충실도 향상을 달성했다. 103개의 고전 캔들스틱 패턴을 포함하는 시나리오 생성도 가능하다. 이는 단순한 기술적 성취가 아니다 — 데이터가 부족한 신흥 시장이나 특수 상품 클래스에서의 모델 학습과 백테스팅을 가능하게 하는 실용적 인프라다.
도메인 특화 모델의 교훈 — 제조로의 전이
Kronos가 금융에서 증명한 것은 단순히 "금융에 특화된 좋은 모델"이 아니다. "도메인 고유의 언어를 이산 토큰으로 학습하면, 범용 모델이 가진 규모와 범용성의 이점을 도메인 언어의 정밀성이 압도할 수 있다"는 패러다임을 실증한 것이다. 그렇다면 이 패러다임을 금융이 아닌 다른 도메인, 특히 제조와 산업 시계열에 적용하면 어떻게 될까.
3.1 금융과 제조의 유추 — 놀랍도록 유사한 구조
두 도메인의 구조적 유사성은 생각보다 깊다.
| 금융 도메인 | 대응 | 제조 도메인 |
|---|---|---|
| K-line (OHLCVA) | ↔ | 센서 시계열 (온도·압력·진동·전류) |
| 거래소 45개+ | ↔ | 공장·설비 종류 다양성 |
| 가격 변동성 (Volatility) | ↔ | 장비 열화 / 이상 신호 |
| 캔들 패턴 (차트 분석) | ↔ | 장비 건강 패턴 (예측 유지보수) |
| 백테스팅 데이터 부족 | ↔ | 실제 고장 데이터 희소성 |
| 합성 K-line 생성 | ↔ | 합성 센서 시계열 생성 |
3.2 왜 제조 도메인 파운데이션 모델은 아직 없나
유추 구조가 이렇게 선명함에도, 제조 도메인의 파운데이션 모델은 아직 초기 단계에 머물러 있다. Siemens가 Microsoft Azure와 협력하여 IFM(Industrial Foundation Model) 프로젝트를 2025년 하노버 메세에서 발표했고, ProcessFM 프레임워크가 최초의 전용 FM 제안을 내놓았지만, 금융의 Kronos에 해당하는 완성도 높은 모델은 아직 없다. 이유는 구조적이다.
- • 복잡한 물리화학 메커니즘: 제조 공정의 열역학, 반응 동역학, 유체역학은 금융의 가격 메커니즘보다 훨씬 높은 비선형성을 갖는다. 단순 시계열 패턴 학습으로는 물리적 인과관계를 포착할 수 없다.
- • 데이터 사일로: 금융 시장은 거래소라는 중앙화된 데이터 수집 인프라가 존재하지만, 제조 공장의 센서 데이터는 각 공장이 독립적으로 관리한다. 45개 거래소의 데이터를 한 곳에 모으는 것과, 45개 공장의 데이터를 한 곳에 모으는 것은 완전히 다른 문제다.
- • 이종 데이터 통합: 제조 데이터는 센서 시계열뿐 아니라 이미지(비전 검사), CAD 도면, PLC 제어 코드, 작업 지시서 등 이질적인 형태를 갖는다. 단일 토크나이저로 이를 통합하는 것은 기술적으로 미해결 문제다.
- • 라벨 부족: 실제 고장 데이터는 자연적으로 희소하다. 1년에 한 번 발생하는 장비 고장 데이터로 모델을 학습하는 것은 사실상 불가능하다. 합성 데이터 없이는 이 문제가 해결되지 않는다.
3.3 데이터 품질이 선결 조건인 이유 — codebook 오염 메커니즘
Kronos의 BSQ codebook은 학습 데이터 분포를 직접 반영한다. 이는 단순히 기술적 사실이 아니라, 데이터 품질에 대한 근본적 함의를 갖는다. 만약 학습 데이터에 노이즈·이상치·결측값이 포함되어 있다면, 그 오염된 분포가 codebook에 그대로 인코딩된다. 노이즈를 정상 신호로 학습한 codebook은 모든 다운스트림 추론에서 오염된 표현을 사용하게 된다.
VQ(Vector Quantization) 문헌의 Representation Collapse 문제(arXiv:2411.16550)는 이를 실증적으로 보여준다. 노이즈가 포함된 학습 데이터는 codebook의 일부 엔트리만 활용되고 나머지는 "죽은 코드(dead codes)"가 되는 표현 붕괴를 유발한다. 어휘 크기가 2^20이어도 실제로는 수천 개 엔트리만 사용되는 상황이 발생하며, 이는 모델의 표현 능력을 근본적으로 제한한다. 제조 센서 데이터의 이상치, 결측 구간, 캘리브레이션 오류가 산업 파운데이션 모델에 동일한 메커니즘으로 작용할 것이다.
3.4 제조 AI의 현재와 시장 기회
그럼에도 시장의 방향은 명확하다. 한국 정부는 스마트팩토리 30,144개(2022년 말 기준)에서 AI 팩토리 500개(2026년 목표)로의 전환을 추진하고 있으며, 관련 예산은 KRW 4,020억으로 전년 대비 70% 증가했다. 예측 유지보수 시장은 2026년 $10B~$18B 규모로 CAGR 20~30%의 성장세를 보이고 있다. 디지털 트윈 시장은 2025년 $36.19B에서 2030년 $180.28B으로 성장이 예상된다(CAGR 37.87%).
NIST는 2026년 5월 "AI for Manufacturing Workshop"을 예정하고 있다. Siemens IFM과 ProcessFM은 아직 초기 수준이지만, 이 방향이 실현될 때 가장 큰 병목은 기술이 아니라 데이터다. 대규모·고품질·표준화된 제조 센서 데이터가 없으면, 아무리 정교한 아키텍처도 Kronos와 같은 성과를 낼 수 없다.
페블러스와의 연결고리 — 데이터 레디니스 파트너
Kronos가 금융에서 보여준 것은 페블러스의 핵심 가치 제안과 정확히 맞닿아 있다. "도메인 특화 파운데이션 모델의 성능은 codebook 품질에서 시작하고, codebook 품질은 학습 데이터 품질에서 결정된다." 이 인과 사슬의 가장 상류(upstream)에 위치한 것이 DataClinic이고, 그 연장선에서 데이터 부족 문제를 해결하는 것이 DataGreenhouse다.
4.1 DataClinic — codebook 오염을 업스트림에서 방지
Kronos가 학습 시 적용한 품질 필터링 — 비유동성 자산 제거, Z-score [-5, 5] 클리핑 — 은 DataClinic이 자동화하는 과정과 기능적으로 상보적이다. DataClinic의 시계열 이상치 탐지 기능은 Kronos의 Z-score 클리핑을 더 정교하게 수행하며, 결측값 처리 기능은 비유동성 구간 제거의 자동화 버전이다. 분포 진단 기능은 학습 데이터의 도메인 커버리지를 사전 검증하여, codebook이 의도하지 않은 분포로 편향되는 것을 방지한다.
이는 단순한 전처리 자동화가 아니다. Gartner의 경고를 다시 가져오면: "Through 2026, organizations will abandon 60% of AI projects unsupported by AI-ready data." 도메인 특화 FM을 구축하려는 기업들이 직면하는 가장 큰 위험이 바로 이것이다. 데이터 품질 미달로 학습된 FM은 codebook 오염으로 인해 실제 환경에서 작동하지 않는다. DataClinic은 이 60% 실패의 근본 원인을 업스트림에서 제거한다.
AIMA(Alternative Investment Management Association) 2025 보고서는 헤지펀드의 95%가 이미 생성형 AI를 활용하고 있으며, 58%가 알파 생성에 AI 활용을 확대할 계획이라고 밝혔다. 동시에 "데이터 품질과 접근성이 AI 도입의 1차적 장벽"이라는 점도 확인했다. 기업 48%가 변동성 높고 불완전한 시계열 데이터로 인한 모델 정확도 문제를 직면하고 있다는 것도 데이터다. Kronos를 활용한 금융 AI PoC에서 파인튜닝 데이터 정제 단계의 파트너로 DataClinic이 포지셔닝될 수 있는 근거가 여기 있다.
4.2 DataGreenhouse — 합성 K-line에서 합성 센서 시계열로
Kronos의 합성 K-line 생성(+22% fidelity)은 DataGreenhouse가 제조 도메인에서 구현하려는 합성 센서 시계열 생성의 선행 증명이다. 두 문제의 구조가 동일하다. 금융에서는 특정 시장 조건의 역사 데이터가 부족하고, 제조에서는 실제 고장 데이터가 희소하다. Kronos가 강세장/약세장/횡보장 시나리오를 합성 K-line으로 재현하듯, DataGreenhouse는 정상/이상/고장 상태의 센서 패턴을 합성 시계열로 생성할 수 있다.
합성데이터 전략의 전략적 가치는 시장이 이미 인정했다. Gretel은 NVIDIA에 인수되었고(2025.03), Hazy는 SAS에 인수되었다(2024.11). 합성데이터 시장은 2026년 약 $636M 규모로 CAGR 30.8~46.3%의 빠른 성장세를 보이고 있다. 제조 합성 센서 데이터는 디지털 트윈과 결합할 때 특히 강력하다 — 시뮬레이션 환경에서 다양한 고장 시나리오를 생성하고, 그 합성 데이터로 IFM을 학습시키는 파이프라인이 현실화될 수 있다.
4.3 AI-Ready Data 포지셔닝 — 파이프라인 전체를 잇는 인프라
Kronos가 증명한 패러다임 전환을 한 문장으로 표현하면 이렇다: "범용 모델 시대에 데이터 품질은 '있으면 좋은 것'이었다. 도메인 특화 모델 시대에 데이터 품질은 '모델 자체의 구성 요소'다." 이 전환이 페블러스의 AI-Ready Data 전략에 가장 강력한 논거를 제공한다.
페블러스가 포지셔닝하는 파이프라인은 다음과 같다.
- ① 데이터 생성/수집: 공장 센서, 거래소 피드, 의료 기기 등 도메인 원천
- ② DataClinic 진단·정제: 이상치 탐지, 결측값 처리, 분포 진단으로 codebook 오염 방지
- ③ DataGreenhouse 합성 증강: 희소 시나리오 합성, 불균형 클래스 보완
- ④ 도메인 특화 FM 학습: 정제·증강된 데이터로 IFM/금융 FM 학습 또는 파인튜닝
- ⑤ 예측/의사결정: 디지털 트윈 연동, 알파 생성, 예측 유지보수
이 파이프라인에서 ②와 ③을 책임지는 것이 페블러스의 역할이다. Kronos 사례는 이 두 단계가 전체 파이프라인의 성능을 결정하는 핵심임을 실증했다. Physical AI 플랫폼 관점에서, 센서 → 디지털 트윈 → 예측 의사결정의 연결고리에서 "예측" 단계의 엔진이 도메인 특화 FM이라면, 그 엔진의 연료(학습 데이터) 품질 관리가 Physical AI 플랫폼의 필수 레이어가 된다.
경쟁 지형과 전망 — TSFM 생태계의 분화
2024~2025년 TSFM 생태계는 빠른 분화를 겪고 있다. 한편에서는 구글(TimesFM), 아마존(Chronos), 세일즈포스(Moirai) 같은 대형 기업들이 범용 TSFM을 경쟁적으로 고도화하고 있다. 다른 한편에서는 Kronos, FinCast 같은 도메인 특화 모델들이 범용 모델을 뛰어넘는 성능을 특정 영역에서 실증하며 새로운 전선을 열고 있다.
5.1 범용 vs 도메인 특화 TSFM 지형도
주요 TSFM의 현황을 비교하면 다음과 같다.
| 모델 | 개발사 | 유형 | 규모 | 특징 |
|---|---|---|---|---|
| TimesFM 2.5 | Google Research | 범용 | 200M | GIFT-Eval #1, 16K 컨텍스트 |
| Chronos-2 | Amazon | 범용 | 120M | HF 6억+ 다운로드 |
| Moirai 2.0 | Salesforce | 범용 | 11.4M | 30x 작고 2x 빠름 |
| Kronos | Tsinghua / NeoQuasar | 도메인 특화 (금융) | 4.1M~499.2M | RankIC +93%, GitHub 16.4K stars |
| FinCast | 학술 (CIKM 2025) | 도메인 특화 (금융) | 1B | MoE, MSE -20%/MAE -10% vs TimesFM |
GitHub stars 비교는 TSFM 생태계의 세력 분포를 잘 보여준다. 2026년 4월 기준으로 Kronos(16.4K)는 TimesFM(~15.6K)을 소폭 상회하며, Chronos(~4.8K)와 Moirai(~1.5K)를 크게 앞선다. 도메인 특화 모델이 개발자 커뮤니티에서 얼마나 강한 관심을 받고 있는지 보여주는 지표다. 단, Kronos Large(499.2M)를 공개하지 않고 기관 라이선싱 방식으로 유지하는 전략은 오픈소스 생태계의 한계와 상업화 간의 긴장을 반영한다.
5.2 오픈소스 생태계와 기업 채택 경로
Kronos의 MIT 라이선스는 파인튜닝과 상업 배포를 무제한 허용한다. PoC 진입 장벽이 사실상 제로에 가깝다는 의미다. Microsoft Qlib과의 공식 통합은 중국 A주 백테스트 파이프라인을 즉시 활용할 수 있게 하며, BTC/USDT 실시간 예측 데모(GitHub Pages)는 Kronos의 실용성을 직접 확인할 수 있는 채널이다.
기업 채택 패턴은 점진적이다. 오픈소스 Mini/Small로 PoC → 도메인 데이터로 Base 파인튜닝 → 생산 환경에서 Base 또는 Large(기관 라이선싱)로 배포하는 단계적 경로가 자연스럽다. 데이터 사이언티스트 71%가 파운데이션 모델 기반 예측을 채택 중이라는 설문 데이터(2025)는 이 채택 경로가 이미 실행되고 있음을 시사한다.
5.3 2026~2028 전망 — 도메인 전이의 순서
학술 서베이(arXiv:2504.04011, "Foundation Models for Time Series: A Survey")는 도메인 특화 TSFM의 전개 순서를 다음과 같이 예측한다. 금융이 가장 먼저(데이터 가용성과 성과 측정의 명확성 때문), 그 다음이 헬스케어(EMR·바이탈 시계열의 대규모화), 그 다음이 제조·에너지 순서다.
한국 시장에서의 시사점은 구체적이다. 금융 측면에서는 2026년 1월 AI 기본법 시행 이후 금융 AI 가이드라인이 확정되면서 KRX AI 스타트업 인수, NH투자증권 AI 리서치 속도 40~50% 향상 같은 사례가 가속화될 전망이다. 한국 금융 AI 시장은 2025년 $3.166B에서 2030년 $5.667B으로 CAGR 12.35%의 성장이 예상된다. 제조 측면에서는 스마트팩토리 → AI 팩토리 전환에 수반되는 예측 유지보수 시장이 한국 AI 기반 제조 솔루션의 CAGR 16.6%(2025~2030) 성장의 핵심 동력이 될 것이다.
시사점 요약: 범용 TSFM 시대가 끝나는 것이 아니라, 범용과 도메인 특화가 공존하는 시대가 시작된다. 범용 모델은 새 도메인의 초기 탐색과 적은 데이터로 빠른 PoC에, 도메인 특화 모델은 성능이 결정적인 생산 환경에 사용될 것이다. 이 분화 과정에서 도메인 특화 모델의 구축과 유지를 위한 데이터 인프라의 중요성은 기하급수적으로 증가한다.
참고문헌
- • Shi et al. (2025). "Kronos: A Foundation Model for Time Series in Financial Domain." arXiv:2508.02739. AAAI 2026.
- • (2025). "Re(Visiting) Time Series Foundation Models in Finance." arXiv:2511.18578.
- • Das et al. (2024). "TimesFM 2.5." Google Research. GIFT-Eval.
- • Ansari et al. (2024). "Chronos: Learning the Language of Time Series." Amazon Science. arXiv:2403.07815.
- • (2025). "Moirai 2.0: Advancing Foundation Models for Time Series Forecasting." arXiv:2511.11698.
- • (2025). "FinCast: A Foundation Model for Financial Forecasting." arXiv:2508.19609. CIKM 2025.
- • (2025). "Foundation Models for Time Series: A Survey." arXiv:2504.04011.
- • (2024). "Representation Collapse in Vector Quantization." arXiv:2411.16550.
- • AIMA (2025). "AI and Data Science in Alternative Investments Survey." AUM $788B, N=150.
- • Gartner (2025.02.26). "Gartner Predicts Through 2026, 60% of AI Projects Will Be Abandoned."
- • Kronos GitHub: https://github.com/shiyu-coder/Kronos (16.4K stars, MIT License)
- • HuggingFace NeoQuasar: https://huggingface.co/NeoQuasar/Kronos-base
Kronos가 증명한 것은 금융 AI의 성과 이상이다. "도메인의 언어를 이산 토큰으로 배울 수 있다면, 그 도메인의 예측 문제는 언어 모델의 방식으로 풀 수 있다"는 원리가 금융을 넘어 제조, 헬스케어, 에너지로 확장될 준비를 마쳤다. 그 확장의 속도는 아키텍처 혁신보다 데이터 인프라의 성숙도에 달려 있다. AI-Ready Data가 준비된 도메인이 다음 Kronos를 만들어낼 것이다.
이 보고서가 도메인 특화 파운데이션 모델을 검토하고 있는 금융·제조·산업 분야의 데이터 사이언티스트와 ML 엔지니어들에게 실질적인 판단 근거가 되기를 바란다. DataClinic이나 DataGreenhouse를 통한 데이터 레디니스 준비에 대한 질문은 언제든 페블러스 팀에 문의해주시기 바란다.
페블러스 Research Team
2026년 4월 13일