데이터클리닉 2.0 데모

데이터 진단 신청에서 평가 결과 확인까지

데모 영상 설명

이 데모 영상은 데이터클리닉 2.0의 전체 프로세스를 보여줍니다. 사용자가 데이터 품질 진단을 신청하고, AADS 에이전트가 데이터를 분석한 후, 최종 품질 평가 결과를 제공하는 전 과정을 확인할 수 있습니다.

AADS (Agentic AI Data Scientist)는 자율적으로 데이터를 분석하고 품질을 평가하는 AI 에이전트입니다. ISO/IEC 5259 국제 표준 기반의 데이터 품질 측정과 페블러스의 특허 기술인 데이터 이미징(Data Imaging) 기법을 결합하여, 데이터의 품질 문제를 시각적으로 진단하고 개선 방안을 제시합니다.

1단계 핵심 성과

데이터클리닉 2.0 에이전트 워크플로우 + AADS-KONI LLM

90.5점
ISO 5259 품질 지수
목표 88점 초과 달성
87.45%
업무 시간 단축
수작업 대비 효율화
1위
RAG 성능 (vs GPT-4)
SemanticSim 0.7476 달성

왜 AADS인가?

AI 개발의 80%를 차지하는 데이터 준비, 에이전트가 자율적으로 해결합니다

AI 개발 프로젝트의 성패가 고품질 데이터에 달려있음에도 불구하고, 실제 개발 과정의 약 80%는 데이터 수집, 정제, 가공 등 지난한 준비 작업에 소요됩니다. 이는 AI 도입의 가장 큰 장벽이자, 기업의 혁신 속도를 저해하는 막대한 비효율의 근원입니다.

AADS(Agentic AI Data Scientist)는 이 문제를 정면으로 해결합니다. AI 에이전트가 스스로 데이터 품질 문제를 진단하고, 해결책을 계획하며, 실행하고, 그 결과를 보고하는 완전한 자율 운영 체계를 지향합니다.

KISTI의 과학기술 특화 LLM 'KONI LLM'을 기반으로 데이터 품질 진단에 특화된 AADS-LLM을 공동 개발하여, 복잡한 데이터 문제에 대한 깊이 있는 이해와 추론 능력을 제공합니다.

국제 표준 기반 거버넌스

ISO/IEC 5259(데이터 품질 모델) 및 ISO/IEC 42001(AI 경영시스템) 기반 수행 및 기록

설계 기반 데이터 품질

Data Quality by Design - 저품질 데이터 생성 가능성을 사전에 차단하는 접근법

에이전트 워크플로우

진단 → 개선 → 규제 대응, 데이터 품질 관리 전 과정을 자율 수행

Diagnosis (진단)

ISO/IEC 5259 국제 표준 기반으로 데이터의 편향성, 다양성을 정밀 진단합니다.

Enhancement (개선)

데이터가 부족하면 채우고(Bulk-up), 중복되면 줄이는(Diet) 자율 순환 시스템.

Compliance (규제 대응)

EU AI Act, ISO 42001 등 복잡한 규제 리포트를 클릭 한 번으로 자동 생성합니다.

1차년도 정량 목표 달성

6대 핵심 지표 전 항목 달성, 데이터 품질 자동화의 실증

자율적 데이터 품질 개선

88점

ISO/IEC 5259 기반 품질 지수

에이전트 기반 기능 수행

100+ Task

성공률 95% 이상

투명한 수행 과정 보장

80%

ISO 42001 Annex A 로그 충족률

품질 관리 효율 향상

30%

기존 수작업 대비 시간 단축

고품질 학습 데이터 구축

11만 건

Q&A 데이터셋 (학습 10만 + 테스트 1만)

우수한 챗봇 성능

90%

ChatGPT-4o 대비 정확도

3개년 로드맵

MVP → 상용화 → 글로벌 플랫폼, 완전 자율 데이터 품질 시스템으로

1단계

기반 구축

핵심 기술 연동 및 시장성 검증

  • KISTI KONI LLM 기반 AADS-LLM v0.9 개발
  • 데이터 클리닉 v2.0 MVP 출시
  • 로봇 1곳, 제조 2곳 PoC 수행
2단계

기술 고도화

멀티모달 확장 및 상용화

  • 차트 이해 특화 VLM 개발
  • 데이터 클리닉 v3.0 상용 패키지
  • 5곳 이상 유료 상용 고객 확보
3단계

플랫폼 완성

완전 자율화 및 글로벌 사업화

  • 에이전트 오케스트레이션 시스템
  • AADS v1.0 플랫폼 정식 출시
  • AWS 마켓플레이스 등록, 해외 진출

1차년도 발표자료

2025년 12월 평가 발표 슬라이드 전문

1 / -

고객 가치

데이터 병목 해소, 규제 준수, AI 도입 리스크 제거

개발자 속도 해방

AI 개발 파이프라인의 80%를 차지하는 데이터 병목을 제거하여, 핵심 인재가 가치 창출에 집중하도록 지원

데이터 신뢰성 극대화

ISO 국제 표준 준수 자동화 품질 관리 및 리포팅으로 모든 데이터 처리 과정 추적 및 증명

자율적 문제 해결

AI 에이전트가 데이터 품질 문제를 스스로 진단하고 최적의 개선 시나리오 제시 (로봇 경로 데이터 누락, 부품 규격 단위 오기입 등)

AI 도입 리스크 제거

ISO 42001, EU AI Act 등 글로벌 규제를 위한 감사 가능 증적과 보고서를 원클릭으로 생성

핵심 기술

데이터클리닉, 페블로스코프, 합성 데이터 — 특허 기반 원천 기술

데이터 클리닉

AI 학습 데이터의 품질을 종합 진단하고, 데이터 다이어트(Diet)벌크업(Bulk-up)으로 자동 보정하는 핵심 엔진

페블로스코프

데이터의 임베딩 구조를 시각적으로 해석하여 데이터셋의 내재적 특성과 잠재적 편향성을 직관적으로 파악하는 분석 도구

합성 데이터

희귀 데이터개인정보 민감 데이터를 보강하는 고품질 가상 데이터 생성 기술로 AI 모델의 강건성 강화

과제 정보

사업명

글로벌 빅테크 육성사업

지원기관

과학기술정보통신부

주관기관

(주)페블러스

공동연구기관

한국과학기술정보연구원(KISTI)