데이터클리닉 2.0 데모
데이터 진단 신청에서 평가 결과 확인까지
데모 영상 설명
이 데모 영상은 데이터클리닉 2.0의 전체 프로세스를 보여줍니다. 사용자가 데이터 품질 진단을 신청하고, AADS 에이전트가 데이터를 분석한 후, 최종 품질 평가 결과를 제공하는 전 과정을 확인할 수 있습니다.
AADS (Agentic AI Data Scientist)는 자율적으로 데이터를 분석하고 품질을 평가하는 AI 에이전트입니다. ISO/IEC 5259 국제 표준 기반의 데이터 품질 측정과 페블러스의 특허 기술인 데이터 이미징(Data Imaging) 기법을 결합하여, 데이터의 품질 문제를 시각적으로 진단하고 개선 방안을 제시합니다.
1단계 핵심 성과
데이터클리닉 2.0 에이전트 워크플로우 + AADS-KONI LLM
왜 AADS인가?
AI 개발의 80%를 차지하는 데이터 준비, 에이전트가 자율적으로 해결합니다
AI 개발 프로젝트의 성패가 고품질 데이터에 달려있음에도 불구하고, 실제 개발 과정의 약 80%는 데이터 수집, 정제, 가공 등 지난한 준비 작업에 소요됩니다. 이는 AI 도입의 가장 큰 장벽이자, 기업의 혁신 속도를 저해하는 막대한 비효율의 근원입니다.
AADS(Agentic AI Data Scientist)는 이 문제를 정면으로 해결합니다. AI 에이전트가 스스로 데이터 품질 문제를 진단하고, 해결책을 계획하며, 실행하고, 그 결과를 보고하는 완전한 자율 운영 체계를 지향합니다.
KISTI의 과학기술 특화 LLM 'KONI LLM'을 기반으로 데이터 품질 진단에 특화된 AADS-LLM을 공동 개발하여, 복잡한 데이터 문제에 대한 깊이 있는 이해와 추론 능력을 제공합니다.
국제 표준 기반 거버넌스
ISO/IEC 5259(데이터 품질 모델) 및 ISO/IEC 42001(AI 경영시스템) 기반 수행 및 기록
설계 기반 데이터 품질
Data Quality by Design - 저품질 데이터 생성 가능성을 사전에 차단하는 접근법
에이전트 워크플로우
진단 → 개선 → 규제 대응, 데이터 품질 관리 전 과정을 자율 수행
Diagnosis (진단)
ISO/IEC 5259 국제 표준 기반으로 데이터의 편향성, 다양성을 정밀 진단합니다.
Enhancement (개선)
데이터가 부족하면 채우고(Bulk-up), 중복되면 줄이는(Diet) 자율 순환 시스템.
Compliance (규제 대응)
EU AI Act, ISO 42001 등 복잡한 규제 리포트를 클릭 한 번으로 자동 생성합니다.
1차년도 정량 목표 달성
6대 핵심 지표 전 항목 달성, 데이터 품질 자동화의 실증
자율적 데이터 품질 개선
88점
ISO/IEC 5259 기반 품질 지수
에이전트 기반 기능 수행
100+ Task
성공률 95% 이상
투명한 수행 과정 보장
80%
ISO 42001 Annex A 로그 충족률
품질 관리 효율 향상
30%
기존 수작업 대비 시간 단축
고품질 학습 데이터 구축
11만 건
Q&A 데이터셋 (학습 10만 + 테스트 1만)
우수한 챗봇 성능
90%
ChatGPT-4o 대비 정확도
3개년 로드맵
MVP → 상용화 → 글로벌 플랫폼, 완전 자율 데이터 품질 시스템으로
기반 구축
핵심 기술 연동 및 시장성 검증
- • KISTI KONI LLM 기반 AADS-LLM v0.9 개발
- • 데이터 클리닉 v2.0 MVP 출시
- • 로봇 1곳, 제조 2곳 PoC 수행
기술 고도화
멀티모달 확장 및 상용화
- • 차트 이해 특화 VLM 개발
- • 데이터 클리닉 v3.0 상용 패키지
- • 5곳 이상 유료 상용 고객 확보
플랫폼 완성
완전 자율화 및 글로벌 사업화
- • 에이전트 오케스트레이션 시스템
- • AADS v1.0 플랫폼 정식 출시
- • AWS 마켓플레이스 등록, 해외 진출
AADS 상세 개요
기술 개발 성과와 사업화 전략을 한눈에
1차년도 발표자료
2025년 12월 평가 발표 슬라이드 전문
고객 가치
데이터 병목 해소, 규제 준수, AI 도입 리스크 제거
개발자 속도 해방
AI 개발 파이프라인의 80%를 차지하는 데이터 병목을 제거하여, 핵심 인재가 가치 창출에 집중하도록 지원
데이터 신뢰성 극대화
ISO 국제 표준 준수 자동화 품질 관리 및 리포팅으로 모든 데이터 처리 과정 추적 및 증명
자율적 문제 해결
AI 에이전트가 데이터 품질 문제를 스스로 진단하고 최적의 개선 시나리오 제시 (로봇 경로 데이터 누락, 부품 규격 단위 오기입 등)
AI 도입 리스크 제거
ISO 42001, EU AI Act 등 글로벌 규제를 위한 감사 가능 증적과 보고서를 원클릭으로 생성
핵심 기술
데이터클리닉, 페블로스코프, 합성 데이터 — 특허 기반 원천 기술
데이터 클리닉
AI 학습 데이터의 품질을 종합 진단하고, 데이터 다이어트(Diet)와 벌크업(Bulk-up)으로 자동 보정하는 핵심 엔진
페블로스코프
데이터의 임베딩 구조를 시각적으로 해석하여 데이터셋의 내재적 특성과 잠재적 편향성을 직관적으로 파악하는 분석 도구
합성 데이터
희귀 데이터나 개인정보 민감 데이터를 보강하는 고품질 가상 데이터 생성 기술로 AI 모델의 강건성 강화
과제 정보
사업명
글로벌 빅테크 육성사업
지원기관
과학기술정보통신부
주관기관
(주)페블러스
공동연구기관
한국과학기술정보연구원(KISTI)