12종 드론을 구별하는 AI — PBLS_Drone_classification DataClinic 진단기

Executive Summary

이 글은 DataClinic 리포트 #227의 분석 결과를 바탕으로 작성되었습니다. PBLS_Drone_classification은 페블러스(Pebblous)가 자체 제작한 드론 합성 이미지 데이터셋으로, 앞서 진단된 PBLS_Drone(#226)과 동일한 원본 데이터에 12종 드론 기종 분류 레이블을 붙인 버전입니다. 총 28,800장, 클래스당 정확히 2,399장의 완벽한 균형 구조이지만, DataClinic 종합 점수는 76점(보통)으로 #226(82점)보다 낮습니다. 클래스 균형은 완벽한데 왜 점수가 내려갔을까 — 이것이 이 진단의 핵심 질문입니다.

76

DataClinic 종합 점수

12

드론 기종 클래스

28,800

총 이미지 수

2,399

클래스당 이미지 (완벽 균형)

#226 vs #227 — 같은 데이터, 다른 진단

82점

#226 PBLS_Drone

단일 클래스 "drone" · 28,801장

DataBulkup 권장

76점

#227 PBLS_Drone_classification

12 클래스 DR01~DR12 · 28,800장

DataDiet 권장

클래스 레이블 추가 → 도메인 특화 53차원 렌즈 적용 → 다중 클러스터 구조 지속 → 점수 하락

DataClinic 등급 요약

L1 무결성좋음

L1 결측값좋음

L1 클래스균형좋음

L1 통계좋음

L2 DataLens특이사항 없음

L2 기하좋음

L2 분포나쁨

L3 DataLens특이사항 없음

L3 기하보통

L3 분포나쁨

탐지 vs 분류 — 무엇이 다른가

드론 AI에는 두 가지 근본적으로 다른 문제가 있습니다.

🔍

탐지 (Detection)

"저것이 드론인가?" — 이진 판별

PBLS_Drone(#226)이 이 목적에 설계됨. 단일 클래스, 다양한 드론 형태를 하나로 묶어 "드론의 본질"을 학습.

🎯

분류 (Classification)

"저것은 어떤 드론인가?" — 기종 판별

PBLS_Drone_classification(#227)의 목적. 12종 DR01~DR12를 구별 → Counter-UAS 위협 레벨 평가에 직결.

군사 작전에서 드론 분류는 단순한 기술적 과제가 아닙니다. 소형 정찰 드론(DR01)과 자폭형 로이터링 탄약(DR05·DR09)은 위협 레벨이 전혀 다릅니다. AI가 기종을 정확히 분류해야 적절한 대응 — 재밍, 레이저 요격, 물리적 방어 — 을 즉각 결정할 수 있습니다.

데이터 요구사항의 차이: 탐지 모델은 "드론이냐 아니냐"를 구분하면 되므로 단일 클래스 데이터로 충분합니다. 분류 모델은 클래스 간 특징 차이를 학습해야 하므로 클래스 내 다양성과 클래스 간 변별력 모두가 중요합니다. 이것이 동일한 이미지 집합이 탐지용으로는 82점, 분류용으로는 76점을 받은 핵심 이유입니다.

데이터셋 소개 — PBLS_Drone_classification

PBLS_Drone_classification은 페블러스(Pebblous)가 자체 제작한 드론 합성 이미지 분류 데이터셋입니다. 동일한 CG 렌더링 파이프라인으로 생성된 28,800장의 Full HD(1920×1080) RGB 이미지에 12종 드론 기종 레이블을 체계적으로 부여했습니다.

PBLS_Drone_classification 데이터셋 대표 이미지 콜라주

PBLS_Drone_classification — 12종 드론 합성 이미지 콜라주 (DataClinic L1)

파일명 구조 — 클래스와 프레임의 설계

DR05_1247.png

DR01 ~ DR12

드론 기종 클래스
12종의 서로 다른 드론

0001 ~ 2399

비행 시퀀스 프레임 번호
각도·거리·배경 변화 순서

12종 × 2,399프레임 = 28,788장 (진단 사용). 각 드론이 시뮬레이션 비행 경로를 따라 다양한 각도·배경에서 연속 캡처됩니다.

📊 데이터셋 사양

🖼️ 28,800장 (진단 사용: 28,788장)
📦 52GB (52,644MB)
📐 1920×1080px — Full HD
🎨 RGB 채널 — 전체 일관
🏷️ 12개 클래스 — DR01~DR12
⚖️ 완벽 균형 — 클래스당 2,399장, σ=0

🎯 활용 목적

🛡️ 드론 기종 분류 AI 모델 훈련
🎯 위협 레벨 판별 시스템 개발
🔬 세밀 클래스 구분 벤치마크
🌐 Counter-UAS 의사결정 AI
📡 멀티센서 융합 분류 연구

⚠️ 상업적 이용 불가

국방 특화 목적으로 개발된 데이터셋입니다. 연구·교육·국방 AI 개발 등 비영리 목적으로만 사용 가능합니다.

12종 드론 클래스 갤러리

DR01부터 DR12까지, 각 클래스는 서로 다른 형태·크기·용도의 드론을 대표합니다. 정찰형 멀티로터부터 자폭형 로이터링 탄약, 고정익 무인기까지 — 현대 전장의 드론 위협 스펙트럼을 망라합니다.

각 카드는 두 장으로 구성됩니다 — 전형 전형적인 프레임(고밀도) · 특이 가장 이질적인 프레임(저밀도)

전형

특이

DR01

소형 정찰 멀티로터

전형

특이

DR02

중형 감시 드론

전형

특이

DR03

쿼드콥터형

전형

특이

DR04

헥사콥터형

전형

특이

DR05

전술 공격형

전형

특이

DR06

고정익 UAV

전형

특이

DR07

혼합형 VTOL

전형

특이

DR08

대형 멀티로터

전형

특이

DR09

로이터링 탄약

전형

특이

DR10

군집형 소형

전형

특이

DR11

장거리 정찰기

전형

특이

DR12

중형 공격 UCAV

완벽한 균형의 의도적 설계: 12종 각각 정확히 2,399장. 표준편차 σ=0. 이는 우연이 아닌 합성데이터 생성 파이프라인의 정밀한 제어 결과입니다. 실사 촬영에서는 불가능한 이 완벽한 균형이 합성데이터의 핵심 강점입니다.

Level 1 — 기본 품질: 모든 항목 '좋음'

Level 1은 이미지의 기본적인 정합성·결측값·클래스 균형·통계를 점검합니다. PBLS_Drone_classification은 4개 항목 모두 좋음을 기록했습니다.

✅ 이미지 정합성

모든 이미지 1920×1080px 고정. 최솟값=최댓값으로 사이즈 편차 0. RGB 채널 100% 일관. 전처리 없이 즉시 학습 가능한 상태.

✅ 클래스 균형

12 클래스 × 2,399장. 표준편차 σ = 0.0. 클래스 불균형으로 인한 모델 편향 없음. 어떤 클래스도 과대/과소 표현 없음.

L1 요약 — 합성데이터의 완벽한 제어

실제 드론 영상을 수집해 분류 데이터셋을 만든다면 클래스 균형을 맞추는 것 자체가 극도로 어렵습니다. 특정 기종은 촬영 기회가 드물고, 특정 환경·각도는 데이터가 편중됩니다. PBLS_Drone_classification은 CG 생성 파이프라인을 통해 이 문제를 원천적으로 해결했습니다 — 12종 드론을 각각 정확히 2,399번 렌더링하면 됩니다.

클래스 평균 이미지 — 배경이 반복됨을 눈으로 확인

평균 이미지(Mean Image)는 해당 클래스의 모든 이미지를 픽셀 단위로 평균낸 결과입니다. 배경이 자주 반복될수록 배경은 선명하게, 드론은 흐릿하게 나타납니다. 오른쪽은 같은 클래스에서 가장 전형적인(고밀도) 실제 이미지입니다.

DR01 — 평균(좌) · 대표(우)

DR02 — 평균(좌) · 대표(우)

DR03 — 평균(좌) · 대표(우)

DR04 — 평균(좌) · 대표(우)

DR05 — 평균(좌) · 고밀도 대표(우)

DR06 — 평균(좌) · 대표(우)

▲ DR01~DR06 클래스별 평균 이미지(DataClinic L1) & 고밀도 대표 샘플. 평균 이미지에서 배경이 선명하게 남을수록 같은 배경의 반복이 많다는 신호입니다.

Level 2 — DataLens 분석: 환경은 나뉘지만 분포는 파편화

Level 2는 Wolfram ImageIdentify Net V2 (1280차원) 신경망을 렌즈로 사용해 데이터의 잠재 공간 구조를 분석합니다. 이 렌즈는 드론에 특화되지 않은 범용 렌즈로, 이미지의 전반적인 시각적 특성을 포착합니다.

PBLS_Drone_classification Level 2 PCA 분포 — 전체 데이터 피처 공간

▲ L2 PCA 전체 분포 — 전체 데이터 피처 공간 분포 (좌상단 밀집, 우측 분산 / Wolfram 1280차원 렌즈)

3개 환경 클러스터

범용 렌즈로 보면 데이터는 드론 기종이 아닌 촬영 환경에 따라 그룹화됩니다.

1

도시 환경

고층 빌딩, 도심 배경. 가장 많은 이미지가 속하는 지배적 클러스터.

2

자연 환경

숲, 들판, 하늘 배경. 도시 배경과 시각적으로 뚜렷이 구분됨.

3

혼합 환경

해변, 교외 등 복합 배경. 두 클러스터의 중간 지점에 위치.

▲ L2 밀도 지형도 — 3개 환경 클러스터의 위치와 밀도

L2 분포: 나쁨 — 다봉형(Multimodal)의 의미

L2 분포 등급이 나쁨인 이유는 다봉형(Multimodal) 분포 때문입니다. 데이터가 하나의 연속적인 분포를 이루지 않고 여러 클러스터로 분리되어 있습니다. 환경 클러스터 3개가 서로 단절되어 있는 것이 원인 — 이는 데이터가 파편화(fragmented)되어 있음을 의미합니다. 모델이 환경 변화에 강건하게 일반화하려면 클러스터 간 전환 영역(in-between data)이 필요합니다.

Level 3 — 특화 렌즈로 봐도: 분열은 해소되지 않았다

Level 3는 53차원으로 최적화된 도메인 특화 렌즈를 사용합니다. 3백만 장 학습 기반 Wolfram 모델에서 드론 분류 과제의 클래스 구별력을 유지하는 차원만 선별한 렌즈로, 범용 렌즈(L2)보다 드론에 특화된 시각으로 데이터를 바라봅니다.

PBLS_Drone_classification Level 3 PCA 분포 — 드론 특화 53차원 렌즈

▲ L3 PCA 전체 분포 — 53차원 드론 특화 렌즈. 점군이 넓게 분산되고 밀도가 불균일한 구조.

⚠️ 3클러스터 구조 지속 — 특화 렌즈도 분열을 해소하지 못했다

1280차원 범용 렌즈(L2)에서 3개 클러스터로 분리됐던 이 데이터셋은, 53차원 드론 특화 렌즈(L3)로 바라봐도 여전히 3개의 분리된 클러스터를 유지합니다. 아래 밀도 등고선이 이를 명확하게 보여줍니다:

• 주클러스터 (좌중앙, 압도적): 가장 크고 밀도가 높은 지배적 그룹 — 데이터 대부분이 여기 집중
• 부클러스터 (우상단): 중간 크기, 주클러스터와 공간적으로 단절
• 소형 클러스터 (우하단): 소규모, 낮은 밀도의 소수 그룹

L2의 분열이 "범용 렌즈가 배경·환경 차이를 포착한 결과"라면, 특화 렌즈에서는 해소될 수 있습니다. 그러나 드론 분류 관련 특징에서 보더라도 분열이 지속된다는 것은 — 데이터 내에 드론 관련 시각 특징 자체에서 이질적인 하위 그룹이 존재함을 시사합니다. 이것이 L3 "분포 나쁨" 판정의 실체입니다.

▲ L3 밀도 등고선 — 좌중앙 주클러스터(짙은 적색, 압도적 크기) + 우상단·우하단 부클러스터 2개. 세 클러스터가 등고선으로 명확히 분리된다.

PBLS_Drone_classification Level 3 밀도 지형도

▲ L3 밀도 지형도 — 우측에 고밀도 집중 구간이 복수로 산재, 좌측은 저밀도 분산 영역. 전체적으로 비대칭 구조.

비디오 연속 프레임 문제: 각 드론의 2,399장 이미지는 비행 시뮬레이션의 연속 프레임에서 추출됩니다. 프레임 간격이 작으면 인접 프레임이 거의 동일합니다 — 드론이 조금 이동했을 뿐인 장면. 특화 렌즈는 이 중복 프레임들이 피처 공간에서 밀집 클러스터를 형성함을 포착합니다. 클래스 내 실질 다양성이 낮다는 진단의 실체가 바로 이것입니다.

밀도 히스토그램 — L2 vs L3 렌즈 비교

각 이미지의 밀도 값(얼마나 전형적인가) 분포를 히스토그램으로 시각화합니다. 중심이 높고 좁을수록 이미지들이 서로 유사(중복 많음), 넓게 퍼질수록 다양성이 높습니다. 인디고 영역은 이상치 구간, 틸 영역은 롱테일(비디오 중복) 구간입니다.

▲ L2 밀도 히스토그램 — 범용 1280차원 렌즈. 낮은 밀도 범위(0.1~0.7), 다봉형 구조 반영.

▲ L3 밀도 히스토그램 — 드론 특화 53차원 렌즈. 1.5~1.8 중심 종형 + 오른쪽 꼬리(2.5~4.0) — 고밀도 반복 프레임 반영.

두 렌즈가 포착하는 것의 차이

L2 (범용 1280차원)

밀도 범위 0.1~0.7로 좁고 낮은 분포. 환경·배경 차이를 반영해 이미지들이 여러 클러스터로 분산됨. 다봉형 구조의 원인이 "배경 변화"임을 시사.

L3 (드론 특화 53차원)

밀도 범위 0.7~4.0로 훨씬 넓고 높음. 1.5~1.8 중심 종형 + 오른쪽 꼬리(2.5↑). 드론 시각 특징 관점에서도 고밀도 반복 구간이 존재 — 중복 프레임의 구조적 문제를 날카롭게 포착.

클래스별 밀도 분포 — 어떤 드론이 가장 전형적인가

▲ L3 클래스별 밀도 박스 차트 — 오른쪽일수록 해당 클래스 이미지가 서로 유사(전형적). DR04·DR08이 압도적 고밀도, DR06·DR02가 최저.

밀도 순위가 말하는 것

DR04·DR08은 중앙값 밀도가 2.2·2.0으로 압도적으로 높습니다. 이 두 클래스 이미지들은 드론 특화 렌즈의 눈에도 서로 매우 유사하게 보입니다 — 중복 프레임이 특히 많다는 의미입니다. 반면 DR06·DR02는 중앙값 밀도 1.7 수준으로 가장 낮아, 클래스 내 시각적 다양성이 상대적으로 높습니다. 좋은 분류 데이터셋이라면 DR06·DR02 수준의 다양성이 전 클래스에 고르게 분포해야 합니다.

이상치 샘플 분석 — 전형과 특이

DataClinic은 밀도 기반 이상치 탐지로 데이터셋의 "가장 전형적인 이미지"(고밀도)와 "가장 특이한 이미지"(저밀도)를 찾아냅니다. 이 샘플들을 보면 데이터의 품질 문제가 직관적으로 이해됩니다.

🟢 고밀도 — 전형적(가장 반복되는) 샘플

데이터셋에서 가장 많이 등장하는 "평균적인" 이미지들. 이 이미지들과 유사한 샘플이 데이터에 가득 들어있습니다.

DR05 밀도 0.677

DR05 밀도 0.675

DR08 밀도 0.669

DR11 밀도 0.667

🔴 저밀도 — 특이(가장 드문) 샘플

데이터셋에서 가장 독특한 이미지들. 다른 이미지들과 시각적으로 많이 다른 케이스입니다.

DR02 밀도 0.103

DR02 밀도 0.106

DR12 밀도 0.109

DR06 밀도 0.111

고밀도 vs 저밀도 — 무엇을 말하는가

고밀도 샘플(DR05, DR08, DR11)이 전형적으로 반복되고 있다는 것은, 이 클래스들의 이미지가 서로 너무 유사하다는 의미입니다. 반면 저밀도 샘플(DR02, DR06, DR12)에서는 독특한 배경이나 각도가 관찰됩니다 — 이 이미지들이 실제로는 더 가치있는 다양성을 담고 있습니다. 좋은 분류 데이터셋이라면 저밀도 샘플처럼 다양한 이미지가 더 많아야 합니다.

76점의 역설 — 완벽한 균형이 왜 낮은 점수인가

L1 전 항목이 '좋음'이고 클래스 균형은 완벽합니다. 그런데 왜 76점(보통)일까요? 점수를 갉아먹는 요인은 L2와 L3의 분포 나쁨입니다.

✅

클래스 균형

σ=0, 완벽 균형
AI 편향 없음

❌

분포 다양성

다중 클러스터 지속 (L2·L3)
중복 프레임 다수

⚠️

실질 학습 가치

28,800장 중 중복 제거 시
실질 다양성은 훨씬 작음

"균형은 필요조건, 다양성은 충분조건"

클래스 균형이 잘 맞아도, 각 클래스 내 이미지들이 서로 너무 유사하면 모델은 제대로 학습하지 못합니다. DR05 클래스에 2,399장이 있어도, 그 중 2,000장이 거의 동일한 비행 시퀀스 프레임이라면 실질 학습 데이터는 400장 수준입니다. 같은 드론이 조금씩 이동한 장면을 2,000번 보여줘도 모델은 새로운 것을 배우지 못합니다.

분류 모델의 실제 위험

중복 프레임이 많은 데이터로 학습된 분류 모델은 데이터셋 내부 검증 성능은 높지만 실전 배치 성능은 낮은 overfitting 패턴을 보일 수 있습니다. Counter-UAS 시스템에서 이는 치명적입니다 — 훈련 때 보지 못한 각도나 조명의 DR05 드론을 다른 기종으로 오분류할 수 있습니다.

개선 제안 — Data Diet가 먼저

DataClinic은 PBLS_Drone_classification에 Data Diet(데이터 다이어트) 한 가지를 권장합니다. #226의 DataBulkup(보충)과 정반대 처방입니다 — 같은 데이터셋임에도 클래스 분류 관점에서는 줄여야 한다는 진단입니다.

🥗 Data Diet — 중복 프레임 제거

1

연속 프레임 샘플링

비행 시퀀스에서 N프레임 간격으로 샘플링. 예: 10프레임 간격이면 2,399장 → ~240장으로 압축하되 다양성은 유지.

2

임베딩 기반 중복 탐지

L3 특화 렌즈의 임베딩을 활용해 코사인 유사도 임계값 이상의 쌍을 제거. 정보 손실 없이 중복만 제거.

+

배경 다양화 보강 (후속)

Diet 후, 도시 편중 해소를 위해 야간·악천후·산악·해상 환경 이미지 추가 생성. L2 다봉형 분포 문제도 함께 해결.

⚖️ #226 DataBulkup vs #227 DataDiet

동일 원본, 반대 처방이 흥미롭습니다. 탐지 모델용(#226)으로는 더 많은 다양성이 필요(Bulkup). 분류 모델용(#227)으로는 중복 제거가 먼저(Diet). 데이터 품질 문제는 어떤 AI 과제를 위한 데이터냐에 따라 처방이 달라집니다.

📈 기대 효과

중복 제거 후 동일 클래스 내 다양성 증가 → L3 분포 개선 → 점수 상승 예상. 더 중요하게는, 학습 효율 향상(같은 성능을 더 적은 데이터로)과 실전 일반화 성능 개선이 기대됩니다.

결론

PBLS_Drone_classification은 합성데이터 생성 파이프라인의 강점을 잘 보여주는 데이터셋입니다. 12종 드론을 각각 정확히 2,399장씩 — 실사 촬영으로는 불가능한 완벽한 균형. 1920×1080 FHD, RGB 일관, 결측치 없음 — L1 모든 항목 좋음.

그러나 DataClinic의 L2·L3 렌즈는 그 뒤에 숨은 구조적 문제를 포착했습니다. 범용 렌즈(L2)에서도, 드론 특화 렌즈(L3)에서도, 데이터는 세 클러스터로 분열된 채 통합을 거부합니다. 클래스 내 다양성 부족과 비디오 연속 프레임의 반복 — 숫자는 많지만 정보는 빈약한 데이터의 역설입니다.

같은 데이터, 다른 렌즈, 다른 처방.
탐지(Detection)에는 DataBulkup, 분류(Classification)에는 DataDiet. 데이터 품질 진단의 가치는 "무엇을 위한 데이터인가"를 묻는 데서 시작합니다.

DataClinic 리포트 #227 전체 결과 보기 →