Executive Summary
2026년 유타밸리대학교 연구진이 미국 대표 표본 632명에게 가상의 주민투표 의제를 놓고 찬반 영상을 보여 줬습니다. 절반은 실제 인물이 출연한 진짜 영상을, 절반은 똑같은 메시지를 담은 딥페이크를 봤습니다. 투표 의향이 바뀐 정도에는 통계적으로 의미 있는 차이가 없었습니다. 딥페이크는 진짜 영상만큼 사람들의 마음을 움직였고, 신뢰도 점수는 오히려 같거나 더 높았습니다. 이 글은 그 결과에서 출발합니다.
방어선을 맡아 온 것은 딥페이크 탐지 기술입니다. 그런데 광고 문구의 90~99% 정확도는 실험실 밖에서 50~65%로 주저앉습니다. 탐지 모델은 자신이 학습한 생성 방식만 잘 잡아내고, 새 생성 모델이 나올 때마다 다시 학습하기 전까지 뒤처지기 때문입니다. 탐지는 본질적으로 사후 추격이라, 만드는 쪽이 늘 앞섭니다.
그래서 질문을 바꿔야 합니다. "이 영상이 가짜인가"를 끝없이 쫓는 대신, "이 영상이 어디서 왔는가"를 증명하는 쪽으로 신뢰의 기준을 옮기는 것입니다. 딥페이크의 실제 영향력도, 탐지의 구조적 열세도, 출처증명(provenance)의 가능성과 그 한가운데 뚫린 구멍도 모두 수치로 확인됩니다. 그리고 그 끝에서, 콘텐츠의 진본성 문제는 결국 데이터 진본성 문제와 같은 자리에서 만납니다.
주요 수치
출처: 유타밸리대학교(KSL) 632명 실험, Scam.ai·SecurityWeek 탐지 벤치마크, iProov 2025, AIIP Protection
네 개의 숫자가 이 글의 뼈대를 한눈에 보여 줍니다. 딥페이크가 진짜만큼 효과적이라는 실험 결과, 탐지가 실전에서 무너지는 폭, 사람의 눈이 얼마나 무력한지, 그리고 출처증명이라는 대안에도 큰 구멍이 하나 있다는 사실입니다.
차이 없음
진짜 vs 딥페이크 여론 영향
632명 통제 실험에서 의견 변화에 통계적 유의차가 없었고 신뢰도는 동등하거나 우위
90% → 50%대
탐지 정확도 붕괴
광고된 90~99%가 학습하지 않은 생성 방식 앞에서 50~65%로 하락
0.1%
진짜·가짜 완벽 식별한 사람
iProov 2025: 참가자의 0.1%만 모두 맞혔고 고품질 영상 정답률은 24.5%
사실상 100%
SNS가 지우는 출처 정보
주요 플랫폼 업로드·스크린샷 한 번이면 출처증명 메타데이터가 소멸
딥페이크가 진짜 영상만큼 표를 움직였다
딥페이크를 둘러싼 오랜 직관은 "정교한 가짜일수록 위험하다"였습니다. 유타밸리대학교 게리 R. 허버트 공공정책연구소의 2026년 실험은 그 직관을 비껴갑니다. 연구진은 미국 인구를 대표하는 632명을 모아, 가상의 주민투표 의제에 찬성하거나 반대하는 영상을 보여 줬습니다. 한 집단은 사람이 실제로 말하는 진짜 영상을, 다른 집단은 같은 주장을 그대로 옮긴 합성 영상을 시청했습니다. 시청 전후로 투표 의향이 얼마나 달라졌는지를 측정한 결과, 두 집단 사이에 통계적으로 의미 있는 차이가 나타나지 않았습니다.
더 눈여겨볼 대목은 신뢰도입니다. 참가자들은 딥페이크 영상에 진짜 영상과 같거나 오히려 더 높은 신뢰 점수를 매겼습니다. 합성 영상이라고 해서 더 의심받지 않았다는 뜻입니다. 연구진은 개인이 더 똑똑하게 가려내라는 권고만으로는 부족하며, 대응을 개인 책임에서 정책과 제도의 차원으로 끌어올려야 한다고 결론지었습니다.
여기에 결이 다른 연구를 나란히 두면 그림이 또렷해집니다. 2024년 워싱턴대학교 세인트루이스의 연구는, 전문적으로 제작돼 특정 정치인을 비방하려는 딥페이크조차 다른 형태의 가짜뉴스보다 특별히 더 기만적이거나 감정적으로 더 조작적이지는 않다고 봤습니다. 언뜻 앞의 결과와 충돌하는 듯하지만, 두 연구는 같은 진실의 다른 면을 비춥니다. 딥페이크의 위협은 "특별히 더 위험하다"에 있지 않습니다. "진짜만큼 효과적이다"에 있습니다.
핵심은 정교함이 아니라 구분 불가능성입니다. 가짜가 진짜와 분간되지 않는 순간, 가짜뉴스는 새로운 임계점을 넘습니다. 더는 "조작된 티가 나는 영상을 조심하라"는 조언이 통하지 않는다는 뜻입니다. 위협은 기술의 화려함이 아니라, 진짜와 가짜의 경계가 사라졌다는 사실 그 자체에서 옵니다.
이 변화는 추상적 우려에 머물지 않습니다. 2023년 슬로바키아 총선에서는 야당 지도자가 부정선거와 맥주값 인상을 모의하는 듯한 합성 음성이 투표 직전 퍼졌습니다. 하필 언론의 반박이 법으로 제한되는 선거 침묵 기간 직전이라, 해명할 시간조차 막혔습니다. 2024년 미국 뉴햄프셔 예비선거에서는 조 바이든의 목소리를 복제한 로보콜이 유권자에게 투표 불참을 권했습니다. 같은 해 젤렌스키 대통령 부인이 명품차를 샀다는 허위 영상은 24시간 만에 약 1,800만 회 재생됐습니다. 진짜와 구분되지 않는 영상은 이미 현실의 표심과 여론을 건드리고 있습니다.
탐지는 구조적으로 한 발 늦는다
그렇다면 가짜를 잡아내는 탐지 기술에 기대면 되지 않을까요. 문제는 탐지가 광고만큼 작동하지 않는다는 데 있습니다. 상용 딥페이크 탐지기는 흔히 90~99%의 정확도를 내세웁니다. 그러나 이 수치는 자신이 학습한 데이터와 비슷한 환경에서 나온 성적입니다. 학습하지 않은 생성 방식이나 실제 인터넷에 떠도는 콘텐츠를 만나면, 정확도는 50~65%로 주저앉습니다. 동전 던지기보다 약간 나은 수준입니다.
이유는 탐지 모델의 작동 원리에 있습니다. 탐지기는 특정 생성 방식이 남기는 통계적 흔적을 학습합니다. 그래서 학습한 방식은 잘 잡지만, 처음 보는 방식 앞에서는 무력합니다. 새로운 이미지·영상 생성 모델이 출시될 때마다, 기존 탐지기는 다시 학습되기 전까지 그 출력물을 제대로 가려내지 못합니다. 실제로 2024년 실세계 딥페이크 벤치마크가 공개되자 기존 탐지 모델의 성능은 45~50% 떨어졌습니다. 탐지는 새 위협이 등장한 뒤에야 따라잡는 사후 추격이고, 만드는 쪽은 언제나 한발 앞서 출발합니다.
2.1사람의 눈은 더 못 미덥다
"그래도 사람이 보면 이상한 걸 느끼지 않을까"라는 기대도 데이터 앞에서는 흔들립니다. iProov가 2025년에 진행한 연구에서, 진짜와 가짜를 모두 정확히 가려낸 참가자는 전체의 0.1%에 불과했습니다. 고품질 딥페이크 영상을 맞힌 비율은 24.5%로, 무작위 추측보다 약간 나은 정도였습니다. 응답자의 70%는 복제된 목소리를 진짜와 구별할 자신이 없다고 답했습니다. 사람의 직관은 신뢰할 만한 방어선이 되지 못합니다.
2.2격차가 아니라 게임의 구조
규모를 보면 추격전의 형세가 더 분명해집니다. 딥페이크 영상은 2019년 약 1만 4천 개로 추산됐는데, 2025년에는 800만 개에 이른다는 집계가 나왔습니다. 6년 사이 수백 배입니다. 음성 쪽에서도 합성 음성 사용이 가파르게 늘고 있습니다. 만드는 쪽은 갈수록 싸고 빠르게 늘어나는데, 잡는 쪽은 매번 새 사례를 학습한 뒤에야 대응할 수 있습니다.
공정하게 말하면 탐지 쪽도 손을 놓고 있지는 않습니다. 같은 실세계 벤치마크에서 시각·언어 모델을 다시 다듬은 연구는 정확도를 81%까지 끌어올려, 선도 상용 탐지기와 견줄 만한 수준에 닿았습니다. 탐지가 더 좋아질 여지는 분명히 있다는 뜻입니다. 다만 이런 향상은 이미 드러난 사례를 학습한 뒤에야 가능했고, 벤치마크 자체도 규모가 작다는 한계를 안고 있습니다. 탐지가 발전해도, 새 위협을 본 다음에야 따라잡는다는 순서까지 바뀌지는 않습니다.
그래서 탐지의 열세는 더 좋은 모델로 메울 일시적 격차가 아니라, 게임의 구조에서 비롯된 문제입니다. 생성은 자유롭게 앞서가고, 탐지는 학습한 분포에 갇혀 뒤를 따릅니다. 이 비대칭이 바뀌지 않는 한, 탐지에만 의존하는 전략은 이기기 어려운 싸움에 자원을 붓는 일입니다.
질문을 뒤집는다: 가짜 잡기에서 진짜 증명하기로
탐지가 구조적으로 지는 싸움이라면, 전선을 옮길 차례입니다. 탐지는 콘텐츠를 들여다보며 "이것이 가짜인가"를 판별합니다. 끝없이 새로워지는 가짜를 매번 쫓아야 하는 일입니다. 반대로 출처증명(provenance)은 "이 콘텐츠가 어디서, 누구에 의해, 어떻게 만들어졌는가"를 증명합니다. 가짜를 추격하는 대신, 진짜의 기준점을 세우는 방식입니다.
이 전환은 신뢰의 질문 자체를 바꿉니다. 지금까지는 "진짜처럼 보이는가"가 판단 기준이었습니다. 그런데 딥페이크가 진짜처럼 보이는 데 성공한 이상, 외형은 더 이상 단서가 되지 못합니다. 출처증명은 기준을 "어디서 만들어졌고 그 이력을 검증할 수 있는가"로 옮깁니다. 보이는 것이 아니라 따라갈 수 있는 출처가 신뢰의 근거가 되는 것입니다.
전략의 관점에서 보면, 이것은 방어선을 탐지 모델에서 출처 인프라로 재배치하는 결정입니다. 탐지에 들어갈 자원을, 콘텐츠가 생성되는 시점에 검증 가능한 이력을 새겨 두는 인프라로 옮기는 것입니다. 한쪽은 끝없는 추격이고, 다른 한쪽은 한 번 깔아 두면 누적되는 기준점입니다. 어느 쪽이 지속 가능한 투자인지는 분명해 보입니다.
진짜를 증명하는 기술: C2PA와 Content Credentials
출처증명은 이미 추상적 구상을 넘어 구체적 표준과 제품으로 굳어지고 있습니다. 그 중심에 C2PA(Coalition for Content Provenance and Authenticity)가 있습니다. 2021년 어도비, Arm, BBC, 인텔, 마이크로소프트, Truepic이 만든 이 연합은, 파일 안에 암호학적으로 서명된 이력 정보를 심는 방식을 정의했습니다. 이렇게 새겨진 이력을 Content Credentials라고 부릅니다. 언제 어떤 기기로 촬영됐고 어떤 도구로 편집됐는지가 변조하기 어려운 형태로 기록되며, 중앙 서버에 조회할 필요 없이 오프라인에서도 검증할 수 있습니다.
채택의 속도가 이 표준의 무게를 말해 줍니다. 어도비가 이끄는 콘텐츠 진본성 이니셔티브(CAI)의 회원은 6,000개 조직을 넘어섰고, 2024년에는 구글이 운영위에 합류했습니다. 2025년에는 클라우드플레어가 주요 CDN 가운데 처음으로 Content Credentials를 구현했는데, 이 회사가 웹 트래픽의 약 20%를 처리한다는 점에서 영향이 작지 않습니다. 유튜브는 카메라로 촬영된 영상에 라벨을 붙이기 시작했고, 오픈AI의 영상 생성 모델 Sora 2는 출력물에 C2PA 정보를 자동으로 삽입합니다.
하드웨어도 같은 방향으로 움직입니다. 라이카가 2023년 전용 보안 칩으로 사진에 서명하는 최초의 소비자 카메라를 내놓은 뒤, 소니, 삼성, 니콘이 잇따라 출처 서명 기능을 탑재했습니다. 접근법이 하나만 있는 것은 아닙니다. 구글의 SynthID와 메타의 Video Seal은 신호 자체에 보이지 않는 워터마크를 심는 방식이고, C2PA는 암호학적 메타데이터에 무게를 둡니다. 기술 전략은 다르지만 목표는 같습니다. 콘텐츠에 검증 가능한 출처를 부여하는 것입니다.
주목할 점은 표준과 하드웨어, 규제가 동시에 정렬되고 있다는 사실입니다. EU AI Act는 AI 생성 콘텐츠에 라벨을 요구하고, 미국에서는 NSA·CISA가 정부와 핵심 인프라의 미디어 파이프라인에 Content Credentials 도입을 권고했습니다. 표준이 깔리고, 기기가 서명하고, 규제가 등을 미는 흐름이 한자리에서 만나는 일은 드뭅니다. 출처증명의 인프라는 이미 설치되는 중입니다.
증명도 만능은 아니다
출처증명을 은탄환으로 소개하면 정직하지 못합니다. 가장 큰 약점은 메타데이터가 너무 쉽게 지워진다는 데 있습니다. 인스타그램, X, 링크드인, 틱톡, 페이스북 같은 플랫폼은 업로드된 파일을 다시 압축하고 포맷을 바꾸면서 C2PA 정보를 체계적으로 제거합니다. 2026년 현재 주요 SNS를 거치면 출처 메타데이터는 사실상 전부 사라집니다. 더 단순하게는, 화면을 한 번 캡처하는 것만으로 출처증명이 즉시 소멸합니다. 정작 콘텐츠가 가장 빠르게 퍼지는 경로에서 출처 정보가 가장 먼저 떨어져 나가는 셈입니다.
보이지 않는 워터마크라고 안전한 것은 아닙니다. 확산 모델을 이용한 공격은 워터마크를 무작위 노이즈로 흩뜨린 뒤 이미지를 복원하는 방식으로 표식을 지우려 합니다. 견고하게 설계된 워터마크에는 잘 통하지 않고 복원된 이미지가 원본과 달라지기는 하지만, 워터마크 탐지가 확률적이라 오탐과 미탐이 생기고 알고리즘이 역공학되면 위조 가능성도 열린다는 한계는 남습니다.
프라이버시 문제도 가볍지 않습니다. 출처 메타데이터에 창작자의 신원이 담기면, 본인이 원치 않는 신원 노출로 이어질 수 있습니다. 권위주의 국가의 언론인이나 내부고발자, 활동가, 가정폭력 피해자에게는 이 노출이 곧 위험입니다. 가명 인증서로 신원을 가리는 방안이 표준에 들어 있지만 실제 구현은 드뭅니다.
가장 자주 오해받는 지점은 출처증명의 성격 자체입니다. C2PA는 진짜 콘텐츠에 이력을 붙일 뿐, 가짜를 잡아내지 않습니다. 라벨이 없다고 해서 곧 딥페이크인 것도 아닙니다. 오래된 기기로 찍었거나 SNS를 거치며 메타데이터가 벗겨졌을 수도 있습니다. 다만 검증 가능한 출처가 없다는 사실은, 그 콘텐츠에 더 높은 회의를 적용할 근거가 됩니다.
그래서 출처증명은 탐지의 대체재가 아니라 보완재입니다. 고무결성이 필요한 파이프라인에는 메타데이터 기반의 출처 기록을, 메타데이터가 벗겨지는 상황에는 워터마크나 핑거프린팅 같은 내구성 신호를 함께 두는 하이브리드 방향으로 업계는 수렴하고 있습니다. 은탄환을 팔지 않는 정직함이, 오히려 이 기술의 신뢰를 떠받칩니다.
콘텐츠 진본성은 결국 데이터 진본성이다
한 걸음 물러서서 보면, 딥페이크 영상에 출처를 붙이는 일과 AI 학습 데이터에 출처를 붙이는 일은 같은 질문의 두 얼굴입니다. 영상이든 데이터든 묻는 것은 동일합니다. 이것은 어디서 왔고, 누가, 언제, 어떻게 바꿨는가. 그 이력을 검증 가능한 형태로 설명할 수 있는가. 콘텐츠의 진본성과 데이터의 진본성은 표현만 다를 뿐 같은 신뢰의 토대를 가리킵니다.
두 영역이 만나는 지점은 이미 표준 안에 들어와 있습니다. C2PA는 2024년 v2.1에서 AI 학습에 쓰인 데이터를 공개하는 항목을 더했습니다. 콘텐츠의 출처를 기록하는 표준이, 그 콘텐츠를 만든 모델이 어떤 데이터로 학습됐는지까지 담기 시작한 것입니다. 결국 "이 영상은 어디서 왔는가"라는 질문은 "이 모델은 어떤 데이터로 만들어졌는가"라는 질문과 한 줄기로 이어집니다.
AI를 학습시키고 운영하는 파이프라인에서, 어떤 데이터를 어디서 어떤 권리로 받아 어떻게 가공했는지를 추적 가능하게 남기는 일은 더 이상 선택이 아닙니다. 데이터의 품질을 따질 때 우리는 흔히 정확성과 완결성을 봅니다. 그러나 진본성, 즉 출처를 설명할 수 있는 능력은 그 못지않은 품질의 축입니다. 출처가 불분명한 데이터는 아무리 깨끗해 보여도 신뢰의 토대가 되지 못합니다.
페블러스가 데이터 진본성과 출처추적을 데이터 품질의 한 축으로 다루는 이유가 여기에 있습니다. 가짜를 사후에 잡아내는 일에 매달리기보다, 데이터와 콘텐츠가 생성되는 시점에 출처를 새겨 두는 쪽이 더 단단한 신뢰를 만듭니다. 딥페이크 시대가 던지는 교훈은 영상에만 머물지 않습니다. 진짜를 증명하는 능력을 처음부터 데이터에 내장해 둔 조직만이, 신뢰를 묻는 어떤 질문에도 같은 기록으로 답할 수 있습니다.
마무리: 탐지는 끝없는 추격이고, 증명은 한 번 세우면 누적되는 기준점입니다. 질문을 "어떻게 가짜를 잡을까"에서 "어떻게 진짜를 증명할까"로 뒤집는 순간, 콘텐츠의 신뢰 문제는 곧 데이터의 출처 문제와 같은 자리에서 만납니다. 다음 시대의 신뢰는, 진짜를 증명할 수 있는 능력 위에 세워질 것입니다.
참고문헌
학술 논문
- 1.Momeni, M. (2025). "Artificial Intelligence and Political Deepfakes: Shaping Citizen Perceptions Through Misinformation." Media and Communication. SAGE Journals. doi.org/10.1177/09732586241277335
- 2.Optica Publishing Group. (2025-02). "Generating and Detecting Deepfakes: A 21st-Century Arms Race." Optics and Photonics News. optica-opn.org
- 3.Anonymous authors. (2025). "Revisiting Simple Baselines for In-The-Wild Deepfake Detection." arXiv preprint. arxiv.org/abs/2509.04150
- 4.Anonymous authors. (2026). "Media Integrity and Authentication: Status, Directions, and Futures." arXiv preprint. arxiv.org/abs/2602.18681
보도 및 사례 연구
- 5.KSL.com / Gary R. Herbert Institute for Public Policy. (2026). "AI deepfake media can sway public opinion as effectively as real media, UVU study finds." ksl.com
- 6.Washington University in St. Louis Source. (2024-08). "Political deepfake videos no more deceptive than other fake news, research finds." source.washu.edu
- 7.SecurityWeek. (2024). "The AI Arms Race: Deepfake Generation vs. Detection." securityweek.com
- 8.Scam.ai. (2025). "Deepfake detection accuracy: what the benchmarks reveal." scam.ai
- 9.DeepStrike. (2025). "Deepfake Statistics 2025: The Data Behind the AI Fraud Wave." deepstrike.io
- 10.Council on Foreign Relations. (2024). "Election 2024: The Deepfake Threat to the 2024 Election." cfr.org
- 11.PBS NewsHour. (2024). "AI robocalls impersonate President Biden urging New Hampshire voters not to vote." pbs.org/newshour
공식 문서 및 보고서
- 12.NSA / CISA / U.S. Department of Defense. (2025-01). "Strengthening Multimedia Integrity in the Generative AI Era." media.defense.gov
- 13.Content Authenticity Initiative (Adobe). (2026). "The State of Content Authenticity in 2026." contentauthenticity.org
- 14.SimaLabs. (2025). "C2PA vs. SynthID vs. Meta Video Seal: 2025 Playbook for Enterprise AI-Video Authenticity." simalabs.ai
- 15.AIIP Protection. (2025). "Why C2PA Watermarks Fail on Social Media (And What Enterprise Teams Need Instead)." aiipprotection.org
- 16.World Privacy Forum. (2025). "Privacy, Identity and Trust in C2PA: A Technical Review and Analysis." worldprivacyforum.org
- 17.Truescreen. (2025). "C2PA Standard: History, Promises and Structural Limitations." truescreen.io
- 18.iProov. (2025). "Deepfake Detection Study: Human Identification Rates." iproov.com