Executive Summary
Databricks가 20,000개가 넘는 글로벌 조직의 사용 데이터를 집계해 2026년 리포트에 담은 한 문장이 있다. 거버넌스 도구를 쓰는 조직이 AI 프로젝트를 12배 더 많이 프로덕션에 올렸다는 것이다. 어제까지 거버넌스는 재무팀과 다투어야 하는 지출 항목이었다. 이 숫자가 나온 순간, 그것은 배포 배수로 환산되는 ROI 지렛대가 됐다. 이 글은 그 12라는 숫자를 어디까지 믿어야 하고, 왜 그것이 페블러스 독자에게 오래된 주장의 정량적 증명인지를 본다.
물론 12배는 검증된 인과가 아니라 상관이다. 벤더 자체 telemetry라는 한계도 있다. 그런데 방법론이 전혀 다른 독립 설문에서도 방향은 같았다. 기업 리더 364명을 조사한 Larridin은 공식 거버넌스 정책을 가진 조직이 AI로 ROI를 입증할 확률이 2.2배 높다고 보고했다. 서로 다른 렌즈가 같은 곳을 가리킬 때, 신호는 우연이 아니다.
이 글은 짧다. 숫자 하나를 정직하게 읽고, 그 숫자가 왜 "문제는 모델이 아니라 데이터와 조직"이라는 오래된 진단의 다른 이름인지까지만 따라간다.
주요 수치
출처: Databricks 2026 State of AI Agents · 2.2배·69%는 Larridin 2026
아래 네 숫자가 이 글의 뼈대다. 앞의 둘은 거버넌스와 평가가 배포로 환산되는 배수이고, 세 번째는 방법론이 다른 독립 설문의 확인, 네 번째는 그 배수를 무력화하는 함정이다.
12배
거버넌스 도구 사용 조직의 프로덕션 배포 배수
Databricks, 20,000+ 조직 telemetry
6배
평가(evaluation) 도구 사용 조직의 배포 배수
거버넌스와 한 쌍으로 작동
2.2배
거버넌스 조직의 ROI 입증 확률
Larridin 독립 설문 364명, 84.5% vs 37.9%
69%
"정책이 있다"고 답했으나 절반은 자사 도입률조차 모름
정책 보유 ≠ 거버넌스 작동
12배라는 숫자가 바꾼 대화
거버넌스를 놓고 벌이는 회의는 늘 비슷하게 흘러간다. 데이터 팀은 계보와 접근 통제와 품질 검증에 예산을 달라고 하고, 재무팀은 그게 매출에 어떻게 잡히느냐고 묻는다. 거버넌스는 규제에 대응하는 방어 비용, 좋게 말해도 보험료 정도로 취급됐다. 딱 떨어지는 숫자로 값을 매기기 어려운 항목이었기 때문이다.
그 대화의 성격을 바꾼 문장이 Databricks의 2026년 리포트에 담겼다. 20,000개가 넘는 조직의 익명화된 사용 데이터를 집계해 보니, AI 거버넌스 도구를 쓰는 조직이 그렇지 않은 조직보다 AI 프로젝트를 12배 더 많이 프로덕션에 올렸다는 것이다. 함께 발표된 평가(evaluation) 도구 쪽 숫자도 방향이 같다. 평가 도구를 쓰는 조직은 6배 더 많은 AI 시스템을 프로덕션으로 보냈다.
숫자가 바꾼 것은 거버넌스의 위치다. "12배 더 배포"는 데이터 팀의 언어가 아니라 경영진의 언어다. 배포된 AI가 12배 많다는 것은 프로덕션에서 돌아가며 실제로 값을 만드는 시스템이 그만큼 많다는 뜻이고, 이건 예산 심사에서 그대로 통하는 셈법이다. 어제까지 거버넌스는 지출 항목이었다. 이 문장이 나온 뒤로, 그것은 배포 배수로 환산되는 지렛대가 됐다.
이 12배, 얼마나 믿어야 할까
인상적인 숫자일수록 먼저 의심하는 게 예의다. 12배는 인과가 아니라 상관이다. 리포트는 거버넌스 도구를 쓰는 조직과 안 쓰는 조직의 배포 수를 비교했을 뿐, 거버넌스가 배포를 낳았다는 것까지 증명하지는 않는다. 이미 성숙한 조직이 거버넌스도 도입하고 배포도 많이 하는 것일 수 있다. 이 경우 거버넌스는 원인이 아니라 성숙함의 증상이다. 베이스라인이 되는 거버넌스 미사용 조직의 비율도, 데이터 수집 기간도 공개되지 않았다.
여기에 하나 더. 이 데이터는 Databricks 자체 플랫폼에서 나온 telemetry다. 자사 도구의 가치를 부각하기 좋은 프레이밍이 섞일 여지가 있다. 이런 한계를 감추면 세일즈 자료가 되고, 드러내면 오히려 신뢰가 붙는다. 그러니 12배를 "거버넌스가 배포를 12배 늘린다"가 아니라 "거버넌스를 쓰는 조직이 12배 더 배포하는 상태로 관찰됐다"로 읽는 편이 정확하다.
그럼에도 이 신호를 버리기 아까운 이유는, 전혀 다른 방법으로 잰 숫자가 같은 곳을 가리키기 때문이다. 기업 리더 364명을 설문한 Larridin의 2026년 조사에서, 공식화된 AI 리스크·컴플라이언스 정책을 가진 조직은 AI로 ROI를 입증할 확률이 2.2배 높았다(84.5% 대 37.9%). 한쪽은 플랫폼 telemetry, 다른 쪽은 사람에게 직접 물은 설문이다. 측정 도구가 이렇게 다른데도 화살표가 같은 방향이면, 그건 도구의 편향이 아니라 실제 패턴일 가능성이 크다.
방법론이 다른 두 조사가 같은 결론에 수렴할 때, 각각의 약점은 서로를 보완한다. telemetry의 벤더 편향은 독립 설문이 상쇄하고, 설문의 자기보고 편향은 실제 사용 데이터가 상쇄한다. 12배라는 크기는 신중하게 받되, "거버넌스가 있는 쪽이 프로덕션에 더 간다"는 방향만큼은 견고하다.
지렛대는 어디에 힘을 주는가
12배가 갈리는 지점은 하나다. 파일럿이 프로덕션으로 넘어가느냐. 대부분의 조직은 인상적인 데모를 만드는 데까지는 간다. 막히는 곳은 그다음, 실제 사용자와 실제 데이터가 오가는 운영 환경으로 올리는 단계다. 파일럿이 프로덕션에서 좌초하는 이유를 들여다보면, 문제는 모델의 정확도보다 그 모델에 무엇을 먹이고 무엇을 내보낼지 통제할 수 없다는 데 있다.
거버넌스와 평가가 힘을 주는 곳이 정확히 이 지점이다. 프로덕션에 AI를 올리려면 최소한 세 가지가 필요하다. 이 데이터가 어디서 왔고 누가 만졌는지 아는 계보, 누가 어떤 데이터에 접근할 수 있는지 정하는 규칙, 그리고 배포한 뒤에도 자사 KPI 기준으로 정확도와 안전성이 유지되는지 계속 재는 평가다. 이 셋이 없으면 데모는 되지만 운영은 안 된다. 사고가 났을 때 원인을 추적할 수 없고, 규제 앞에서 데이터 출처를 증명할 수 없기 때문이다.
거버넌스를 브레이크로만 보면 놓치는 게 하나 더 있다. 가트너는 AI 거버넌스 기술이 규제 컴플라이언스 비용을 약 20% 줄여 준다고 봤다. 아낀 그 여력이 방어에 머물지 않고 전략적 성장 투자로 되돌아간다는 뜻이다. 계보와 접근 통제를 갖춘 조직이 오히려 더 과감하게 배포하는 이유가 여기 있다. 규칙이 명확할수록 어디까지 밟아도 되는지가 분명해지기 때문이다.
그래서 거버넌스(12배)와 평가(6배)는 따로 노는 두 지표가 아니라 한 쌍이다. 거버넌스가 프로덕션에 올릴 자격을 만들고, 평가가 올린 뒤에도 자격을 유지시킨다. 이렇게 보면 거버넌스는 규제 대응 부서의 일이 아니라 배포 인프라의 일부다. 방어를 위한 브레이크가 아니라, 액셀을 끝까지 밟을 수 있게 해 주는 조향 장치에 가깝다.
정책이 있다 ≠ 거버넌스가 작동한다
숫자만 좇으면 빠지기 쉬운 함정이 있다. "거버넌스가 배포를 12배 늘린다니, 우리도 거버넌스 정책 문서를 만들자"는 반응이다. 그런데 같은 Larridin 조사가 이 반응에 찬물을 끼얹는다. 응답 조직의 69.2%가 "AI 정책이 있다"고 답했지만, 그중 45.6%는 자사의 AI 도입률조차 알지 못했고, 37.1%는 거버넌스가 일관되게 지켜지지 않는다고 인정했다. 정책 문서의 존재와 거버넌스의 작동은 다른 이야기다.
배수를 만드는 건 문서가 아니라 집행이다. 그리고 집행의 대상은 결국 데이터다. 같은 조사에서 기업 AI 도입의 약 45%가 공식 IT 조달 밖에서 일어나는 이른바 섀도우 AI로 집계됐다. 어디서 어떤 데이터가 어떤 모델로 흘러가는지 보이지 않는다면, 그 위에 아무리 훌륭한 정책을 얹어도 작동할 수가 없다. 볼 수 없는 것은 다스릴 수 없다.
12배는 "정책을 문서로 가진 조직"이 아니라 "데이터 위에서 거버넌스가 실제로 집행되는 조직"의 숫자로 읽어야 한다. 정책만 걸어 두고 배수를 기대하면 거버넌스 극장에 그친다. 진짜 지렛대는 데이터의 계보·접근·품질이 눈에 보이고 손에 잡힐 때 비로소 힘을 받는다.
준비도의 가치가, 마침내 숫자가 됐다
페블러스는 몇 년째 같은 문장을 반복해 왔다. 모델은 대체로 멀쩡했고, 막힌 곳은 데이터와 조직이었다는 것. 데이터 청소는 AI-레디의 끝이 아니라 시작일 뿐이라는 것. 이 주장들은 옳았지만 정성적이었다. 회의실에서 "데이터가 준비 안 됐다"고 말하면, 상대는 "그래서 그게 얼마짜리 문제냐"고 되물었고, 우리에게는 그 되물음에 댈 숫자가 없었다.
12배와 6배, 그리고 2.2배가 그 빈칸을 채운다. 거버넌스가 배포 배수로 환산된다는 것은, 데이터를 AI에 쓸 수 있게 준비하는 일이 배포 배수로 환산된다는 것과 같은 말이다. 거버넌스는 데이터 준비도의 다른 이름이기 때문이다. 계보를 아는 것, 접근을 통제하는 것, 품질을 계속 재는 것은 전부 "이 데이터가 AI에 쓰일 준비가 됐는가"라는 한 질문의 다른 얼굴이다. 페블러스의 DataClinic이 데이터의 품질과 준비도를 진단하는 것도 이 질문에 숫자로 답하기 위해서다.
그러니 이 리포트의 진짜 의미는 "거버넌스 도구를 사라"가 아니다. 오랫동안 감으로만 말해 온 준비도의 가치를, 이제 경영 언어로 옮길 수 있게 됐다는 것이다. 다음 예산 회의에서 데이터 준비도에 투자해야 하는 이유를 물으면, 이렇게 답할 수 있다. 준비된 쪽이 프로덕션에 12배 더 간다고. 그 숫자가 완벽한 인과는 아니지만, 방향만큼은 서로 다른 두 조사가 함께 가리키고 있다고.
거버넌스는 비용 항목에서 지렛대로 성격이 바뀌었다. 바뀐 것은 거버넌스의 본질이 아니라 그것을 잴 수 있는 자가 생겼다는 사실이다. 준비도의 가치가 숫자가 되는 순간, 데이터 준비를 미루는 일은 더 이상 절약이 아니라 배포 배수를 스스로 깎는 선택이 된다.
참고문헌
1차 리포트
- 1.Databricks. (2026). "Enterprise AI agent trends: Top use cases, governance + evaluations and more." Databricks Blog. (12x / 6x 1차 출처)
- 2.Databricks. (2026). "2026 State of AI Agents." (20,000+ 글로벌 조직 telemetry 집계 eBook)
- 3.Larridin. (2026). "2026 State of Enterprise AI." (독립 설문 364명 — 2.2배 ROI, 거버넌스 극장, 섀도우 AI 45%)
업계 분석·인용
- 4.Dataiku. (2026). "Governance as Acceleration: The Data Proves It's Not a Speed Bump." Dataiku Blog. (Databricks·Larridin·Gartner 교차 데이터)
- 5.Tenfold. (2026). "Top AI Trends in June 2026: What Enterprise Leaders Need to Know Now." Tenfold Blog. (Databricks를 12x 원 출처로 지목)