Executive Summary

2026년 5월 19일, 두 개의 AI 연구 에이전트가 같은 날 Nature에 실렸다. Google DeepMind의 Co-Scientist와 FutureHouse의 Robin이다. 한쪽은 가설을 토너먼트로 겨루게 했고, 다른 한쪽은 실명 질환 치료제 후보를 자율로 골라냈다. 그런데 두 시스템에는 잘 드러나지 않는 공통점이 하나 있다. 둘 다 공개된 논문 안에서만 가설을 세운다는 점이다.

같은 호에 실린 네이처 사설은 이 흐름에 한 줄로 못을 박았다. 효율이 곧 통찰은 아니라는 것이다. AI가 더 빨리 읽고 더 많이 조합한다고 해서, 사람이 실패와 우회에서 길어 올리던 통찰까지 자동으로 따라오지는 않는다. 그리고 그 효율이 작동하는 범위 자체가 이미 좁다. 생물의학 논문의 64%는 유료 장벽 뒤에 있어, 두 시스템의 시야 밖에 머문다.

자동화된 발견의 천장은 모델의 영리함이 아니라 그 모델이 읽을 수 있는 데이터의 경계에서 정해진다. 그렇다면 아직 존재하지 않는 데이터와 닫혀 있는 데이터, 그 경계를 넓히는 일은 누구의 몫인가.

두 시스템의 성취와 한계는 네 개의 숫자에 함께 담겨 있다. 공개된 문헌이 차지하는 몫과 그 바깥에 잠긴 몫, 그리고 그 좁은 시야 안에서 Robin이 실제로 거둔 결과다.

36%

공개 액세스 비율

PubMed 색인 ~3,900만 편 중 무료로 열린 몫

64%

유료 장벽 뒤

AI 연구 에이전트가 닿지 못하는 생물의학 논문

10주

Robin 약물 재목적화

공개 문헌만으로 10개 질환을 훑은 기간

0편

선행 제안 연구

리파수딜을 dAMD에 제안한 기존 논문은 없었다

1

같은 날, 두 AI 연구자가 실렸다

Co-Scientist는 Gemini를 토대로 한 여섯 개의 전문 에이전트로 이뤄진다. 가설을 만드는 에이전트, 그것을 비판하는 에이전트, 순위를 매기는 에이전트가 서로 맞물려 돌아간다. 가설들은 Elo 토너먼트로 겨루고, 에이전트끼리 일종의 과학 논쟁을 시뮬레이션하면서 살아남는 가설이 위로 올라온다. 실제로 Calico Life Sciences 연구진은 이 시스템이 내놓은 통합 스트레스 반응 가설을 실험실에서 확인했다.

Robin은 역할을 더 또렷이 나눈다. Crow가 문헌을 요약하고 실험을 제안하면, Falcon이 심층 기술 보고서를 쓰고, Finch가 RNA-seq 같은 원시 데이터를 분석한다. 이 시스템은 전 세계 1억 9,600만 명이 앓는 건성 황반변성을 입력으로 받아, 약 400편의 논문에서 30개 후보를 추린 끝에 녹내장 치료제 리파수딜(Ripasudil)을 새 적응증 후보로 지목했다. 어떤 선행 연구도 이 약을 건성 황반변성에 연결한 적이 없었다.

성격이 다른 두 시스템이지만, 가설의 재료를 길어 오는 우물은 같다. Co-Scientist는 웹 검색과 ChEMBL·UniProt 같은 오픈 데이터에 기댄다. Robin은 공개 액세스 문헌만 읽는다. 둘 다 arXiv, PubMed Central, Semantic Scholar처럼 누구나 열어 볼 수 있는 저장소 위에서 움직인다. 구독형 데이터베이스 안쪽은 보지 못한다.

Co-Scientist Google DeepMind · 6개 전문 에이전트 Elo 토너먼트 · 가설 생성·비판·순위 Robin FutureHouse · Crow · Falcon · Finch 약물 재목적화 · 문헌→실험→분석 공개 액세스 문헌 36% arXiv · PubMed Central · Semantic Scholar · ChEMBL · UniProt PubMed 색인 약 3,900만 편 중 약 1,400만 편만 무료 공개 유료 장벽 뒤 64% — AI 시야 밖 구독형 저널 · 미출판 음성 결과 · 독점 임상 데이터
▲ 두 시스템은 같은 공개 문헌 저장소에서 가설 재료를 가져온다. 나머지 64%는 두 시스템의 시야 밖이다. | 페블러스 원본 도식 (Fig. 1 재해석)

두 시스템이 보여 준 것은 분명하다. 공개된 문헌을 빠르게 읽고 새롭게 조합하면, 사람이 미처 잇지 못한 연결을 찾아낼 수 있다. 리파수딜과 건성 황반변성을 이은 것이 그 증거다. 다만 그 연결은 모두 이미 공개된 논문 안에 흩어져 있던 조각들이었다.

2

사설이 그은 선: 효율과 통찰

네이처는 두 논문과 같은 호에 사설을 함께 실었다. 제목은 "Why AI cannot do good science without humans"였고, 핵심 문장은 이렇게 적혀 있다.

"AI systems might offer greater efficiency in some instances, but we don't yet know whether greater efficiency equates to greater insight."

AI 시스템이 어떤 국면에서는 더 높은 효율을 줄 수 있지만, 그 효율이 더 깊은 통찰과 같은지는 아직 모른다는 뜻이다. 사설은 같은 맥락에서 인간의 지혜와 공감, 그리고 그 어수선함이 과정과 효율만큼이나 진보의 일부라고 덧붙였다.

이 문장이 가리키는 곳은 단순한 정서가 아니다. 사람 과학자는 실패한 실험과 막다른 골목, 결국 논문이 되지 못한 시도에서도 무언가를 배운다. 그런데 그 배움의 상당 부분은 출판된 문헌에 기록되지 않는다. AI 연구 에이전트가 읽는 것은 살아남아 출판된 결과뿐이다. 버려진 시도의 지혜는 처음부터 코퍼스 밖에 있다.

3

데이터 경계가 발견의 천장이다

AI 연구 에이전트의 성능을 논할 때 우리는 보통 모델의 추론 능력을 본다. 더 큰 모델, 더 영리한 토너먼트, 더 정교한 에이전트 분업. 그러나 두 시스템이 함께 드러낸 진짜 상한은 다른 곳에 있다. 그 시스템이 읽을 수 있는 데이터의 경계다.

숫자가 그 경계를 보여 준다. PubMed에 색인된 생물의학 논문은 약 3,900만 편인데, 무료로 공개된 것은 그중 약 1,400만 편, 36%에 그친다. 나머지 64%는 구독료나 페이월 뒤에 있다. 공개 비율은 분야마다 갈린다. 천문학이나 열대의학은 80%를 넘지만, 약학과 화학공학은 10%에 못 미친다. AI가 신약을 찾으려 할 때 정작 가장 닫혀 있는 분야의 문을 두드리는 셈이다.

분야별 공개 액세스 비율 PubMed 색인 생물의학 분야 기준 · 출처: Zheng et al., Learned Publishing 2026 0% 25% 50% 75% 100% 약학 8% 화학공학 9% 생물의학 평균 36% 열대의학 85%
▲ AI가 신약 개발에 가장 많이 활용하는 약학 분야의 공개 액세스 비율은 8%에 불과하다. | 페블러스 원본 도식 (Fig. 2 재해석)

이 경계 밖에는 세 종류의 데이터가 있다. 페이월 뒤에 잠긴 출판 논문, 출판되지 않은 음성 결과와 실패 실험, 그리고 기업이 쥐고 있는 독점 임상 데이터다. 두 시스템에게 이 영역은 어렵게 닿는 데이터가 아니라, 처음부터 존재하지 않는 데이터다. 보이지 않는 것에 대해서는 가설조차 세울 수 없다.

그래서 Co-Scientist와 Robin이 찾은 것은 공개 문헌이 허용한 발견이다. 잠긴 문헌이 담고 있는 발견은 여전히 잠긴 채로 남아 있다. 모델을 더 영리하게 만들어도 이 천장은 올라가지 않는다. 천장을 올리려면 읽을 수 있는 데이터 자체를 넓혀야 한다.

4

경계를 넓히는 사람

그렇다면 질문은 모델이 아니라 데이터로 옮겨 간다. 아직 존재하지 않는 데이터는 누가 만드는가. 새로운 실험을 설계하고 돌려 결과를 남기는 일은 여전히 사람의 몫이다. 닫혀 있는 데이터는 누가 여는가. 페이월을 넘고, 독점 데이터를 공유 가능한 형태로 정제하고, 출판되지 않은 음성 결과를 기록으로 남기는 일도 마찬가지다.

그리고 데이터를 만드는 일만으로는 충분하지 않다. AI가 같은 데이터를 사람과 다르게 해석하는 사례가 이미 보고됐다. 그래서 누가 데이터를 만드느냐와 함께, 누가 그 데이터의 품질을 검증하느냐가 자동화된 발견의 신뢰도를 가른다. 데이터를 만드는 사람과 검증하는 사람이 사실상 AI 발견의 상한선을 그린다.

AI 공동연구자는 분명 빠르고 유능한 동료다. 다만 그 동료가 볼 수 있는 세계는 우리가 읽을 수 있게 만들어 둔 데이터까지다. 그 너머는 여전히 사람이 먼저 만들고 검증해 넘겨주어야 할 영역으로 남아 있다.

Editor's Note. 페블러스는 AI가 읽고 쓸 수 있는 데이터, 즉 AI-Ready Data를 만들고 그 품질을 검증하는 일을 한다. 이 글이 가리키는 경계 — 아직 존재하지 않거나 닫혀 있는 데이터 — 가 바로 그 작업이 향하는 곳이다.

R

참고문헌

학술 문헌

업계 분석

  • 5.IntuitionLabs (2026). "Full-text access: the main barrier for AI research tools." intuitionlabs.ai