[윌 폴킹혼 니드 대표]지난 2년 간 실리콘밸리를 주도해 온 서사는 오픈AI(OpenAI)와 같은 소수의 민간 기업이 대규모 인공지능(AI) 모델을 개발하고 이를 통제해 회계, 코딩, 고객 서비스 등 다양한 스타트업 응용 분야에서 과도한 독과점이 발생할 것이라는 점이었다.
 | 윌 폴킹혼 니드 대표 |
|
하지만 최근 중국 스타트업 딥시크(DeepSeek)가 이러한 통념을 깨는 새로운 기류를 예고해 전 세계 기술 전문가와 금융 시장을 깜짝 놀라게 했다. 중국의 한 헤지펀드의 지원을 받는 딥시크는 대규모 자본을 동원한 거대 기업들보다 훨씬 적은 비용으로 강력한 AI 모델을 개발했고 이를 오픈 소스로 공개해 전 세계 기업이 무료로 사용할 수 있게 했다.
해당 모델이 어떻게 개발됐고 어떤 훈련 데이터를 사용했는지는 아직 명확하지 않지만 분명한 건 오픈 소스 AI 모델이 이제 폐쇄형 최고급 모델과 견줄 만큼 경쟁력을 갖추거나 더 우수할 수 있다는 점이다. 이러한 오픈 소스 모델들은 AI 기술의 사용 비용을 낮춰 더 많은 사람과 기업이 활용할 수 있는 환경을 만들어갈 것이다. 또 다른 시사점은 AI 개발자들 사이에서 그동안 데이터 부족으로 한계에 도달할 것이라는 우려가 컸던 ‘훈련 장벽’(training wall)이 가시화하는 일은 없을 것이라는 점이다.
우리는 이러한 놀라운 발전 속에서 또 다른 장벽인 ‘추론 장벽’(inference wall)에 주목해야 한다. 추론 데이터는 실제 AI 모델 사용 시 필요한 입력 데이터로, AI가 개인과 사회에 미치는 영향력을 제한하는 주요 요인 중 하나다. 특히 의료 분야는 거대한 추론 장벽에 맞닥뜨린 대표적인 영역이다. 환자의 검사 결과, 방사선 이미지, 기타 의료 기록 등에 해당하는 추론 데이터는 여러 기관에 분산된 전자 의료 기록 시스템(EMR)과 구형 데이터베이스에 묶여 접근이 쉽지 않은 경우가 많다. 이 같은 의료 추론 데이터에 대한 접근이 불가능하다면 결국 AI 모델이 의사가 환자를 치료하거나 건강과 관련한 통찰력을 지원하는 데 큰 제약을 받을 수밖에 없다.
그렇기에 AI를 둘러싼 범업계적인 열정과 충분한 투자 속에서 우리는 방향성을 재고해야 한다. 미국에서는 최근 트럼프 대통령이 ‘스타게이트’(Stargate) 프로젝트에 5000억 달러를 투입해 오픈AI가 더 강력한 AI 모델을 개발할 수 있는 데이터 센터와 인프라를 구축하겠다고 발표했다. 하지만 AI의 발전을 저해하는 요소가 훈련 장벽이 아닌 추론 장벽이라면 우리는 데이터 접근성을 개선하는 데 투자와 에너지를 집중해야 한다. 추론 데이터에 대한 접근이 불가능하다면 가장 강력한 AI 모델도 단순 정보를 제공하는 역할에 머무를 수밖에 없기 때문이다.
미국 정책 담당자들이 수십 년간 환자 데이터 접근성을 개선하겠다고 이야기해 왔지만 두드러진 성과는 크지 않았던 반면 한국은 실질적인 진전을 보이고 있다. 최근 한국 정부가 추진 중인 ‘의료 마이데이터(MyData)’가 바로 그것이다. 이 프로젝트는 의료기관에 흩어진 건강 정보와 검사 결과, 치료 기록을 통합하고 신뢰할 수 있는 개발자만이 접근할 수 있는 혁신적인 인프라를 구축하고 있어 주목받고 있다.
결국 의료 분야에서는 추론 데이터에 대한 접근성이 관건이 될 것으로 보인다. 환자의 모든 건강 및 의료 데이터를 통합해 최신 과학과 기술로 분석하고 환자의 건강 증진을 위한 최적의 추천이나 치료 계획을 생성하는 것이 핵심 과제가 되는 것이다. 그리고 이 과정에서 필수적인 추론 데이터에 대한 접근 없이는 결코 AI가 가진 잠재력을 온전히 발휘할 수 없다는 사실을 명심해야 한다.