[라스베이거스(미국)=이데일리 임유경 기자] 아마존웹서비스(AWS)는 AWS 리인벤트에서 LG그룹의 인공지능(AI) 연구 허브인 LG AI연구원이 AWS 클라우드를 기반으로 암 진단과 치료를 위한 새로운 병리학 기반 모델(파운데이션모델)을 개발했다고 발표했다.
LG AI연구원의 병리학 기반 모델인 엑사원패스(EXAONEPath)는 3000억 개의 파라미터를 보유한 멀티모달 기반 모델 엑사원(EXAONE) 중 일부다. 암 환자의 조직병리 이미지를 안전하게 분석해 유전자 검사 시간을 기존 2주에서 1분 미만으로 단축함으로써 의료진의 치료 속도와 효과를 개선할 수 있도록 돕도록 특화됐다.
| 엑사원패스를 통한 이미지 분석.(사진=AWS) |
|
엑사원패스는 이미지 패치를 정확하게 분류하는 데 있어 여섯 가지 벤치마크에서 평균 86.1%의 정확도를 달성했다. 이는 훨씬 더 큰 데이터셋으로 학습된 다른 주요 병리 기반 모델들과 견줄 만한 수준이다. AWS를 통해 LG AI연구원은 테라바이트 단위의 데이터를 1시간 이내로 클라우드에 전송해 모델 학습 시간을 60일에서 1주일로 단축시켰켜 엑사원패스의 암 진단 및 검출 성능을 향상시켰다. 또한, LG AI연구원은 AWS를 활용해 데이터 관리 및 인프라 비용을 약 35% 절감하고, 데이터 준비 시간을 95% 단축할 수 있었다.
또 아마존 세이지메이커를 활용해 2억8500만 개의 데이터 포인트와 3만5000개 이상의 고해상도 조직 샘플 이미지를 사용하여 8개월 만에 대규모 엑사원패스 모델을 학습하고 배포했다. 방대한 데이터셋으로 AI 모델을 처리하고 학습하기 위해서는 막대한 스토리지, 고속 데이터 전송 및 컴퓨팅 성능이 필요하다. AWS와 엔비디아 그래픽처리장치(GPU)를 통해 LG AI연구원은 딥 러닝 워크로드의 학습과 추론 속도를 가속화하고 있다.
LG AI연구원은 연구에 핵심적인 대용량 데이터를 저장하고 검색하는 데 아마존 S3를 활용한다. 러스트용 아마존 FSx(Amazon FSx for Lustre)는 밀리초 미만의 지연 시간과 초당 수백 기가바이트의 처리량을 제공하여, 대규모 데이터셋에 대한 빠른 접근이 필요한 애플리케이션에 필수적이다. 이 고성능 파일 및 스토리지 시스템은 병렬 데이터 처리와 분석을 가능하게 하여 인사이트를 얻는 데 필요한 시간을 크게 단축한다.
이화영 LG AI연구원 상무는 “AWS를 통해 AI 연구를 가속화해 접근이 용이하고 신속한 암 검진을 현실화가 가능할 것”이라며 “AWS를 활용해 방대한 데이터셋에서 병리학 모델을 더 빠르고 안전하고, 비용 효율적으로 학습시킬 수 있었다. 엑사원패스의 향상된 데이터 처리 기능은 더 개인화되고 효율적인 암 치료를 제공하여 환자의 건강을 개선할 수 있도록 도와줄 것이다. 엑사원패스는 전 세계적으로 암 진단 및 치료 방식을 혁신할 수 있는 잠재력을 가지고 있다”라고 말했다.
댄 시런 AWS 헬스케어 및 생명 과학 부문 총괄 매니저는 “헬스케어 업계는 AWS의 AI를 통해 진단을 가속화하고 환자들을 더 빠르게 치료하는 데 있어 빠른 진전을 보이고 있다”며, “AWS를 통해 LG AI연구원은 엑사원패스를 전례 없는 규모로 개발 및 활용할 수 있게 되어, 데이터 처리와 모델 훈련 시간을 단축하고 정확도를 개선할 수 있었다. 이를 통해 의료 서비스 제공자들은 암 진단 및 치료를 개선하고, 대기 시간을 줄이며 환자 맞춤형 치료를 제공할 수 있을 것”이라고 말했다.