서울대병원·네이버, AI로 생물학적 나이와 건강 위험 예측


서울대병원과 네이버 공동 연구팀이 개발한 AI 모델을 통해서는 개인의 생물학적 나이를 파악할 수 있다. [출처: Gettyimagesbank]

서울대병원과 네이버 공동 연구팀이 개발한 AI 모델을 통해서는 개인의 생물학적 나이를 파악할 수 있다. [출처: Gettyimagesbank]


서울대병원과 네이버 공동 연구팀이 건강검진 데이터를 활용해 개인의 생물학적 나이와 건강 위험을 함께 평가할 수 있는 인공지능(AI) 모델을 개발했다.  


생물학적 나이는 유전, 생활습관, 환경, 질병 이력 등 다양한 요인을 종합해 신체의 실제 노화 정도를 수치로 표현한 지표다. 실제 나이보다 생물학적 나이가 낮으면 건강 상태가 양호함을 의미하고, 높으면 노화가 빠르거나 질병 위험이 높을 수 있다. 문제는 기존의 생물학적 나이 예측 모델은 주로 건강한 사람의 데이터를 기반으로 제작돼 만성질환자에게 적용하기 어렵고 사망 위험을 반영하지 못한다는 점이었다.


이러한 한계를 극복하기 위해 서울대병원 내분비대사내과 조영민·배재현·윤지완 교수팀과 네이버 디지털 헬스케어 랩(Digital Healthcare LAB) 유한주·문성은 박사팀이 손을 맞잡았다. 이들은 2003~2020년서울대병원 강남센터에서 건강검진을 받은 15만1281명의 데이터를 분석했다.  


데이터에는 신체계측, 혈액·소변검사, 폐 기능 검사, 질병 유무 및 사망 정보가 포함됐으며 연구 대상자는 혈당·혈압·콜레스테롤(지질) 수치에 따라 ▶정상군 ▶질환 전단계군 ▶질환군으로 분류됐다.


연구팀은 이 데이터를 토대로 트랜스포머 구조의 AI 모델을 설계했다. AI는 혈압, 혈당, 폐 기능, 콜레스테롤 등 다양한 건강 지표를 통합 분석해 개인의 생물학적 나이를 예측하고, 이를 실제 나이와 비교해 두 값의 차이를 산출하도록 꾸려졌다. 학습된 대규모 데이터를 바탕으로 사용자의 건강 지표가 과거 생존율이 높았던 집단과 사망 위험이 높았던 집단 중 어느 쪽과 유사한지를 분석해 구체적인 예측값도 제시한다.


연구진은 남녀의 생리적 차이도 반영하기 위해 성별별 모델을 각각 학습시켰다. 건강 지표 변화가 질병 유무, 사망 위험에 어떤 영향을 미치는지도 함께다. 이를 통해 해당 모델이 단순히 생물학적 나이를 계산하는 데 그치지 않고, 현재의 건강 상태가 향후 생존율과 어떤 통계적 연관성을 가지는지까지 평가할 수 있도록 했다.


실제 적용 결과도 유의미했다. 이번에 개발된 AI 모델은 정상군–질환 전단계군–질환군을 명확히 구분했다. 정상군은 생물학적 나이가 실제 나이보다 낮게, 질환군은 높게 나타나 건강 상태에 따른 뚜렷한 차이를 보였다. 혈당·혈압·지질 수치가 악화할수록 둘 사이의 차이가 벌어졌으며 심혈관질환이나 암이 있는 경우에도 그 수준이 유의하게 증가했다. 


조영민 교수는 “이번 연구는 질병 유병 상태와 사망 정보를 동시에 학습한 최초의 트랜스포머 기반 생물학적 나이 예측 모델이라는 점에서 의미가 크다”며 “AI가 단순히 생물학적 나이를 계산하는 것을 넘어 개인의 건강 상태와 미래 위험을 함께 반영할 수 있는 새로운 임상 도구로 발전했다”고 말했다. 그러면서 “서울대병원의 대규모 임상 데이터와 네이버의 첨단 AI 기술력이 결합해 의료 전문성과 기술이 함께 만든 산학 협력의 대표적 성과”라고도 했다. 한편 이번 연구 결과는 의료정보학 분야의 국제학술지 ‘Journal of Medical Internet Research’ 최근호에 게재됐다.  


하지수 기자 ha.jisu@joongang.co.kr


  


 

실생활에 유용한 정보를 쉽고 정확하게 전하는 생활정보 전문 기자.