2026.03.19 (목)

  • 맑음동두천 4.0℃
  • 맑음강릉 7.6℃
  • 맑음서울 4.2℃
  • 맑음대전 5.0℃
  • 맑음대구 6.9℃
  • 연무울산 7.0℃
  • 맑음광주 6.4℃
  • 맑음부산 10.5℃
  • 맑음고창 5.1℃
  • 맑음제주 8.6℃
  • 맑음강화 5.9℃
  • 맑음보은 2.9℃
  • 흐림금산 0.2℃
  • 맑음강진군 6.3℃
  • 맑음경주시 7.6℃
  • 맑음거제 8.1℃
기상청 제공

서울대병원, 인공지능 기반 수술 위험 예측 모델 개발...전문의 예측 성적보다 특이도·민감도 높아

수술 전 마취 위험 예측하는 거대언어모델 개발...71만여명 수술 데이터 학습

  수술 전 위험을 보다 빠르고 정확하게 예측할 길이 열렸다. 서울대병원 연구팀이 마취 전 평가 요약문을 바탕으로 환자의 수술 위험을 평가하는 거대언어모델(LLM)을 자체적으로 개발했다. 이를 활용하면 신속하고 객관적인 수술 위험 평가를 통해 의료서비스의 질을 향상할 수 있을 것으로 기대된다.

  서울대병원 마취통증의학과 이형철·윤수빈 교수 및 국가전략기술 특화연구소 이현훈 교수 공동연구팀이 71만여명의 수술 데이터를 바탕으로 수술 전 마취 위험을 예측하는 인공지능 모델을 개발하고, 그 성능을 검증한 결과를 28일 발표했다.

  수술 전 마취 위험을 평가하는 과정은 환자의 안전을 위해 매우 중요하다. 국내 의료 현장에서는 환자의 전반적인 건강상태를 1등급(건강한 환자)부터 6등급(뇌사 상태)으로 구분하는 ‘미국마취과학회 신체상태 분류(ASA-PS)*’를 도입해 마취 위험과 전반적인 수술 위험의 예측 도구로 널리 활용하고 있다.

[표] 미국마취과학회 신체상태 분류(ASA Physical Status Classification)

등급

정의

기준

ASA

건강한 환자

신체적으로 건강, 비만 없음, 흡연 및 음주 없음

ASA

경미한 전신질환 환자

경미한 고혈압, 경증 천식, 흡연자, 임신 초기, 경도 비만,

잘 조절되는 당뇨병 등

ASA

중등도에서 중증의 전신질환 환자

잘 조절되지 않는 고혈압 및 당뇨병, 심부전, 폐쇄성 폐질환 등

ASA

지속적으로 생명을 위협하는

중증 전신질환 환자

최근 발생한 심근경색, 진행성 심부전,

지속적인 혈역학적 불안정성 등

ASA

수술 없이 생존 불가능한 말기 환자

대동맥류 파열, 중증 외상, 두부손상, 다발성 장기부전 등

ASA

뇌사 상태

-


 그러나 ASA-PS 체계는 중증도 기준이 주관적이어서 의료진 간 ASA-PS 등급 분류가 불일치하는 문제가 종종 발생했다. 의료 서비스를 효율적으로 제공하려면 중증도 마취 위험을 일관적·객관적으로 파악할 수 있는 수술 전 평가 도구가 필요했다.

  연구팀은 이런 문제를 해결하기 위해 2004-2023년 서울대병원에서 수술 받은 대규모 환자 데이터를 학습시켜 ASA-PS 등급을 자동 분류하는 거대언어모델을 개발했다. 이 모델은 사람의 언어를 이해하는 챗GPT처럼 자연어처리 기술을 기반으로 하는 인공지능으로, 특히 의료 기록과 개인정보 보안에 특화되어 있다.

  이 거대언어모델을 활용하면 환자의 건강상태·기저질환 등을 간략하게 서술한 ‘마취 전 평가 요약문’을 바탕으로 ASA-PS 등급을 신속하고 객관적으로 분류할 수 있다. 따라서 임상 현장에서 의사소통의 효율성과 환자 안전을 증진하는 데 도움이 될 수 있다는 것이 연구팀의 설명이다.

  환자 460명의 데이터를 바탕으로 분류 성능을 평가한 결과, 모든 ASA-PS 등급에 대한 이 모델의 평균 예측 정확도(AUROC)는 0.915로 매우 높았다. 이 수치가 1에 가까울수록 완벽한 예측을 했음을 의미한다.

  또한, 거대언어모델 및 마취과 전문의 분류 성적은 각각 특이도(0.901 vs 0.897), 정밀도(0.732 vs 0.715), F1-점수(0.716 vs 0.713)로, 모두 거대언어모델이 조금씩 우수한 성능을 보였다.
*F1-점수: 정밀도(모델이 양성으로 예측한 것 중 실제 양성 비율) 및 재현율(실제 양성인 것 중 모델이 양성으로 예측한 비율)의 조화평균

  추가적으로 임상적 의사결정에 중요한 ASA-PS 1~2등급(건강한 사람 및 경미한 전신질환)과 3등급 이상(중증도 전신질환 이상)의 환자를 구분하는 데 있어 거대언어모델의 오류율은 11.74%로, 이는 마취과 전문의의 오류율 13.48%보다 우수한 성적이었다.

  이형철·윤수빈 교수(마취통증의학과)는 “이 연구 결과는 인공지능 기술이 임상 현장에서 실질적으로 활용될 수 있음을 보여주는 성과”라며 “후속 연구를 통해 환자의 안전 및 의료 질 향상에 기여할 수 있는 기술을 지속적으로 개발할 수 있도록 노력할 예정이다”라고 말했다.

  이현훈 교수(국가전략기술 특화연구소)는 “인공지능 수술 전 평가 모델이 세계적으로 활용될 수 있도록 특화연구소의 데이터를 바탕으로 세계적으로 협력하면서 글로벌 기술사업화를 추진해나갈 계획”이라고 말했다.

  한편, 이번 연구는 디지털 헬스케어 분야의 네이처 파트너 저널 ‘디지털 메디신(npj Digital Medicine, IF;12.4)’ 최근호에 게재됐다.

배너
배너

배너


배너
배너

제약ㆍ약사

더보기

배너
배너
배너

의료·병원

더보기
용인세브란스병원, 센서 내장된 깔창 이용 진단‧재활 딥러닝 모델 구축 연세대학교 용인세브란스병원(병원장 박진오) 재활의학과 김나영 교수 연구팀이 신발 속에 삽입하는 ‘스마트 인솔(깔창)’을 활용해 노인의 다양한 보행 질환을 구분하고 환자의 재활 상태를 모니터링할 수 있는 디지털 헬스 기술을 개발했다. 급격한 고령화로 파킨슨병, 무릎 관절염, 정상압 수두증 등 다양한 퇴행성 질환으로 인한 ‘노인 보행 장애’가 중요한 건강 문제로 떠오르고 있다. 보행 장애는 낙상 위험을 높이고 활동성을 저해하는 등 삶의 질 저하로 이어질 수 있다. 또한 보행 변화는 다양한 신경계‧근골격계 질환의 진행 상태나 재활 효과를 평가하는 중요한 임상 지표로 활용된다. 기존의 보행 속도나 보폭 같은 지표는 초기 인지-운동 기능 저하를 구분하기 어렵고, 현재 임상에서 활용되는 보행 평가는 일상 환경에서의 보행 상태를 지속적으로 평가하기 어렵다는 한계가 있었다. 이에 연구팀은 실제 생활 환경에서 환자의 보행 데이터를 수집해, 질환을 구분하고 재활 경과를 모니터링할 수 있는 디지털 헬스 기술 개발에 나섰다. 연구팀은 먼저 압력 센서가 내장된 스마트 인솔(sensor-embedded insole)로 측정한 보행 속도, 보폭 등 데이터의 정확도를 검증했다. 그 결과