기사상세페이지

인공지능, 의대생도 능가! 눈 질병 진단 능력 보여

인공지능, 의대생도 능가! 눈 질병 진단 능력 보여

기사입력 2024.04.19 11:59

SNS 공유하기

fa tw
  • ba
  • ka ks url
    GPT-4, 의사 시험에서 인턴보다 똑똑하다?
    GPT-4, 의사 시험에서 인턴보다 똑똑하다?
    캠브리지대 연구팀은 인공지능(AI) 모델 GPT-4가 눈 질병 진단 시험에서 의대생들을 능가하는 성능을 보여주었다고 밝혔다

     

    영국 케임브리지 대학교 연구팀은 최근 인공지능(AI) 대형 언어 모델(LLM) GPT-4가 의사 시험에서 인턴보다 더 높은 점수를 받았다고 밝혔다. 이 연구 결과는 LLM이 의학 분야, 특히 안과 진단 분야에 활용될 가능성을 제시하지만, 동시에 제한점과 위험 또한 존재한다는 점을 강조하고 있다.

     

    GPT-4, 인턴보다 똑똑하지만 아직 의사는 아니다

     

    연구팀은 GPT-4를 비롯한 여러 LLM을 대상으로 안과 진단 시험을 실시했다. 그 결과 GPT-4는 87개 문항 중 60개 문항에 정답을 맞추며 인턴(평균 59.7점)과 1년차 수련의(평균 37점)보다 높은 점수를 받았다. 하지만 전문 안과 의사들의 평균 점수(66.4점)에는 미치지 못했다. PaLM 2, GPT-3.5와 같은 다른 LLM은 GPT-4보다 더 낮은 점수를 받았다.

     

    잘못된 정보 제공과 판단 오류

     

    비록 이 연구 결과는 LLM이 안과 진단 분야에 활용될 수 있는 잠재력을 시사하지만, 동시에 심각한 위험성도 존재한다는 점을 놓칠 수 없다.

     

    첫째, 제한된 시험 문항 풀로 인해 LLM의 실제 활용 가능성에 대한 우려가 제기된다. 둘째, LLM은 '환각' 현상에 취약하여 실제 존재하지 않는 정보를 만들어낼 수 있으며, 이는 백내장이나 암과 같은 심각한 질환의 오진으로 이어질 수 있다는 우려도 있다. 셋째, LLM은 인간의 미묘한 언어적 표현을 이해하지 못하기 때문에 진단 결과의 정확성을 떨어뜨릴 수 있다는 점도 지적된다.

     

    의학 진단 도구로서의 LLM 활용, 아직 시기상조

     

    연구 결과는 LLM이 의학 진단 도구로 활용되기 전에 더 많은 연구와 개발이 필요하다는 것을 명확하게 보여준다. 특히 의학 진단은 환자의 생명과 건강에 직접적인 영향을 미칠 수 있기 때문에 LLM 활용에는 매우 신중해야 한다. 따라서 LLM이 의료 현장에 본격적으로 도입되기까지는 상당한 시간이 걸릴 것으로 보인다.

     

     

    backward top home