2024.05.02 (목)

  • 맑음속초14.8℃
  • 맑음13.3℃
  • 맑음철원13.1℃
  • 맑음동두천13.2℃
  • 맑음파주11.0℃
  • 맑음대관령8.8℃
  • 맑음춘천13.4℃
  • 맑음백령도12.9℃
  • 맑음북강릉16.1℃
  • 맑음강릉19.0℃
  • 맑음동해13.5℃
  • 맑음서울15.7℃
  • 맑음인천14.2℃
  • 맑음원주15.7℃
  • 맑음울릉도12.5℃
  • 맑음수원12.6℃
  • 맑음영월13.1℃
  • 맑음충주13.1℃
  • 맑음서산10.9℃
  • 맑음울진12.4℃
  • 맑음청주17.1℃
  • 맑음대전14.9℃
  • 맑음추풍령14.8℃
  • 맑음안동14.6℃
  • 맑음상주16.7℃
  • 맑음포항13.2℃
  • 맑음군산13.2℃
  • 맑음대구15.0℃
  • 맑음전주15.0℃
  • 맑음울산10.2℃
  • 맑음창원12.2℃
  • 맑음광주15.1℃
  • 맑음부산13.2℃
  • 맑음통영12.4℃
  • 맑음목포13.8℃
  • 맑음여수13.2℃
  • 맑음흑산도12.9℃
  • 구름조금완도13.6℃
  • 맑음고창11.5℃
  • 맑음순천10.2℃
  • 맑음홍성(예)11.6℃
  • 맑음13.1℃
  • 구름많음제주15.3℃
  • 맑음고산14.8℃
  • 구름조금성산11.8℃
  • 구름많음서귀포14.8℃
  • 맑음진주10.2℃
  • 맑음강화14.2℃
  • 맑음양평15.1℃
  • 맑음이천16.2℃
  • 맑음인제11.7℃
  • 맑음홍천13.7℃
  • 맑음태백8.7℃
  • 맑음정선군11.0℃
  • 맑음제천12.0℃
  • 맑음보은12.7℃
  • 맑음천안13.1℃
  • 맑음보령11.9℃
  • 맑음부여12.0℃
  • 맑음금산12.4℃
  • 맑음13.5℃
  • 맑음부안13.7℃
  • 맑음임실11.9℃
  • 맑음정읍11.9℃
  • 맑음남원13.6℃
  • 맑음장수10.2℃
  • 맑음고창군11.1℃
  • 맑음영광군12.1℃
  • 맑음김해시13.0℃
  • 맑음순창군13.1℃
  • 맑음북창원12.9℃
  • 맑음양산시12.3℃
  • 맑음보성군11.7℃
  • 맑음강진군12.5℃
  • 맑음장흥11.6℃
  • 맑음해남11.6℃
  • 맑음고흥11.0℃
  • 맑음의령군11.5℃
  • 맑음함양군11.2℃
  • 맑음광양시12.1℃
  • 맑음진도군11.5℃
  • 맑음봉화9.9℃
  • 맑음영주17.3℃
  • 맑음문경17.8℃
  • 맑음청송군9.7℃
  • 맑음영덕9.2℃
  • 맑음의성10.7℃
  • 맑음구미14.7℃
  • 맑음영천11.0℃
  • 맑음경주시10.7℃
  • 맑음거창10.9℃
  • 맑음합천13.4℃
  • 맑음밀양12.4℃
  • 맑음산청11.7℃
  • 맑음거제11.1℃
  • 맑음남해12.3℃
  • 맑음11.9℃
기상청 제공
디지털포커스 로고
인공지능, 의대생도 능가! 눈 질병 진단 능력 보여
  • 해당된 기사를 공유합니다

AI

인공지능, 의대생도 능가! 눈 질병 진단 능력 보여

인공지능, 의대생도 능가! 눈 질병 진단 능력 보여

GPT-4, 의사 시험에서 인턴보다 똑똑하다?

GPT-4, 의사 시험에서 인턴보다 똑똑하다?
캠브리지대 연구팀은 인공지능(AI) 모델 GPT-4가 눈 질병 진단 시험에서 의대생들을 능가하는 성능을 보여주었다고 밝혔다

 

영국 케임브리지 대학교 연구팀은 최근 인공지능(AI) 대형 언어 모델(LLM) GPT-4가 의사 시험에서 인턴보다 더 높은 점수를 받았다고 밝혔다. 이 연구 결과는 LLM이 의학 분야, 특히 안과 진단 분야에 활용될 가능성을 제시하지만, 동시에 제한점과 위험 또한 존재한다는 점을 강조하고 있다.

 

GPT-4, 인턴보다 똑똑하지만 아직 의사는 아니다

 

연구팀은 GPT-4를 비롯한 여러 LLM을 대상으로 안과 진단 시험을 실시했다. 그 결과 GPT-4는 87개 문항 중 60개 문항에 정답을 맞추며 인턴(평균 59.7점)과 1년차 수련의(평균 37점)보다 높은 점수를 받았다. 하지만 전문 안과 의사들의 평균 점수(66.4점)에는 미치지 못했다. PaLM 2, GPT-3.5와 같은 다른 LLM은 GPT-4보다 더 낮은 점수를 받았다.

 

잘못된 정보 제공과 판단 오류

 

비록 이 연구 결과는 LLM이 안과 진단 분야에 활용될 수 있는 잠재력을 시사하지만, 동시에 심각한 위험성도 존재한다는 점을 놓칠 수 없다.

 

첫째, 제한된 시험 문항 풀로 인해 LLM의 실제 활용 가능성에 대한 우려가 제기된다. 둘째, LLM은 '환각' 현상에 취약하여 실제 존재하지 않는 정보를 만들어낼 수 있으며, 이는 백내장이나 암과 같은 심각한 질환의 오진으로 이어질 수 있다는 우려도 있다. 셋째, LLM은 인간의 미묘한 언어적 표현을 이해하지 못하기 때문에 진단 결과의 정확성을 떨어뜨릴 수 있다는 점도 지적된다.

 

의학 진단 도구로서의 LLM 활용, 아직 시기상조

 

연구 결과는 LLM이 의학 진단 도구로 활용되기 전에 더 많은 연구와 개발이 필요하다는 것을 명확하게 보여준다. 특히 의학 진단은 환자의 생명과 건강에 직접적인 영향을 미칠 수 있기 때문에 LLM 활용에는 매우 신중해야 한다. 따라서 LLM이 의료 현장에 본격적으로 도입되기까지는 상당한 시간이 걸릴 것으로 보인다.

 

 










 
모바일 버전으로 보기