기사상세페이지
인공지능, 의대생도 능가! 눈 질병 진단 능력 보여
인공지능, 의대생도 능가! 눈 질병 진단 능력 보여
기사입력 2024.04.19 11:59
영국 케임브리지 대학교 연구팀은 최근 인공지능(AI) 대형 언어 모델(LLM) GPT-4가 의사 시험에서 인턴보다 더 높은 점수를 받았다고 밝혔다. 이 연구 결과는 LLM이 의학 분야, 특히 안과 진단 분야에 활용될 가능성을 제시하지만, 동시에 제한점과 위험 또한 존재한다는 점을 강조하고 있다.
GPT-4, 인턴보다 똑똑하지만 아직 의사는 아니다
연구팀은 GPT-4를 비롯한 여러 LLM을 대상으로 안과 진단 시험을 실시했다. 그 결과 GPT-4는 87개 문항 중 60개 문항에 정답을 맞추며 인턴(평균 59.7점)과 1년차 수련의(평균 37점)보다 높은 점수를 받았다. 하지만 전문 안과 의사들의 평균 점수(66.4점)에는 미치지 못했다. PaLM 2, GPT-3.5와 같은 다른 LLM은 GPT-4보다 더 낮은 점수를 받았다.
잘못된 정보 제공과 판단 오류
비록 이 연구 결과는 LLM이 안과 진단 분야에 활용될 수 있는 잠재력을 시사하지만, 동시에 심각한 위험성도 존재한다는 점을 놓칠 수 없다.
첫째, 제한된 시험 문항 풀로 인해 LLM의 실제 활용 가능성에 대한 우려가 제기된다. 둘째, LLM은 '환각' 현상에 취약하여 실제 존재하지 않는 정보를 만들어낼 수 있으며, 이는 백내장이나 암과 같은 심각한 질환의 오진으로 이어질 수 있다는 우려도 있다. 셋째, LLM은 인간의 미묘한 언어적 표현을 이해하지 못하기 때문에 진단 결과의 정확성을 떨어뜨릴 수 있다는 점도 지적된다.
의학 진단 도구로서의 LLM 활용, 아직 시기상조
연구 결과는 LLM이 의학 진단 도구로 활용되기 전에 더 많은 연구와 개발이 필요하다는 것을 명확하게 보여준다. 특히 의학 진단은 환자의 생명과 건강에 직접적인 영향을 미칠 수 있기 때문에 LLM 활용에는 매우 신중해야 한다. 따라서 LLM이 의료 현장에 본격적으로 도입되기까지는 상당한 시간이 걸릴 것으로 보인다.
많이본뉴스
많이 본 뉴스
- 1LEGO 레트로 라디오, 라디오 기능 없이 눈길만 사로잡아!
- 2하데스 2 정복 가이드: 초보 플레이어 위한 핵심 팁
- 3에이수스, 휴대용 게임 PC 최신 모델 “ROG Ally X” 발표
- 4GTA 6, 락스타 웹사이트에 등장 후 사라져! 5월 16일 발표 예상?
- 5닌텐도 스위치 2, 성능 유출? 12GB RAM, 8인치 디스플레이 예상
- 6구글 크롬, “서클 투 서치” 도구 탑재? 이미지 보고 바로 검색
- 7윈도우 11 스크린샷 도구, QR 코드 스캔 및 이모티콘 지원 추가!
- 8"기계 vs 인간" 암시? 애플, 논란의 여지가 있는 아이패드 프로 광고 사과
- 9구글 I/O 2024, 안드로이드 15와 제미나이 AI 등 새로운 기능 공개 예상
- 10엑스박스, 모바일 게임 스토어 7월 출시! 모든 기기에서 이용 가능