오픈AI는 스프링 업데이트 행사에서 검색엔진 경쟁보다는 훨씬 더 인상적인 'GPT-4 옴니(GPT-4o)'를 공개했다.
기존 챗GPT보다 더 빠르고 무료로 이용할 수 있는 GPT-4o는 휴대폰이나 데스크탑 앱을 통해 자연스러운 대화가 가능해 꿈꿔왔던 가상비서가 될 가능성을 열어준다.
감정 인식까지 가능한 멀티모달 인공지능
GPT-4o는 실제 사람과 가까운 대화를 할 수 있도록 커뮤니케이션 이해 능력을 크게 발전시켰다. 사람처럼 말을 끊거나, 어감을 이해하고 실수를 인정하는 등 사실적인 대화 속 혼란함까지 재현한다.
최초 라이브 데모에서 발표자는 자신의 호흡법에 대한 피드백을 요청했다. 그는 휴대폰에 거칠게 숨을 들이쉬자 챗GPT는 "청소기가 아니에요. 더 천천히 숨쉬면 좋을 것 같아요."라고 재치 있는 답변을 통해 섬세한 부분까지 이해하고 반응할 수 있는 능력을 보여줬다.
유머 감각도 탑재! 다양한 톤 & 스타일 대화 가능
챗GPT는 유머 감각도 갖추고 있으며 대화 상황에 따라 목소리 강약을 조절하며 생각을 전달한다. 실제 대화처럼 질문을 끊거나, 답변을 수정하도록 요청할 수도 있고 특정 톤이나 스타일, 로봇 목소리로 말하도록 지시할 수도 있다. 또한 번역 기능도 제공한다.
실제 사용자 제안에 따라 이루어진 라이브 데모에서는 영어를 사용하는 한 명과 이탈리아어를 사용하는 한 명의 발표자가 함께 무대에 올라 챗GPT-4o를 통역가로 활용했다. 챗GPT는 이탈리아어를 영어로 빠르게 번역하고 다시 영어 답변을 이탈리아어로 되돌려주는 모습을 보였다.
시각 정보까지 이해하는 멀티모달 인공지능
GPT-4o는 음성뿐만 아니라 시각 정보도 이해한다. 수학 방정식 이미지를 보고 풀이 과정을 안내할 수 있으며, 라이브 셀피 사진을 보고 옷차림이나 감정 상태를 설명할 수도 있다.
데모에서 챗GPT는 발표자가 행복하고 명랑해 보인다고 말했지만, 아직은 완벽하지 않은 부분도 있다. 이전에 보여준 나무 상판 이미지를 보고 방정식 이미지가 나오기 전에 이미 이미지를 확인했다고 언급하는 오류도 있었다.
하지만 전체적으로 데모에서 챗GPT는 빠르게 작동하며 문제를 이해하거나 질문을 던지는 데 어려움을 겪지 않았다. 또한 질문을 입력하는 것보다 자연스럽게 휴대폰에 이야기하고 원하는 답변을 얻을 수 있다는 점에서 기존 방식과 차별화된다.
영화 'Her'의 '사만다'처럼?
자연스러운 대화가 가능한 챗GPT는 마치 영화 'Her' 속 인공지능 사만다와 같은 순간을 연출한다. 무료로 제공되는 휴대폰 및 데스크탑 앱 출시로 많은 사람들이 곧 'Her'와 비슷한 경험을 할 수 있을 것으로 보인다.
이번 음성과 시각 자료에 걸친 인상적인 데모는 일부에 불과할 수 있다. GPT-4o가 다양한 환경에서 전반적인 성능과 일상적인 성능을 얼마나 잘 수행하는지는 두고 봐야한다. 챗GPT-4o가 앞으로 어떻게 발전할지, 그리고 인공지능 가상비서의 미래는 어떻게 진행될지 무척 기대되는 시점이다.