구글은 개발자 컨퍼런스 I/O에서 인공지능 모델 제미나이 그룹의 업그레이드를 발표했다. 이번에 공개된 '제미나이 1.5 플래시'는 속도와 효율성을 최적화한 새로운 모델이다.
텍스트 요약, 채팅봇, 이미지 캡션 생성 등 다양한 활용
데미스 하사비스(Demis Hassabis) 구글 딥마인드 연구소(DeepMind) CEO는 블로그 포스트에서 "제미나이 1.5 플래시는 요약, 채팅 응용 프로그램, 이미지 및 비디오 캡션, 문서 및 표 데이터 추출 등에 탁월하다"고 밝혔다.
하사비스는 개발자들이 2월 발표된 제미나이 프로보다 더 가볍고 저렴한 모델을 필요로 하기 때문에 제미나이 1.5 플래시를 개발했다고 덧붙였다. 제미나이 1.5 프로는 작년 발표된 기존 제미나이 모델보다 더 효율적이고 강력하다.
기존 프로 모델보다 가볍고 저렴, 성능 유사
제미나이 1.5 플래시는 구글 최소형 모델인 제미나이 1.5 나노와 제미나이 1.5 프로 사이에 위치한다. 나노는 기기에서 로컬로 실행되는 반면, 플래시는 프로보다 가볍지만 동등한 성능을 가진다.
1500페이지 문서 분석, 3만 줄 코드 이해 가능
구글은 '증류(distillation)'라는 과정을 통해 프로의 가장 필수적인 지식과 기술을 플래시에 전달하여 가벼운 모델에도 강력한 성능을 구현했다. 이를 통해 플래시는 프로와 동일한 다중 모달(multimodal) 기능과 100만 토큰의 긴 컨텍스트 윈도우(텍스트 양)를 활용할 수 있다. 즉, 플래시는 1500페이지 문서 또는 3만 라인 이상의 코드베이스를 한 번에 분석할 수 있다.
하지만 제미나이 1.5 플래시는 일반 사용자를 위한 것이 아니다. 개발자들이 구글 기술을 사용하여 자체 인공지능 제품과 서비스를 구축하는 데 더 빠르고 저렴한 방법을 제공한다.
플래시 출시와 더불어 구글은 제미나이 1.5 프로도 업그레이드했다. 코드 작성, 추리, 오디오 및 이미지 분석 기능이 향상되었다고 밝혔다. 하지만 가장 큰 업그레이드는 올해 말 프로의 컨텍스트 윈도우를 기존 2배인 200만 토큰으로 늘린다는 발표였다. 이를 통해 프로는 2시간 분량의 동영상, 22시간 분량의 오디오, 6만 라인 이상의 코드, 140만 단어 이상의 텍스트를 동시에 처리할 수 있게 된다.
제미나이 1.5 플래시와 프로는 현재 구글의 AI 스튜디오와 버텍스 AI에서 공개 프리뷰로 이용할 수 있다. 또한 구글은 오늘 개방형 모델 제마 2 출시도 발표했지만, 이 업데이트는 인공지능 앱과 서비스 개발을 좋아하는 개발자 또는 전문가를 위한 것이 일반 사용자 대상은 아니다.