구글은 I/O 2024 개발자 컨퍼런스에서 '프로젝트 아스트라(Project Astra)'라는 새로운 AI 기능을 공개했다. 이 프로젝트는 스마트폰 카메라와 인공지능을 활용하여 일상 속 문제 해결을 돕는다.
실시간 정보 처리로 일상 도움
프로젝트 아스트라는 뷰파인더를 기반으로 하는 앱 형태이다. 사용자가 카메라를 사무실 주변으로 돌리면서 "소리가 나는 것 알려줘"라고 말하면, 아스트라 AI가 "스피커가 보여요. 소리를 내는 거죠"라고 응답한다. 사용자가 스피커 부분을 가리키면 "저건 트위터라고 해요. 고주파 사운드를 내는 부분이죠"라고 세밀하게 설명해준다.
프로젝트 아스트라는 단순한 물체 인식뿐 아니라 창의적인 질문에도 응답한다. 예를 들어 테이블 위 크레용을 가리키면 "색채로 가득찬 창작을 만들 크레용이군요" 라고 시적인 표현을 답변한다.
기록 정보 활용하여 잊어버린 물건 찾기
더욱 놀라운 점은 프로젝트 아스트라가 시야 밖에 있는 물건도 찾을 수 있다는 것이다. 사용자가 "안경 봤던 곳 기억해?"라고 물으면 "빨간 사과 옆 책상에 있었어요"라고 정확하게 답변한다.
이처럼 아스트라는 실시간 영상과 음성 정보를 처리하는 동시에 기록된 정보를 활용한다. 따라서 시야 밖에 있던 안경도 이전에 본 정보를 바탕으로 위치를 추측할 수 있다.
AI 안경 착용 시 시각적 정보 활용
프로젝트 아스트라 영상 후반부는 가상의 AI 안경을 착용한 시점을 보여준다. 안경 카메라가 칠판 다이어그램을 인식하고 "시스템 속도 향상 위해 뭘 추가할 수 있을까?"라는 질문에 "서버와 데이터베이스 사이에 캐시 추가하면 속도 빨라질 수 있어요"라고 답변한다.
사용자가 칠판에 그려진 고양이 그림을 보면서 "이게 뭘 떠올리게 해?"라고 묻자 아스트라는 "슈뢰딩거의 고양이"라고 대답한다. 또한 장난감 호랑이와 골든 리트리버를 가리키면 "이 둘에게 밴드 이름 좀 지어줘"라는 요청에 "황금 줄무늬(Golden Stripes)"라고 답변한다.
프로젝트 아스트라의 기술
데미스 하사비스 구글 딥마인드 CEO는 "프로젝트 아스트라의 에이전트는 연속적으로 비디오 프레임을 인코딩하고, 비디오와 음성 입력을 이벤트 타임라인으로 결합하며, 효율적인 정보 복원을 위해 이를 캐싱하여 빠르게 정보를 처리하도록 설계됐다"고 설명했다.
출시 시기와 향후 전망
프로젝트 아스트라는 아직 초기 단계에 있으며 출시 계획은 명확하지 않다. 하지만 하사비스 CEO는 미래에 이러한 에이전트들이 "휴대폰이나 안경을 통해" 사용될 수 있다고 언급했다. 이 안경이 실제 상품인지 구글 글래스의 후속 제품인지는 아직 알 수 없지만, 하사비스 CEO는 "일부 기능은 올해 하반기 제미나이 앱 등 구글 제품에 적용될 예정"이라고 밝혔다.