구글은 I/O 2024 개발자 컨퍼런스에서 데이터 센터용 6세대 텐서 처리 장치(TPU) '트릴리움(Trillium)'을 공개했다. 구글은 오랜 기간 AI 혁신에 앞장서 왔으며, 10년 넘게 GPU 분야 선구자로 자리매김해 왔다.
4.7배 성능 향상, 두 배 메모리 대역폭, 67% 에너지 효율 향상
트릴리움은 5세대 TPU 대비 칩당 컴퓨팅 성능이 4.7배 향상되었다. 이는 칩의 행렬 곱셈 장치(MXU)를 개선하고 전체 클럭 속도를 높여 달성했다. 또한, 메모리 대역폭은 두 배로 늘어났다.
트릴리움은 구글의 3세대 스파스코어(SparseCore) 기술을 적용했다. 이 기술은 "고급 랭킹 및 추천 작업에서 일반적으로 사용되는 대규모 작업을 위한 맞춤형 가속기"로 설명된다. 이를 통해 트릴리움 TPU는 모델 학습 속도를 높이고 모델 제공 시 지연 시간을 줄일 수 있다.
에너지 효율 또한 트릴리움의 주요 특징이다. 구글은 트릴리움을 "지금까지 가장 에너지 효율적인" TPU라고 강조했다. 이는 AI 칩에 대한 수요가 끊임없이 증가하고 있으며, 이는 상당한 환경 영향을 미칠 수 있다는 점을 고려할 때 특히 중요하다. 구글은 트릴리움의 에너지 효율이 이전 세대 대비 67% 향상되었다고 주장한다.
'트릴리움', 고급 랭킹 및 추천 작업 속도 향상
트릴리움은 고급 랭킹 및 추천 작업에서 사용되는 대규모 모델을 학습하고 제공하는 데 특히 유용하다. 이는 검색 결과, 뉴스 피드, 추천 상품 등을 개선하는 데 사용될 수 있다.
트릴리움은 아직 출시 날짜가 정해지지 않았지만, 올해 말에 출시될 예정이다.
트릴리움의 출시는 AI 분야에서 중요한 이정표이며, 구글의 기술 리더십을 강화하는 데 기여할 것으로 기대된다.