AI 뉴스목록
-
OpenAI, 최신 콘텐츠 제작 도구 '소라' 홍보위해 할리우드 공략OpenAI가 최근 몇 달 동안 할리우드 스튜디오와 미디어 업계, 연예기획사 등을 적극 공략하고 있다는 보도가 나왔다. OpenAI의 목표는 최신 콘텐츠 제작 도구인 '소라'가 영화 제작에 유용하다는 것을 설득하는 것이다. OpenAI, 할리우드 스튜디오에 '소라' 공략…영화 제작에 인공지능 도입? 블룸버그 통신은 OpenAI가 다음 주 로스앤젤레스에서 "할리우드 스튜디오, 미디어 간부, 연예기획사" 등과 회의를 더 진행할 계획이라고 전했다. 이는 이미 여러 차례 회의가 이루어졌다는 소식통의 말을 바탕으로 한 내용이다. 또한 보고서는 OpenAI의 CEO인 샘 알트먼이 오스카 시상식 주말에 로스앤젤레스에서 여러 파티에 참석했다고 언급한다. 다만 샘의 파티 참석이 '소라' 홍보와 관련이 있는지는 밝혀지지 않았다. OpenAI가 할리우드와 어떤 논의를 했는지는 정확히 알려지지 않았다. OpenAI 대변인은 블룸버그의 질문에 대해 "OpenAI는 반복적인 배포 과정을 통해 업계와 협업하는 전략을 가지고 있다. 이는 안전한 실행을 보장하고 사람들에게 미래 가능성을 제시하기 위해 단계적으로 인공지능 기술을 발전시키는 것이다. 예술가와 크리에이터들과 지속적인 대화를 기대한다"고 막연하게 답변했다. 인공지능 vs. 인간: '소라' 할리우드 일자리 위협 OpenAI가 이른바 크리에이터들과의 "대화"를 기대하고 있다면, 크리에이터들은 반드시 반가워하지 않을 수 있다. 인공지능은 작가, 배우, 특수 효과 제작자들을 대체하는 데 사용될 수 있다는 우려가 할리우드 전역에 퍼져 있으며, 이는 정당한 이유가 있다. 실제로 인공지능은 작년 할리우드 시나리오 작가 파업 협상에서 중요한 역할을 했다. 아직 공개되지 않은 OpenAI의 '소라'는 지난 달 앱으로 생성된 몇 가지 영상을 공개했다. 이 영상들은 뛰어난 시각 효과를 칭찬하는 사람들과 비웃는 사람들로 SNS 상에 뜨거운 화제가 되었다.
-
유엔, 세계 최초 AI 윤리 원칙 만장일치로 채택3월 21일(현지 시각) 유엔 총회는 세계 최초의 인공지능(AI) 윤리 원칙을 만장일치로 채택했다고 로이터가 보도했다. 이번 결의안은 개인정보 보호 강화, 윤리적 개발 및 사용 촉진, 잠재적 위험에 대한 긴밀한 감시 등을 목표로 한다. 미국이 제안한 이 결의안은 중국을 포함해 122개국들의 지지를 받았다. 법적 구속력은 없지만 업계 환영 결의안은 법적 구속력이 없지만, 인공지능 업계에서는 폭넓은 지지를 받고 있다. 마이크로소프 부회장 브래드 스미스(Brad Smith)는 "우리는 유엔의 포괄적인 인공지능 결의안 채택을 완전히 지지한다. 오늘의 합의는 윤리적이고 지속적인 인공지능 개발을 위한 국제적 틀을 마련하는 중요한 발걸음이며, 이 기술이 모든 사람들의 필요를 충족하도록 보장할 것"이라고 밝혔다. 안전하고 신뢰할 수 있는 인공지능 개발 목표 "안전하고 신뢰할 수 있는 인공지능 시스템을 통한 지속 가능한 발전의 기회 포착"이라는 제목의 이번 결의안은 3개월 간의 협상 끝에 만들어졌으며, 이해관계자들은 국제 협력의 수준에 만족감을 표시하고 있다. 한 미국 정부 고위 관리는 로이터와의 인터뷰에서 " 빠르게 변화하는 기술과 함께 험난한 해를 헤쳐나가고 있다. 따라서 우리의 가치에 따라 나아가는 것이 중요하다. 이는 인공지능에 대한 최초의 진정한 세계적 합의 문서라는 점에서 중요하다"고 밝혔다. 인공지능 악용 방지 노력 이번 결의안은 유엔이 말하는 인권과 기본 자유를 위협할 수 있는 무책임하거나 악의적인 인공지능 시스템 적용의 위험을 다루고자 한다. 앞서 챗GPT와 GPT-4 출시 이후 전 세계 정부들은 인공지능 개발 궤도에 영향을 미치기 위한 노력들을 펼쳐왔고, 일부 기술 업계 관계자들은 지난해 전 세계적인 캠페인을 통해 엄청난 열기를 띄우기도 했다. 비평가들은 인공지능이 민주주의 과정을 약화시키거나 사기 행위를 증폭시키거나 심각한 실업 유발에 기여할 수 있다고 우려한다. 미래의 인공지능 발전 방향 설정 유엔은 새로운 결의안을 통해 모든 회원국이 참여하는 진정한 "글로벌" 합의라고 강조했지만, 실제로는 최초의 다국적 인공지능 협정은 아니었다. 최초의 다국적 인공지능 협정은 영국의 첫 번째 인공지능 서밋에 참석한 28개국이 11월 서명한 '블레츨리 선언(Bletchley Declaration)'으로 보인다. 또한 11월에는 미국, 영국 등 여러 국가들이 악의적 행위자의 악용으로부터 보호하기 위해 "설계부터 안전한" 인공지능 시스템 개발에 초점을 맞춘 합의를 발표했다. 유럽은 인공지능 규제를 위한 잠정 합의를 통해 천천히 발전하고 있으며 세계 최초의 종합적인 인공지능 규제를 구현하는 데 가까워지고 있다. 반면, 미국 정부는 아직 인공지능 규제와 관련된 입법 조치에 대한 합의가 이루어지지 않은 상태다. 바이든 행정부는 국가 안보를 강화하면서 인공지능 위험을 완화하기 위한 조치를 옹호하고 있다. 결론적으로 유엔의 새로운 인공지능 윤리 원칙 채택은 인공지능 개발과 활용에 대한 국제적 협력을 강화하는 중요한 발걸음이다. 이 결의안은 인공지능 기술의 혜택을 누리면서 동시에 인권과 사회적 가치를 보호하는 데 기여할 것으로 기대된다.
-
OpenAI의 슈퍼 언어 모델 GPT-5, 이번 여름 출시 예정OpenAI의 차세대 텍스트 생성 AI ‘GPT-5’가 이번 여름 출시될 것으로 예상된다. 비즈니스 인사이더(Business Insider)에 따르면 OpenAI는 몇 달 안에 새로운 대형 언어 모델(LLM)인 GPT-5를 출시할 예정이라고 한다. 게다가 GPT-5 데모 버전을 사용해 본 일부 기업 고객들은 GPT-4에 비해 훨씬 뛰어나다고 평가했다. 한 CEO는 인터뷰에서 “정말 훌륭하다. 기존 모델과는 비교할 수 없을 정도로 발전했다.”고 말했다. 하지만 아직은 윤리적·안전상의 문제점을 파악하기 위한 적대적 테스트(red-teaming)가 진행 중이라고 한다. 이 테스트 결과가 최종 출시 시점을 결정하는 중요한 요소가 될 것이다. 텍스트 생성 AI 경쟁 시대 열리다 OpenAI의 챗GPT 덕분에 구글, 마이크로소프트, 메타, 암페어 등 주요 기술 기업들이 일반 사용자를 위한 텍스트 생성 도구 개발에 뛰어들었다. 구글의 제미나이는 자체 챗봇과 지메일, 구글 문서와 같은 다른 제품의 업무 관련 도구에 활용되고 있는 경쟁 제품이다. OpenAI의 주요 투자자인 마이크로소프트는 GPT-4를 기반으로 워크스페이스 앱과 윈도우 11 기능을 위한 가상 비서 역할을 하는 텍스트 생성 서비스 ‘코파일럿’을 개발했다. 최근 구글은 갤럭시와 픽셀뿐만 아니라 아이폰에도 제미나이 기능을 추가하기 위해 애플과 논의 중이다. GPT-5에 대한 기대치 높아… 막강한 경쟁 속 개발 다가오는 GPT-5 모델에 대한 기대치는 매우 높다. 최근 렉스 프리드먼(Lex Fridman)과의 팟캐스트 인터뷰에서 OpenAI CEO인 샘 알트먼(Sam Altman 은 “GPT-4는 좀 떨어지는 것 같다”고 말하며 “GPT-5와 GPT-4의 차이는 GPT-4와 GPT-3의 차이만큼 클 것”이라고 기대감을 높였다. 그는 “우리는 몇 년 앞의 미래를 살고 있으며, 지금 우리가 가지고 있는 도구는 몇 년 뒤 돌아보면 쓸모없는 것처럼 느껴질 것이기 때문에 미래를 더 좋게 만들어야 한다는 책임이 있다.”라고 덧붙였다. 알트만은 GPT-5의 정확한 출시 시점이나 명칭까지는 밝히지 않았지만 “올해 놀라운 새로운 모델을 출시할 것”이라고만 확인했다. 그는 또한 핵심 기술적인 부분이 최종 제품의 모습을 결정하는 데 매우 중요하다고 언급했다. OpenAI의 성과와 함께 떠오르는 윤리적 문제 OpenAI는 ‘소라’라는 영상 제작 인공지능과 같은 다양한 성과를 보여주었지만 이와 함께 논란도 빠르게 일고 있다. OpenAI는 소라의 훈련 데이터에 대한 정보를 공개하지 않고 있어 크리에이터들은 자신들의 데이터가 허락 없이 사용되었는지 의심하고 있다. OpenAI는 뉴욕 타임스, 더 인터셉트, 로스토리, 알터넷 등 언론사로부터 저작권 침해 소송을 당하고 있다. 또한 OpenAI는 비영리 조직이지만 일부 수익 창출 활동을 하고 있어 논란이 되고 있다. 일론 머스크는 OpenAI가 실제로 비영리 조직이 아님을 주장하며 소송을 제기하기도 했다.
-
구글, 인공지능으로 7일 앞선 홍수 예보 실현구글은 최근 인공지능(AI)을 활용하여 최대 7일 앞선 하천 홍수를 정확하게 예측하는 기술 개발에 성공했다고 밝혔다. 이 연구 결과는 권위있는 학술지 네이처(Nature)에도 게재되었다. 홍수는 전 세계에서 가장 빈번하게 발생하는 자연 재해이기 때문에 조기 경보 시스템의 발전은 매우 중요하다. 기존 홍수 예보의 한계 극복 기존 홍수 예측은 대부분 하천에 유량 측정기가 설치되지 않아 한계가 있었다. 구글은 이러한 문제를 해결하기 위해 과거 홍수 기록, 수위 측정값, 지형 고도 데이터 등 모든 관련 데이터를 이용하여 머신 러닝 모델을 훈련했다. 이후 해당 지역에 맞게 수십만 개의 시뮬레이션을 실행하여 정확한 홍수 예측 모델을 개발했다. 전 세계 홍수 예보 확대 목표 현재 구글의 인공지능 기반 홍수 예측 모델은 특정 지역에 매우 정확하게 적용되지만, 이 기술을 이용하여 향후 전 세계적인 홍수 예보 문제를 해결하고자 한다. 일부 홍수는 최대 7일까지 예측에 성공했지만, 평균 예측 시간은 5일 정도이다. 하지만 구글은 기존의 전 세계적인 홍수 실시간 예보 정확도를 0에서 5일까지 획기적으로 향상시켰다고 강조했다. 특히 아프리카와 아시아 일부 지역과 같이 홍수 예보 인프라가 부족한 지역에서도 예측 정확도가 크게 향상되었다. 홍수 피해 예방 위한 노력 현재 구글의 인공지능 기반 홍수 예측 모델은 80개국, 총 4억 6천만 명의 인구에게 정확한 홍수 예보 정보를 제공하고 있다. 이 정보는 구글 검색, 구글 지도, 안드로이드 알림을 통해 제공되며, 2022년부터 운영되고 있는 구글 자체 홍수 정보 플랫폼 '홍수 허브(Flood Hub)'에서도 확인할 수 있다. 구글은 앞으로도 지속적으로 머신 러닝을 활용하여 더욱 정확한 홍수 예측 모델 개발에 힘을 쏟을 것이며, 학계 연구자들과 협력하여 인공지능 기반 홍수 예보 시스템을 개선할 계획이다. 이러한 노력을 통해 구글은 결국 전 세계적인 홍수 예보 플랫폼 구축을 목표로 하고 있다.
-
인공지능, 인간 능가 시대 5년 앞으로 다가온다! 엔비디아 CEO 젠슨 황의 과감한 예측엔비디아의 젠슨 황 CEO는 최근 개최된 GTC 개발자 컨퍼런스에서 인공일반지능(AGI; Artificial General Intelligence)에 대한 질문 공격에 지겨워했다. 특히 과장된 언론 보도들이 인공지능 전문가들을 "인류 종말" 시나리오로 몰아붙이는 것에 그는 불편감을 나타냈다. 5년 안에 인공일반지능? 과장된 희망인가, 현실적인 목표인가? 하지만 황 CEO는 인공일반지능에 대한 자신의 생각을 공유했다. 그는 "인공일반지능이 무엇을 의미하는지 정확히 정의한다면 5년 안에 가능하다"고 말했다. 인공일반지능 능력을 객관적으로 평가하는 방법으로 사법시험, 논리 테스트, 경제 테스트, 의대 진학 시험 등을 제안했다. 인공지능 환각 해결 방법은? 기자와의 질문답변 시간에는 '인공지능 환각' 문제에 대한 질문도 나왔다. 인공지능은 때때로 실체가 없는 그럴듯한 답변을 만들어내는 문제가 있는데, 황 CEO는 이는 쉽게 해결할 수 있다고 강조했다. 그는 "인공지능이 답변하기 전에 반드시 자료를 검토하도록 해야 한다"고 말했다. 이를 위해 '검색증강 생성(Retrieval-augmented generation)'이라는 방법을 제안했다. 기본적인 미디어 리터러시와 유사한 이 방법은 정보 출처와 맥락을 확인하고, 사실 관계를 검토하는 것이다. 희망적 전망과 함께 남은 과제 황 CEO의 발언은 긍정적인 전망이지만 여전히 해결해야 할 과제들이 많다. 인공지능의 윤리적 사용, 의사 결정 과정의 투명성, 그리고 잠재적인 악용 가능성 등은 지속적인 논의가 필요하다.
-
구글, 사진 하나로 움직이는 영상 만들어내는 AI '블로거' 개발! 딥페이크 시대 열릴까?구글 연구팀이 정지 사진 한 장만 있으면 영상을 만들어내는 인공지능 '블로거(VLOGGER)'를 개발했다. 이 기술은"VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis"라는 연구 논문에서 소개됐다. 정지 사진에서 움직이는 사람 만들어 내는 '블로거' VLOGGER는 최첨단 머신러닝 모델을 기반으로 사진과 음声を 입력받아 말하는 사람의 영상을 합성한다. 사람의 움직임, 제스처, 표정 등이 매우 사실적으로 재현되기 때문에 다양한 분야에 활용 가능성이 높지만, 딥페이크 제작에도 악용될 수 있다는 우려도 함께 나오고 있다. VLOGGER는 텍스트 설명만으로도 사실적인 이미지를 생성하는 기술인 '확산 모델'을 발전시켜 영상 분야에 적용한 것이다. 연구팀은 방대한 새로운 데이터셋을 사용하여 훈련함으로써 정지 사진을 놀랍도록 사실적인 영상으로 변환하는 AI 시스템을 만들어냈다. 연구팀은 "기존 연구와 달리 우리의 방법은 개별 사람별 훈련이나 얼굴 인식, 이미지 자르기가 필요하지 않다"라고 밝혔다. "또한 얼굴이나 입술만 아니라 전체적인 이미지를 생성하며 다양한 민족, 연령, 의상, 포즈 등을 고려하여 실제 사람의 소통을 정확하게 합성한다"고 덧붙였다. 성공적인 연구에는 멘토(MENTOR)라는 새로운 데이터셋 활용이 중요한 역할을 했다. 멘토 데이터셋은 80만 명 이상의 다양한 사람과 2,200시간 분량의 영상으로 구성되어 있으며, 기존 데이터셋보다 규모가 10배 이상 크다. 덕분에 VLOGGER는 인종, 나이, 의상, 포즈, 배경 등에 따른 편견 없이 사람들의 영상을 제작할 수 있다. 사실적인 영상 제작 가능… 딥페이크 악용 우려 커져 VLOGGER는 동영상을 다른 언어로 자동 더빙하거나 빠진 프레임을 편집, 채워넣는 용도로 활용될 수 있다. 또한 단순한 사진 한 장만으로도 사람의 전체 영상을 만들어낼 수 있어 배우들이 자신의 3D 모델을 제작하여 새로운 연기를 선보이는 데도 사용될 수 있다. 뿐만 아니라 가상현실과 게임에서 사실적인 아바타를 만들거나 더욱 매력적이고 표현력이 풍부한 AI 가상 비서와 챗봇을 개발하는 데도 활용 가능하다. 구글은 VLOGGER를 목소리, 제스처, 눈 contacto (컨택 - 접촉)를 통해 사람과 자연스럽게 소통하는 "구현된 대화 에이전트" 개발의 발판으로 보고 있다. 하지만 이 기술은 딥페이크 제작에도 악용될 수 있다. 딥페이크는 실제 영상 속 사람을 다른 사람의 모습으로 합성하는 기술이다. AI로 생성된 영상이 더욱 사실적이고 쉽게 제작될 수 있게 되면서 잘못된 정보와 디지털 위조 영상 문제가 더욱 심각해질 수 있다는 우려가 나온다. 다양한 분야 활용 기대… 미래에는 진짜와 가짜 구분 어려워질까? VLOGGER는 아직 한계가 있다. 생성된 영상은 비교적 짧고 배경이 정적이다. 사람들이 3D 환경에서 움직이는 모습을 만들어내는 데는 아직 이르다. 또한, 제스처와 말투는 사실적이지만 아직 실제 사람과 완벽하게 구분할 수는 없다. 하지만 VLOGGER는 AI 연구의 새로운 지평을 열었다. 연구팀은 "세 가지 다른 평가 기준을 사용하여 VLOGGER를 평가한 결과, 제안된 모델이 이미지 품질, 아이덴티티 유지, 시간적 일관성 측면에서 기존 최첨단 기술을 능가했다"고 밝혔다. 인공지능 기술의 발전 속도를 고려하면, 가까운 미래에는 AI 영상 제작 기술이 더욱 발전하여 실제 사람과 구분하기 어려울 정도로 사실적인 영상을 만들어낼 가능성이 높다. VLOGGER는 이러한 미래를 엿볼 수 있게 해주는 기술이지만, 동시에 딥페이크 악용에 대한 경각심을 일깨워주기도 한다.
-
인간 거짓말 탐지 AI 탄생! 경제적 이유로 거짓말하는 사람 걸려낼 수 있어인공지능(AI) 프로그램이 사람의 거짓말을 더 정확하게 판별하도록 돕는 새로운 훈련 도구가 개발됐다. 이 도구는 특히 모기지 신청이나 보험료 할인 신청과 같이 사람이 경제적 이익을 위해 거짓말 동기가 높은 상황에서 활용될 수 있다. 경제적 이득 관련 거짓말 판별… 인공지능의 새로운 도전 연구 논문의 공동저자인 노스캐롤라이나 주립대 경영대학 풀 칼리지 메흐메트 카너(Mehmet Caner) 교수는 "인공지능 프로그램은 개인이 얼마나 큰 규모의 모기지를 획득할 수 있을지, 또는 얼마나 저렴한 보험료를 낼 수 있을지 예측하는 등 다양한 비즈니스 상황에서 사용된다"라고 말했다. "하지만 기존 인공지능 프로그램은 통계 자료에 기반한 수학적 알고리즘만 사용하기 때문에 사람들이 모기지 승인이나 보험료 할인을 위해 거짓말을 하도록 유도할 수 있다는 문제가 있다"고 카너 교수는 지적했다. "우리는 이러한 경제적 이득을 고려하여 인공지능 알고리즘을 조정하는 방법이 있는지 연구해보고 싶었다"고 카너 교수는 설명했다. AI 훈련 데이터 개선으로 거짓말 탐지 기능 강화 연구팀은 인공지능이 스스로 예측 모델을 학습하도록 돕는 새로운 훈련 매개 변수를 개발했다. 이 매개 변수는 특히 인간 사용자의 경제적 이득 동기를 인식하고 고려하도록 설계되었다. 즉, 인공지능은 사람들이 자신의 이익을 위해 거짓말을 할 수 있는 상황을 파악하도록 훈련된다. 실제 상황을 모사하는 시험에서 변형된 인공지능은 사용자가 제공한 부정확한 정보를 더 정확하게 탐지하는 성능을 보였다. 카너 교수는 "이를 통해 사용자가 정보를 제출할 때 거짓말 동기를 효과적으로 줄일 수 있다. , 하지만 사소한 거짓말은 여전히 탐지되지 않음 상태로 남을 수 있다. '사소한 거짓말'과 '큰 거짓말' 사이의 경계가 어디인지 더 명확히 파악하기 위해 추가 연구가 필요하다."고 말했다. 인공지능 발전, ‘완벽한 거짓말’ 시대는 사라질까? 연구팀은 개발된 인공지능 훈련 매개 변수를 공개하여 인공지능 개발자들이 실험에 활용할 수 있도록 했다. 카너 교수는 "이 연구는 인공지능 프로그램을 개선하여 사람의 거짓말 동기를 줄일 수 있음을 보여준다. 앞으로 인공지능이 더욱 발전한다면 완전히 거짓말 동기를 없앨 수도 있을 것이다."라고 말했다. 이 연구 결과는 Journal of Business & Economic Statistics에 게재됐다.
-
애플, AI 경쟁에서 쌍두마차 전략 추진? 제미나이 협력과 자체 개발 병행6월 WWDC(전 세계 개발자 컨퍼런스)를 앞두고 애플의 인공지능(AI) 전략에 대한 루머가 뜨거워지고 있다. 최근 몇 가지 중요한 사실들이 공개되면서 애플이 어떤 방식으로 AI 기능을 사용자들에게 선보일지 예상할 수 있게 됐다. 제미나이와의 손잡기? 애플 AI 전략의 변화 블룸버그 보도에 따르면 애플은 구글과 자사 시스템에 구글의 제미나이 생성 AI 도구를 탑재하는 방안과 옵티피(OpenAI)의 챗GPT 도구 도입을 모두 고려하고 있다고 한다. 제미나이와의 협력이 이루어진다면 맥, 아이폰 등 애플 기기 사용 방식이 완전히 달라질 수 있지만, 규제 기관의 면밀한 감시 또한 피할 수 없을 것으로 보인다. 이번 루머는 애플의 AI 개발 노력에 대한 최근 다른 소식들과는 다소 차이가 있다. 몇 달 전부터 애플은 '아약스(Ajax)'라는 자체 개발 생성 AI 모델을 개발 중이라는 루머가 떠돌았는데, 이 모델은 애플 운영체제 내 모든 기능을 강화시킬 수 있다는 예상이 나왔었다. 페이지(Pages)부터 시리(Siri)까지 다양한 애플 앱과 서비스가 자체 AI를 탑재해 더욱 스마트해 질 것이라는 이야기였다. 하지만 블룸버그의 보도에 의하면 이러한 계획은 차질을 빚을 수도 있다. 애플이 외부 기업과 협력한다는 소식이 놀라운 이유는 또 있다. 애플은 기존에 시스템 제어에 대한 강한 지배권을 유지해 왔으며, 새로운 기능 개발도 자체적으로 추진하는 경향이 강했다. 과연 애플이 이처럼 중요한 분야의 기술 개발을 다른 회사에 맡길까? 두마리 토끼를 잡을 수 있을까? 애플의 딜레마 더욱이 애플과 구글은 수년간 경쟁 관계를 유지해 왔다. 두 회사는 매우 다른 철학을 가지고 있다. 구글은 대체적으로 속도와 성능 향상을 위해 클라우드 서비스를 선호하는 반면, 애플은 사용자 보안과 개인정보 보호를 위해 장치 내에서 작업을 진행하는 것을 중요하게 생각한다. 많은 사람들은 서로 전혀 다른 두 기술 기업이 어떻게 서로에게 이익이 되는 타협을 이끌어 낼 수 있을지 궁금해하고 있다. 하지만 애플과 구글이 이제껏 협력을 전혀 하지 않는 것은 아니다. 실제로 현재도 애플 기기에서 구글이 기본 검색 엔진으로 설정되어 있다는 점을 생각해 보자. 많은 사용자들은 iOS와 맥OS에서 기본 검색 엔진 변경이 어렵다고 불편해 한다. 하지만 이번 루머가 진짜라면 애플 자체 AI 개발이 아직 완성되지 않았다는 것을 의미한다. 완성되었다면 제미나이나 챗GPT와 같은 외부 서비스를 이용할 필요가 없을 것이기 때문이다. 애플은 AI 경쟁에서 더욱 뒤쳐지고 싶지 않지만 자체 모델 개발에 충분한 시간이 없는 상황인 것 같다. 그렇다면 제미나이가 아이폰에 도입된다면 어떤 기능을 제공할까? 블룸버그 기자 마크 거먼은 제미나이의 AI 기능이 "이론적으로 시리와 다른 앱에 통합될 것"이라고 예상한다. 한편 애플 자체 AI는 "사용자에게 사전 예측 정보를 제공하고 사용자 대신에 백그라운드에서 작업을 수행하는 데 집중할 것"이라고 한다. 애플이 제미나이를 선택한다면 시리에 큰 힘을 실어줄 수 있으며, 경쟁 서비스들과 어깨를 나란히 할 수 있을 것으로 기대된다. 현재 시리와 챗GPT와 같은 생성 AI 사이에는 엄청난 격차가 존재한다. 미래는 어둡다? 애플 AI의 불확실한 전망 흥미롭게도 애플은 자체 생성 AI 모델 개발에 투자하고 있다. 최근 공개된 애플 연구 논문에 따르면, 애플 자체 AI는 텍스트와 이미지 데이터를 기반으로 학습되었으며, 다양한 기준에서 "최첨단 소량 데이터 학습 결과"를 달성했다고 한다. 'MM1'이라는 이름의 이 모델은 사용자의 많은 입력 없이도 심층적인 다단계 추론을 수행할 수 있다. 애플은 또한 이미지 설명과 자연어 의미 분석에서도 인상적인 성능을 보인다고 주장한다. 하지만 애플이 구글과 제미나이 협력을 추진하는 것을 보면, 이러한 기술의 상용화는 아직 시간이 걸릴 것으로 보인다. 거먼은 애플이 WWDC에서 제미나이와의 협력을 발표하지 않을 것으로 예상하지만, 올해 말에는 발표될 가능성이 있다고 말한다. 그렇다면 자체 AI 모델 '아약스'의 출시는 더욱 늦춰질 수밖에 없을 것이다. 그렇다면 애플은 언제까지 제미나이에 의존할 계획인가? 규제 문제와 개인정보 보호 문제가 불거져 나올 가능성이 높기 때문에 애플은 조만간 자체 AI 모델 '아약스'로 전환할 필요가 있을 것이다. 하지만 '아약스'가 실제로 언제 완성될지는 누구도 알 수 없다.
-
안드로이드폰에 탑재되는 제미나이 AI의 차세대 기능은? 웹 요약 기능 탑재 예상최근 스마트폰과 앱에는 인공지능(AI) 기능이 속속 등장하고 있다. 구글의 제미나이 모델이 이러한 변화를 앞장서고 있으며, 이제 차세대 안드로이드 스마트폰용 제미나이 기능에 대한 중요한 정보가 나왔다. 안드로이드 코드 분석: 크롬 웹 요약 기능 탑재 예상 IT 매체 Android Authority에 따르면, 스마트폰에서 로컬로 실행되도록 설계된 소형 제미나이 나노 AI 모델은 크롬 웹사이트 기사 요약 기능을 갖게 될 것으로 예상된다. 안드로이드 코드에 숨겨진 몇 가지 단서를 바탕으로 추측된 내용이다. 하지만 현재 구글 앱의 실험적인 검색 생성 경험(SGE) 기능에 등록했다면, 제미나이 AI는 이미 이와 같은 기능을 수행할 수 있다. 하지만 구글 나노는 웹과 통신하지 않고 로컬에서 모든 처리를 한다는 차이점이 있다. 예를 들어, 이 기사를 안드로이드 스마트폰에서 열었다면 몇 줄 길이의 요약본을 볼 수 있을 것이다. 물론 기사의 전체 내용을 읽는 것을 추천하지만, 요약본을 선택할 수 있는 옵션이 생길 것이다. 하지만 이 기능이 언제 출시될지는 아직 명확하지 않다. 더 빠른 처리 속도와 개선된 개인정보 보호 이 기능은 특히 인터넷 연결 상태가 좋지 않은 경우에도 성능을 보여줄 것이며, 구글 서버와의 데이터 전송량도 줄어들 것이다. 현재 제미나이 나노는 구글 픽셀 8 프로와 삼성 갤럭시 S24 휴대폰에서 사용할 수 있으며, 향후 더 많은 기종에 적용될 것으로 예상된다. 제미나이 나노는 이미 픽셀 8 프로의 픽셀 레코더 앱에서 제공되는 음성 녹음 AI 요약 기능과 갤럭시 S24 스마트폰에서 메시지 작성을 도와주는 매직 컴포즈 기능 등을 지원하고 있다. 나노 버전의 제미나이는 모바일 기기에서 실행되도록 설계되었기 때문에 다른 버전에 비해 크기가 작고 기능이 제한적이다. 이는 기능 자체를 제한하지만, 개인정보 보호 강화와 빠른 처리 속도라는 장점도 있다. 최근 갤럭시 S24 출시와 함께 갤럭시 AI에 대한 기사도 많았고, 앞으로도 더 많은 변화가 있을 것으로 예상된다. 5월 14일 개최되는 구글 I/O 2024 행사는 인공지능에 중점을 둘 것이며, 애플도 iOS 18에 다양한 생성형 인공지능 기능을 탑재할 것이라고 약속했다.
-
클레온, 엔비디아 GTC 2024에서 획기적인 디지털 휴먼 기술 공개디지털 휴먼 기술 분야의 선두주자인 클레온이 2024년 3월 18일부터 21일까지 진행되는 글로벌 AI 컨퍼런스인 ‘엔비디아 GTC’에서 최신 혁신 기술을 공개한다. 이번에 공개하는 기술은 인간과 같은 다양한 감정을 표현하고 대화가 가능한 ‘디지털 휴먼’으로, 엔비디아 기술을 기반으로 2년 이상 진행한 연구 개발의 결과물이다. 이 기술은 2024년 상반기 출시 예정인 클레온의 실시간 대화형 디지털 휴먼 채팅 솔루션인 ‘크리챗’에 적용된다. 크리챗은 유명인 IP와 클레온의 기술을 결합한 디지털 휴먼과 사용자와 음성 및 영상을 통해 실제와 같은 대화를 나눌 수 있는 앱이다. 클레온은 감정 데이터를 기반으로 자연스러운 표정과 움직임 구현에 주력하며 디지털 휴먼 기술의 선두에 서 왔다. 클레온은 특히 엔비디아 A2F (Audio2Face) 애플리케이션을 활용해 디지털 휴먼의 미묘한 감정 표현을 구현하는 데 성공했으며, 이외에도 엔비디아의 최첨단 GPU와 전문 기술을 활용해 이 분야에서 상당한 발전을 이뤘다. 클레온은 기술 발전을 통한 산업 혁신적인 스타트업 육성 프로그램인 ‘엔비디아 인셉션’의 멤버이기도 하다. 이 프로그램은 클레온의 감정 데이터를 기반으로 다양한 표정과 움직임을 표현하는 디지털 휴먼 개발을 위한 연구, 리소스 및 협업 혁신을 지원하고 있다. 사진 한 장과 30초 분량의 음성 데이터로 디지털 휴먼을 생성하는 클레온의 핵심 기술은 생성 AI 분야에서의 중요한 도약을 의미한다. 지난해 11월 클레온은 세계 최초로 ‘헤드스왑’ 기술을 상용화해 이를 자체 개발한 디지털 휴먼 영상 제작 솔루션인 ‘클론’에 완벽하게 통합하는데 성공했다. 헤드스왑은 사람의 얼굴을 포함한 전체 두상 이미지를 원하는 대상의 두상으로 교체하는 기술이다. 클레온 ‘헤드 스왑’ 기술의 핵심은 단 한 장의 얼굴 사진만으로 얼굴형, 머리카락, 피부 질감까지 얼굴 특징과 구조를 자동 인식하고, 이 정보를 바탕으로 고도의 정밀한 디지털 휴먼을 생성한다는 점이다. 이를 통해 디지털 휴먼 제작 시간과 비용을 크게 줄일 수 있다. 클레온이 엔비디아 GTC에서 그간의 연구 결실을 공개할 준비를 하면서 업계의 기대감이 커지고 있다. 엔터테인먼트, 교육, 상담 등 감정 표현이 가능한 디지털 휴먼에 대한 시장성은 점점 더 확대되고 있으며, 잠재력은 무궁무진하다. 강지수 클레온 CRO는 “엔비디아 기술 기반의 개인화된 디지털 휴먼 구현은 단순 기술 개발의 수준이 아니라 업계를 선도하는 기업임을 보여주는 것”이라며 엔비디아와의 2년여 간의 연구 여정에 자부심을 드러냈다.
많이본뉴스
많이 본 뉴스
- 1LEGO 레트로 라디오, 라디오 기능 없이 눈길만 사로잡아!
- 2하데스 2 정복 가이드: 초보 플레이어 위한 핵심 팁
- 3에이수스, 휴대용 게임 PC 최신 모델 “ROG Ally X” 발표
- 4GTA 6, 락스타 웹사이트에 등장 후 사라져! 5월 16일 발표 예상?
- 5닌텐도 스위치 2, 성능 유출? 12GB RAM, 8인치 디스플레이 예상
- 6구글 크롬, “서클 투 서치” 도구 탑재? 이미지 보고 바로 검색
- 7윈도우 11 스크린샷 도구, QR 코드 스캔 및 이모티콘 지원 추가!
- 8구글 I/O 2024, 안드로이드 15와 제미나이 AI 등 새로운 기능 공개 예상
- 9"기계 vs 인간" 암시? 애플, 논란의 여지가 있는 아이패드 프로 광고 사과
- 10엑스박스, 모바일 게임 스토어 7월 출시! 모든 기기에서 이용 가능