AI 뉴스목록
-
삼성SDS, 기업 맞춤형 생성형 AI 서비스 본격 출시… "하이퍼오토메이션 시대 열다"삼성SDS는 2일 잠실캠퍼스에서 기업 맞춤형 생성형 AI 서비스 'FabriX(패브릭스)'와 'Brity Copilot(브리티 코파일럿)'의 본격 출시를 선언하며, 기업의 하이퍼오토메이션(Hyper-automation) 시대를 도입한다고 밝혔다. 황성우 대표이사 "삼성SDS, 기업에서도 생성형 AI 서비스 혁신 시작“ 황성우 삼성SDS 대표이사는 "FabriX와 Brity Copilot의 정식 출시로 기업 업무의 하이퍼오토메이션을 돕겠다"며 "삼성 스마트폰, TV, 가전 분야에서 소비자들을 만족시켰던 AI 혁신에 이어 기업에서도 생성형 AI 서비스 혁신이 시작됐다"고 강조했다. Brity Copilot, 기업 공통 협업 업무 자동화 Brity Copilot은 기업의 공통 협업 업무를 지원하는 솔루션 'Brity Works(브리티 웍스)'에 생성형 AI 기술을 적용한 서비스다. 주요 기능으로는 영상회의 중 자막(한/영) 및 번역(13개 언어 지원), 회의록 작성 및 실행 방안 도출, 메일/메신저 대화 요약, 메일 초안 작성 등이 있다. 특히, 한국어 음성의 높은 인식 정확도(94%)와 실시간 번역 기능으로 전문 통역사 없이도 더욱 명확한 커뮤니케이션이 가능하다. Brity Automation, 업무 프로세스 자동화 Brity Automation은 RPA/BPA 등 업무 프로세스 자동화 솔루션에 생성형 AI 서비스를 결합해 복잡한 기업 업무의 모든 과정을 자동화하는 하이퍼오토메이션 솔루션이다. 자연어 대화 방식을 통해 여러 핵심 시스템에 걸친 복잡한 업무 프로세스를 사람과 AI가 협업해 해결하는 새로운 방식의 업무 자동화를 구현한다. FabriX, 기존 정보와 시스템을 생성형 AI와 연결 FabriX는 기업의 다양한 데이터와 지식자산, 업무 시스템 등 IT 자원을 생성형 AI와 연결하고, 임직원들이 손쉽게 공유하고 사용할 수 있도록 지원하는 클라우드 기반의 기업용 생성형 AI 서비스 플랫폼이다. 기업 맞춤 LLM을 통해 업종 특화 용어나 데이터를 학습하고, 기존 핵심 업무 시스템에 Copilot을 구현하는 형태로 서비스를 적용한다. 또한, 삼성 클라우드 플랫폼(SCP)을 기반으로 키워드 필터링, 데이터 및 사용자 권한 관리 등의 보안체계를 통해 강력한 데이터 보안을 구현했다. 삼성SDS, 차별화된 기업 맞춤형 생성형 AI 서비스 플랫폼으로 사업 전개 삼성SDS는 FabriX를 통해 기업의 특성에 맞는 LLM 구축, 빠르게 변화하는 생성형 AI 기술 적용, GPU 서비스 비용 삭감 등 생성형 AI 서비스를 도입하려는 기업의 고민을 단번에 해결할 수 있다고 강조했다. 특히 수많은 임직원들이 동시에 안정적으로 FabriX를 사용하고 데이터 학습 등을 할 수 있도록 효율적인 GPU 서비스도 제공한다. 삼성SDS 구형준 클라우드서비스사업부장(부사장)은 “FabriX는 현재 10만 명이 사용하고 있는 국내 최대 규모의 기업용 생성형 AI 서비스 플랫폼”이라고 강조하며 “앞으로도 이를 체계적으로 발전시키면서 차별화된 기업 맞춤형 생성형 AI 서비스 플랫폼으로 사업을 전개해 나갈 것”이라 밝혔다.
-
구글에 대한 부러움? 마이크로소프트, OpenAI 투자 배경은 '인공지능 경쟁'최근 미국 정부의 구글 반독점 소송 관련 자료 공개를 통해, 마이크로소프트의 인공지능 연구소 OpenAI 투자 배경이 드러났다. 공개된 자료에 따르면, 마이크로소프트는 구글의 빠른 인공지능 기술 발전에 위기감을 느끼고 있었다. 구글의 인프라 우월함 인정 특히 사티아 나델라 CEO는 2019년 내부 메일에서 케빈 스콧 CTO의 우려를 전달하며 "OpenAI 투자가 필요한 이유"와 "인프라 구축의 중요성"을 강조했다. 스콧 CTO는 구글의 급격한 인공지능 발전에 대해 "매우 걱정된다"며, 초기에는 구글의 알파고 모델과 같은 인공지능 게임 개발을 과소평가했다고 언급했다. 하지만 구글이 인공지능 모델 훈련을 위한 뛰어난 인프라를 구축한 뒤 자연어 처리 모델인 'BERT-large'를 개발하는 것을 보고 위협감을 느끼게 되었다고 밝혔다. 또한 스콧 CTO는 구글의 지메일 자동완성 기능과 같은 인공지능 활용 사례를 칭찬하며, 마이크로소프는 "기계 학습 규모 측면에서 경쟁 업체보다 몇 년 뒤쳐져 있다"고 솔직하게 인정했다. 스콧 CTO는 마이크로소프트의 머신러닝 팀은 "매우 똑똑한" 인재들로 구성되어 있지만, 규모와 자원 제약으로 인해 능력을 제대로 발휘하지 못하고 있다고 지적했다. OpenAI에 10억 달러 투자 결과적으로 마이크로소프트는 스콧 CTO의 우려를 받아들여 2019년 OpenAI에 10억 달러를 투자했다. 현재까지 총 130억 달러를 투자하며 OpenAI와의 협력을 통해 인공지능 개발을 가속화하고 있다. 인공지능은 놀라운 성과를 내지만, 노동 시장을 파괴하고 기존의 잘못된 정보 유포 문제를 더욱 악화시킬 수 있다는 우려도 있다. 앞으로 마이크로소프트와 구글의 인공지능 경쟁이 어떤 방향으로 전개될지 주목된다.
-
앤트로픽, 대규모 언어 모델 클로드 모바일 앱 출시 및 팀 플랜 공개앤트로픽은 클로드 AI 모델의 iOS 앱을 출시하고 그룹 사용자들이 모델에 대한 접근 권한을 공유할 수 있도록 두 번째 유료 요금제를 추가했다. 모바일 앱으로 챗봇 및 이미지 분석 가능 클로드 모바일 앱은 챗봇 역할을 할 수 있으며, 사용자는 "이미지 분석"을 위해 사진을 앱에 직접 업로드할 수 있다. 이전에는 클로드를 앤트로픽의 Claude.ai 웹사이트 및 아마존 베드락, 허깅페이스, 마이크로소프트 애저와 같은 타사 모델 라이브러리에서만 사용할 수 있었다. 앤트로픽 제품 관리자 스콧 화이트(Scott Whit)는 많은 클로드 사용자가 모바일 웹을 통해 AI 모델에 접근하고 있다고 말했다. 이에 따라 앤트로픽은 Claude.ai의 앱 버전을 제공하기로 했다. 그는 또한 앤트로픽이 곧 안드로이드 버전도 출시할 것이라고 말했다. 앤트로픽, 모바일 앱 출시 지연 하지만 앤트로픽은 모바일 앱 출시가 다소 지연되었다. 경쟁사인 오픈AI의 챗GPT는 이미 모바일 앱을 운영하고 있으며, 구글의 제미나이는 아이폰 사용자를 위한 구글 앱과 안드로이드를 위한 자체 앱에서 찾을 수 있다. AI 검색 플랫폼 퍼플렉시티도 모바일 앱을 보유하고 있다. 개인 및 팀 사용자 대상 요금제 제공 클로드 앱은 무료 사용자, 클로드 프로 구독자 및 새로운 클로드 팀 플랜을 포함한 모든 클로드 AI 모델 사용자에게 무료로 제공된다. 앤트로픽은 이번 달 출시하는 팀 플랜이 최소 5명의 그룹 구성원에게 월 $30의 가격으로 클로드 모델에 대한 접근 권한을 제공한다고 말했다. 팀 플랜 사용자는 클로드 모델 기반으로 작업을 시작할 때 다른 사용자와 공유할 수 있다. 9월에 처음 출시된 프로 플랜은 개인만 사용할 수 있으며 월 $20이다. 팀 플랜, 더 많은 기능 제공 팀 플랜 구독자는 프로 플랜의 모든 기능을 이용할 수 있다. 또한 프로 사용자보다 클로드 모델에서 더 많은 챗 쿼리를 수행할 수 있으며, 무료 사용자보다 5배 더 많은 챗을 수행할 수 있다. 또한 팀 플랜은 더 큰 컨텍스트 창을 제공하여 사용자가 클로드 챗봇에 방대한 문서를 분석하고 복잡한 대화를 유지할 수 있도록 한다. 그룹 관리 기능 강화 앤트로픽은 또한 그룹에 더 많은 관리 권한을 제공한다고 말했다. 사용자는 앱에서 프로 구독과 팀 플랜 간에 전환할 수 있으며, 특히 업무와 개인 생활에서 클로드를 사용하려는 사용자에게 유용하다. 앤트로픽은 지난 3월 클로드 3 모델 제품군을 출시했다. 이 제품군에는 중형 크기의 클로드 소넷(Claude Sonne), 최대 모델인 클로드 오퍼스(Claude Opus), 그리고 앤트로픽의 최소 모델인 클로드 하이쿠(Claude Haiku)가 포함된다.
-
엔비디아 챗RTX, 구글 Gemma 모델, 음성 검색 등 신기능 지원엔비디아가 RTX GPU 사용자를 위한 챗봇 '챗RTX(ChatRTX)'에 새로운 기능을 추가했다. 챗RTX는 로컬 서버를 구축하여 사용자의 문서, 유튜브 영상 등을 분석하고 질의응답, 요약 등을 제공하는 챗봇이다. 이번 업데이트에는 구글의 Gemma 모델, 챗GLM3, CLIP 모델 등이 추가되어 기능이 크게 강화되었다. 다양한 인공지능 모델 지원 챗RTX는 이제 구글의 Gemma 모델을 지원한다. Gemma 모델은 강력한 랩탑이나 데스크톱 PC에서 직접 실행하도록 설계되었으며, 챗RTX는 사용자의 데이터 분석 및 검색에 적합한 모델을 선택할 수 있도록 인터페이스를 제공한다. 챗RTX는 또한 챗GLM3 모델을 지원한다. 챗GLM3은 영어와 중국어를 지원하는 대규모 언어 모델이며, 챗RTX를 통해 사용자는 이 모델을 사용하여 질의응답 및 요약 기능을 활용할 수 있다. 마지막으로 챗RTX는 CLIP 모델을 지원한다. CLIP 모델은 이미지와 텍스트를 대조하여 학습하는 모델이며, 챗RTX를 통해 사용자는 로컬 사진 데이터를 검색하고 이미지를 인식하도록 모델을 학습할 수 있다. 음성 검색 기능 추가 챗RTX는 이제 음성 검색 기능을 지원한다. 엔비디아는 AI 음성 인식 시스템 위스퍼를 챗RTX에 통합하여 사용자의 음성으로 데이터를 검색할 수 있도록 했다. 챗RTX는 엔비디아 웹사이트에서 36GB 용량의 파일로 다운로드할 수 있다. RTX 30 또는 40 시리즈 GPU와 8GB 이상의 VRAM이 필요하다. 챗RTX는 딥러닝과 인공지능 기술을 활용하여 사용자의 데이터 분석 및 검색 경험을 크게 향상시킬 것으로 기대된다.
-
구글 AI 탈출, 애플 AI 팀에 합류하는 인재들: 핵심 개발자 36명 흡수구글의 AI 전문가들이 애플로 대거 떠나고 있다는 사실이 밝혀졌다. 파이넨셜 타임스가 링크드인 프로필을 기반으로 한 조사에 따르면, 2018년 이후 애플은 구글에서 인공지능 개발 경험을 가진 최소 36명의 전문가들을 채용했다. AI 인재 쟁탈전 이 중 가장 주목할 만한 인물은 애플의 최고 인공지능 책임자로 임명된 존 지안난드레아 전 구글 인공지능 책임자이다. 지난 달에는 애플 연구팀이 발표한 다중 모달 대규모 언어 모델 논문에 참여한 6명의 저자가 지난 2년 동안 구글에서 채용된 것으로 드러났다. 링크드인 프로필에 따르면, 논문의 31명의 저자 중 9명이 마지막 직장으로 구글을 꼽았다. 이러한 인재 이동은 인공지능 분야에서 구글과 애플 간의 치열한 경쟁을 보여주는 지표이다. 메타 CEO 마크 주커버그도 개인 이메일을 통해 구글의 인공지능 연구원들을 물색하고 채용하려 했다는 소식도 있다. 비밀 유럽 연구소에서 펼쳐지는 AI 개발 애플은 지난해 유럽 취리히에 비밀 연구소를 설립하여 인공지능 전문가 팀을 구성하기도 했다. 이 팀은 구글, 마이크로소프트 등 다른 대기업에서 근무 경험을 가진 전문가들로 구성되어 있으며, "비전 랩(Vision Lab)"이라는 이름으로 알려져 있다. 비전 랩은 첨단 다중 모달 대규모 언어 모델 개발에 집중하는 것으로 보인다. 애플은 캘리포니아와 시애틀에도 인공지능 개발 센터를 운영하고 있다. iOS 18에 구현될 혁신적인 AI 기능 이러한 인공지능 전문가들의 영입은 iOS 18에 시리, 스포트라이트, 단축키, 애플 뮤직, 메시지, 건강, 키노트, 넘버즈, 페이지 등 다양한 애플리케이션에 생성형 인공지능 기능을 도입하는 데 기여할 것으로 예상된다. 애플은 기기 내에서 이러한 기능을 실행하는 방식을 추구하고 있으며, 이를 위해 프랑스 스타트업 데이터칼라브(Datakalab)를 인수하여 기기 내 대규모 언어 모델 개발에 힘쓰고 있다.
-
파이낸셜 타임스, 오픈AI와 손잡고 인공지능 모델 훈련영국의 경제 전문 신문 파이낸셜 타임스(FT)가 오픈AI와 손잡았다. 25일 양측은 공동 발표를 통해 FT의 기사를 활용하여 오픈AI의 인공지능(AI) 모델을 훈련하고, 독자를 위한 새로운 AI 상품과 기능 개발에 협력할 것이라고 밝혔다. 뉴스 기사로의 가치를 높인 파이낸셜 타임스 오픈AI의 대표적인 AI 모델인 챗GPT는 FT의 정보를 인용할 경우 출처를 명시하고 링크를 제공해야 한다. "AI 플랫폼이 콘텐츠 사용에 대한 대가를 출판사에 지불하는 것은 당연한 일이다"라고 FT의 존 리딩 CEO는 성명을 통해 밝히며, "FT는 인간 중심의 저널리즘에 최선을 다할 것이다"고 덧붙였다. 양측은 계약 금액을 공개하지 않았다. AI 모델 훈련, 양날의 검 인공지능 모델의 성능은 훈련 데이터의 질에 크게 좌우된다. 지금까지 AI 기업들은 제작자들의 동의 없이 인터넷에서 공개적으로 접근 가능한 모든 데이터를 수집해왔으며, 최신 모델의 성능을 유지하기 위해 끊임없이 새로운 데이터 출처를 찾고 있다. 뉴스 기사는 AI 모델 훈련에 적합한 데이터이지만, 일부 출판사들은 콘텐츠를 무료로 제공하는 것을 꺼린다. 예를 들어 뉴욕타임스와 BBC는 오픈AI가 자사 웹사이트를 스크래핑하는 것을 금지하고 있다. 오픈AI의 파트너십 확대 이러한 상황 속에서 오픈AI는 주요 출판사들과 파트너십을 맺고 모델 훈련에 필요한 데이터를 확보하고 있다. 지난해 오픈AI는 독일 출판사 악셀 슈프링어와 협력하여 미국 정치뉴스 사이트 폴리티코와 비즈니스 인사이더, 독일 언론사 빌트와 디벨트의 기사를 활용하여 모델을 훈련했다. 또한 AP, 프랑스의 르몽드, 스페인의 프리사 미디어와도 파트너십을 맺고 있다. 유료 구독과 무료 접근의 갈등 파이낸셜 타임스의 월 구독료는 최소 39달러이다. 하지만 일부 사람들은 오픈AI와의 파트너십이 사실상 일반 독자들에게 유료 구독 장벽을 허물고 무료 접근을 가능하게 한다고 주장한다.
-
구글 제미나이, 안드로이드 10 지원 확대! 오래된 스마트폰도 사용 가능!구글의 AI 어시스턴트 앱 제미나이가 안드로이드 10 이하 기기까지 지원을 확대한다는 소식이 전해졌다. 이전 버전은 안드로이드 12 이상에서만 작동했지만, 최근 업데이트된 제미나이 앱은 안드로이드 10 및 11 기기에서도 사용할 수 있게 되었다는 사용자들의 보고가 잇따라 접수되고 있다. 실제 사용자들의 후기를 보면, 안드로이드 10 기기에서도 제미나이 앱이 끊김 없이 원활하게 작동한다는 이야기다. 플로팅 윈도우, 실시간 생성, 프롬프트 스케줄링 등 신기능 추가 예정 이뿐만 아니라, 구글은 제미나이 안드로이드 플랫폼에 새로운 기능들을 추가할 계획이다. 플로팅 윈도우 기능은 다른 앱 위에 제미나이를 띄워 사용할 수 있게 해주고, 실시간 생성 기능은 사용자의 요청에 맞춰 텍스트, 이미지, 코드 등을 실시간으로 생성해준다. 프롬프트 스케줄링 기능은 미리 설정한 시간에 특정 프롬프트를 자동으로 실행해준다. 아직은 기능 제한적이지만, 앞으로는 더욱 강력해질 것으로 기대 현재 제미나이 AI 어시스턴트의 기능은 다소 제한적이다. 텍스트 생성, 번역, 질문 답변 등 기본적인 AI 작업은 수행할 수 있지만, 타사 앱과의 연동은 아직 불가능하다. 예를 들어, 제미나이를 통해 왓츠앱 메시지를 보내려고 하면, 궁극적으로는 구글 어시스턴트를 통해 메시지를 보내야 한다. 하지만, 이전 보도에 따르면 구글은 제미나이 AI 어시스턴트의 기능을 개선하기 위해 노력하고 있다. 특히, 스포티파이, 유튜브 뮤직 등 타사 앱에서 음악을 재생하는 기능이 추가될 가능성이 높다. 구글 제미나이가 안드로이드 10 이하 기기를 지원하게 됨으로써, 더 많은 사용자들이 제미나이 AI의 혜택을 누릴 수 있게 되었다. 플로팅 윈도우, 실시간 생성, 프롬프트 스케줄링 등 새로운 기능들이 추가되면 제미나이는 더욱 강력하고 유용한 AI 어시스턴트로 진화할 것으로 기대된다.
-
에스티 로더, 마이크로소프트와 손잡고 뷰티 산업에 제너레이티브 AI 도입!뷰티 대기업 에스티 로더(Estée Lauder)와 마이크로소프트가 전략적 파트너십을 넓히고 새로운 협업을 발표했다. 두 회사는 'AI 혁신 연구소' 라는 가상 프로그램을 시작했는데, 마이크로소프트의 Azure OpenAI 서비스를 활용해 에스티 로더 산하 20개 이상의 브랜드가 제너레이티브 AI를 도입하는 방법을 개발할 예정이라고 한다. 마이크로소프트의 글로벌 산업 솔루션 부문 부사장 셸리 브랜스텐은 "제너레이티브 AI는 뷰티 산업에 중요한 기회를 제공한다"며 "더 흥미로운 고객 경험을 만들고, 제품을 더 빠르게 출시하며, 더 효율적이고 지속 가능하게 신상품을 개발하는 등 많은 분야에 활용될 수 있다"고 밝혔다. 빠른 캠페인 출시 & 로컬 맞춤 마케팅 에스티 로더와 마이크로소프트가 제너레이티브 AI를 활용하고 싶어하는 분야 중 하나는 소셜 트렌드와 소비자 요구에 더 빠르게 반응하는 새로운 방법 찾기다. 두 회사는 Azure OpenAI 서비스를 사용하여 내부 챗봇을 개발했는데, 이 챗봇은 팀들이 에스티 로더의 제품 데이터베이스와 클레임 데이터를 탐색하고 활용하도록 돕는다. 이를 통해 에스티 로더의 브랜드는 이전보다 더 빠르게 지역 맞춤 캠페인을 출시할 수 있다. 이런 도구는 마케팅 캠페인 실행에 필요한 노력을 간소화해준다. 이제 팀은 다른 지역의 팀들이 어떤 걸 했는지 정보를 얻기 위해 질문만 입력하면 그 내용을 바탕으로 캠페인을 복제할 수 있다. 제품 개발 속도 향상 또 다른 활용 분야는 제품 혁신 속도를 높이는 것이다. 에스티 로더는 연구 개발팀이 제너레이티브 AI를 사용하여 새로운 제품 및 성분 트렌드를 더 빠르고 정확하게 파악하고 있다고 밝혔다. 과학자들은 이제 문헌을 뒤적거리지 않고 마이크로소프트의 소프트웨어 내에서 쿼리를 실행하여 개발하고 시장에 출시해야 할 솔루션을 파악할 수 있다. 에스티 로더 측은 "AI 혁신 연구소는 AI 기반 도구를 활용하여 고객과의 연결을 강화하고 제품과 고품질 경험을 더 빠르게 시장에 출시하는 데 초점을 둘 것"이라고 밝혔다. 에스티 로더, AI 활용에 적극적 AI가 일부 기업에게는 새로운 기술일지 모르지만, 에스티 로더는 이 기술에 이미 익숙하다. 2023년 에스티 로더는 직원들이 기업과 팀, 고객에게 긍정적인 영향과 가치를 제공할 수 있는 AI 기반 솔루션을 발표하는 '아이디어톤'을 개최하기도 했다. 마지막으로 에스티 로더는 마이크로소프트의 Azure AI를 사용하여 시각 장애인 사용자의 메이크업을 할 수 있도록 지원하는 모바일 기반 음성 지원 메이크업 어시스턴트를 출시했다. 에스티 로더가 세대 AI와 협력하는 기술 회사는 Microsoft뿐만이 아니다. 지난 여름, 에스티 로더는 구글 클라우드(Google Cloud)와의 협업을 발표했다. 이 계약에 따라 Google의 Gen AI 기능은 실시간 소비자 감정 및 피드백 모니터링을 처리힌다. 또한 비즈니스 애플리케이션은 Google의 Vertex AI 플랫폼에서 개발되고 에스티 로더는 PaLM 2 LLM을 사용한다.
-
신세시아, 인공지능 기술로 현실과 구분 불가능한 '감정 표현 가상 배우' 출시!영국 런던에 위치한 인공지능(AI) 합성 영상 스타트업 신세시아(Synthesia)가 기업용 고품질 AI 영상 제작 플랫폼을 한 단계 업그레이드했다. 이번 업그레이드의 주인공은 바로 '감정 표현 가상 배우'입니다. 텍스트 내용 이해해 감정 표현하는 가상 배우 이 가상 배우들은 기존의 디지털 아바타와는 달리, 전달하는 내용의 맥락에 따라 목소리 톤, 얼굴 표정, 몸짓까지 조절한다. 흥미롭게도 이 발표는 마이크로소프트가 얼굴 사진만 있으면 말하는 영상과 노래 영상을 만들어내는 AI 프레임워크 '바사(VASA)'를 공개한 지 불과 일주일만에 이루어진 일이다. 하지만 연구 단계에 머무는 바사와 달리, 신세시아의 '감정 표현 가상 배우' 기술은 실용적이며 기업 고객들이 목표 고객에게 더욱 사실적인 AI 영상을 제작하는 데 도움을 줄 것이다. 신세시아의 AI 영상 제작 기술 진화 신세시아는 스탠퍼드와 케임브리지 대학 출신 연구원 및 기업가들로 구성된 팀에 의해 2017년 설립되었다. 신세시아는 사용자 정의 AI 음성과 아바타(기존 아바타 사용도 가능) 제작과 함께 미리 작성된 스크립트 또는 AI 제작 스크립트를 사용하여 스튜디오 수준의 AI 영상을 제작할 수 있는 엔드투엔드 플랫폼을 구축했다. 이 서비스는 기업 고객들에게 폭발적인 반응을 얻었으며, 현재까지 20만 명 이상의 사용자가 디지털 아바타를 활용하여 1,800만 개 이상의 영상을 제작했다. 하지만 지금까지 신세시아를 포함한 모든 업체들이 제공하는 아바타에게는 한 가지 큰 한계가 있었다. 바로 감정 이해 기능이다. 실제 영상 발표자와 달리 디지털 아바타는 스크립트에 따라 목소리 톤, 표정 또는 제스처를 바꿀 수 없었으며 이러한 요소들은 미리 정의되어 있어야 했다. 하지만 이제 '감정 표현 가상 배우' 출시로 상황이 달라졌다. 신세시아는 새로운 가상 배우가 텍스트 내용의 맥락과 감정을 이해하여 목소리 톤과 표정을 바꾸어 대사를 전달할 수 있다고 설명한다. 신세시아는 미묘한 표정 변화, 눈 깜박임, 심지어 시선 이동까지 사용하여 다양한 감정을 표현할 수 있다고 주장한다. 흥분된 내용을 이야기할 때는 아바타가 미소 짓고 웃으며, 슬프거나 우울한 내용일 때는 천천히 말하고 긴 침묵을 삽입할 수 있다는 것이다. 신세시아 CTO 존 스타크는 "이 새로운 아바타를 통해 우리는 단순히 디지털 렌더링을 만드는 것이 아니라 디지털 배우를 선보인다. 이 기술은 가상과 현실의 경계를 흐리는 정교함과 사실감을 디지털 아바타에게 가져다준다."라고 블로그 게시물에 썼다. 신세시아는 이러한 수준의 감정 예측과 사실감을 달성하기 위해 텍스트와 실제 세계에서 텍스트가 어떻게 말해지는지 보여주는 비디오를 수 시간 동안 학습시킨 딥러닝 모델 'EXPRESS-1'을 사용하고 있다. 스타크는 "EXPRESS-1은 모든 움직임과 얼굴 표정을 실시간으로 예측하여 음성 언어의 타이밍, 억양 및 강조에 매끄럽게 맞춘다. 그 결과 놀라울 정도로 자연스럽고 인간과 같은 연기를 할 수 있다"고 덧붙였다. 새로운 아바타는 또한 다양한 언어로 보다 자연스러운 립싱크와 음성을 제공한다. 신세시아, 감정 표현 가상 배우 악용 방지에도 힘써! 인간과 유사한 방식으로 감정을 표현하고 말할 수 있는 디지털 아바타는 사람들을 속이고 개인 또는 사회에 해를 끼칠 수 있는 악용 가능성이 높다. 하지만 신세시아는 기업 중심의 긍정적인 활용 사례, 특히 의사 소통 및 지식 공유 분야에서의 활용을 보장하기 위해 적극적으로 노력하고 있다. 예를 들어, 신세시아는 의료 기관들이 환자를 위해 더욱 공감적인 영상을 제작하거나 마케팅 팀들이 새로운 제품을 소개하는 영상에서 흥분과 낙관을 표현하는 데 이 새로운 기술을 사용할 수 있다고 제안한다.
-
어도비, AI 기반 영상 선명화 기술 'VideoGigaGAN'' 출시최근 어도비는 인공지능(AI) 기술을 활용한 영상 확대 기능 'VideoGigaGAN'을 선보였다. 이 기능은 기존의 영상 확대 기술과 달리 흔히 발생하는 깨짐이나 흔들림 없이 최대 8배까지 영상을 선명하게 확대할 수 있다는 것이 특징이다. AI 기반 영상 확대 기술 'VideoGigaGAN' VideoGigaGAN은 일반적인 영상 슈퍼 해상도(VSR) 기술과는 차별화된 방식으로 작동한다. 기존 VSR 기술은 종종 'GAN(General Adversarial Networks)'이라는 기술을 사용하여 영상 확대 과정에서 깨짐이나 흔들림 현상이 발생하는 경우가 많았다. 하지만 VideoGigaGAN은 이러한 문제점을 해결하기 위해 '시간적 주의(temporal attention)' 기술을 도입하여 시간 경과에 따라 누적되는 깨짐 현상을 줄였으며, '특징 전파(feature propagation)' 기술을 통해 존재하지 않는 디테일을 자연스럽게 추가하는 방식으로 작동한다. 또한 '안티앨리어싱(anti-aliasing)' 기술을 통해 계단 현상을 줄이고 'HF 셔틀(HF shuttle)' 기술을 통해 고주파 디테일을 효과적으로 전달함으로써 뛰어난 영상 확대 결과를 만들어낸다. 탁월한 해상도로 깨끗한 영상 생성 VideoGigaGAN은 아직 초기 단계이지만, 프리미어 프로(Premiere Pro)나 애프터 이펙트(After Effects)와 같은 어도비 영상 편집 소프트웨어에 적용된다면 저해상도 영상도 훨씬 더 선명하게 표현할 수 있을 것으로 기대된다. 하지만 AI 기술을 사용하여 사람의 외모를 개선하는 것은 윤리적으로 논란이 되고 있다는 점도 고려해야 한다. 현재 VideoGigaGAN은 짧은 영상만 처리할 수 있으며, 프레임 레이트 또한 12fps로 낮은 편이다. 하지만 어도비뿐만 아니라 엔비디아(NVIDIA), 마이크로소프트(Microsoft), 블랙매직 디자인(Blackmagic Design) 등 다양한 기업들이 AI 영상 확대 기술 개발에 힘쓰고 있는 만큼, 앞으로 더욱 발전된 기술이 등장할 것으로 예상된다.
많이본뉴스
많이 본 뉴스
- 1LEGO 레트로 라디오, 라디오 기능 없이 눈길만 사로잡아!
- 2하데스 2 정복 가이드: 초보 플레이어 위한 핵심 팁
- 3에이수스, 휴대용 게임 PC 최신 모델 “ROG Ally X” 발표
- 4GTA 6, 락스타 웹사이트에 등장 후 사라져! 5월 16일 발표 예상?
- 5닌텐도 스위치 2, 성능 유출? 12GB RAM, 8인치 디스플레이 예상
- 6구글 크롬, “서클 투 서치” 도구 탑재? 이미지 보고 바로 검색
- 7윈도우 11 스크린샷 도구, QR 코드 스캔 및 이모티콘 지원 추가!
- 8구글 I/O 2024, 안드로이드 15와 제미나이 AI 등 새로운 기능 공개 예상
- 9"기계 vs 인간" 암시? 애플, 논란의 여지가 있는 아이패드 프로 광고 사과
- 10엑스박스, 모바일 게임 스토어 7월 출시! 모든 기기에서 이용 가능