본문 바로가기
IT와 AI 인공지능

[I/O 2024] 구글, 동영상 생성 모델 비오(Veo)와 Text-to-Image 변환 모델 이마젠3(Imagen 3), 음악 AI 샌드박스, 리리아(Lyria) 공개

by 새콤달콤심쿵 2024. 5. 16.
반응형

크리에이터를 위한 새로운 생성형 미디어 모델 및 도구 공개

구글은 미국에서 'I/O 2024 컨퍼런스'를 개최하며, 크리에이터들과 공동으로 개발한 생성형 미디어 모델 및 도구들을 발표했습니다. 고화질 비디오 생성에 최적화된 '비오(Veo)' 모델과 최상의 Text-to-Image 변환을 제공하는 '이마젠 3(Imagen 3)'을 비롯해, 'AI 리리아(Lyria)'를 이용한 새로운 실험적 음악과 '뮤직 AI 샌드박스'도 선보였습니다. 

크리에이터를 위한 생성형 미디어 모델 및 도구 공개
크리에이터를 위한 생성형 미디어 모델 및 도구 공개

 

발표된 새로운 기능 중에는 구글 검색이 'SGE(생성형 AI 검색)' 서치랩으로 업데이트되어 생성형 AI를 통합하고, 'AI 개요(AI Overviews)' 기능과 '더 복잡한 질문' 기능이 확장되며, AI가 정리한 검색 결과를 사용하여 '맞춤형 제미나이(Gemini) 모델' 검색이 새롭게 도입된다고 발표했습니다.  

 

비오(Veo): 구글의 가장 뛰어난 성능의 비디오 생성 모델

구글의 비오(Veo)는 동영상 생성 분야에서 혁신적인 발전을 이루었습니다. 이 모델은 다양한 시네마틱 효과와 1080p 고화질의 1분 이상의 긴 동영상을 자연어 프롬프트로부터 생성할 수 있는 능력을 갖추고 있으며, 사용자의 창의적인 요구를 정확하게 이해하고 반영할 수 있습니다.

구글 'I/O 2024 컨퍼런스'에서 비오(Veo) 소개
구글 'I/O 2024 컨퍼런스'에서 비오(Veo) 소개

구글은 이 기술을 통해 '타임랩스(timelapse)' 또는 '풍경의 항공 촬영(aerial shots of a landscape)’과 같은 영화 용어를 이해하여 영화 제작자와 크리에이터들이 자신의 비전을 실현할 수 있도록 지원하고 있으며, 이러한 협업을 통해 기술 개발 과정에 크리에이터의 의견을 반영하고자 노력하고 있습니다. 

비오(Veo) AI 동영상 생성 모델 소개영상

비오(Veo)는 스토리텔링과 교육 등 다양한 분야에서 새로운 가능성을 열어주고 있습니다. 영화 프로젝트를 위해 비오(Veo)를 실험한 영화 제작자 도널드 글로버(Donald Glover) 및 그의 크리에이티브 스튜디오인 길가(Gilga)와의 작업을 미리 살펴보세요. 

Donald Glover와 그의 창작 스튜디오인 Gilga의 영화제작

 

비오(Veo)는 아키텍처, 스케일링 법칙 및 기타 새로운 기술을 결합하여 화질과 출력 해상도를 개선하는 GQN(Generative Query Network), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet 및 Lumiere 등 수 년에 걸친 구글의 생성형 비디오 모델 작업을 기반으로 합니다.

 

비오(Veo)를 통해 모델이 비디오의 내용을 이해하고, 고화질 이미지를 렌더링, 물리학을 시뮬레이션하는 등 학습 방법을 개선했습니다. 복잡한 장면 내에서 세부 사항을 정교하게 렌더링하며, 비오(Veo)는 비디오 제작을 모든 사람에게 접근 가능하게 만드는 도구가 될것 입니다. 

 

현재 일부 크리에이터들에게 VideoFX를 통해 비오(Veo)를 사용할 수 있게 제공하고 있으며, 추후 유튜브 쇼츠와 다른 제품에도 그 기능이 통합될 예정입니다. 

 

상세 기능은 비오(Veo) 공식 사이트를 참고해주세요. 

 

이마젠 3: 최고 품질의 Text-to-Image 변환 모델

이마젠 3(Imagen 3)는 최고 품질의 Text-to-Image 이미지 변환 모델입니다. 놀라운 수준의 디테일을 생성하며, 이전 모델보다 훨씬 적은 시각적 결함으로 사실적이고 생생한 이미지를 만들어냅니다. 

프롬프트: 편광 필터를 사용하여 DSLR 카메라 스타일로 촬영합니다. 튀르키예 카파도키아의 독특한 암석 층 위에 두 개의 열기구가 떠 있는 사진입니다. 이 열기구의 색상과 패턴은 아래 풍경의 흙빛과 아름답게 대조됩니다. 이 사진은 그러한 경험을 즐기는 데 따르는 모험심을 포착합니다.
프롬프트: 편광 필터를 사용하여 DSLR 카메라 스타일로 촬영합니다. 튀르키예 카파도키아의 독특한 암석 층 위에 두 개의 열기구가 떠 있는 사진입니다. 이 열기구의 색상과 패턴은 아래 풍경의 흙빛과 아름답게 대조됩니다. 이 사진은 그러한 경험을 즐기는 데 따르는 모험심을 포착합니다.
프롬프트: 회색 배경 앞에 규칙적으로 자리잡은 날렵한 늑대의 클로즈업으로 세밀한 세부 사항이 포함된 고해상도 사진을 통해 초실감 스타일의 색상 등급으로 일반 스톡 사진에 격리됩니다.
프롬프트: 회색 배경 앞에 규칙적으로 자리잡은 날렵한 늑대의 클로즈업으로 세밀한 세부 사항이 포함된 고해상도 사진을 통해 초실감 스타일의 색상 등급으로 일반 스톡 사진에 격리됩니다.
알림: 진흙에 구워서 바위 산책로에서 쉬고 있는 잘 된 등산화 한 켤레. 다람쥐의 머리가 부츠 중 하나를 삐죽 내밀고 있는데, 다람쥐는 신발의 작은 왕인 카메라를 게으르게 바라봅니다. 두 부츠의 끈이 느슨하게 땅에 떨어집니다. 배경에는 산이 많은 풍경이 있습니다. 시네마틱 무비 스틸, 고품질 DSLR 사진입니다.
프롬프트: 진흙에 구워서 바위 산책로에서 쉬고 있는 잘 된 등산화 한 켤레. 다람쥐의 머리가 부츠 중 하나를 삐죽 내밀고 있는데, 다람쥐는 신발의 작은 왕인 카메라를 게으르게 바라봅니다. 두 부츠의 끈이 느슨하게 땅에 떨어집니다. 배경에는 산이 많은 풍경이 있습니다. 시네마틱 무비 스틸, 고품질 DSLR 사진입니다.

 

이마젠 3(Imagen 3)는 자연어 처리와 프롬프트의 의도를 더욱 정확하게 이해하고, 긴 프롬프트에서도 세부적인 부분까지 포착합니다. 이러한 세심한 디테일 처리는 이마젠 3이 다양한 스타일을 완벽하게 구현하는 데 도움이 됩니다. 

프롬프트: 추상 스케치: 흐릿한 표정의 선과 에너지가 몸짓으로 그린 숯 그림에서 무용수의 역동적인 움직임을 포착합니다. 오래된 양피지에 스케치하세요.
프롬프트: 추상 스케치: 흐릿한 표정의 선과 에너지가 몸짓으로 그린 숯 그림에서 무용수의 역동적인 움직임을 포착합니다. 오래된 양피지에 스케치하세요.
프롬프트 : 사바나를 걷는 코끼리 아미구루미, 전문 사진, 배경 흐림.
프롬프트 : 사바나를 걷는 코끼리 아미구루미, 전문 사진, 배경 흐림.
알림: 꽃이 피는 덩굴로 덮인 풍화된 나무로 된 메기 로봇이 작은 파랑새 한 마리를 뻗은 손으로 쉬고 있는 키 큰 야생화 밭에 평화롭게 서 있습니다. 따뜻한 색상과 부드러운 선이 있는 디지털 만화입니다. 폭포가 있는 큰 절벽이 뒤에 나타납니다.
프롬프트: 꽃이 피는 덩굴로 덮인 풍화된 나무로 된 메기 로봇이 작은 파랑새 한 마리를 뻗은 손으로 쉬고 있는 키 큰 야생화 밭에 평화롭게 서 있습니다. 따뜻한 색상과 부드러운 선이 있는 디지털 만화입니다. 폭포가 있는 큰 절벽이 뒤에 나타납니다.

 

이마젠 3(Imagen 3)은 현재 일부 크리에이터들에게 대상으로 이미지FX 내에서 제공되기 시작하며, 대기자 명단에 등록해 추가 참여할 수 있습니다. 이마젠 3는 곧 버텍스 AI에 출시될 예정입니다. 

 

상세 기능은 이마젠 3(Imagen 3) 공식 사이트를 참고해주세요. 

 

뮤직 AI 샌드박스, AI 리리아(Lyris) 음악 생성 도구 

구글은 유튜브와의 협력을 통해 '리리아(Lyria)'를 포함한 AI 음악 생성 기술을 발전시키고 있으며, '뮤직 AI 샌드박스(Music AI Sandbox)'와 같은 도구를 통해 사용자들이 창의적으로 음악을 만들고 사운드를 변형할 수 있게 지원하고 있습니다. 이 기술들은 개인화된 경험을 제공하며, 예술 작품에 대한 접근성을 향상시키고, 예술적 표현의 본질에 중요한 영향을 주고 있습니다.   

 

• 시청하실 유튜브 영상은 '자막'을 켜시고 톱니바퀴 모양의 '설정'에서 '자막 > '자동 번역' > '한국어'로 선택하여 시청하시면 내용을 이해하는데 도움이 됩니다.  

자동 자막 설정 방법
자동 자막 설정 방법

음악의 궁극적인 협력자 | 뮤직 AI 샌드박스

구글은 AI 음악 도구를 활용하여 제작한 데모 녹음을 유튜브 채널을 통해 공개했으며, 그래미 수상자 위클리프 진(Wyclef Jean), 일렉트로닉 음악가 마크 레빌레(Marc Rebillet), 그래미 후보 작곡가 저스틴 트랜터(Justin Tranter)와 함께 이러한 음악적 실험을 지속하고 있습니다. 

 

신스ID(SynthID)를 통한 디지털 워터마크 삽입

구글은 AI와 같은 최첨단 기술의 발전에 주력하면서도, 이러한 기술이 사회에 미치는 영향을 책임감 있게 관리하는 데 중점을 두고 있습니다. AI로 생성된 콘텐츠에 대한 신뢰성을 높이기 위해 디지털 워터마크를 삽입하는 신스ID(SynthID)와 같은 혁신적인 도구를 개발하여, 사용자가 AI를 더 안전하고 책임감 있게 사용할 수 있도록 지원하고 있습니다. 

비디오 워터마킹을 위한 SynthID는 생성된 비디오의 모든 프레임을 표시합니다.
비디오 워터마킹을 위한 SynthID는 생성된 비디오의 모든 프레임을 표시합니다.

SynthID: AI 생성 콘텐츠를 워터마킹하고 식별하는 도구

 

또한, 오늘부터 비디오FX에서 비오(Veo)로 생성한 모든 동영상에는 신스ID 워터마크를 삽입합니다. 

 

• 이번 업데이트되는 AI 기능은 미국 영어 사용자에게만 제공되며, 곧 더 많은 국가로 확대될 예정입니다.

 

함께 보면 도움이 되는 콘텐츠 보기

▶ [I/O 2024] 구글, ‘SGE(생성형 AI 검색)’ 서치랩이 제미나이(Gemini) AI와 통합됩니다. 'AI 개요(AI Overviews)' 기능 출시

 

[I/O 2024] 구글, ‘SGE(생성형 AI 검색)’ 서치랩이 제미나이(Gemini) AI와 통합됩니다. 'AI 개요(AI Overvie

구글 검색에 AI 제미나이(Gemini) 도입구글은 이번 미국에서 'I/O 2024 컨퍼런스'를 개최하고 새로운 서비스 상품들을 발표했습니다. 발표된 새로운 기능 중에는 구글 검색이 'SGE(생성형 AI 검색)' 서

bizstoryway.tistory.com

▶ OpenAI의 챗GPT의 새로운 인공지능 모델 GPT-4o 출시: 모든 사용자에게 무료로 제공되는 '옴니(omni)'

 

OpenAI의 챗GPT의 새로운 인공지능 모델 GPT-4o 출시: 모든 사용자에게 무료로 제공되는 '옴니(omni)'

챗GPT의 새로운 AI 모델 GPT-4o 공개5월 14일(한국 시간)에 OpenAI가 'GPT-4o'라는 새로운 다중 모달 모델을 발표했습니다. 이 모델은 텍스트, 이미지, 오디오를 결합하여 이해하고 추론하는 능력을 가지

bizstoryway.tistory.com

▶ 크롬(Chrome) 주소표시줄에서 제미나이(Gemini), @Gemini 사용방법

 

크롬(Chrome) 주소표시줄에서 제미나이(Gemini), @Gemini 사용방법

크롬(Chrome) 제미나이(Gemini) 업데이트 출시 최근 구글은 크롬(Chrome) 브라우저와 제미나이(Gemini)를 업데이트하여 기존의 167개국 외에도 더 많은 국가와 언어에서 사용할 수 있게 업데이트했습니

bizstoryway.tistory.com

▶ 이제 윈도우용 아크(Arc) 브라우저를 설치 할 수 있습니다. 전통적인 탭 사용 경험 혁신을 제공

 

이제 윈도우용 아크(Arc) 브라우저를 설치 할 수 있습니다. 전통적인 탭 사용 경험 혁신을 제공

윈도우용 아크(Arc) 브라우저 출시The Browser Company는 최근 윈도우 11 사용자를 위한 아크(ARC) 브라우저의 출시를 발표했습니다. 이는 맥(Mac) 사용자들이 2022년부터 누려온 혁신적인 웹 탐색 경험을

bizstoryway.tistory.com

 

※ 포스팅이 도움이 되셨다면 💓공감, 댓글, 응원하기👍, 광고 부탁 드립니다. ~ 🎉👍🙏

 

반응형