크리에이터를 위한 새로운 생성형 미디어 모델 및 도구 공개
구글은 미국에서 'I/O 2024 컨퍼런스'를 개최하며, 크리에이터들과 공동으로 개발한 생성형 미디어 모델 및 도구들을 발표했습니다. 고화질 비디오 생성에 최적화된 '비오(Veo)' 모델과 최상의 Text-to-Image 변환을 제공하는 '이마젠 3(Imagen 3)'을 비롯해, 'AI 리리아(Lyria)'를 이용한 새로운 실험적 음악과 '뮤직 AI 샌드박스'도 선보였습니다.
발표된 새로운 기능 중에는 구글 검색이 'SGE(생성형 AI 검색)' 서치랩으로 업데이트되어 생성형 AI를 통합하고, 'AI 개요(AI Overviews)' 기능과 '더 복잡한 질문' 기능이 확장되며, AI가 정리한 검색 결과를 사용하여 '맞춤형 제미나이(Gemini) 모델' 검색이 새롭게 도입된다고 발표했습니다.
비오(Veo): 구글의 가장 뛰어난 성능의 비디오 생성 모델
구글의 비오(Veo)는 동영상 생성 분야에서 혁신적인 발전을 이루었습니다. 이 모델은 다양한 시네마틱 효과와 1080p 고화질의 1분 이상의 긴 동영상을 자연어 프롬프트로부터 생성할 수 있는 능력을 갖추고 있으며, 사용자의 창의적인 요구를 정확하게 이해하고 반영할 수 있습니다.
구글은 이 기술을 통해 '타임랩스(timelapse)' 또는 '풍경의 항공 촬영(aerial shots of a landscape)’과 같은 영화 용어를 이해하여 영화 제작자와 크리에이터들이 자신의 비전을 실현할 수 있도록 지원하고 있으며, 이러한 협업을 통해 기술 개발 과정에 크리에이터의 의견을 반영하고자 노력하고 있습니다.
비오(Veo) AI 동영상 생성 모델 소개영상
비오(Veo)는 스토리텔링과 교육 등 다양한 분야에서 새로운 가능성을 열어주고 있습니다. 영화 프로젝트를 위해 비오(Veo)를 실험한 영화 제작자 도널드 글로버(Donald Glover) 및 그의 크리에이티브 스튜디오인 길가(Gilga)와의 작업을 미리 살펴보세요.
Donald Glover와 그의 창작 스튜디오인 Gilga의 영화제작
비오(Veo)는 아키텍처, 스케일링 법칙 및 기타 새로운 기술을 결합하여 화질과 출력 해상도를 개선하는 GQN(Generative Query Network), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet 및 Lumiere 등 수 년에 걸친 구글의 생성형 비디오 모델 작업을 기반으로 합니다.
비오(Veo)를 통해 모델이 비디오의 내용을 이해하고, 고화질 이미지를 렌더링, 물리학을 시뮬레이션하는 등 학습 방법을 개선했습니다. 복잡한 장면 내에서 세부 사항을 정교하게 렌더링하며, 비오(Veo)는 비디오 제작을 모든 사람에게 접근 가능하게 만드는 도구가 될것 입니다.
현재 일부 크리에이터들에게 VideoFX를 통해 비오(Veo)를 사용할 수 있게 제공하고 있으며, 추후 유튜브 쇼츠와 다른 제품에도 그 기능이 통합될 예정입니다.
상세 기능은 비오(Veo) 공식 사이트를 참고해주세요.
이마젠 3: 최고 품질의 Text-to-Image 변환 모델
이마젠 3(Imagen 3)는 최고 품질의 Text-to-Image 이미지 변환 모델입니다. 놀라운 수준의 디테일을 생성하며, 이전 모델보다 훨씬 적은 시각적 결함으로 사실적이고 생생한 이미지를 만들어냅니다.
이마젠 3(Imagen 3)는 자연어 처리와 프롬프트의 의도를 더욱 정확하게 이해하고, 긴 프롬프트에서도 세부적인 부분까지 포착합니다. 이러한 세심한 디테일 처리는 이마젠 3이 다양한 스타일을 완벽하게 구현하는 데 도움이 됩니다.
이마젠 3(Imagen 3)은 현재 일부 크리에이터들에게 대상으로 이미지FX 내에서 제공되기 시작하며, 대기자 명단에 등록해 추가 참여할 수 있습니다. 이마젠 3는 곧 버텍스 AI에 출시될 예정입니다.
상세 기능은 이마젠 3(Imagen 3) 공식 사이트를 참고해주세요.
뮤직 AI 샌드박스, AI 리리아(Lyris) 음악 생성 도구
구글은 유튜브와의 협력을 통해 '리리아(Lyria)'를 포함한 AI 음악 생성 기술을 발전시키고 있으며, '뮤직 AI 샌드박스(Music AI Sandbox)'와 같은 도구를 통해 사용자들이 창의적으로 음악을 만들고 사운드를 변형할 수 있게 지원하고 있습니다. 이 기술들은 개인화된 경험을 제공하며, 예술 작품에 대한 접근성을 향상시키고, 예술적 표현의 본질에 중요한 영향을 주고 있습니다.
• 시청하실 유튜브 영상은 '자막'을 켜시고 톱니바퀴 모양의 '설정'에서 '자막 > '자동 번역' > '한국어'로 선택하여 시청하시면 내용을 이해하는데 도움이 됩니다.
음악의 궁극적인 협력자 | 뮤직 AI 샌드박스
구글은 AI 음악 도구를 활용하여 제작한 데모 녹음을 유튜브 채널을 통해 공개했으며, 그래미 수상자 위클리프 진(Wyclef Jean), 일렉트로닉 음악가 마크 레빌레(Marc Rebillet), 그래미 후보 작곡가 저스틴 트랜터(Justin Tranter)와 함께 이러한 음악적 실험을 지속하고 있습니다.
신스ID(SynthID)를 통한 디지털 워터마크 삽입
구글은 AI와 같은 최첨단 기술의 발전에 주력하면서도, 이러한 기술이 사회에 미치는 영향을 책임감 있게 관리하는 데 중점을 두고 있습니다. AI로 생성된 콘텐츠에 대한 신뢰성을 높이기 위해 디지털 워터마크를 삽입하는 신스ID(SynthID)와 같은 혁신적인 도구를 개발하여, 사용자가 AI를 더 안전하고 책임감 있게 사용할 수 있도록 지원하고 있습니다.
SynthID: AI 생성 콘텐츠를 워터마킹하고 식별하는 도구
또한, 오늘부터 비디오FX에서 비오(Veo)로 생성한 모든 동영상에는 신스ID 워터마크를 삽입합니다.
• 이번 업데이트되는 AI 기능은 미국 영어 사용자에게만 제공되며, 곧 더 많은 국가로 확대될 예정입니다.
함께 보면 도움이 되는 콘텐츠 보기
▶ [I/O 2024] 구글, ‘SGE(생성형 AI 검색)’ 서치랩이 제미나이(Gemini) AI와 통합됩니다. 'AI 개요(AI Overviews)' 기능 출시
▶ OpenAI의 챗GPT의 새로운 인공지능 모델 GPT-4o 출시: 모든 사용자에게 무료로 제공되는 '옴니(omni)'
▶ 크롬(Chrome) 주소표시줄에서 제미나이(Gemini), @Gemini 사용방법
▶ 이제 윈도우용 아크(Arc) 브라우저를 설치 할 수 있습니다. 전통적인 탭 사용 경험 혁신을 제공
※ 포스팅이 도움이 되셨다면 💓공감, 댓글, 응원하기👍, 광고 부탁 드립니다. ~ 🎉👍🙏
'IT와 AI 인공지능' 카테고리의 다른 글
갤럭시 휴대폰이나 태블릿 카메라를 웹캠으로 사용 방법, 윈도우 11 지원 (166) | 2024.05.17 |
---|---|
챗GPT 무료 사용자를 위한 GPT-4o와 GPT-3.5 사용방법 및 모델 전환, GPT스토어 무료 사용, 모바일 및 맥(Mac) 데스크톱 앱 설치 (224) | 2024.05.16 |
윈도우 11, 코파일럿(Copilot) '전화' 플러그인 사용방법.. 편리함의 시작 (192) | 2024.05.14 |
OpenAI의 챗GPT의 새로운 인공지능 모델 GPT-4o 출시: 모든 사용자에게 무료로 제공되는 '옴니(omni)' (198) | 2024.05.14 |
크롬(Chrome) 브라우저에서 웹사이트를 '웹앱(PWA)'으로 설치하여 독립적으로 사용하는 방법 (117) | 2024.05.14 |