본문 바로가기
IT와 AI 인공지능

텍스트만으로 음악, 오디오를 3분까지 만들 수 있는 Stable Audio v2.0 출시, Stability AI

by 새콤달콤심쿵 2024. 4. 5.
반응형

Stable Audio 2.0 소개

최근 Stability AI는 텍스트만으로 음악, 오디오를 만드는 AI를 업그레이드한 Stable Audio 2.0을 발표했습니다. 이는 AI가 생성하는 고품질의 전체 트랙을 최대 3분 길이까지, 44.1kHz 스테레오로 제공하는 고품질의 새로운 기능을 무료를 포함한 서비스로 제공합니다. 이번 업데이트 모델에는 자연어 프롬프트를 사용하여 샘플을 업로드하고 변환하는 Audio-to-Audio 생성 기능을 도입했습니다.

Stability AI의 Stable Audio v2.0
Stability AI의 Stable Audio v2.0

Stability AI의 X(구, 트위터) 발표

Stable Audio 2.0은 AudioSparx 음악 라이브러리에서 라이선스를 받은 데이터셋으로 독점적으로 훈련되었으며, 창작자에 대한 공정한 보상을 보장하고 옵트아웃 요청을 존중합니다. 이 모델은 현재 Stable Audio 웹사이트에서 무료로 사용할 수 있으며, 곧 Stable Audio API에서도 이용 가능할 예정입니다. 

 

Stable Audio 2.0 주요 특징

가장 진보된 오디오 Stable Audio v2.0 모델은 새로운 기능을 통해 아티스트와 음악가를 위한 창의적인 툴킷을 제공하며, Text-Audio 및 Audio-Audio 프롬프트를 통해 사용자는 멜로디, 반주 트랙, 줄기 및 음향 효과를 생성하여 창작 과정을 향상시킬 수 있습니다.  

 

• 전체 길이 트랙: Stable Audio 2.0은 서곡, 발전, 그리고 결말을 포함한 구조화된 작곡을 포함한 최대 3분 길이의 음악을 생성할 수 있습니다. 

3분 길이의 음악 샘플

• Audio-to-Audio 생성: 사용자는 오디오 파일을 업로드하여 아이디어를 완전히 제작된 샘플로 변환할 수 있습니다.

Audio-Audio 기능 데모

• 변형 및 사운드 이펙트 생성: 이 모델은 키보드 타이핑 소리부터 군중의 함성, 도시 거리의 윙윙거림에 이르기까지 다양한 사운드와 오디오 이펙트의 생산을 증폭합니다. 

• 오디오 품질: Stable Audio 1.0의 기반을 업그레이드하여 고품질의 44.1kHz 음악을 생산할 수 있습니다. 

• 스타일 전송: 이 새로운 기능은 생성 과정 내에서 새로 생성되거나 업로드된 오디오의 테마를 수정하여 프로젝트의 특정 스타일과 톤에 맞게 조정할 수 있습니다. 

Stable Audio 서비스
Stable Audio 서비스

Stable Audio 2.0의 라텐트 확산 모델 아키텍처는 전체 트랙을 구조적으로 생성할 수 있도록 특별히 설계되었습니다. 이 모델은 Stable Audio 1.0을 기반으로 하며, 2023년 9월에 처음으로 상업적으로 실행 가능한 AI 음악 생성 도구로 데뷔하여 고품질 44.1kHz 음악을 생산할 수 있었습니다. 이후 TIME지의 2023년 최고의 발명품 중 하나로 선정되었습니다. 

 

Stable Audio로 만든 음악의 저작권 범위

Stable Audio AI를 통해 생성된 음악에 대한 소유권, 라이선스 및 저작권에 관한 정보는 다음과 같습니다.

 

▶ Stable Audio 음악의 소유권 및 라이선스
• 무료 사용자: Stable Audio를 통해 생성된 오디오를 비상업적 프로젝트에 사용할 수 있습니다.
• 유료 사용자: 상업적 미디어 프로젝트에 사용할 수 있는 권한이 부여됩니다. 여기에는 비디오, 게임, 팟캐스트 등이 포함됩니다.

Stable Audio로 만든 음악의 저작권 범위


▶ 라이선스 유형
Stable Audio는 다음과 같은 세 가지 라이선스 유형을 제공합니다.
1. 개인 라이선스: 개인 및 비상업적 프로젝트에 오디오 생성물을 사용할 수 있습니다.
2. 창작자 라이선스: 상업 프로젝트 및 음악 발매에 생성된 오디오를 사용할 수 있습니다. 이 라이선스는 개인 창작자에게 적합합니다. 
3. 기업 라이선스: 중대형 조직의 일부로서, 거의 모든 용도로 생성된 오디오를 사용할 수 있습니다. 

▶ 상업적 사용에 대한 가이드라인
• 상업적 프로젝트: 100,000 MAU(월간 활성 사용자) 미만의 상업적 제품에 사용 가능합니다.
• 대규모 상업적 프로젝트: 100,000 MAU 이상의 상업적 제품, 영화, TV, 광고, 앱 및 게임에 사용하려면 기업 라이선스가 필요합니다.  

 

Stable Audio 2.0 사용 방법

1. Stable Audio v2.0 웹사이트 https://stableaudio.com/로 이동합니다. 
• 구글이나 기타 계정으로 가입을 합니다. 무료로 사용가능 합니다. 

2. ① 'Prompt'에 텍스트로 음악을 만들고자 하는 내용, 스타일, 악기 등을 입력합니다. 

3. 프롬프트 'Prompt'에 대한 아이디어를 얻고 싶다면 'Prompt Library'에서 다양한 샘플을 사용할 수 있습니다. 

다양한 음악 스타일의 프롬프트(Prompt) 제공
다양한 음악 스타일의 프롬프트(Prompt) 제공

4. 'Model'에서 3분 길이의 음악을 만들기 위해서는 'Stable Audio AudioSparx v2.0'를 선택합니다. 

5. 'Duration' 음원 길이는 3m(3분)으로 설정합니다. 기본적으로 3m으로 설정되어 있습니다. 

• 음악 길이를 조정하고 싶으면 시간 길이를 조정하면 됩니다. 

' Stable Audio AudioSparx v2.0' 선택
' Stable Audio AudioSparx v2.0' 선택

6. ①의 설정 등을 해서 'Generate'를 클릭하여 음악을 생성합니다.

7. 무료 사용할 경우 크리딧이 소모됩니다. 무료 사용자는 매월 1일에 20 크리딧이 충전됩니다. 

• Stable Audio v1.0 비용은 1 크리딧이 소모됩니다. 

• Stable Audio v1.1 비용은 1 크리딧이 소모됩니다. 

Stable Audio v2.0 비용은 2 크리딧이 소모됩니다. 

8. 생성된 음악은 ② 목록에 나타나며, 플레이 버튼을 클릭하여 생성된 음악을 감상할 수 있습니다. 

9. 플레이를 하면 ③ 프롬프트(Prompt)와 다양한 기능을 제공하면서 생성된 음악의 정보와 함께 음악을 감상할 수 있습니다. 

Stable Audio 화면 UI
Stable Audio 화면 UI

10. 생성된 음악은 목록화면에서 오른쪽에 있는 공유와 파일 다운로드를 할 수 있습니다. 

• 파일 형식은 MP3, WAV(유료), Video(Mp4)를 제공합니다. 

생성된 음악을 공유 및 다운로드 하기
생성된 음악을 공유 및 다운로드 하기

그 외 많은 기능이 있으니 다양하게 사용해 보시기 바랍니다. 

 

Stable Audio로 만든 음악 들어보기

• Stable Audio 웹사이트 https://stableaudio.com/에서 V2.0 모델로 만든 3분 길이의 음악 들어보기 

1. Prompt:

Soulful Boom Bap Hip Hop instrumental, Solemn effected Piano, SP-1200, low-key swing drums, sine wave bass, Characterful, Peaceful, Interesting, well-arranged composition, 90 BPM 

Stable Audio에서 생성된 3분 길이의 Souful 스타일의 음악

2. Prompt:

Disco, Driving Drum Machine, Synthesizer, Bass, Piano, Guitars, Instrumental, Clubby, Euphoric, Chicago, New York, 115 BPM 

Stable Audio에서 생성된 3분 길이의 Disco 스타일의 음악

 

마치며

Stability AI의 Stable Audio는 수노(Suno)와는 달리 작사, 노래 불러주는 기능은 제공하지 않지만 풍부한 음악을 제공하기 때문에 차이점이 있습니다. 유튜브, SNS, 커피숍 등의 BGM(배경음악)에 잘 어울릴 것 같은데요. 용도에 맞게 잘 사용한다면 나만의 멋진 음악을 만들 수 있을 것입니다.  

 

함께 보면 도움이 되는 콘텐츠 보기

▶ 노래 음악 만들어주는 AI 수노(Suno) V3 출시, 코파일럿 플러그 인에도 V3가 제공됩니다.

 

노래 음악 만들어주는 AI 수노(Suno) V3 출시, 코파일럿 플러그 인에도 V3가 제공됩니다.

더욱 향상된 라디오 품질의 수노(Suno) V3 출시 AI 기반 음악 제작 플랫폼인 수노(Suno)가 새로운 V3 모델을 출시했다는 소식은 음악 제작의 미래에 대한 흥미로운 전망을 제시합니다. 이 최신 버전은

bizstoryway.tistory.com

▶ OpenAI, 사람의 목소리를 생성하는 "AI 보이스 엔진(Voice Engine)" 공개, 다국어도 가능

 

OpenAI, 사람의 목소리를 생성하는 "AI 보이스 엔진(Voice Engine)" 공개, 다국어도 가능

AI 음성 엔진(Voice Engine) 공개 3월 29일(미국 시간)에 OpenAI가 인간의 목소리를 재현할 수 있는 새로운 "AI 음성 생성 도구인 보이스 엔진(Voice Engine)"의 미리 보기(Preview) 발표했습니다. 이 AI 보이스

bizstoryway.tistory.com

▶ 챗GPT(Chat GPT)에서 이제 답변을 음성으로 들을 수 있는 'Read aloud(소리 내어 읽기)' 기능을 제공합니다.

 

챗GPT(Chat GPT)에서 이제 답변을 음성으로 들을 수 있는 'Read aloud(소리 내어 읽기)' 기능을 제공합니

챗GPT에서 음성 읽어주는 기능 출시 3월 5일(미국 시간) OpenAI는 챗GPT(ChatGPT)의 새로운 'Read aloud(소리 내어 읽기)' 기능을 발표했습니다. 이 기능을 사용하면 챗봇이 5가지 다른 목소리로 답변을 읽

bizstoryway.tistory.com

▶ 윈도우, 그림판에서 배경제거(누끼따기) 후 레이어의 '배경색' 설정하고 숨기는 방법

 

윈도우, 그림판에서 배경제거(누끼따기) 후 레이어의 '배경색' 설정하고 숨기는 방법

그림판 '배경색' 기능 출시 윈도우에서 최근 업데이트로 '그림판'이 "배경"이라는 새로운 기능을 탑재하여 더욱 스마트해졌습니다. 이는 첫 번째로 '배경 제거' 기능을 시작으로 두 번째 '레이어'

bizstoryway.tistory.com

 

※ 포스팅이 도움이 되셨다면 💓공감, 댓글, 응원하기👍, 광고 부탁 드립니다. ~ 🎉👍🙏

 

반응형