Stable Audio AI란 무엇이며 어떻게 사용하나요?

2024/02/20

인공 지능은 널리 보급되어 이미지 생성, 텍스트 기반 콘텐츠, 심지어 사운드 및 음악 제작까지 다양한 목적으로 사용되고 있습니다. Stable Audio AI는 현재 사용할 수 있는 오디오 제작을 위한 최고의 AI 모델 중 하나입니다.

이 가이드에서는 이 AI 플랫폼이 무엇인지, 그리고 이를 사용하여 악기 없이도 원본 오디오를 만드는 방법을 살펴보겠습니다.

안정적인 오디오 AI란 무엇입니까?

Stable Audio AI는 사용자가 제공한 프롬프트를 기반으로 이미지를 생성할 수 있는 Stable Diffusion AI로 가장 잘 알려진 Stability AI가 개발한 AI 모델입니다.

Stable Audio는 고급 인공 지능 기술(특히 확산 모델)을 사용하여 텍스트 설명에서 오디오를 생성합니다. 원하는 종류의 음악이나 사운드를 입력하면 몇 초 안에 생성됩니다.

Stable Audio AI는 Stability AI의 오디오 연구실인 Harmonai에서 제작되었으며 사용자가 프롬프트를 사용하여 원본 오디오를 생성할 수 있습니다.

이 오디오 생성 AI 모델이 그토록 인상적인 이유는 선도적인 디지털 음악 라이브러리인 AudioSparx의 19,500시간 분량의 오디오 데이터에 대해 교육을 받았다는 것입니다. 이를 훈련하는 데 800,000개 이상의 오디오 파일이 사용되었으며, 이를 통해 AI는 Nvidia A100 GPU를 사용하여 1초 이내에 95초의 44.1kHz 스테레오 품질 오디오를 생성할 수 있게 되었습니다.

이미지 생성을 위한 회사의 Stable Diffusion AI와 유사한 잠재 확산 기술을 사용하여 이를 수행합니다. 그리고 다른 오디오 생성 AI 모델과 달리 Stability Audio AI는 다양한 길이의 사운드를 생성하는 데 사용할 수 있습니다.

Stable Audio AI를 사용하면 단일 악기의 사운드, 주변 사운드 또는 전체 앙상블의 사운드를 생성할 수 있습니다. 이제 이를 사용하여 오디오를 생성하는 방법을 이해해 보겠습니다.

안정적인 오디오 AI 시작하기

Stable Audio AI를 사용하여 인공 지능을 사용하여 무료로 오디오를 생성할 수 있지만 이를 위해서는 Stable Audio 웹 사이트에서 계정을 만들어야 합니다. 무료 계정에도 특정 제한 사항이 있습니다.

브라우저를 실행하고 Stable Audio 웹사이트 로 이동하세요 . 거기에 도달하면 오른쪽 상단에 ‘무료로 사용해 보세요’라고 표시된 파란색 캡슐 모양의 버튼을 클릭하세요.

버튼을 클릭하면 Stable Audio AI를 사용하는 데 필요한 계정을 만들 수 있는 새 페이지로 이동합니다. 이메일 주소와 비밀번호를 입력하여 새 계정을 설정하거나 Google 계정을 통해 로그인할 수 있습니다.

Google 계정을 사용하여 로그인하기로 선택한 경우 계정 세부정보를 웹사이트와 공유하려면 Google에 승인을 제공해야 합니다. Google 계정 사용자 이름과 비밀번호를 입력한 후 ‘계속’ 버튼을 클릭하여 필요한 인증을 제공하세요.

로그인하면 Stable Audio AI 플랫폼의 홈 페이지가 나타납니다. 여기에는 계속 진행하기 위해 동의해야 하는 이용약관이 포함되어 있습니다. 여기에서 Stable Audio 뉴스레터에 가입하도록 선택할 수도 있습니다. ‘이용 약관을 읽었으며 이에 동의합니다’ 옆에 있는 버튼을 클릭하고, 원하는 경우 아래 버튼을 클릭하여 뉴스레터를 구독하세요. 그 후 하단의 ‘다음’ 버튼을 클릭하세요.

이용 약관에 동의하면 Stable Audio 대시보드로 이동하여 프롬프트를 사용하여 원본 오디오를 생성하는 데 사용할 수 있습니다.

안정적인 오디오 AI 사용

페이지의 왼쪽 상단 섹션에서는 오디오 생성을 위한 프롬프트를 입력할 수 있습니다.

Hard rock, concert promotion, metal, 180 bpm상자에 프롬프트를 입력할 수 있습니다 . 그런 다음 하단의 ‘생성’ 버튼을 클릭하여 오디오 생성을 시작합니다.

오디오를 생성하는 또 다른 방법은 프롬프트 섹션 아래에 있는 ‘프롬프트 라이브러리’에서 미리 만들어진 프롬프트를 사용하는 것입니다. 여기서 다양한 오디오 프롬프트 스타일에 액세스할 수 있습니다. 그렇게 하려면 ‘없음’이라고 표시된 캡슐 모양의 버튼을 클릭하세요. 그러면 오디오에 추가하기 위해 선택할 수 있는 다양한 스타일이 포함된 라이브러리가 열립니다.

라이브러리에서 오디오 프롬프트 스타일을 선택하려면 해당 스타일을 클릭하기만 하면 됩니다. 라이브러리 위의 프롬프트 섹션에는 스타일에 포함된 프롬프트가 표시됩니다. 선택한 스타일은 재생 아이콘을 갖게 되며 프롬프트 라이브러리 버튼의 라벨도 선택한 스타일을 반영하도록 변경됩니다.

‘프롬프트 라이브러리’ 아래에서 오디오 생성 프로세스에 사용된 AI 모델을 볼 수 있습니다. 모델 이름(이 경우 ‘Stable-audio-audiosparx-v1-0’)을 클릭하면 사용 가능한 모든 모델이 표시됩니다. 현재 사용할 수 있는 추가 모델은 베타 버전뿐입니다. 베타 AI 모델을 사용하려면 Pro 플랜으로 업그레이드해야 합니다.

다음은 생성된 오디오의 지속 시간을 제어할 수 있는 ‘기간’ 섹션입니다. 아래쪽 화살표를 클릭하면 지속 시간이 감소하고 위쪽 화살표를 클릭하면 지속 시간이 늘어납니다. Stable Audio의 무료 버전을 사용하면 45초 길이의 오디오를 생성할 수 있습니다. Pro 버전으로 업그레이드하면 1분 30초 길이의 오디오를 생성할 수 있습니다.

왼쪽의 마지막 항목은 오디오를 사용자 정의하는 데 사용할 수 있는 ‘추가 항목’ 옵션입니다. 현재 ‘단계’, ‘결과 수’, ‘시드’ 및 ‘프롬프트 강도’를 포함하는 사용 가능한 옵션을 보려면 ‘+’ 버튼을 클릭하세요.

이러한 추가 옵션 각각에는 사용자 정의할 수 있는 설정이 있습니다. 예를 들어 ‘단계’ 옵션을 클릭하면 AI가 오디오를 생성하는 데 걸리는 단계 수를 늘릴 수 있습니다. 기본적으로 50단계가 추가되며, 제공된 상자에 단계 수를 입력하여 100단계까지 늘릴 수 있습니다.

하단의 ‘초기화’ 버튼을 클릭하시면 기본값으로 되돌릴 수 있습니다. 추가 항목을 모두 제거하려면 단계 수를 입력해야 하는 상자 옆에 있는 ‘X’ 버튼을 클릭하세요.

완료한 후 ‘생성’ 버튼을 클릭하면 Stable Audio가 오디오 생성을 시작합니다. 또는 단계를 제거하고 오디오 생성의 무작위성을 제어하는 ’시드’ 옵션과 같은 다른 추가 기능을 사용할 수 있습니다. 기본적으로 옵션은 ‘Random’으로 설정되어 있습니다. 이는 AI 모델이 오디오를 생성하기 위해 다양한 오디오 배열을 사용한다는 의미입니다. ‘Random’ 라벨을 클릭하고 ‘222222’와 같은 값을 입력하면 AI가 매번 동일한 배열을 사용하도록 하여 다른 값을 입력할 수 있습니다.

기타 추가 기능으로는 ‘결과 수’ 및 ‘프롬프트 강도’가 있습니다. 전자는 AI가 프롬프트에 대해 반환할 트랙 수(최대 5개)를 제어할 수 있는 Pro 기능이며 무료 버전에서는 사용할 수 없습니다. 그러나 ‘Prompt Strength’ 옵션을 클릭하면 시험해 볼 수 있습니다. 이렇게 하면 생성된 오디오가 제공된 프롬프트에 얼마나 가까운지 제어하는 슬라이더가 나타납니다. 기본적으로는 80%로 설정되어 있지만 슬라이더를 왼쪽이나 오른쪽으로 드래그하여 필요에 따라 강도를 줄이거나 늘릴 수 있습니다.

프롬프트 강도를 조정한 후 ‘생성’ 버튼을 클릭하여 AI에게 오디오 생성을 시작하라고 지시하세요. Stability Audio AI 페이지의 오른쪽 상단에도 몇 가지 항목이 포함되어 있습니다. 첫 번째는 무료 사용자가 보유한 크레딧 수를 나타내는 음표 기호입니다. 크레딧이 있는 경우에만 오디오를 생성할 수 있으며 매달 20크레딧을 받습니다. 그런 다음 Pro 버전으로 업그레이드할 수 있는 버튼, 계정 세부정보를 확인할 수 있는 옵션, 추가 옵션이 포함된 햄버거 메뉴가 있습니다.

‘Pro 업그레이드’ 버튼을 클릭하면 사용 가능한 가격 플랜이 표시됩니다. 무료 플랜 외에도 각각 월 $11.99, $29.99, 월 $89.99의 Pro, Studio, Max 플랜 중에서 선택할 수 있습니다. ‘무료’ 요금제는 매월 20개의 트랙을 생성할 수 있는 반면, ‘프로’ 요금제는 500개의 트랙을 생성할 수 있습니다. ‘Studio’ 요금제는 최대 1,350개, ‘Max’ 요금제는 4,500개까지 올라갑니다. 또한, ‘Free’ 요금제의 트랙 지속 시간은 45초인 반면 다른 모든 요금제에서는 90초입니다. ‘무료’ 요금제에는 개인용 라이선스가 포함되어 있으며, 다른 옵션과 함께 Creator 라이선스가 제공됩니다.

업그레이드 버튼 옆의 옵션은 Stable Audio AI 플랫폼의 계정 세부 정보를 표시합니다. 이를 클릭하면 현재 계획과 제공되는 모든 내용을 알 수 있습니다.

프롬프트 개선하기

프롬프트를 다듬으면 Stability Audio가 제공하는 출력을 미세 조정할 수 있습니다. 생성 AI로 작업할 때 프롬프트가 좋을수록 결과도 좋아집니다. 메시지를 개선할 수 있는 몇 가지 방법은 다음과 같습니다.

출력 소리가 너무 전자적이거나 디지털적인 경우 프롬프트에 ‘Band’ 또는 ‘Live’와 같은 단어를 사용하는 것이 좋습니다.
프롬프트에 ‘44.1kHz’, ‘고품질’, ‘스테레오’와 같은 단어를 포함하면 생성된 출력 품질을 향상시킬 수 있습니다.
출력을 향상시키려면 트랙의 주요 악기 이름 뒤에 ‘Solo’라는 단어를 사용하세요. 예를 들어, 기본 악기가 바이올린인 경우 프롬프트에서 ‘솔로 바이올린’을 사용할 수 있습니다.

Stability Audio AI를 사용하면 프롬프트를 사용하여 인상적인 오디오 트랙을 쉽게 생성할 수 있습니다. 초보자라면 무료 플랜이 모델을 시험해 볼 수 있는 훌륭한 방법이며, 전문 음악가는 유료 플랜으로 업그레이드하여 플랫폼에서 제공하는 고급 기능을 확인할 수 있습니다.

안정적인 오디오 AI란 무엇입니까?

안정적인 오디오 AI 시작하기

안정적인 오디오 AI 사용

프롬프트 개선하기

답글 남기기 응답 취소