Stable Audio 2.0, model pembuatan audio AI Stabil, kini memungkinkan pengguna mengunggah sampel audio mereka sendiri yang kemudian dapat diubah dengan perintah dan membuat lagu yang dihasilkan AI. Namun lagu-lagunya belum memenangkan Grammy Awards.
Versi pertama Stable Audio dirilis pada September 2023 dan hanya menawarkan durasi hingga 90 detik untuk beberapa pengguna berbayar, artinya mereka hanya dapat membuat klip audio pendek untuk dicoba. Stable Audio 2.0 menyediakan trek berdurasi tiga menit penuh, sama panjangnya dengan kebanyakan lagu ramah radio. Semua file audio yang diunggah harus bebas hak cipta.
Berbeda dengan model pembangkitan suara OpenAI, Voice Engine, yang hanya tersedia untuk kelompok pengguna tertentu, Stability AI telah menjadikan suara statis gratis dan tersedia untuk umum melalui situs webnya, dan segera melalui API-nya.
Salah satu perbedaan besar antara Stable Audio 2.0 dan versi sebelumnya adalah kemampuan untuk membuat lagu yang terdengar seperti lagu, lengkap dengan intro, progresi, dan outro, kata Stability AI.
Perusahaan mengizinkan saya bermain-main sedikit dengan Stable Audio untuk melihat cara kerjanya, dan anggap saja jalan masih panjang sebelum saya dapat menyalurkan batin Beyonce saya. Dengan “lagu pop dengan nuansa Americana” (yang saya maksud adalah Americana), Stable Audio telah menghasilkan sebuah lagu yang, sebagian, terdengar seperti lagu tersebut termasuk dalam playlist Mountain Vibes Wednesday Morning Spotify. Tapi dia juga menambahkan apa yang menurutku vokal? terakhir tepian Reporter tersebut mengklaim bahwa suara tersebut terdengar seperti suara ikan paus. Aku lebih khawatir karena aku tidak sengaja mengundang Keanu ke rumahku.
Secara teori, saya dapat mengubah audio agar lebih sesuai dengan gaya mendengarkan saya, karena fitur baru di Stable Audio 2.0 memungkinkan pengguna menyesuaikan proyek mereka dengan menyesuaikan kekuatan prompt (alias berapa banyak prompt yang harus diikuti) dan berapa banyak audio yang diunggah. akan memodulasi. Pengguna juga dapat menambahkan efek suara seperti raungan penonton atau klik keyboard.
Selain suara Whale Gregory yang aneh, tidak mengherankan jika lagu-lagu buatan AI masih terdengar aneh dan tidak berjiwa. kolega saya Wes Davis memikirkan hal ini setelah mendengarkan lagu ciptaan Sono. Perusahaan lain, seperti Meta dan Google, juga telah mencoba pembuatan audio AI, namun belum merilis model mereka secara publik karena mereka mengumpulkan masukan dari pengembang untuk menanggapi masalah audio tanpa jiwa.
Stable Audio dilatih berdasarkan data dari AudioSparx, yang memiliki perpustakaan lebih dari 800.000 file audio, kata Stable AI dalam siaran pers. Stability AI mengonfirmasi bahwa artis dalam AudioSparx telah diizinkan untuk tidak ikut serta dalam materi mereka untuk melatih model tersebut. Pelatihan audio berhak cipta adalah salah satu alasan mantan VP audio Stable AI, Ed Newton-Rex, meninggalkan perusahaan tidak lama setelah Stable Audio diluncurkan. Untuk rilis kali ini, Stability AI mengatakan telah bermitra dengan Audible Magic untuk menggunakan teknologi pengenalan kontennya guna melacak materi berhak cipta dan memblokirnya agar tidak memasuki platform.
Stable Audio 2.0 lebih baik dari versi sebelumnya dalam membuat lagu terdengar seperti lagu, namun belum sampai ke sana. Jika model bersikeras menambahkan semacam vokal, mungkin versi berikutnya akan memiliki bahasa yang lebih jelas.
More Stories
PlayStation 5 Pro rencananya akan diumumkan dalam beberapa minggu
Kuo: Peningkatan RAM ke 12GB tahun depan akan terbatas pada iPhone 17 Pro Max
Perusahaan kecerdasan buatan Midjourney sedang menggoda produk perangkat keras dalam bentuk baru