Apakah MusicLM Google Sesuai dengan Hype?

Pembaca seperti Anda membantu mendukung MUO. Saat Anda melakukan pembelian menggunakan tautan di situs kami, kami dapat memperoleh komisi afiliasi. Baca selengkapnya.

Pada Januari 2023, Google mengumumkan MusicLM, alat AI eksperimental yang dapat menghasilkan musik berdasarkan deskripsi teks. Bersamaan dengan berita tersebut, Google merilis makalah penelitian menakjubkan untuk MusicLM yang membuat banyak orang terpesona dengan kemampuan menyulap musik dari udara tipis.

GUNAKAN VIDEO HARI INI GULIR UNTUK LANJUTKAN DENGAN KONTEN

Diberi prompt teks, model berjanji untuk menghasilkan musik fidelitas tinggi yang menyampaikan semua jenis deskripsi dari genre ke instrumen hingga teks abstrak yang menggambarkan karya seni terkenal. Sekarang MusicLM terbuka untuk umum, kami memutuskan untuk mengujinya.

Upaya Google untuk Membuat Generator Musik AI

Aplikasi web untuk Google's MusicLM AI music generator

Mengubah permintaan teks seperti 'jazz santai' menjadi trek yang siap diputar bisa dibilang merupakan cawan suci eksperimen dalam musik AI. Mirip dengan generator gambar AI terkenal seperti Dall-E atau Midjourney, Anda tidak perlu memiliki setitik pengetahuan musik untuk menghasilkan trek yang memiliki melodi dan ketukan.

Pada Mei 2023, mereka yang mendaftar ke Dapur Uji AI Google dapat mencoba demo untuk pertama kalinya. Disambut oleh halaman web yang ramah pengguna dan beberapa aturan panduan—instrumen elektronik dan klasik bekerja paling baik, dan jangan lupa untuk menentukan 'getaran'—memproduksi cuplikan musik sangatlah mudah.

Kecepatan adalah salah satu dari sedikit hal yang benar-benar diberikan oleh MusicLM, di samping sampel fidelitas yang relatif tinggi. Namun, tes sebenarnya tidak diukur dengan stopwatch saja. Bisakah MusicLM menghasilkan musik yang nyata dan dapat didengarkan berdasarkan beberapa kata? Tidak persis (kita akan segera membahasnya).

Cara Menggunakan MusicLM di Google's AI Test Kitchen

Menggunakan MusicLM itu mudah, Anda dapat mendaftar ke daftar tunggu untuk Dapur Uji AI Google jika Anda ingin mencobanya.

Di aplikasi web, Anda akan melihat kotak teks tempat Anda dapat membuat prompt dari beberapa kata hingga beberapa kalimat yang menjelaskan jenis musik yang ingin Anda dengar. Untuk hasil terbaik, Google menyarankan Anda untuk 'sangat deskriptif', menambahkan bahwa Anda harus mencoba memasukkan mood dan emosi musik.

Saat Anda siap, tekan enter untuk mulai memproses. Dalam waktu sekitar 30 detik, dua cuplikan audio akan tersedia untuk Anda audisi. Dari keduanya, Anda memiliki opsi untuk memberikan trofi kepada sampel terbaik yang cocok dengan perintah Anda, yang pada gilirannya membantu Google melatih model dan meningkatkan hasilnya.

Seperti Apa Kedengarannya MusicLM

Manusia telah membuat musik setidaknya sejak 40.000 tahun yang lalu tanpa tahu pasti apakah musik muncul sebelum, sesudah, atau bersamaan dengan perkembangan bahasa. Jadi dalam beberapa hal, tidak mengherankan jika MusicLM belum cukup memecahkan kode seni universal kuno ini.

Makalah penelitian MusicLM Google menyarankan bahwa MusicLM dapat menghasilkan musik dari teks dari karya seni terkenal, dan mengikuti instruksi seperti mengubah genre atau suasana hati dengan cara yang halus mengikuti urutan petunjuk yang berbeda.

Namun, sebelum membahas pesanan yang begitu tinggi, kami menemukan bahwa MusicLM memiliki beberapa masalah mendasar yang harus diatasi terlebih dahulu.

Kesulitan Menempel Tempo

Pekerjaan paling mendasar dari setiap musisi hanyalah bermain tepat waktu. Dengan kata lain, pertahankan tempo. Anehnya, itu bukanlah sesuatu yang dapat dilakukan MusicLM 100% sepanjang waktu.

Nyatanya, menggunakan prompt yang sama sebanyak 10 kali, yang menghasilkan 20 trek musik, hanya tiga yang tepat waktu. 17 sampel yang tersisa lebih cepat atau lebih lambat dari tempo yang ditentukan yang ditulis dalam 'ketukan per menit', istilah yang banyak digunakan untuk mendeskripsikan musik.

Dalam contoh ini, kami menggunakan prompt 'piano klasik solo dimainkan dengan 80 ketukan per menit, damai dan meditatif'. Saat mendengarkan lebih dekat, musik sering kali dipercepat atau diperlambat dalam panjang sampel yang kecil.

Musiknya juga tidak memiliki ketukan yang kuat dan terdengar seolah-olah seseorang telah memainkan permainan di tengah-tengah lagu. Apakah ini disengaja atau tidak, sulit untuk menilai apakah MusicLM benar-benar dapat membuat awal atau akhir yang tepat untuk sebuah karya musik selain tetap mengikuti irama.

Pemilihan Instrumen Acak

Mungkin MusicLM belum mempelajari cara bermain dalam pengaturan waktu yang ketat, jadi kami beralih ke parameter musik umum lainnya. Kami ingin melihat apakah itu akan mengabulkan permintaan kami untuk instrumen tertentu.

cara mendapatkan lebih banyak video ram

Kami menulis beberapa prompt berbeda yang menyertakan deskripsi seperti 'synthesizer solo' dan 'gitar bass solo'. Lainnya adalah ansambel yang lebih besar seperti 'String quartet' atau 'Jazz band'. Secara keseluruhan, sepertinya peluang 50:50 Anda akan mendapatkan apa yang Anda minta.

Salah satu teorinya adalah bahwa model tersebut mengaitkan beberapa instrumen dengan genre musik populer. Ambil, misalnya, prompt 'Synthesizer solo, progresi akor. Hidup dan ceria'. Alih-alih mendapatkan suara synthesizer sendiri, MusicLM menghasilkan trek elektronik lengkap dengan drum dan bass.

Ada kemungkinan bahwa model tersebut tidak memiliki cukup data dan pelatihan yang cukup untuk memahami permintaan khusus untuk suatu instrumen.

Vokal Keluar dari Persamaan

Menurut batasan pada saat itu, model tersebut tidak akan memproduksi musik yang mengandung vokal. Masalah hak cipta MusicLM yang pelik dan vokal buggy adalah faktor yang mungkin mengapa Google memilih untuk bermain aman dengan menetapkan batasan ini.

Namun setelah bereksperimen dengan MusicLM selama beberapa waktu, kami menyadari bahwa kontrol Google atas keluaran model tidak sepenuhnya ketat. Anehnya, prompt seperti 'gitar akustik' akan menghasilkan trek yang berisi vokal seperti hantu di latar belakang yang terdengar teredam dan jauh.

Meskipun ini bukan kejadian umum, ini membuat Anda bertanya-tanya tentang kemampuan MusicLM untuk menciptakan vokal yang meyakinkan.

Dengan perangkat lunak seperti VOCALOID dan Synthesizer V memimpin Teknologi sintesis vokal berbantuan AI , menghilangkan vokal dari model saat ini membuat kami bertanya-tanya apakah itu belum cukup baik untuk bersaing dengan teknologi yang ada. MusicLM mungkin masih harus menempuh jalan panjang sebelum musisi menyanyikan pujiannya.

Masa Depan Generator Musik AI

Saran cepat yang berbeda di MusicLM's web application

Sementara MusicLM telah memajukan teknologi musik AI generatif, MusicLM perlu kembali ke sekolah dan mempelajari beberapa hal lagi sebelum dapat melakukan pekerjaan praktis di industri musik.

Sebelumnya, upaya terbaik untuk musik AI generatif adalah model yang disebut JukeboxAI oleh OpenAI. Itu tidak benar-benar dalam keadaan siap pakai, dan butuh waktu sembilan jam untuk merender hanya satu menit musik.

Atas upaya Anda, Anda kemungkinan besar akan mendapatkan kembali trek yang benar-benar terdengar asing yang penuh dengan distorsi audio dan artefak. Sisi baiknya, Anda tidak akan bosan mendengarkan kreasi aneh yang disulap Jukebox .

Sehubungan dengan ini, MusicLM telah membuat beberapa kemajuan signifikan menuju generator musik AI yang ramah pengguna. Kami hampir dapat memaafkan model untuk keluaran acaknya ketika Anda berhenti memikirkan betapa rumitnya menghasilkan musik dalam bentuk audio mentah.

Namun, setelah menerapkan model tersebut, MusicLM terasa setengah matang jika dibandingkan dengan apa yang dipublikasikan Google dalam makalah penelitian awalnya. Jarang sekali pembuat gambar AI mendapatkan gambar Apple yang salah, demikian juga pembuat musik AI harus mendapatkan beberapa dasar yang benar seperti tempo dan instrumen.

MusicLM Google Jauh dari Harapan

Dengan perusahaan teknologi berlomba untuk bersaing satu sama lain di bidang AI, MusicLM merasa seolah-olah memasuki uji coba publik sebelum siap. Alih-alih memperbaiki dasar-dasarnya, model tersebut tampaknya mengambil pendekatan yang jauh lebih kabur dan subyektif untuk memproduksi musik.

Google mungkin mendorong Anda untuk lebih spesifik dengan prompt Anda, tetapi tidak dapat menangani tempo dengan baik, dan Anda tidak dijamin mendapatkan instrumen yang Anda minta setiap waktu. MusicLM mungkin menarik, dan demonstrasi yang bagus dari kemajuan AI yang kuat, tetapi jika musik adalah tujuan akhir, jalan masih panjang.