تبدیل متن به موسیقی توسط هوش مصنوعی
تبدیل متن به موسیقی توسط هوش مصنوعی
آی سی تی نیوز -آی سی تی نیوز - سیستم هوش مصنوعی جدید گوگل می تواند با استفاده از توضیحات متنی یک قطعه موسیقی را در هر ژانری تولید کند؛ اما این فناوری هنوز در دسترس همه قرار نگرفته است.

به گزارش فارس به نقل از ورج، محققان گوگل سیستم هوش مصنوعی جدیدی را ساختند که می‌تواند قطعات موسیقی چند دقیقه‌ای را از پیام‌های متنی تولید و حتی ملودی سوت یا زمزمه‌ را به سازهای دیگر تبدیل کند.

گوگل قطعه‌های ۳۰ ثانیه‌ای از آنچه شبیه آهنگ‌های واقعی به نظر می‌رسد منتشر کرده این قطعات از توضیحات طولانی ایجاد شده‌اند. این ویژگی احتمالا برای همه در دسترس نباشد. این مدل MusicLM نام دارد و حتی می‌تواند صدای انسان را شبیه‌سازی کند.

مطمئناً این مدل اولین سیستم هوش مصنوعی مولد برای آهنگ نیست. تلاش‌های دیگری نیز از جمله Riffusion ، Dance Diffusion، AudioML گوگل و Jukebox OpenAI انجام شده است. اما هیچ‌کدام به دلیل محدودیت‌های فنی و داده‌های آموزشی محدود، نتوانسته‌اند آهنگ‌هایی به‌ویژه از نظر آهنگسازی پیچیده یا با کیفیت بالا تولید کنند. MusicLM شاید اولین موردی باشد که این توانایی را دارد.

این مدل روی مجموعه داده‌ای از ۲۸۰هزار ساعت موسیقی آموزش دید تا یاد بگیرد که آهنگ‌های منسجمی بسازد. آهنگ‌های آن، به‌طور قابل‌توجهی شبیه موارد تولید شده توسط یک هنرمند انسانی است؛ البته نه لزوماً مبتکرانه یا از نظر موسیقی منسجم تر از آن.

قابلیت‌های MusicLM فراتر از تولید کلیپ‌های کوتاه آهنگ است. محققان گوگل نشان می‌دهند که این سیستم می‌تواند روی ملودی‌های موجود، چه زمزمه‌شده، آواز، سوت یا نواختن یک ساز، ساخته شود.

MusicLM همچنین می‌تواند از طریق ترکیبی از تصویر و زیرنویس آموزش داده شود یا صدایی تولید کند که توسط یک نوع خاص از ساز در یک ژانر خاص پخش می‌شود. حتی سطح تجربه هوش مصنوعی گوگل را می توان تنظیم کرد و سیستم می تواند موسیقی الهام گرفته از مکان ها، دوره ها یا الزامات ایجاد کند (مثلاً موسیقی انگیزشی برای تمرین).

با این حال، محققان گوگل به چالش‌های اخلاقی زیادی که توسط سیستمی مانند MusicLM ایجاد می‌شود، اشاره می‌کنند که یکی از آن ها تمایل به گنجاندن مطالب دارای حق چاپ از داده‌های آموزشی در آهنگ‌های تولید شده است. آن‌ها در طی آزمایش دریافتند که حدود ۱درصد از موسیقی‌ای که سیستم تولید می‌کند مستقیماً از آهنگ‌هایی که روی آن‌ها آموزش داده شده تکرار می‌شود؛ آستانه‌ای که ظاهراً به اندازه‌ای بالاست که آنها را از انتشار MusicLM در وضعیت فعلی آن منصرف کند.

به نظر می‌رسد با فرض اینکه MusicLM یا سیستمی مانند آن روزی در دسترس قرار گیرد؛ مسائل حقوقی عمده مطرح شود حتی اگر این سیستم‌ به عنوان ابزاری برای کمک به هنرمندان باشد.

در سال ۲۰۲۰، شرکت ضبط Jay-Z به دلیل استفاده از هوش مصنوعی برای ایجاد کاور آهنگ هایی مانند یک آهنگ مشهور از بیلی جوئل، علیه یک کانال یوتیوب، شکایت کرد.

موسیقی تولید شده توسط هوش مصنوعی سابقه ای طولانی دارد که به چندین دهه قبل باز می گردد. یکی از نسخه‌های اخیر از موتور تولید تصویر با هوش مصنوعی StableDiffusion برای تبدیل پیام‌های متنی به طیف‌نگاری استفاده می‌کند که  این اینکار در نهایت به موسیقی تبدیل می‌شود. MusicLM می‌تواند از نظر کیفیت و پایبندی به عنوان و همچنین این واقعیت که می‌تواند صدا را دریافت و ملودی را کپی کند، از سایر سیستم‌ها بهتر عمل خواهد کرد.

شفافیت در مورد این سیستم باید به زودی انجام شود،  احتمالا چندین پرونده قضایی که به دادگاه راه می یابند بر هوش مصنوعی تولید کننده موسیقی تأثیر خواهد داشت؛ از جمله حقوق هنرمندانی است که بدون اطلاع یا رضایت آنها برای آموزش سیستم های هوش مصنوعی استفاده می شود.