شرکت انویدیا روز دوشنبه مدل جدیدی از هوش مصنوعی را معرفی کرد که میتواند موسیقی و صدا تولید کند، صداها را تغییر دهد و صداهای جدیدی بسازد.
فناوری جدید انویدیا در تولید موسیقی و صداهای نوآورانه
به گزارش خبرگزاری ماه آزادی، انویدیا اعلام کرد که اکنون برنامهای برای عرضه عمومی این فناوری به نام Fugatto ندارد. Fugatto مخفف عبارت Foundational Generative Audio Transformer Opus 1 است.
این فناوری به سایر تکنولوژیهای مشابه از شرکتهای نوظهوری مانند Runway و شرکتهای بزرگتری همچون متا میپیوندد که قادر به تولید صدا یا ویدیو بر اساس متن هستند. نسخه انویدیا میتواند جلوههای صوتی و موسیقی را از توصیفات متنی ایجاد کند. مثلا تبدیل صدای ترومپت به صدای پارس کردن سگ.
آنچه این فناوری را از دیگر تکنولوژیهای هوش مصنوعی متمایز میکند، توانایی آن در دریافت و تغییر صدای موجود است. برایان کاتانزارو، معاون پژوهشهای یادگیری عمیق کاربردی در انویدیا، گفت:
اگر به صداهای مصنوعی طی ۵۰ سال گذشته نگاه کنیم، موسیقی به دلیل کامپیوترها و سینتیسایزرها تغییر کرده است. من فکر میکنم هوش مصنوعی مولد قابلیتهای جدیدی را به موسیقی، بازیهای ویدیویی و حتی افراد عادی که میخواهند چیزهایی خلق کنند، خواهد آورد.
چالشهای عرضه عمومی و نگرانیهای مربوط به سو استفاده از فناوری
در حالی که شرکتهایی مانند OpenAI با استودیوهای هالیوود در مورد استفاده از هوش مصنوعی در صنعت سرگرمی مذاکره میکنند، روابط میان فناوری و هالیوود به دلیل مسائلی مانند اتهام اسکارلت جوهانسون به OpenAI برای تقلید از صدایش، متشنج شده است.
کاتانزارو افزود:
هر فناوری مولدی همیشه ریسکهایی به همراه دارد؛ چرا که ممکن است مردم از آن برای تولید محتوای ناخواسته استفاده کنند. باید نسبت به این موضوع محتاط باشیم، به همین دلیل فعلا برنامهای برای عرضه عمومی آن نداریم.
سازندگان مدلهای هوش مصنوعی مولد هنوز راهکاری برای جلوگیری از سو استفاده از فناوری، مانند تولید اطلاعات نادرست یا نقض حقکپیرایت، پیدا نکردهاند. شرکتهای OpenAI و متا هم هنوز اعلام نکردهاند که چه زمانی مدلهای خود برای تولید صدا یا ویدیو را عمومی خواهند کرد.