پروژه جدید شرکت «متا» با همکاری شرکت «گوگل» از هوش مصنوعی برای تولید پادکست استفاده میکند.
به گزارش ای سی تی نیوز، شرکت «متا»(Meta) اجرای منبع باز ویژگی تولید پادکست را در نرمافزار «نوتبوکالام»(NotebookLM) شرکت «گوگل» منتشر کرده است.
این پروژه موسوم به «نوتبوکلاما»(NotebookLlama) از مدلهای «لاما» خود شرکت متا برای بیشتر پردازشها استفاده میکند و مانند نوتبوکالام میتواند خلاصههایی را به سبک پادکست از فایلهای متنی آپلودشده در آن ایجاد کند.
نوتبوکلاما ابتدا یک رونوشت را از فایلهایی مانند PDF یک مقاله خبری یا پست وبلاگ ایجاد میکند و پیش از ارائه رونوشت برای فعال کردن مدلهای تبدیل متن به گفتار، گزینه نمایش بیشتر و وقفهها را میافزاید.
نتایج این نرمافزار به خوبی کار نوتبوکالام به نظر نمیرسد. در نمونههای نوتبوکلاما که گزارشگر تک کرانچ به آنها گوش داده است، صداها به وضوح از کیفیت رباتیک برخوردار هستند و تمایل دارند درباره موضوعات عجیب صحبت کنند اما پژوهشگران این پروژه در شرکت متا میگویند که کیفیت را میتوان با ارائه مدلهای قویتر بهبود بخشید.
آنها در توضیح نرمافزار جدید نوشتند: مدل تبدیل متن به گفتار، محدودیتی برای طبیعی به نظر رسیدن این نرمافزار است. همچنین، یکی دیگر از روشهای نوشتن پادکست این است که دو طرف درباره موضوع مورد نظر صحبت کنند و طرح کلی پادکست را بنویسند. این در حالی است که ما از یک مدل واحد برای نوشتن طرح کلی پادکست استفاده میکنیم.
نوتبوکلاما اولین تلاش برای تکرار ویژگی پادکست نوتبوکالام نیست. برخی از پروژهها موفقیت بیشتری را نسبت به نمونههای دیگر داشتهاند اما هیچ کدام -حتی خود نوتبوکالام- نتوانستهاند مشکل توهم را حل کنند که در همه مدلهای هوش مصنوعی وجود دارد و باعث میشود پادکستهای تولیدشده توسط هوش مصنوعی حاوی چیزهای ساختگی باشند.