محققان ادوبی یک مدل هوش مصنوعی مولد جدید به نام VideoGigaGAN توسعه دادهاند که میتواند ویدیوهای تار را تا هشت برابر وضوح اصلی خود ارتقاء دهد. Adobe که در مقاله ای منتشر شده در 18 آوریل معرفی شد، ادعا می کند VideoGigaGAN نسبت به سایر روش های ویدئو سوپر رزولوشن (VSR) برتری دارد زیرا می تواند جزئیات دقیق تری را بدون وارد کردن «عجیب هوش مصنوعی» در فیلم ارائه دهد.
به طور خلاصه، شبکههای متخاصم مولد (GAN) برای ارتقاء مقیاس تصاویر ثابت به وضوح بالاتر مؤثر هستند، اما برای انجام همین کار برای ویدیو بدون ارائه سوسو زدن و سایر مصنوعات ناخواسته تلاش میکنند. سایر روشهای افزایش مقیاس میتوانند از این امر جلوگیری کنند، اما نتایج آنقدر واضح یا دقیق نیستند. هدف VideoGigaGAN ارائه بهترین های هر دو جهان است – کیفیت تصویر/فیلم بالاتر مدل های GAN، با مشکلات سوسو زدن یا اعوجاج کمتر در فریم های خروجی. این شرکت چندین مثال در اینجا ارائه کرده است که کار خود را با وضوح کامل نشان می دهد.
برخی از جزئیات دقیق در کلیپهای نمایشی ارائه شده توسط Adobe کاملاً مصنوعی به نظر میرسد، مانند بافت پوست و چینها در مثال زیر، اما نتایج بهطور چشمگیری طبیعی به نظر میرسند. گفتن اینکه از هوش مصنوعی مولد برای بهبود وضوح استفاده شده است، دشوار است، که می تواند بحث «عکس چیست» را به ویدیو نیز گسترش دهد.
این فقط یک پیش نمایش تحقیقاتی است، بنابراین هیچ تضمینی وجود ندارد که Adobe VideoGigaGAN را از طریق نرم افزار Creative Cloud مانند Premiere Pro در دسترس مصرف کنندگان قرار دهد. این شرکت قبلاً یک آزمایش جدید نمونهبرداری مبتنی بر انتشار جداگانه به نام Project Res-Up را در طول رویداد MAX خود در اکتبر 2023 پیشنمایش کرده بود که به طور مشابه کیفیت تصاویر GIF و فیلمهای ویدیویی با وضوح پایین را بهبود میبخشد. و Adobe در این کار تنها نیست، زیرا مایکروسافت و انویدیا نیز فناوری ارتقاء مقیاس VSR خود را توسعه داده اند.