VMAF چیست؟ معرفی راهکاری دقیق برای سنجش کیفیت ویدیو
با توجه به رشد روزافزون کاربران محتوای ویدئویی، ارائه کیفیتی که مخاطب را راضی کند، به یکی از دغدغههای اصلی سرویسهای استریمینگ مانند نتفلیکس تبدیل شده است. اما چگونه میتوان کیفیت ویدئو را به دقت سنجید؟ آیا میتوان با تکیه بر معیارهای موجود کیفیت یک ویدئو را همانطور که بینندگان آن را میبینند ارزیابی کرد؟ اینجاست که VMAF یا Video Multi-method Assessment Fusion وارد صحنه میشود. در این بلاگ قصد داریم به بررسی اینکه VMAF چیست، چگونه ایجاد شد، و چرا در صنعت ویدئو مورد استقبال قرار گرفته است بپردازیم.
عناوین
- آغاز ماجرای VMAF
- VMAF چیست و چگونه کار می کند؟
- استقبال صنعت رسانه از VMAF
- کاربرد های VMAF در نتفلکیس
- بهینه سازی VMAF
- بهترین شیوه های استفاده از VMAF
- آینده VMAF
آغاز ماجرای VMAF
پیش از توسعه VMAF، برای سنجش کیفیت ویدئو از روشهایی مانند PSNR و SSIM استفاده میشد. این روشها بیشتر مبتنی بر پردازش سیگنال بودند و کیفیت تصویر را با توجه به تفاوتهای بین پیکسلهای تصویر اصلی و تصویر فشردهشده، ارزیابی میکردند. اما مشکل اصلی این روشها در این بود که بهخوبی با ادراک انسانی همخوانی نداشتند و نمیتوانستند کیفیت ویدئو را آنطور که یک انسان میبیند، ارزیابی کنند. به همین دلیل، نتفلیکس به دنبال روشی بود که نه تنها دقت بالایی در سنجش کیفیت ویدئو داشته باشد، بلکه قابلاتکا و همسو با نظر بینندگان واقعی باشد. این جستجو به تولد VMAF انجامید.
VMAF چیست و چگونه کار می کند؟
VMAF چیست؟ این راهکار یک متریک کیفیت ویدئویی است که مدلسازی دید انسان را با یادگیری ماشینی ترکیب میکند. این پروژه با همکاری گروه تحقیقاتی پروفسور سی سی جی کو از دانشگاه جنوب کالیفرنیا آغاز شد و ایدههای مربوط به ادراک انسانی به ویدئو گسترش یافت. به مرور زمان، همکاریهای بیشتری با پژوهشگرانی مانند پروفسور آلن بُویک از دانشگاه تگزاس و پاتریک لوکاله از دانشگاه نانت برای بهبود دقت VMAF انجام شد. در ژوئن 2016، این پروژه به صورت کد منبع باز(Open-source) در گیتهاب منتشر شد تا سایر محققان و توسعهدهندگان نیز بتوانند در بهبود آن مشارکت کنند.
VMAF از چندین روش و الگوریتم مختلف برای ارزیابی کیفیت استفاده میکند که هرکدام به جنبهای از ادراک انسان مربوط میشوند. سپس با ترکیب نتایج این روشها و استفاده از یک مدل یادگیری ماشینی(Machine learning)، امتیازی ارائه میدهد که با تجربه انسانی همخوانی بیشتری داشته باشد. بهطور خلاصه، VMAF با ترکیب جنبههای مختلف ادراک انسانی و تحلیل ماشینی، معیاری دقیق و قابلاتکا برای سنجش کیفیت ویدئوها فراهم میآورد.
استقبال صنعت ویدئو از VMAF
پروژه VMAF به سرعت در بین محققان و شرکتهای فعال در صنعت ویدئو جایگاه خود را پیدا کرد و به ابزاری مهم در سنجش کیفیت تبدیل شد. بسیاری از ابزارهای سنجش ویدئو مانند FFmpeg و MSU Video Quality Measurement Tool از VMAF به عنوان یکی از معیارهای اصلی سنجش کیفیت استفاده میکنند. همچنین، در همایشها و نمایشگاههای صنعتی مانند NAB و Demuxed از VMAF برای مقایسه کیفیت ویدئوها بهرهبرداری میشود. با گذشت زمان، محققان مستقل از جمله گروههای تحقیقاتی از دانشگاه یونسی و دانشگاه نانت دقت این ابزار را با دادههای مختلف تأیید کردهاند. این سطح از پذیرش و تایید نشان میدهد که VMAF توانسته استانداردهای سنجش کیفیت ویدئو را به سطحی بالاتر ارتقا دهد.
انکودر و دیکودر صدا و تصویر چیست و چه کاربری دارند؟
کاربردهای VMAF در نتفلیکس
نتفلیکس از VMAF در بخشهای مختلفی از فرآیند تولید و پخش ویدئو استفاده میکند. در ادامه، برخی از کاربردهای اصلی VMAF در نتفلیکس را بررسی میکنیم:
- مقایسه کدکها: برای مقایسه کدکهای ویدئویی مختلف، VMAF ابزار مهمی می باشد. این متریک میتواند تفاوتهای ظریف بین کدکها را که با ادراک انسانی همخوانی دارد، شناسایی کند. به عنوان مثال، VMAF میتواند تفاوت بین کدکهایی مانند264 و AV1 را در شرایط مختلف تشخیص داده و مقایسههای دقیقی ارائه دهد.
- تصمیمگیریهای مربوط به رمزگذاری: در فرآیند رمزگذاری ویدئوها، VMAF به عنوان یک معیار بهینهسازی استفاده مفیشود. به عنوان مثال، در ابزار Dynamic Optimizer، نتفلیکس از VMAF برای انتخاب بهترین ترکیب از وضوح و نرخ بیت استفاده میکند. این ابزار با ارزیابی کیفیت ویدئوها بر اساس امتیاز VMAF، تصمیماتی را اتخاذ میکند که منجر به ارائه بالاترین کیفیت ممکن برای بینندگان میشود.
- تجربههای A/B: نتفلیکس از VMAF برای ارزیابی تاثیر تغییرات مختلف بر کیفیت تجربه کاربران استفاده میکند. برای مثال، زمانی که الگوریتم استریمینگ تطبیقی تغییر میکند، از VMAF برای مقایسه کیفیت ویدئوها قبل و بعد از تغییر استفاده میشود. این مقایسه به نتفلیکس کمک میکند تا تغییراتی را که کیفیت را بهبود میبخشد، شناسایی و به کار بگیرد.
بهبود و بهینهسازی VMAF
نتفلیکس همواره در حال بهبود و توسعه VMAF است. از زمان انتشار نسخه اول، ویژگیها و بهینهسازیهای زیادی به این ابزار اضافه شده است. به عنوان مثال:
- افزایش سرعت: در سال 2018، قابلیت چندرشتهای به VMAF اضافه شد که باعث افزایش سرعت پردازش این ابزار شد. این بهروزرسانی به نتفلیکس و سایر کاربران امکان میدهد VMAF را در زمان واقعی (حتی برای ویدئوهای 4K) اجرا کنند.
- مدلهای اختصاصی برای شرایط مختلف: یکی دیگر از بهبودهای VMAF، توسعه مدلهای مختلف برای دستگاهها و شرایط مشاهده مختلف است. برای مثال، مدلهای اختصاصی برای گوشیهای همراه و نمایشگرهای 4K ایجاد شده که باعث دقت بیشتر ارزیابیها میشود.
- بهبود دقت پیشبینی: نتفلیکس دادههای بیشتری از نظرسنجیهای انسانی جمعآوری کرده و به این ترتیب، دقت VMAF را بهبود بخشیده است. این دادهها شامل تنوع بیشتری از محتوای ویدئویی، رزولوشنها، و پارامترهای مختلف فشردهسازی می باشد.
بهترین شیوههای استفاده از VMAF
VMAF به دلیل دقت بالای خود، بهعنوان معیار اصلی کیفیت ویدئو در نتفلیکس و بسیاری از سازمانهای دیگر به کار گرفته میشود. با این حال، چندین نکته کلیدی در استفاده صحیح از VMAF وجود دارد که رعایت آنها میتواند نتایج دقیقتری را ارائه دهد:
- محاسبه VMAF در وضوح صحیح: هنگامی که ویدئوهای با وضوح پایینتر نسبت به منبع فشرده میشوند، باید آنها را در همان وضوح منبع اندازهگیری کرد. این کار باعث میشود که همه آثار فشردهسازی و مقیاسبندی در نتیجه نهایی لحاظ شوند.
- انتخاب الگوریتم مناسب برای مقیاسبندی: زمانی که ویدئوهای رمزگذاری شده با وضوح پایینتر برای اندازهگیری به وضوح منبع تبدیل میشوند، استفاده از یک الگوریتم مقیاسبندی مناسب مانند bicubic پیشنهاد میشود. این روش نزدیکترین نتایج را به دستگاههای نمایش واقعی ارائه میدهد.
- زمانبندیهای مناسب برای استفاده از VMAF: از آنجایی که VMAF امتیازهای کیفی را فریم به فریم محاسبه میکند، میتوان برای بهبود دقت، از میانگینگیریهای زمانی مختلف استفاده کرد. برای مثال، از میانگین حسابی (AM) برای میانگینگیری زمانی در دورههای طولانی و از میانگین هارمونیک (HM) برای دورههای کوتاهمدت با تاکید بر مقادیر پایینتر استفاده میشود.
آینده VMAF
با پیشرفتهای جدید در صنعت ویدئو، نیاز به ابزارهایی مانند VMAF بیشتر از همیشه احساس میشود. نتفلیکس با همکاری پژوهشگران و جوامع متنباز در حال کار بر روی بهبود VMAF است تا قابلیتهایی همچون مدلهای ادراکی پیشرفتهتر و استفاده از شبکههای عصبی را به آن اضافه کند. به این ترتیب، VMAF میتواند به ارزیابی دقیقتر و بهینهتر کیفیت ویدئوها کمک کند و تجربه تماشای کاربران را بهبود بخشد.