VMAF چیست؟ معرفی راهکاری دقیق برای سنجش کیفیت ویدیو

VMAF

VMAF چیست؟ معرفی راهکاری دقیق برای سنجش کیفیت ویدیو

با توجه به رشد روزافزون کاربران محتوای ویدئویی، ارائه کیفیتی که مخاطب را راضی کند، به یکی از دغدغه‌های اصلی سرویس‌های استریمینگ مانند نتفلیکس تبدیل شده است. اما چگونه می‌توان کیفیت ویدئو را به دقت سنجید؟ آیا می‌توان با تکیه بر معیارهای موجود کیفیت یک ویدئو را همانطور که بینندگان آن را می‌بینند ارزیابی کرد؟ اینجاست که VMAF یا Video Multi-method Assessment Fusion وارد صحنه می‌شود. در این بلاگ قصد داریم به بررسی اینکه VMAF چیست، چگونه ایجاد شد، و چرا در صنعت ویدئو مورد استقبال قرار گرفته است بپردازیم.

عناوین

  • آغاز ماجرای VMAF
  • VMAF چیست و چگونه کار می کند؟
  • استقبال صنعت رسانه از VMAF
  • کاربرد های VMAF در نتفلکیس
  • بهینه سازی VMAF
  • بهترین شیوه های استفاده از VMAF
  • آینده VMAF

آغاز ماجرای VMAF

پیش از توسعه VMAF، برای سنجش کیفیت ویدئو از روش‌هایی مانند PSNR و SSIM استفاده می‌شد. این روش‌ها بیشتر مبتنی بر پردازش سیگنال بودند و کیفیت تصویر را با توجه به تفاوت‌های بین پیکسل‌های تصویر اصلی و تصویر فشرده‌شده، ارزیابی می‌کردند. اما مشکل اصلی این روش‌ها در این بود که به‌خوبی با ادراک انسانی همخوانی نداشتند و نمی‌توانستند کیفیت ویدئو را آنطور که یک انسان می‌بیند، ارزیابی کنند. به همین دلیل، نتفلیکس به دنبال روشی بود که نه تنها دقت بالایی در سنجش کیفیت ویدئو داشته باشد، بلکه قابل‌اتکا و همسو با نظر بینندگان واقعی باشد. این جستجو به تولد VMAF انجامید.

VMAF چیست و چگونه کار می کند؟

VMAF چیست؟ این راهکار یک متریک کیفیت ویدئویی است که مدل‌سازی دید انسان را با یادگیری ماشینی ترکیب می‌کند. این پروژه با همکاری گروه تحقیقاتی پروفسور سی سی جی کو از دانشگاه جنوب کالیفرنیا آغاز شد و ایده‌های مربوط به ادراک انسانی به ویدئو گسترش یافت. به مرور زمان، همکاری‌های بیشتری با پژوهشگرانی مانند پروفسور آلن بُویک از دانشگاه تگزاس و پاتریک لوکاله از دانشگاه نانت برای بهبود دقت VMAF انجام شد. در ژوئن 2016، این پروژه به صورت کد منبع باز(Open-source) در گیت‌هاب منتشر شد تا سایر محققان و توسعه‌دهندگان نیز بتوانند در بهبود آن مشارکت کنند.

 

VMAF از چندین روش و الگوریتم مختلف برای ارزیابی کیفیت استفاده می‌کند که هرکدام به جنبه‌ای از ادراک انسان مربوط می‌شوند. سپس با ترکیب نتایج این روش‌ها و استفاده از یک مدل یادگیری ماشینی(Machine learning)، امتیازی ارائه می‌دهد که با تجربه انسانی همخوانی بیشتری داشته باشد. به‌طور خلاصه، VMAF با ترکیب جنبه‌های مختلف ادراک انسانی و تحلیل ماشینی، معیاری دقیق و قابل‌اتکا برای سنجش کیفیت ویدئوها فراهم می‌آورد.

استقبال صنعت ویدئو از VMAF

پروژه VMAF به سرعت در بین محققان و شرکت‌های فعال در صنعت ویدئو جایگاه خود را پیدا کرد و به ابزاری مهم در سنجش کیفیت تبدیل شد. بسیاری از ابزارهای سنجش ویدئو مانند FFmpeg و MSU Video Quality Measurement Tool از VMAF به عنوان یکی از معیارهای اصلی سنجش کیفیت استفاده می‌کنند. همچنین، در همایش‌ها و نمایشگاه‌های صنعتی مانند NAB و Demuxed از VMAF برای مقایسه کیفیت ویدئوها بهره‌برداری می‌شود. با گذشت زمان، محققان مستقل از جمله گروه‌های تحقیقاتی از دانشگاه یونسی و دانشگاه نانت دقت این ابزار را با داده‌های مختلف تأیید کرده‌اند. این سطح از پذیرش و تایید نشان می‌دهد که VMAF توانسته استانداردهای سنجش کیفیت ویدئو را به سطحی بالاتر ارتقا دهد.

انکودر و دیکودر صدا و تصویر چیست و چه کاربری دارند؟

بیشتر بخوانید

کاربردهای VMAF در نتفلیکس

نتفلیکس از VMAF در بخش‌های مختلفی از فرآیند تولید و پخش ویدئو استفاده می‌کند. در ادامه، برخی از کاربردهای اصلی VMAF در نتفلیکس را بررسی می‌کنیم:

  1. مقایسه کدک‌ها: برای مقایسه کدک‌های ویدئویی مختلف، VMAF ابزار مهمی می باشد. این متریک می‌تواند تفاوت‌های ظریف بین کدک‌ها را که با ادراک انسانی همخوانی دارد، شناسایی کند. به عنوان مثال، VMAF  می‌تواند تفاوت بین کدک‌هایی مانند264 و AV1  را در شرایط مختلف تشخیص داده و مقایسه‌های دقیقی ارائه دهد.
  2. تصمیم‌گیری‌های مربوط به رمزگذاری: در فرآیند رمزگذاری ویدئوها، VMAF به عنوان یک معیار بهینه‌سازی استفاده مفی‌شود. به عنوان مثال، در ابزار Dynamic Optimizer، نتفلیکس از VMAF برای انتخاب بهترین ترکیب از وضوح و نرخ بیت استفاده می‌کند. این ابزار با ارزیابی کیفیت ویدئوها بر اساس امتیاز  VMAF، تصمیماتی را اتخاذ می‌کند که منجر به ارائه بالاترین کیفیت ممکن برای بینندگان می‌شود.
  3. تجربه‌های A/B: نتفلیکس از VMAF برای ارزیابی تاثیر تغییرات مختلف بر کیفیت تجربه کاربران استفاده می‌کند. برای مثال، زمانی که الگوریتم استریمینگ تطبیقی تغییر می‌کند، از VMAF برای مقایسه کیفیت ویدئوها قبل و بعد از تغییر استفاده می‌شود. این مقایسه به نتفلیکس کمک می‌کند تا تغییراتی را که کیفیت را بهبود می‌بخشد، شناسایی و به کار بگیرد.

بهبود و بهینه‌سازی VMAF

نتفلیکس همواره در حال بهبود و توسعه VMAF است. از زمان انتشار نسخه اول، ویژگی‌ها و بهینه‌سازی‌های زیادی به این ابزار اضافه شده است. به عنوان مثال:

  • افزایش سرعت: در سال 2018، قابلیت چندرشته‌ای به VMAF اضافه شد که باعث افزایش سرعت پردازش این ابزار شد. این به‌روزرسانی به نتفلیکس و سایر کاربران امکان می‌دهد VMAF را در زمان واقعی (حتی برای ویدئوهای 4K) اجرا کنند.
  • مدل‌های اختصاصی برای شرایط مختلف: یکی دیگر از بهبودهای VMAF، توسعه مدل‌های مختلف برای دستگاه‌ها و شرایط مشاهده مختلف است. برای مثال، مدل‌های اختصاصی برای گوشی‌های همراه و نمایشگرهای 4K  ایجاد شده که باعث دقت بیشتر ارزیابی‌ها می‌شود.
  • بهبود دقت پیش‌بینی: نتفلیکس داده‌های بیشتری از نظرسنجی‌های انسانی جمع‌آوری کرده و به این ترتیب، دقت VMAF را بهبود بخشیده است. این داده‌ها شامل تنوع بیشتری از محتوای ویدئویی، رزولوشن‌ها، و پارامترهای مختلف فشرده‌سازی می باشد.

بهترین شیوه‌های استفاده از VMAF

VMAF  به دلیل دقت بالای خود، به‌عنوان معیار اصلی کیفیت ویدئو در نتفلیکس و بسیاری از سازمان‌های دیگر به کار گرفته می‌شود. با این حال، چندین نکته کلیدی در استفاده صحیح از VMAF  وجود دارد که رعایت آنها می‌تواند نتایج دقیق‌تری را ارائه دهد:

  • محاسبه VMAF در وضوح صحیح: هنگامی که ویدئوهای با وضوح پایین‌تر نسبت به منبع فشرده می‌شوند، باید آن‌ها را در همان وضوح منبع اندازه‌گیری کرد. این کار باعث می‌شود که همه آثار فشرده‌سازی و مقیاس‌بندی در نتیجه نهایی لحاظ شوند.
  • انتخاب الگوریتم مناسب برای مقیاس‌بندی: زمانی که ویدئوهای رمزگذاری شده با وضوح پایین‌تر برای اندازه‌گیری به وضوح منبع تبدیل می‌شوند، استفاده از یک الگوریتم مقیاس‌بندی مناسب مانند bicubic  پیشنهاد می‌شود. این روش نزدیک‌ترین نتایج را به دستگاه‌های نمایش واقعی ارائه می‌دهد.
  • زمان‌بندی‌های مناسب برای استفاده از VMAF: از آنجایی که VMAF امتیازهای کیفی را فریم به فریم محاسبه می‌کند، می‌توان برای بهبود دقت، از میانگین‌گیری‌های زمانی مختلف استفاده کرد. برای مثال، از میانگین حسابی (AM) برای میانگین‌گیری زمانی در دوره‌های طولانی و از میانگین هارمونیک (HM) برای دوره‌های کوتاه‌مدت با تاکید بر مقادیر پایین‌تر استفاده می‌شود.

آینده VMAF

با پیشرفت‌های جدید در صنعت ویدئو، نیاز به ابزارهایی مانند VMAF بیشتر از همیشه احساس می‌شود. نتفلیکس با همکاری پژوهشگران و جوامع متن‌باز در حال کار بر روی بهبود VMAF است تا قابلیت‌هایی همچون مدل‌های ادراکی پیشرفته‌تر و استفاده از شبکه‌های عصبی را به آن اضافه کند. به این ترتیب، VMAF می‌تواند به ارزیابی دقیق‌تر و بهینه‌تر کیفیت ویدئوها کمک کند و تجربه تماشای کاربران را بهبود بخشد.

دیدگاهتان را بنویسید

منوی اصلی