بهترین فرمت فشرده سازی ویدئو چیست؟
در صنعت دوربین مداربسته تحت شبکه، همه خواهان کیفیت تصویر عالی هستند. اما هرچه پیکسل و جزئیات بیشتری به تصویر اضافه شود، ناگزیر هنگام ارسال در بستر شبکه، پهنای باند بیشتر و هنگام ذخیره سازی، حافظه بیشتری را اشغال خواهد کرد. در پروژه های نظارت تصویری، بخش عمده ای از هزینه ها صرف حافظه ذخیره سازی (هارد دیسک) می شود. در مورد پهنای باند نیز، با وجود رشد ظرفیت های زیرساخت، همچنان هنگام انتقال فایل های حجیم، با ازدحام شبکه (تجمع داده های انتقالی در صف انتظار) مواجه می شویم. پس چاره چیست؟ آیا راهکاری برای بالا بردن کیفیت تصویر و در عین حال کاهش هزینه های انتقال و ذخیره سازی اطلاعات وجود دارد؟
الگوریتم های فشرده سازی چگونه کار می کنند؟
الگوریتم های فشرده سازی ویدئو به دنبال داده های تکراری و اضافی می گردند. با کاهش تعداد دفعات ارسال داده های تکراری، می توان حجم یک فایل را کاهش داد. برای مثال یک دقیقه از فیلمی را در نظر بگیرید که در آن فردی در جلوی کتابخانه ای در حال صحبت است. منطقی نیست که در هر فریم از این ویدئو، پس زمینه فرد (یعنی همان کتابخانه) ارسال شود. به جای آن، پس زمینه یک بار فشرده سازی شده و هر بار که نیاز بود، دوباره به آن مراجعه می شود. این کار تا زمانی که اطلاعات تکراری در فریم ها باشد، ادامه پیدا می کند.
در الگوریتم های فشرده سازی همانند H.264، تکنیک interframe به همین صورت عمل می کند. نحوه کار این تکنیک با پیش بینی است، یعنی فرض بر آن است که بیشتر آنچه فریم جدید را می سازد در فریم قبلی پیدا می شود، اما شاید در محلی دیگر. این تکنیک جریان (استریم) ویدئو را به سه فریم طبقه بندی می کند
فریم I
فریم P
فریم B
فریم I (I-frame)
فریم I یا Intra-frame فریم مرجع است. یعنی یک فریم کامل که تمامی اطلاعات تصویر را دارد. اولین فریم یک ویدئو همیشه فریم I است. عیب I-frame این است که حجم بالایی دارد، اما از طرفی دیگر، بیشترین کیفیت را نیز دارد. اگر بعد از فعالسازی الگوریتم فشرده سازی، تصویر دوربین مداربسته شما مرتب پیکسل پیکسل شود، یک راه ارتقاء کیفیت تصویر دوربین مداربسته بالا بردن تعداد فریم های I است.
فریم P (P-frame)
P مخفف Predictive و به معنای پیش بینی است. این فریم ها از روی فریم های قبلی پیش بینی می شوند. عیب این فریم ها اینست که به دلیل وابستگی هایی که به فریم های P و یا I قبلی دارند، بسیار حساس به خطاهای ارسال هستند و اگر فریم قبلی به درستی و کامل ارسال نشود، پیکسل پیکسل شدن ویدئو اتفاق می افتد.
فریم B (B-Frame)
در فریم پیش بینی شده ی دو جهته (Bi-predictive)، بعضی از داده ها از روی فریم قبلی و بعضی از روی فریم I بعدی پیش بینی می شوند. به دلیل اینکه فریم های B، هم به فریم قبلی و هم به فریم بعدی مراجعه می کنند، احتمال اینکه داده های تکراری را پیدا کنند بیشتر است، لذا این فریم ها در مقایسه با فریم P کارآمدتر هستند. البته ممکن است تاخیر را کمی بالا ببرند.
به ترتیب قرار گرفتن فریم های I، P و B در جریان ویدئویی GOP یا Group of Pictures گفته می شود.
چرا یونی ویو کدک فشرده سازی هوشمند Ultra 265 را ارائه کرد؟
همانطور که در بالا گفته شد، ارسال ناقص فریم های قبلی، موجب بروز خطا در P فریم ها و پیکسل پیکسل شده تصویر می شود. این موضوع بیشتر در مواقعی اتفاق می افتد که حرکت زیادی در تصویر به چشم می خورد.
برای حل این مشکل، کمپانی یونی ویو فرمت فشرده سازی Ultra 265 را ارائه کرده است. این فرمت فشرده سازی از GOP داینامیک استفاده می کند. بدین صورت که اگر تحرک در تصویر زیاد شود، الگوریتم فشرده سازی Ultra 265 به صورت خودکار تعداد فریم های I را افزایش می دهد تا از بروز پیکسل پیکسل شدن تصویر جلوگیری کرده و کیفیت ویدئو را پایدار نگه دارد. هنگامی که حرکت زیادی در تصویر نباشد، تعداد فریم های I کاهش می یابد (GOP طولانی تر می شود) تا از ارسال داده های تکراری جلوگیری شده و مصرف پهنای باند و حافظه ذخیره سازی را تا 95% کاهش دهد.
همچنین، مزیت دیگر فرمت فشرده سازی Ultra 265 امکان اجرای آن بر روی تمامی جریان های (استریم) ویدئو است.
تفاوت فرمت فشرده سازی Ultra 265 با فرمت های فشرده سازی دیگر
به مثال های زیر توجه کنید
اگر پهنای باند شبکه 20 مگابیت باشد، تصویر چند دوربین 2 مگاپیکسلی را می توان انتقال داد؟
H.264 |
|
|
تصویر |
پهنای باند مصرفی دوربین 2 مگاپیکسل،3.3 مگابیت در ثانیه
|
مشخصات |
H.265 |
|
|
تصویر |
پهنای باند مصرفی دوربین 2 مگاپیکسل1.61 مگابیت در ثانیه
|
مشخصات |
Ultra 265 |
|
|
تصویر |
پهنای باند مصرفی دوربین 2 مگاپیکسل307 کیلوبیت در ثانیه
|
مشخصات |