کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
536973 870653 2013 16 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Distributed video coding based on lossy syndromes generated in hybrid pixel/transform domain
ترجمه فارسی عنوان
کدگذاری ویدئویی توزیع‌شده مبتنی‌بر سندرم‌های بااتلافی که در دامنه‌ی تبدیل/پیکسل هیبریدی تولید شده است
کلمات کلیدی
کدگذاری ویدئوی توزیع‌شده، سندرم‌های بااتلاف، H.264/AVC، دامنه‌ی هیبریدی ، پیچیدگی کم
فهرست مطالب مقاله
چکیده

کلمات کلیدی

1. مقدمه

2. آثار مرتبط

3. ساختار معماری ویدئوی پیشنهادی

شکل 1. معماری رمزگذاری و رمزگشایی سندرم‌های بااتلاف DVC (LSDVC). واحدهای پردازش CRC هر دو رمزگذار و رمزگشایی اختیاری هستند در صورتی که اطلاعات جانبی در رمز گشایی از طریق طغیان تولید می‌شوند: (الف) نمودار بلوک رمزگذار، (ب) نمودار بلوک رمزگشا.

3.1 برآورد همبستگی بلوک های ورودی 4x4

3.2 فشرده‌سازی و ایجاد سندرم

شکل 2. نمونه‌ای از شاخص های تولید سندرم و فرآیند رمزگشایی به دلیل وضوح حذف شده است). با فرض اینکه d = 7 و n = 4، سندرم s = 0100 کمیته Q4 را مشخص می‌کند. پس از رمزگذاری گم شده s در Sr = 0100 + e، مقدار سنج مربوط به 04 می‌شود و پیکسل بازسازی شده sp = s + e (با فرض نویز کمیت افزودنی) است.

3.3 رمزگشایی سندرم و بازسازی سیگنال کدگذاری شده

جدول 1. تفاوت متغیر پیش‌بینی‌کننده هافمن از (فرمول)

جدول2. شبه کد برای فرایند رمزگذاری

3.4 نمای کلی از عملیات رمزگشایی در رمزگشایی

3.5. خطرات پنهان کردن خطا

4. مزایای استفاده از طرح LSDVC

جدول3. شبه کد برای فرایند رمزگذاری.

شکل 3. میانگین تعداد بیت‌های محافظت شده CRC و احتمال رمزگشایی اشتباه برای کدک های LSDVC و NSQ-TD (فریم های QCIF سمن های 1-100). مقادیر گزارش شده توابع پارامتر Quantization (QP) هستند: (الف) تعداد متوسط بیتهای CRC، (ب) احتمال رمزگشایی اشتباه. 

شکل 4. میانگین تعداد بیت‌های محافظت شده CRC و احتمال رمزگشایی اشتباه برای کدک های LSDVC و NSQ-TS (فریم های QCIF سمن های 1-100). مقادیر گزارش شده توابع QP هستند: (الف) واریانس سندرم، (ب) آنتروپی سندرم.

شکل 5. انحراف استاندارد (Std.) برای تعداد بیت‌های سندرم کد گذاری شده برای LSDVC و رویکردهای NSQ-TD (QCIF پیشران دنباله در 15 فریم در ثانیه). توجه داشته باشید که هر مقدار انحراف استاندارد به عنوان تابعی از MSE بلوک فعلی (به دلیل سادگی در 7 کلاس اندازه‌گیری شده است) و از QP: (الف) LSDVC، (ب) NSQ-TD

شکل 6. رمزگشایی نسبت زمان بین کدک های NSQ-TD و LSDVC برای کیفیت مختلف QP. نتایج بر روی سکانس دنباله (QCIF با 15 فریم در ثانیه) محاسبه شده است.

شکل 7. عملکرد اعوجاج نرخ دنباله‌های مختلفی که با اندازه GOP 2 اندازه‌گیری شده‌اند: (الف) سرپرست، (ب) فوتبال، (ج) سالن، (د) محافظ ساحلی.

شکل 8. عملکرد اعوجاج نرخ برای الگوریتم های مختلف با GOP size4. نتایج مربوط به پیشکسوتان سکانس (الف)، فوتبال (ب)، سالن (ج)، محافظ ساحلی (د) است.

5- نتایج تجربی

شکل 9. عملکرد اعوجاج نرخ برای الگوریتم های مختلف با اندازه GOP8. نتایج مربوط به پیشکسوتان سکانس (الف)، فوتبال (ب)، سالن (ج)، محافظ ساحلی (د) است.

جدول 4. مقایسه نرخ اعوجاج و پیچیدگی بین LSDVC و H.264 / AVC FME (GOPIPPP).

جدول 5. ارزیابی پیچیدگی برای روش طبقه بندی پیشنهادی مبتنی بر ME.

جدول 6. ارزیابی پیچیدگی برای رمزگشایی LSDVC و DISCOVER.

شکل 10. مقادیر PSNR در مقابل احتمال از دست دادن P. برای توالی‌های مختلف QCIF. نرخ کدگذاری شده R برای هر دو برنامه نویسان درون محور منحنی‌های PSNR-VSrate به دست آمده برای QP در محدوده [20، 30) و نرخ فریم 30 فریم بر ثانیه مساوی شده است: (الف) سرپرست Ro = 230 kbit / s، (b) carphone. جدول = 400 کیلوبیت در ثانیه، (ج) اخبار Ro = 450 kbit / s، (d) جدول Rp = 360 kbit / s.

شکل 11. مقادیر PSNR در مقابل احتمال از دست دادن P. برای توالی‌های مختلف CIF. نرخ کدگذاری شده R برای هر دو برنامه نویسان درون محور منحنی PSNR-vs-نرخ بدست آمده برای QP در محدوده [20، 30) و نرخ فریم 30 فریم بر ثانیه مساوی شده است: (الف) سرپرست Ro = 650 kbit / s. (ب) فوتبال Ro = 1100 kbit / s.

6. نتیجه‌گیری
ترجمه چکیده
دسته‌ای از ویدئوهای مبتنی‌بر کدگذاری منبع توزیع‌شده که اخیرا توسط کدگذاران پیشنهاد شده است، امکان فشرده‌سازی با پیچیدگی کم و انتقال قدرتمند در کانال‌های غیرقابل اطمینان را فراهم می‌سازد. این معماری‌ها سیگنال ویدئویی را یا در پیکسل و یا در دامنه‌ی تبدیل پردازش می‌کند که اطلاعاتی جانبی را تولید می‌کند که در نتیجه رمزگشایی صحیح از تصویر کدگذاری‌شده را از مجموعه‌ای از منابع مرتبط ممکن می‌سازد. رویکرد مطرح‌شده در این مقاله با بهره‌گیری از مزایای طرح و تولید مجموعه‌ای از سندرم‌های بااتلاف، توالی ویدئو را هم در دامنه‌ی تبدیل و هم دامنه‌ی پیکسل پردازش می‌کند. طرح کدگذاری ویدئوی حاصل، با توجه به همتایان دامنه تبدیل‌شان (مانند DISCOVER یا PRISM)، به پیچیدگی محاسباتی کمتری در رمزگشا نیاز دارند و بهبودی چشمگیر در فشرده‌سازی و افزایش استحکام در برابر تلفات کانال را فراهم می‌کند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی


• We introduce the idea of lossy syndrome in hybrid domain for distributed video coding.
• We analyze the statistics of lossy syndromes.
• Lossy syndromes are applied to video coding.
• Rate-distortion performance and complexity is compared with other state-of-the-art distributed video codecs.

A recently proposed class of distributed source coding based video coders enables low-complexity compression and robust transmission over unreliable channels. These architectures process the video signal either in the pixel or in the transform domain generating some side information that permits a correct decoding of the coded image from a set of possible correlated sources. The approach proposed in this paper processes the video sequence both in the pixel and in the transform domain exploiting the advantages of both schemes and generating a set of lossy syndromes. The resulting video coding scheme requires a lower computational complexity at the decoder with respect to their transform-domain counterparts (like DISCOVER or PRISM) and provides a high compression gain and an increased robustness against channel losses.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Signal Processing: Image Communication - Volume 28, Issue 6, July 2013, Pages 553–568
نویسندگان
, ,