کد اسمبلی و C و فایل word پایان نامه پیاده سازی بلادرنگ codec صحبت استاندارد G.278 بر روی پردازنده TMS320C5402

کد اسمبلی و C و فایل word پایان نامه

پیاده سازی بلادرنگ codec صحبت استاندارد G.278 بر روی پردازنده TMS320C5402

 

لینک دانلود

 

چکيده

کدک صحبت استاندارد G.728 ، يک کدک کم تاخير است که صحبت با کيفيت عالی را در نرخ بيت 16 kbps ارائه می‌دهد و برای شبکه‌های تلفن ماهواره ای و اينترنت و موبايل که به تاخير زياد حساس هستند ، مناسب است. در اين رساله به پياده سازی بلادرنگ اينکدر و ديکدر G.728 بصورت دوطرفه کامل ( Full Duplex ) بر روی پردازنده TMS320C5402 می‌پردازيم .
روشی ترکيبی برای برنامه نويسی TMS ارائه می‌شود که در آن زمان وپيچيدگی برنامه نويسی نسبت به برنامه نويسی دستی به 30% کاهش می‌يابد . در اين روش پس از برنامه نويسی و شبيه سازی مميزثابت الگوريتم کدک به زبان C ، با استفاده از نرم افزار ( Code Composer Studio ) CCS ، برنامه به زبان اسمبلی ترجمه شده و بهينه سازی دستی در کل کد اسمبلی صورت می‌گيرد . سپس بعضی از توابع مهم برنامه از نظر MIPS ، بصورت دستی به زبان اسمبلی بازنويسی می‌شوند تا برنامه بصورت بلادرنگ قابل اجرا گردد . در پايان نتايج اين پياده سازی ارائه می‌شود .

کلمات کليدی

کدينگ و فشرده سازی صحبت ، پياده سازی بلادرنگ ، DSP ، TMS320C5402 ، برد DSK

 

فهرست

– مقدمه 4
فصل 1 : بررسی و مدل سازی سيگنال صحبت
1-1- معرفی سيگنال صحبت 6
1-2- مدل سازی پيشگويی خطی 10
1-2-1- پنجره کردن سيگنال صحبت 11
1-2-2- پيش تاکيد سيگنال صحبت 13
1-2-3- تخمين پارامترهای LPC 14

فصل 2 : روش‌ها و استانداردهای کدينگ صحبت
2-1- مقدمه 15
2-2- روش‌های کدينگ 19
2-2-1- کدرهای شکل موج 21
2-2-2- کدرهای صوتی

22 2-2-3- کدرهای مختلط 24
الف- کدرهای مختلط حوزه فرکانس 27
ب- کدرهای مختلط حوزه زمان 29

فصل 3 : کدر کم تاخير LD-CELP
3-1- مقدمه 34
3-2- بررسی کدرکم تاخير LD-CELP 36
3-2-1- LPC معکوس مرتبه بالا 39
3-2-2- فيلتر وزنی شنيداری 42
3-2-3- ساختار کتاب کد 42
3-2-3-1- جستجوی کتاب کد 43
3-2-4- شبه ديکدر 45
3-2-5- پست فيلتر 46
فصل 4 : شبيه سازی مميزثابت الگوريتم به زبان C
4-1- مقدمه 49
4-2- ويژگی‌های برنامه نويسی مميزثابت 50
4-3- ساده سازی محاسبات الگوريتم 53
4-3-1- تطبيق دهنده بهره 54
4-3-2- محاسبه لگاريتم معکوس 58
4-4- روندنمای برنامه 59
4-4-1- اينکدر 63
4-4-2- ديکدر 69
فصل 5 : پياده سازی الگوريتم برروی DSP
5-1- مقدمه 74
5-2- مروری بر پياده سازی بلادرنگ 75
5-3- چيپ‌های DSP 76
5-3-1- DSP‌های مميزثابت 77
5-3-2- مروری بر DSP‌های خانواده TMS320 78
5-3-2-1- معرفی سری TMS320C54x 79
5-4- توسعه برنامه بلادرنگ 81
5-5- اجرای برنامه روی برد توسعه گر C5402 DSK 82
5-5-1- بکارگيری ابزارهای توسعه نرم افزار 84
5-5-2- استفاده از نرم افزارCCS 86
5-5-3- نتايج پياده سازی 94
5-6- نتيجه گيری و پيشنهاد 97

– مراجع 103

 

– مقدمه

امروزه در عصر ارتباطات و گسترش روزافزون استفاده از شبكه‌هاي تلفن ،موبايل و اينترنت در جهان ومحدوديت پهناي باند در شبكه‌هاي مخابراتي ، كدينگ و فشرده سازي صحبت امري اجتناب ناپذير است . در چند دهه اخير روشهاي كدينگ مختلفي پديدآمده اند ولي بهترين و پركاربردترين آنها كدك‌هاي آناليزباسنتز هستند كه توسط Atal & Remedeدر سال 1982 معرفي شدند [2] . اخيرا مناسبترين الگوريتم براي كدينگ صحبت با كيفيت خوب در نرخ بيت‌هاي پائين و زير 16 kbps ، روش پيشگويي خطي باتحريك كد (CELP) مي باشد كه در سال 1985 توسط Schroeder & Atal معرفي شد [8] و تا كنون چندين استاندارد مهم كدينگ صحبت بر اساس CELP تعريف شده اند .
در سال 1988 CCITT برنامه اي براي استانداردسازي يك كدك 16 kbps با تاخيراندك و كيفيت بالا در برابر خطاهاي كانال آغاز نمود و براي آن كاربردهاي زيادي همچون شبكه PSTN ،ISDN ،تلفن تصويري و غيره در نظر گرفت . اين كدك در سال 1992 توسط Chen et al. تحت عنوان LD-CELP معرفي شد[6] و بصورت استاندارد G.728 در آمد[9] و در سال 1994 مشخصات مميز ثابت اين كدك توسط ITU ارائه شد[10] . با توجه به كيفيت بالاي اين كدك كه در آن صحبت سنتزشده از صحبت اوليه تقريبا غيرقابل تشخيص است و كاربردهاي آن در شبكه‌هاي تلفن و اينترنت و ماهواره اي در اين گزارش به پياده سازي اين كدك مي پردازيم .
در فصل اول به معرفي وآناليز سيگنال صحبت پرداخته مي شود و در فصل دوم روش‌ها و استانداردهاي كدينگ بيان مي شوند . در فصل سوم كدك LD-CELP را بيشتر بررسي مي كنيم و در فصل چهارم شبيه سازي مميز ثابت الگوريتم به زبان C را بيان مي نمائيم. ودر پايان در فصل 5 به نحوه پياده سازي بلادرنگ كدكG.728 بر روي پردازنده TMS320C5402 مي پردازيم.

 

فصل 1

بررسي و مدل سازي سيگنال صحبت

1-1 –معرفي سيگنال صحبت

صحبت در اثر دميدن هوا از ريه‌ها به سمت حنجره و فضاي دهان توليد مي‏شود. در طول اين مسير در انتهاي حنجره، تارهاي صوتي قرار دارند. فضاي دهان را از بعد از تارهاي صوتي ، لوله صوتي مي‏نا مند كه در يك مرد متوسط حدود cm 17 طول دارد . در توليد برخي اصوات تارهاي صوتي كاملاً باز هستند و مانعي بر سر راه عبور هوا ايجاد نمي‏كنند كه اين اصوات را اصطلاحاً اصوات بي واك مي‏نامند. در دسته ديگر اصوات ، تارهاي صوتي مانع خروج طبيعي هوا از حنجره مي‏گردند كه اين باعث به ارتعاش درآمدن تارها شده و هوا به طور غير يكنواخت و تقريباً پالس شكل وارد فضاي دهان مي‏شود. اين دسته از اصوات را اصطلاحاً باواك مي‏گويند.
فركانس ارتعاش تارهاي صوتي در اصوات باواك را فركانس Pitch و دوره تناوب ارتعاش تارهاي صوتي را پريود Pitch مي‏نامند. هنگام انتشار امواج هوا در لوله صوتي، طيف فركانس اين امواج توسط لوله صوتي شكل مي‏گيرد و بسته به شكل لوله ، پديده تشديد در فركانس‌هاي خاصي رخ مي‏دهد كه به اين فركانس‌هاي تشديد فرمنت مي‏گويند.
از آنجا كه شكل لوله صوتي براي توليد اصوات مختلف، متفاوت است پس فرمنت‌ها براي اصوات گوناگون با هم فرق مي‏كنند. با توجه به اينكه صحبت يك فرآيند متغيير با زمان است پس پارامترهاي تعريف شده فوق اعم از فرمنت‌ها و پريود Pitch در طول زمان تغيير مي‏كنند به علاوه مد صحبت به طور نامنظمي از باواك به بي واك و بالعكس تغيير مي‏كند. لوله صوتي ، همبستگي‌هاي زمان-كوتاه ، در حدود 1 ms ، درون سيگنال صحبت را در بر مي‏گيرد. و بخش مهمي از كار كدكننده‌هاي صوتي مدل كردن لوله صوتي به صورت يك فيلتر زمان-كوتاه مي‏باشد. همان طور كه شكل لوله صوتي نسبتاً آهسته تغيير مي‏كند، تابع انتقال اين فيلتر مدل كننده هم نياز به تجديد ، معمولاً در هر 20ms يکبارخواهد داشت.
در شكل (1-1 الف) يك قطعه صحبت باواك كه با فركانس 8KHz نمونه برداري شده است ديده مي‏شود. اصوات باواك داراي تناوب زمان بلند به خاطر پريود Pitch هستند كه نوعاً بين 2ms تا 20ms مي‏باشد. در اينجا پريود Pitch در حدود 8ms يا 64 نمونه است. چگالي طيف توان اين قطعه از صحبت در شكل (1-1 ب) ديده مي‏شود[3].
اصوات بي واك نتيجه تحريك نويز مانند لوله صوتي هستند و تناوب زمان- بلند اندكي را در بر دارند ، همانگونه كه در شكل‌هاي (1-1 ج) و (1-1 د) ديده مي‏شود ولي همبستگي زمان كوتاه به خاطر لوله صوتي در آنها هنوز وجود دارد.
بطوركلي سيگنال صحبت داراي افزونگي زيادي است كه ناشي از عوامل ذيل هستند:
ـ وابستگي‌هاي زمان-كوتاه : اين وابستگي‌ها عمدتاً به كندي تغييرات صحبت با زمان و ساختار
( الف) (ب)
(ج) (د)
شكل (1-1) : مقايسه اصوات باواك و بي واك. (الف)و(ب) : باواك ، (ج)و(د) : بي واك

نسبتاً منظم فرمنت‌ها مربوط مي‏شوند.
ـ وابستگي‌هاي زمان- بلند : كه عمدتاً از طبيعت نيمه متناوب اصوات با واك و تغييرات آرام پريود Pitch ناشي مي‏شوند.
ـ‌تابع چگالي احتمال صحبت : عليرغم پيچيدگي آماري صحبت مي‏توان آن را با توابع چگالي احتمال شناخته شده تقريب زد. شكل لوله صوتي و مد تحريك آن به صورت نسبتاً آرام تغيير مي‏كند و بنابراين صحبت را مي‏توان به صورت شبه ايستان در دوره‌هاي كوتاه زماني (حدود 20ms) در نظر گرفت و با يك فرآيند تصادفي ارگاديك در يك قطعه زماني كوچك مدل نمود و طيف مشخصي براي آن در اين قطعه زماني بدست آورد.
علاوه بر افزونگي‌هاي فوق عامل مهم ديگری كه كاهش نرخ داده سيگنال صحبت را ممكن مي سازد، طبيعت غير حساس گوش انسان نسبت به بسياري از ويژگيهاي اين سيگنال مي‏باشد.

مراجع

1- Panos E. Papamichalis, “Practical Approaches to Speech Coding “, Prentice-Hall Inc. ,1987.
2-B.S. Atal & R.Remde “A new model of LPC excited for producing natural-sounding speech at low bit rates”, Proc.ICASSP pp.614-617 1982.
3-Jason P. Woodard , “Digital Speech Coding” , Mini-Thesis , Department of Electronics & Computer Science, University of Southampton, Jun 1994.
4-J.Makhoul “Linear Prediction: A Tutorial Review ” Proc. IEEE,vol 63, No.4,pp.561-580 Apr 1975.
5- Kondoz A.M,” Digital Speech , Coding of low bit rate communication Systems”, Chichester Wiley 2000
6- Chen,Cox & Lin,”A Low-Delay CELP Coder for the CCITT 16 kb/s Speech Coding Standard”,IEEE Jour. On Selected Area in Comm.,vol.10,no.5 ,June 92.
7- L.Hanzo,A.Somerville & Jason P. Woodard, “Voice Compression and Communication”,IEEE series on Digital & Mobile,2001
8- Schroeder & Atal ,”Code-Excited linear Prediction (CELP):High quality speech at very low bit rates”,IEEE,ICASSP,pp.937-940,1985.
9- ITU,”Coding of Speech at 16 kbps using Low-Delay Code Excited Linear Prediction “, ITU (CCITT)Recommendation G.728, 1992.
10- ITU,” G.728 Annex G , 16 kbps Fixed Point specification “, 11/94.
11- TI, “TMS320C54x Assembly language tools user guide “, www.ti.com, June 2001.
12- TI, ” TMS320C54x DSP reference set, volume 1: CPU”, spru131, www.ti.com.
13- TI, ” TMS320C54x DSP reference set, volume 2: Mnemonic instruction set”,spru172, www.ti.com .
14- TI, “Code Composer user guide”,spru 328, www.ti.com.
15- TI, “C5402 DSK user guide” ,www.ti.com.
16- TI,” DSP product tree” , http://dspvillage.ti.com/docs/allproducttree.jhtml.
17- TCTS Lab,” The LD-CELP at 16kb/s (ITU-T G.728)”,Coding research group homepage ,http://tcts.fpms.ac.be/coding.htm.
18- ITU,”G.728 Annex H:variable bit rate LD-CELP operation mainly for DCME at rates less than 16 kb/s”,5/99.
19- DCS G.728 C54x Vocoder, algorithm, http://wwwd.connect.ti.com/dsp/tpcat/tpcodec.nsf/SoftwareForExternal/ EAB728D36C3C916E862569F200542A92.

پیام بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

seventy seven + = 81