بهبود کيفيت صحبت غرق شده در نويزدر سيستمهای ارتباطات اهميت زيادی دارد. امروزه اهميت مسئله حذف نويز صحبت بخصوص با گسترش و توسعه تلفنهای سلولي(موبايل) افزايش يافته است. به عنوان يک مثال صوت ارسالی تلفن همراه، وقتی در اتومبيل در حال حرکت استفاده ميشود، همراه با صدای موتور اتومبيل و باد خواهد بود، و يا در يک مکان شلوغ نويز زيادی همراه صحبت ارسال ميگردد. اگر سيستم، قبل از ارسال سيگنال آنرا به رمز در آورد، عملكرد آن باز هم بدتر ميشود؛ زيرا رمز كننده گفتار بر اساس مدل سيگنال خالص طراحی شده است و معمولاً اين مدلها برای سيگنال نويزی مدل مناسبی نيستند. همچنين اگر از يك سيستم شناسايی گفتار استفاده شود، دقّت شناسايی سيستم در حضور نويز كاهش مييابد؛ زيرا سيگنال ورودی نويزی از مدل آماری سيگنال خالص كه برای شناساگر تعريف شده پيروی نميكند. چنين مشکلاتی در مخابرات هوا به زمين، تلفنهای عمومي، تلفنهای همراه و سيستمهای کنفرانس راديويی موجود ميباشد. بنابراين حذف نويز سيگنال صحبت يکی از مهمترين چالشهای موجود در سيستمهای ارتباطات ميباشد. در دهههای گذشته روشهای بسياری برای کاهش نويز محيطی از سيگنال صحبت ارائه شده و توسعه يافتهاند. بسياری از اين روشها مبتنی بر آرايههای وفقی بوده و عمدتاً نياز به چندين سنسور دارند. تعداد كانالهای صوتی قابل دسترس، عامل مهمی در طراحی سيستمهای پاكسازی گفتار به شمار ميرود. عموماً هر قدر تعداد ميكروفونها بيشتر باشد، پاكسازی بهتر صورت ميگيرد. از جمله روشهای بهبود صحبت ميتوان به روشهای مبتنی بر تفريق طيفي، مدل صحبت، روشهای وفقي، روشهای مبتنی بر زيرفضای سيگنال[1]، فيلترينگ وينر، تخمين خطي(مدل پيشگويی خطي)، الگوريتمهای کور[2]، تبديل موجک[3]، شبکههای عصبي، شبکههای فازی و فيلترينگ کالمن اشاره کرد. از ميان اين روشها، آنهايی که امکان پيادهسازی ارزان را داشته و به توان محاسباتی کمتری نياز دارند و علاوه بر اين نياز به سنسورهای چندگانه نداشته و قادر به حذف نويز روی صحبت نويزی تک کاناله باشند، از لحاظ تجاری دارای اهميت خاصی هستند؛ چرا که سيستمهای تجاری پردازش صحبت مثل ماشينهای پاسخگوی ديجيتال، تلفنهای همراه يا حتی تلفنهای هوشمند عمدتاً نميتوانند دارای چند ورودی باشند، چرا که در اين صورت نياز به مبدلهای A/D چندگانه پيدا ميکنند که سبب بالا رفتن قيمت سيستم ميشود. علاوه بر اين سيستم با چند ورودي، حافظه بيشتر و توان پردازش بالاتری ميطلبد که مستقيما افزايش قيمت را به دنبال دارد[1].
در ميان روشهای حذف نويز، روشهای مبتنی بر تفريق طيفی به دلايل متعددی همچون سادگی پيادهسازي، توان بالا در حذف نويز، سرعت بالای الگوريتم و قابليت پيادهسازی تک کاناله از اهميت زيادی برخوردار ميباشد، به طوری که امروزه اين روش در بسياری از سيستمهای بازشناسی صحبت، کد کنندهها، گوشيهای موبايل، سمعکها و غيره برای کاهش نويز محيطی مورد استفاده قرار ميگيرد و با آنکه حدود سه دهه از ارائه روش تفريق طيفی ميگذرد، هنوز موضوع بسياری از کارهای تحقيقاتی امروزی ميباشد.
[1] Signal Subspace (KL Transform)
[2] Blind Algorithms
[3] Wavelet Transform