در این مدل، با در نظر گرفتن یک سری حالت، احتمال گذار حالات، یک بردار ویژگی و توابع توزیع عناصر بردار در هر حالت، … اعمال الگوریتم جستجوی ویتربی[1]بر روی مشاهدات، بهترین دنباله حالت برای رخداد این مشاهدات، بدست می آید. در [46] از ویژگی های ZCR، انرژی، تابع متوسط اندازه تفاضلاتAMDF[2] و اعمال آنها بر روی مدل مارکوف مخفی تک حالته، دو حالته و یک شبکه رایج حالت های مختلف بررسی شده است. در این روش میتوان برای نویزهای مختلف مدل مارکوف مناسبی را در نظر گرفت و سپس به کمک الگوریتم ویتربی میتوان نواحی سکوت و حتی نویز را تشخیص داد. در [47] با در نظر گرفتن ویژگی اختلاف لگاریتم انرژی فریم و لگاریتم انرژی نویز و ویژگی دلتای انرژی ، به عنوان بردار ویژگی و با در نظر گرفتن دو مدل مارکوف متناظر با گفتار و سکوت، نواحی سکوت تشخیص داده شده است. در این مرجع برای مدل گفتار، یک مدل مخفی مارکوف چهار حالته و برای نویز یک مدل مخفی مارکوف سه حالته در نظر گرفته شده است. سپس الگوریتم جستجوی ویتربی، برای یافتن بهترین دنباله از حالات و در نهایت بهترین و محتمل ترین دنباله از سکوت و گفتار، بر روی شبکه ای مانند شکل (2-6) اعمال شده است. در [48] با در نظر گرفتن بردار ویژگی ای متشکل از 12 ضریب MFCC و توان سیگنال و یک مدل مارکوف 7 حالته متشکل از حالات سکوت قبل از گفتار، گفتار (5 حالت)، سکوت بعد گفتار به بازشناسی نواحی غیرسکوت (2 تا 6 حالت) پرداخته شده است. با استفاده از روش مبتنی بر موجک جهت بهسازی گفتار و استفاده از مدل مارکوف 3 حالته (سکوت قبل از گفتار، گفتار، سکوت بعد از گفتار) نواحی سکوت تشخیص داده شده است.
شکل( 2-6 ): شبکه ای از مدل مخفی مارکوف جهت بررسی دنباله احتمالی گفتار و سکوت [47]
در [49] از یک مدل مارکوف دو حالته(گفتار و سکوت) و در نظر گرفتن احتمال گذار متغیر و بردار ویژگی مشابه با بردار ویژگی مورد استفاده در استاندارد G.729B، نواحی سکوت تشخیص داده شده است. مقدار احتمال گذار از حالت گفتار به حالت سکوت از زمان ورود به حالت گفتار، به مرور زمان کمتر می شود. در [50] سیگنال گفتار از لحاظ چگونگی بیان به 14 دسته تقسیم و با در نظر گرفتن 14 مدل و یک مدل برای نویز، یعنی با 15 مدل سه حالته عملیات تشخیص انجام شده است.
[1] .Vterbi Algorithm
[2].Average Magnitude Difference Function