استخراج ويژگي‏هاي مربوط به کاهش هوشياري

در سيستم‏هاي نظارت چهره راننده، ويژگي‏هاي مفيد براي تشخيص خستگي و عدم تمرکز حواس به سه دسته کلي قابل تقسيم است:

  • ويژگي‏هاي ناحيه چشم
  • ويژگي‏هاي ناحيه دهان
  • ويژگي‏هاي ناحيه چهره و سر

1-1-1- ويژگي‏هاي ناحيه چشم

چشم مهمترين عضو چهره است که نشانه‏هاي خستگي و عدم تمرکز حواس در آن ظهور پيدا مي‏کند. به همين دليل بسياري از سيستم‏هاي نظارت چهره راننده فقط بر اساس ويژگي‏هاي استخراج شده از ناحيه چشم، خستگي و عدم تمرکز حواس راننده را تشخيص مي‏دهند.

بسته بودن چشم

ساده‏ترين ويژگي براي تشخيص خواب‏آلودگي، بسته بودن چشم‏ها[1] است. اين ويژگي، در عين سادگي اطالاعات بسيار مفيدي در مورد خواب‏آلودگي و حتي بيهوشي راننده در اختيار مي‏گذارد. ويژگي بسته‏بودن چشم به دو شکل مختلف براي تشخيص خواب‏آلودگي قابل استفاده است: بسته بودن ممتد چشم و درصد بسته بودن چشم در يک مدت معين.

در روش بسته بودن ممتد چشم، اگر چشم براي يک مدت معين به طور ممتد بسته باشد، خواب‏آلودگي تشخيص داده مي‏شود. اين روش کارايي خوبي ندارد و چندان قابل اطمينان نيست. چرا که خواب‏آلودگي راننده تنها زماني مشخص مي‏شود که چشم‏هاي او براي مدت معيني کاملا بسته شده باشد. اين ويژگي در [24, 25, 31, 34, 35] مورد استفاده قرار گرفته است. براي افزايش دقت سيستم، معمولا اين ويژگي همراه با برخي ويژگي‏هاي ديگر مورد استفاده قرار مي‏گيرد.

روش ديگر بر اساس درصد بسته بودن چشم[2] در يک مدت معين عمل مي‏کند. به اين روش اختصارا PERCLOS گفته مي‏شود. بر اساس تحقيقات به عمل آمده، يکي از بهترين معيارهاي ارزيابي کاهش هوشياري، محاسبه درصد بسته بودن پلک‏ها در يک دوره زماني است [8]. به همين دليل ويژگي PERCLOS به عنوان يک ويژگي بسيار مهم براي تشخيص خواب‏آلودگي در [6, 9, 27, 44, 58] استفاده گرديده است.

روش‏هاي متفاوتي براي تشخيص بسته يا باز بودن چشم استفاده شده که از مهمترين آنها مي‏توان به خاصيت بازتابشي چشم در طيف مادون قرمز [20-23]، محاسبه پروجکشن افقي ناحيه چشم [26-28, 37, 48] و محاسبه شار اپتيکي[3] [7, 49] اشاره کرد.

Zheng و همکارانش [59] روشي را ارائه کرده‏اند که با معلوم بودن ناحيه چشم، قادر است مرکز و شعاع مردمک[4]، گوشه‏هاي چشم و کانتور[5] پلک را مشخص کند. در اين روش مردمک چشم از طريق اعمال سطح آستانه بر روي مقدار H در فضاي رنگي HSI و دوسطحي کردن تصوير چشم تعيين مي‏شود. به اين ترتيب مي‏توان مرکز و شعاع مردمک چشم را در تصوير دوسطحي شده بدست آورد. آشکارسازي گوشه‏هاي چشم با روش فيلتر گوشه چشم[6] و به کمک موجک Gabor انجام شده است. در نهايت کانتور پلک‏ها به کمک نقاط بالا، پايين و طرفين چشم و با استفاده از تابع Spline تعيين مي‏گردد. اين الگوريتم مي‏تواند در تعيين بسته بودن چشم، فاصله بين دو پلک و تعيين جهت نگاه[7] راننده مورد استفاده قرار گيرد.

Brandt و همکارانش [7] و Lalonde و همکارانش [49] براي تشخيص بسته بودن چشم از اندازه‏گيري شار اپتيکي[8] ناحيه چشم استفاده کرده‏اند. در اين روش بر اساس محاسبه مقدار شار اپتيکي و تعيين جهت آن، باز و بسته شدن پلک‏ها قابل تشخيص است.

Grace و همکارانش [20] با استفاده از نورپردازي و تصويربرداري در طيف مادون قرمز و به کمک خاصيت بازتابش نور مادون قرمز از مردمک چشم، مکان چشم را تشخيص داده و از همين طريق بسته يا باز بودن آن را مشخص مي‏کنند. در اين روش اگر درصد بسته بودن چشم در بازه زماني 1 دقيقه بيشتر از 80% باشد، سيستم اعلام هشدار مي‏کند.

تشخيص خواب‏آلودگي در [26] بر اساس بسته بودن چشم در 5 ثانيه متوالي صورت مي‏گيرد. در اين سيستم پس از تعيين ناحيه چشم، با استفاده از عملگر Prewitt لبه‏هاي تصوير استخراج شده و دوسطحي مي‏شود. هنگامي‏که چشم بسته باشد، تنها لبه پلک‏ها آشکارسازي مي‏شود، اما در صورت باز بودن چشم، علاوه بر پلک‏ها، حدقه و عنبيه چشم نيز لبه‏هاي قابل توجه دارند. پس انتظار مي‏رود در صورت بازبودن چشم، پيکسل‏هاي لبه در نواحي اطراف چشم بيشتر باشد. به اين ترتيب باز يا بسته بودن چشم مشخص مي‏گردد.

در [21-23] براي تشخيص بسته بودن چشم از بررسي اندازه مردمک چشم استفاده شده است. در اين روش مردمک چشم بر اساس نوعي نورپردازي طيف مادون قرمز آشکارسازي مي‏شود. اگر اندازه مردمک چشم کمتر از 30% اندازه واقعي خود شود، چشم بسته تشخيص داده خواهد شد. سپس مقدار PERCLOS در 30 ثانيه اخير و مدت زمان بسته بودن ممتد چشم براي تخمين ميزان خستگي راننده محاسبه مي‏شود.

Rang-ben و همکارانش [56] براي تشخيص بسته بودن چشم از موجک Gabor استفاده کرده‏اند. براي اين منظور گوشه‏هاي چشم و مرکز چشم با 18 فيلتر موجک Gabor پردازش شده تا 54 ويژگي (18 ضريب براي هر يک از نقاط دو گوشه چشم و مرکز آن) از هر چشم استخراج شود. اين ويژگي‏ها توسط شبکه عصبي پرسپترون چند لايه[9] (MLP) پردازش مي‏شود تا خواب‏آلودگي راننده تعيين شود. دقت تشخيص خواب‏آلودگي با استفاده از اين روش 85% است.

روش پيشنهادي Horng و همکارانش [30] براي تشخيص خواب‏آلودگي بر اساس بسته يا باز بودن چشم مي‏باشد. مقدار S پيکسل‏هاي مردمک چشم در فضاي رنگي HSI بين صفر تا 14/0 متغير است. به اين ترتيب با اعمال حد آستانه بر روي تصوير ناحيه چشم، بسته يا باز بودن چشم تعيين مي‏شود. اگر چشم به مدت بيشتر از 25/0 ثانيه بسته تشخيص داده شود، سيستم اعلام هشدار خواهد کرد.

Gan و همکارانش [48] روشي را ارائه کرده‏اند که خواب‏آلودگي راننده را بر اساس بسته بودن چشم تشخيص مي‏دهد. در اين روش با محاسبه پروجکشن افقي تصوير دوسطحي چهره، مکان چشم‏ها مشخص شده و بر همين اساس بسته يا باز بودن آن تعيين مي‏شود. در صورت باز بودن چشم، شيب نمودار پروجکشن در ناحيه چشم کم است، در حالي که هنگام بسته بودن چشم، شيب نمودار زياد خواهد بود. به اين ترتيب با استفاده از محاسبه مشتق نمودار پروجکشن و همچنين محاسبه تعداد پيکسل‏هاي سياه چشم، باز يا بسته بودن چشم قابل تشخيص است.

در [27] تشخيص باز و بسته چشم بر اساس محاسبه پروجکشن واريانس افقي انجام شده است. اگر چشم باز باشد، پروجکشن واريانس افقي ناحيه چشم به دليل اختلاف شديد مقادير پيکسل‏هاي کره چشم (روشن) و مردمک (تيره) زياد است. در حالي‏که اگر چشم بسته باشد، پروجکشن واريانس افقي ناحيه چشم کمتر خواهد شد.

فاصله بين پلک‏ها

در [28] براي تشخيص خواب‏آلودگي از فاصله بين دو پلک[10] استفاده شده است. در حالتي که راننده بيدار باشد، فاصله بين دو پلک زياد است، اما با افزايش خستگي، فاصله بين دو پلک کم مي‏شود. در اين روش، فاصله بين دو پلک بر اساس پروجکشن افقي چشم محاسبه مي‏گردد.

سرعت پلک‏زدن

يکي ديگر از ويژگي‏هاي خستگي، کاهش سرعت پلک‏زدن[11] است. منظور از سرعت پلک‏زدن، زمان بين باز و بسته شدن پلک‏ها در يک پلک‏زدن است. در [6, 27, 44] از اين ويژگي براي تشخيص خستگي استفاده شده است. در صورتي که مدت زمان پلک‏زدن بيشتر از يک حد آستانه (حدود 5/0-8/0 ثانيه) اندازه‏گيري شود، خواب‏آلودگي راننده تشخيص داده مي‏شود.

نرخ پلک‏زدن

نرخ پلک‏زدن[12] به معني تعداد دفعات پلک‏زدن در يک مدت معين مي‏باشد. اين ويژگي مي‏تواند براي تشخيص خستگي و عدم تمرکز حواس مورد استفاده قرار گيرد. نرخ پلک‏زدن در افراد مختلف با هم متفاوت است. در صورتي که نرخ پلک‏زدن بسيار کمتر از حد طبيعي باشد، نشانه عدم تمرکز حواس (به دليل عوامل دروني و مشغله ذهني) مي‏باشد و اگر بسيار زياد‏تر از حد طبيعي باشد نشانه خواب‏آلودگي راننده است. از اين ويژگي در [6, 21-23] براي تشخيص خستگي و عدم‏تمرکز حواس استفاده شده است.

جهت نگاه چشم

جهت نگاه[13] چشم ويژگي موثري در تعيين عدم تمرکز حواس راننده است. با استفاده از اين ويژگي، علاوه بر تشخيص عدم توجه راننده به جاده، مي‏توان تصميم راننده براي سبقت گرفتن يا تغيير مسير را تشخيص داد. بر اساس تحقيقات نشان داده شده است که راننده به هنگام سبقت‏گرفتن، دائم جهت نگاه خود را از مسير مبدا به مسير مقصد و بالعکس تغيير مي‏دهد [60, 61]. اين ويژگي در [6, 44] براساس خاصيت بازتابشي چشم در طيف مادون قرمز استخراج شده و براي تشخيص عدم تمرکز حواس راننده مورد استفاده قرار گرفته است.

در [6] تخمين جهت نگاه چشم بر اساس مرکز مردمک چشم و نور بازتابيده شده از قرنيه[14] چشم انجام مي‏شود. نور بازتابيده شده از قرنيه را درخشش چشم[15] مي‏نامند که نسبت به بازتابش نور مردمک ضعيف‏تر و از نظر قطر کوچک‏تر است. در اين سيستم، نور بازتابيده شده از مردمک چشم فقط در فريم‏هاي زوج مشاهده مي‏شود، در حالي که نور بازتابيده شده از قرنيه در تمام فريم‏ها ديده مي‏شود. راستاي خطي که مرکز مردمک چشم را به مرکز درخشش چشم متصل مي‏کند، جهت نگاه چشم را در 9 راستا مشخص خواهد کرد: مستقيم، بالا، پايين، چپ، راست، بالا راست، بالا چپ، پايين راست و پايين چپ. سرعت اجرا اين روش بر روي کامپيوتر Sun Ultra 10 حدود 15 فريم در ثانيه و ميانگين دقت آن بيش از 94% گزارش شده است.

تشخيص و رديابي جهت نگاه چشم در [44] بسيار شبيه روش فوق مي‏باشد، با اين تفاوت که با آموزش يک شبکه عصبي رگرسيون تعميم‌يافته[16] (GRNN)، به کمک تعدادي از ويژگي‏هاي مربوط به مردمک و مرکز انعکاس نور قرنيه چشم، سيستم قادر به تخمين جهت نگاه چشم خواهد بود. دقت اين روش براي تخمين جهت نگاه چشم حدود 96% مي‏باشد.

حرکات جهشي چشم

يکي از ويژگي‏هاي قابل استخراج از جهت نگاه چشم، نرخ حرکات جهشي[17] و نامنظم چشم است. هنگامي‏که راننده هوشياري عادي دارد، هر چند وقت يک بار محيط اطراف خود را بازبيني سريع مي‏کند. اين بازبيني سريع همراه با حرکات سريع جهشي و نامنظم است [44]. Bergasa و همکارانش [21-23] نيز از همين ويژگي تحت عنوان «نگاه ثابت[18]» براي تعيين ميزان هوشياري استفاده کرده‏اند. در واقع ثابت بودن جهت نگاه به مدت طولاني، نشانه عدم تمرکز حواس راننده است.

1-1-2- ويژگي‏هاي دهان

خميازه کشيدن[19] يکي از نشانه‏هاي خستگي مي‏باشد که همراه با باز‏شدن دهان است. همچنين صحبت‏کردن راننده به هنگام رانندگي مي‏تواند از نشانه‏هاي کاهش تمرکز حواس باشد. از جمله مهمترين روش‏هاي تشخيص باز بودن دهان، محاسبه نسبت عرض به ارتفاع دهان [36]، محاسبه ضرايب موجک Gabor در نقاط گوشه دهان [44] و استفاده از ماشين بردار پشتيبان (SVM) [51] است.

1-1-3- ويژگي‏هاي سر

برخي از نشانه‏هاي خستگي و عدم تمرکز حواس راننده در حرکات سر بروز پيدا مي‏کند. از جمله مهمترين ويژگي‏هاي مربوط به ناحيه سر مي‏توان به افتادن سر، تعيين جهت سر (براي آشکارسازي چرخش) و عدم تحرک سر اشاره کرد. در اين بخش ويژگي‏هاي مربوط به ناحيه سر مورد بررسي قرار خواهد گرفت.

افتادن سر

يکي از نشانه‏هاي خواب‏آلودگي در انسان افتادن سر[20] به دليل چرت‏زدن[21] است. در هنگام خواب‏آلودگي ماهيچه‏هاي گردن انقباض کامل ندارند و سر به تدريج خم مي‏شود. اين ويژگي يکي از نشانه‏هاي خواب‏آلودگي يا بيهوشي مي‏باشد و در سيستم‏هاي [7, 21-23, 25, 44] براي تشخيص خواب‏آلودگي مورد استفاده قرار گرفته است. افتادن سر از نحوه رديابي چهره با فيلتر کالمن قابل تعيين است [21-23].

جهت سر

تعيين جهت سر[22] در تشخيص عدم تمرکز حواس راننده و پيش‏بيني قصد او براي تغيير مسير موثر است. در حالت کلي، تعيين جهت سر نياز به مدل سه بعدي از سر دارد. استفاده از بينايي استريو علاوه بر افزايش شديد حجم محاسبات، باعث افزايش قيمت تمام شده سيستم مي‏شود. تاکنون در سيستم‏هاي نظارت چهره راننده از بينايي استريو براي اين منظور استفاده نشده است، بلکه روش‏هايي ارائه شده که بدون نياز به بينايي استريو، مدل سه بعدي چهره و جهت سر تعيين مي‏شود. از جمله تحقيقات انجام شده در اين زمينه مي‌توان به تشخيص جهت سر با استفاده از مکان هندسي چشم‌ها، بيني و دهان نسبت به يکديگر [21-23, 27, 44, 52] و يا استفاده از تغيير شکل هندسي مردمک چشم [6] اشاره کرد.

عدم تحرک سر

عدم تحرک سر[23] براي يک مدت طولاني نشان از عدم تمرکز حواس راننده دارد. هنگامي‏که راننده بر روي موضوعي غير از رانندگي تمرکز مي‏کند، تحرک سر وي کم شده و تقريبا ثابت خواهد شد. اين ويژگي به عنوان يکي از ويژگي‏هاي تشخيص عدم تمرکز راننده در [7] مورد استفاده قرار گرفته است.

[1] Eye Closure

[2] Percentage of Eye Closure

[3] Optical Flow

[4] Pupil

[5] Contour

[6] Eye Corner Filter

[7] Gaze

[8] Optical Flow

[9] Multi Layer Perceptron (MLP)

[10] Eyelid Distance

[11] Eye Blink Speed

[12] Eye Blink Rate

[13] Gaze Direction

[14] Corneal

[15] Glint

[16] Generalized Regression Neural Network (GRNN)

[17] Saccadic Movement

[18] Fixed Gaze

[19] Yawning

[20] Head Nodding

[21] Dozing

[22] Head Orientation

[23] Fixed Head

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.