در سيستمهاي نظارت چهره راننده، ويژگيهاي مفيد براي تشخيص خستگي و عدم تمرکز حواس به سه دسته کلي قابل تقسيم است:
- ويژگيهاي ناحيه چشم
- ويژگيهاي ناحيه دهان
- ويژگيهاي ناحيه چهره و سر
1-1-1- ويژگيهاي ناحيه چشم
چشم مهمترين عضو چهره است که نشانههاي خستگي و عدم تمرکز حواس در آن ظهور پيدا ميکند. به همين دليل بسياري از سيستمهاي نظارت چهره راننده فقط بر اساس ويژگيهاي استخراج شده از ناحيه چشم، خستگي و عدم تمرکز حواس راننده را تشخيص ميدهند.
بسته بودن چشم
سادهترين ويژگي براي تشخيص خوابآلودگي، بسته بودن چشمها[1] است. اين ويژگي، در عين سادگي اطالاعات بسيار مفيدي در مورد خوابآلودگي و حتي بيهوشي راننده در اختيار ميگذارد. ويژگي بستهبودن چشم به دو شکل مختلف براي تشخيص خوابآلودگي قابل استفاده است: بسته بودن ممتد چشم و درصد بسته بودن چشم در يک مدت معين.
در روش بسته بودن ممتد چشم، اگر چشم براي يک مدت معين به طور ممتد بسته باشد، خوابآلودگي تشخيص داده ميشود. اين روش کارايي خوبي ندارد و چندان قابل اطمينان نيست. چرا که خوابآلودگي راننده تنها زماني مشخص ميشود که چشمهاي او براي مدت معيني کاملا بسته شده باشد. اين ويژگي در [24, 25, 31, 34, 35] مورد استفاده قرار گرفته است. براي افزايش دقت سيستم، معمولا اين ويژگي همراه با برخي ويژگيهاي ديگر مورد استفاده قرار ميگيرد.
روش ديگر بر اساس درصد بسته بودن چشم[2] در يک مدت معين عمل ميکند. به اين روش اختصارا PERCLOS گفته ميشود. بر اساس تحقيقات به عمل آمده، يکي از بهترين معيارهاي ارزيابي کاهش هوشياري، محاسبه درصد بسته بودن پلکها در يک دوره زماني است [8]. به همين دليل ويژگي PERCLOS به عنوان يک ويژگي بسيار مهم براي تشخيص خوابآلودگي در [6, 9, 27, 44, 58] استفاده گرديده است.
روشهاي متفاوتي براي تشخيص بسته يا باز بودن چشم استفاده شده که از مهمترين آنها ميتوان به خاصيت بازتابشي چشم در طيف مادون قرمز [20-23]، محاسبه پروجکشن افقي ناحيه چشم [26-28, 37, 48] و محاسبه شار اپتيکي[3] [7, 49] اشاره کرد.
Zheng و همکارانش [59] روشي را ارائه کردهاند که با معلوم بودن ناحيه چشم، قادر است مرکز و شعاع مردمک[4]، گوشههاي چشم و کانتور[5] پلک را مشخص کند. در اين روش مردمک چشم از طريق اعمال سطح آستانه بر روي مقدار H در فضاي رنگي HSI و دوسطحي کردن تصوير چشم تعيين ميشود. به اين ترتيب ميتوان مرکز و شعاع مردمک چشم را در تصوير دوسطحي شده بدست آورد. آشکارسازي گوشههاي چشم با روش فيلتر گوشه چشم[6] و به کمک موجک Gabor انجام شده است. در نهايت کانتور پلکها به کمک نقاط بالا، پايين و طرفين چشم و با استفاده از تابع Spline تعيين ميگردد. اين الگوريتم ميتواند در تعيين بسته بودن چشم، فاصله بين دو پلک و تعيين جهت نگاه[7] راننده مورد استفاده قرار گيرد.
Brandt و همکارانش [7] و Lalonde و همکارانش [49] براي تشخيص بسته بودن چشم از اندازهگيري شار اپتيکي[8] ناحيه چشم استفاده کردهاند. در اين روش بر اساس محاسبه مقدار شار اپتيکي و تعيين جهت آن، باز و بسته شدن پلکها قابل تشخيص است.
Grace و همکارانش [20] با استفاده از نورپردازي و تصويربرداري در طيف مادون قرمز و به کمک خاصيت بازتابش نور مادون قرمز از مردمک چشم، مکان چشم را تشخيص داده و از همين طريق بسته يا باز بودن آن را مشخص ميکنند. در اين روش اگر درصد بسته بودن چشم در بازه زماني 1 دقيقه بيشتر از 80% باشد، سيستم اعلام هشدار ميکند.
تشخيص خوابآلودگي در [26] بر اساس بسته بودن چشم در 5 ثانيه متوالي صورت ميگيرد. در اين سيستم پس از تعيين ناحيه چشم، با استفاده از عملگر Prewitt لبههاي تصوير استخراج شده و دوسطحي ميشود. هنگاميکه چشم بسته باشد، تنها لبه پلکها آشکارسازي ميشود، اما در صورت باز بودن چشم، علاوه بر پلکها، حدقه و عنبيه چشم نيز لبههاي قابل توجه دارند. پس انتظار ميرود در صورت بازبودن چشم، پيکسلهاي لبه در نواحي اطراف چشم بيشتر باشد. به اين ترتيب باز يا بسته بودن چشم مشخص ميگردد.
در [21-23] براي تشخيص بسته بودن چشم از بررسي اندازه مردمک چشم استفاده شده است. در اين روش مردمک چشم بر اساس نوعي نورپردازي طيف مادون قرمز آشکارسازي ميشود. اگر اندازه مردمک چشم کمتر از 30% اندازه واقعي خود شود، چشم بسته تشخيص داده خواهد شد. سپس مقدار PERCLOS در 30 ثانيه اخير و مدت زمان بسته بودن ممتد چشم براي تخمين ميزان خستگي راننده محاسبه ميشود.
Rang-ben و همکارانش [56] براي تشخيص بسته بودن چشم از موجک Gabor استفاده کردهاند. براي اين منظور گوشههاي چشم و مرکز چشم با 18 فيلتر موجک Gabor پردازش شده تا 54 ويژگي (18 ضريب براي هر يک از نقاط دو گوشه چشم و مرکز آن) از هر چشم استخراج شود. اين ويژگيها توسط شبکه عصبي پرسپترون چند لايه[9] (MLP) پردازش ميشود تا خوابآلودگي راننده تعيين شود. دقت تشخيص خوابآلودگي با استفاده از اين روش 85% است.
روش پيشنهادي Horng و همکارانش [30] براي تشخيص خوابآلودگي بر اساس بسته يا باز بودن چشم ميباشد. مقدار S پيکسلهاي مردمک چشم در فضاي رنگي HSI بين صفر تا 14/0 متغير است. به اين ترتيب با اعمال حد آستانه بر روي تصوير ناحيه چشم، بسته يا باز بودن چشم تعيين ميشود. اگر چشم به مدت بيشتر از 25/0 ثانيه بسته تشخيص داده شود، سيستم اعلام هشدار خواهد کرد.
Gan و همکارانش [48] روشي را ارائه کردهاند که خوابآلودگي راننده را بر اساس بسته بودن چشم تشخيص ميدهد. در اين روش با محاسبه پروجکشن افقي تصوير دوسطحي چهره، مکان چشمها مشخص شده و بر همين اساس بسته يا باز بودن آن تعيين ميشود. در صورت باز بودن چشم، شيب نمودار پروجکشن در ناحيه چشم کم است، در حالي که هنگام بسته بودن چشم، شيب نمودار زياد خواهد بود. به اين ترتيب با استفاده از محاسبه مشتق نمودار پروجکشن و همچنين محاسبه تعداد پيکسلهاي سياه چشم، باز يا بسته بودن چشم قابل تشخيص است.
در [27] تشخيص باز و بسته چشم بر اساس محاسبه پروجکشن واريانس افقي انجام شده است. اگر چشم باز باشد، پروجکشن واريانس افقي ناحيه چشم به دليل اختلاف شديد مقادير پيکسلهاي کره چشم (روشن) و مردمک (تيره) زياد است. در حاليکه اگر چشم بسته باشد، پروجکشن واريانس افقي ناحيه چشم کمتر خواهد شد.
فاصله بين پلکها
در [28] براي تشخيص خوابآلودگي از فاصله بين دو پلک[10] استفاده شده است. در حالتي که راننده بيدار باشد، فاصله بين دو پلک زياد است، اما با افزايش خستگي، فاصله بين دو پلک کم ميشود. در اين روش، فاصله بين دو پلک بر اساس پروجکشن افقي چشم محاسبه ميگردد.
سرعت پلکزدن
يکي ديگر از ويژگيهاي خستگي، کاهش سرعت پلکزدن[11] است. منظور از سرعت پلکزدن، زمان بين باز و بسته شدن پلکها در يک پلکزدن است. در [6, 27, 44] از اين ويژگي براي تشخيص خستگي استفاده شده است. در صورتي که مدت زمان پلکزدن بيشتر از يک حد آستانه (حدود 5/0-8/0 ثانيه) اندازهگيري شود، خوابآلودگي راننده تشخيص داده ميشود.
نرخ پلکزدن
نرخ پلکزدن[12] به معني تعداد دفعات پلکزدن در يک مدت معين ميباشد. اين ويژگي ميتواند براي تشخيص خستگي و عدم تمرکز حواس مورد استفاده قرار گيرد. نرخ پلکزدن در افراد مختلف با هم متفاوت است. در صورتي که نرخ پلکزدن بسيار کمتر از حد طبيعي باشد، نشانه عدم تمرکز حواس (به دليل عوامل دروني و مشغله ذهني) ميباشد و اگر بسيار زيادتر از حد طبيعي باشد نشانه خوابآلودگي راننده است. از اين ويژگي در [6, 21-23] براي تشخيص خستگي و عدمتمرکز حواس استفاده شده است.
جهت نگاه چشم
جهت نگاه[13] چشم ويژگي موثري در تعيين عدم تمرکز حواس راننده است. با استفاده از اين ويژگي، علاوه بر تشخيص عدم توجه راننده به جاده، ميتوان تصميم راننده براي سبقت گرفتن يا تغيير مسير را تشخيص داد. بر اساس تحقيقات نشان داده شده است که راننده به هنگام سبقتگرفتن، دائم جهت نگاه خود را از مسير مبدا به مسير مقصد و بالعکس تغيير ميدهد [60, 61]. اين ويژگي در [6, 44] براساس خاصيت بازتابشي چشم در طيف مادون قرمز استخراج شده و براي تشخيص عدم تمرکز حواس راننده مورد استفاده قرار گرفته است.
در [6] تخمين جهت نگاه چشم بر اساس مرکز مردمک چشم و نور بازتابيده شده از قرنيه[14] چشم انجام ميشود. نور بازتابيده شده از قرنيه را درخشش چشم[15] مينامند که نسبت به بازتابش نور مردمک ضعيفتر و از نظر قطر کوچکتر است. در اين سيستم، نور بازتابيده شده از مردمک چشم فقط در فريمهاي زوج مشاهده ميشود، در حالي که نور بازتابيده شده از قرنيه در تمام فريمها ديده ميشود. راستاي خطي که مرکز مردمک چشم را به مرکز درخشش چشم متصل ميکند، جهت نگاه چشم را در 9 راستا مشخص خواهد کرد: مستقيم، بالا، پايين، چپ، راست، بالا راست، بالا چپ، پايين راست و پايين چپ. سرعت اجرا اين روش بر روي کامپيوتر Sun Ultra 10 حدود 15 فريم در ثانيه و ميانگين دقت آن بيش از 94% گزارش شده است.
تشخيص و رديابي جهت نگاه چشم در [44] بسيار شبيه روش فوق ميباشد، با اين تفاوت که با آموزش يک شبکه عصبي رگرسيون تعميميافته[16] (GRNN)، به کمک تعدادي از ويژگيهاي مربوط به مردمک و مرکز انعکاس نور قرنيه چشم، سيستم قادر به تخمين جهت نگاه چشم خواهد بود. دقت اين روش براي تخمين جهت نگاه چشم حدود 96% ميباشد.
حرکات جهشي چشم
يکي از ويژگيهاي قابل استخراج از جهت نگاه چشم، نرخ حرکات جهشي[17] و نامنظم چشم است. هنگاميکه راننده هوشياري عادي دارد، هر چند وقت يک بار محيط اطراف خود را بازبيني سريع ميکند. اين بازبيني سريع همراه با حرکات سريع جهشي و نامنظم است [44]. Bergasa و همکارانش [21-23] نيز از همين ويژگي تحت عنوان «نگاه ثابت[18]» براي تعيين ميزان هوشياري استفاده کردهاند. در واقع ثابت بودن جهت نگاه به مدت طولاني، نشانه عدم تمرکز حواس راننده است.
1-1-2- ويژگيهاي دهان
خميازه کشيدن[19] يکي از نشانههاي خستگي ميباشد که همراه با بازشدن دهان است. همچنين صحبتکردن راننده به هنگام رانندگي ميتواند از نشانههاي کاهش تمرکز حواس باشد. از جمله مهمترين روشهاي تشخيص باز بودن دهان، محاسبه نسبت عرض به ارتفاع دهان [36]، محاسبه ضرايب موجک Gabor در نقاط گوشه دهان [44] و استفاده از ماشين بردار پشتيبان (SVM) [51] است.
1-1-3- ويژگيهاي سر
برخي از نشانههاي خستگي و عدم تمرکز حواس راننده در حرکات سر بروز پيدا ميکند. از جمله مهمترين ويژگيهاي مربوط به ناحيه سر ميتوان به افتادن سر، تعيين جهت سر (براي آشکارسازي چرخش) و عدم تحرک سر اشاره کرد. در اين بخش ويژگيهاي مربوط به ناحيه سر مورد بررسي قرار خواهد گرفت.
افتادن سر
يکي از نشانههاي خوابآلودگي در انسان افتادن سر[20] به دليل چرتزدن[21] است. در هنگام خوابآلودگي ماهيچههاي گردن انقباض کامل ندارند و سر به تدريج خم ميشود. اين ويژگي يکي از نشانههاي خوابآلودگي يا بيهوشي ميباشد و در سيستمهاي [7, 21-23, 25, 44] براي تشخيص خوابآلودگي مورد استفاده قرار گرفته است. افتادن سر از نحوه رديابي چهره با فيلتر کالمن قابل تعيين است [21-23].
جهت سر
تعيين جهت سر[22] در تشخيص عدم تمرکز حواس راننده و پيشبيني قصد او براي تغيير مسير موثر است. در حالت کلي، تعيين جهت سر نياز به مدل سه بعدي از سر دارد. استفاده از بينايي استريو علاوه بر افزايش شديد حجم محاسبات، باعث افزايش قيمت تمام شده سيستم ميشود. تاکنون در سيستمهاي نظارت چهره راننده از بينايي استريو براي اين منظور استفاده نشده است، بلکه روشهايي ارائه شده که بدون نياز به بينايي استريو، مدل سه بعدي چهره و جهت سر تعيين ميشود. از جمله تحقيقات انجام شده در اين زمينه ميتوان به تشخيص جهت سر با استفاده از مکان هندسي چشمها، بيني و دهان نسبت به يکديگر [21-23, 27, 44, 52] و يا استفاده از تغيير شکل هندسي مردمک چشم [6] اشاره کرد.
عدم تحرک سر
عدم تحرک سر[23] براي يک مدت طولاني نشان از عدم تمرکز حواس راننده دارد. هنگاميکه راننده بر روي موضوعي غير از رانندگي تمرکز ميکند، تحرک سر وي کم شده و تقريبا ثابت خواهد شد. اين ويژگي به عنوان يکي از ويژگيهاي تشخيص عدم تمرکز راننده در [7] مورد استفاده قرار گرفته است.
[1] Eye Closure
[2] Percentage of Eye Closure
[3] Optical Flow
[4] Pupil
[5] Contour
[6] Eye Corner Filter
[7] Gaze
[8] Optical Flow
[9] Multi Layer Perceptron (MLP)
[10] Eyelid Distance
[11] Eye Blink Speed
[12] Eye Blink Rate
[13] Gaze Direction
[14] Corneal
[15] Glint
[16] Generalized Regression Neural Network (GRNN)
[17] Saccadic Movement
[18] Fixed Gaze
[19] Yawning
[20] Head Nodding
[21] Dozing
[22] Head Orientation
[23] Fixed Head