در روشهاي کنوني براي استخراج ويژگيهاي خستگي و عدم تمرکز حواس راننده از تصوير چهره، ابتدا بايد اجزاي چهره آشکارسازي شود. تقريبا در تمام سيستمهاي نظارت چهره راننده از ويژگيهاي ناحيه چشم استفاده شده است، بنابراين آشکارسازي چشم اهميت ويژهاي دارد. مهمترين روشهاي آشکارسازي چشم به سه دسته اصلي قابل تقسيم است:
- روشهاي مبتني بر نورپردازي و تصويربرداري طيف مادون قرمز
- روشهاي مبتني بر دوسطحي کردن تصوير
- روشهاي مبتني بر پروجکشن
1-1-1- روشهاي مبتني بر نورپردازي و تصويربرداري در طيف مادون قرمز
يکي از روشهاي سريع و نسبتا دقيق در آشکارسازي چشم، استفاده از روشهاي مبتني بر نورپردازي و تصويربرداري در طيف مادون قرمز ميباشد که در آن از ساختار فيزيولوژي و اپتيکي چشم در طيف مادون قرمز استفاده ميشود. اين روش بدون نياز به آشکارسازي چهره، قادر به آشکارسازي چشم است. به همين علت، حجم محاسبات در سيستمهايي که از اين نوع روش استفاده ميکنند، نسبت به ساير سيستمها کمتر است. البته اين روش بيشتر براي سيستمهايي مناسب ميباشد که فقط بر اساس پردازش ناحيه چشم خستگي و عدم تمرکز حواس راننده را تشخيص ميدهند. مهمترين عيب اين روش اين است که اگر به دليل خطاي رديابي در هنگام خوابآلودگي راننده که چشم تقريبا بسته ميباشد، مکان چشم گم شود، سيستم قادر به آشکارسازي آن نخواهد بود. چرا که در اين حالت مردمک چشم تقريبا مشخص نيست و آشکارسازي چشم مشکل است. بسياري از سيستمهاي نظارت چهره راننده از اين روش براي آشکارسازي چشم استفاده کردهاند [6, 20-23, 39-43]. در اکثر اينگونه سيستمها، از يک پيکربندي خاص براي سيستم نورپردازي و تصويربرداري طيف مادون قرمز استفاده گرديده است. در اين پيکربندي نورپردازي مادون قرمز توسط دو دسته LED تامين ميشود که در اين سيستم نقش بسيار موثري ايفا ميکنند. مطابق شکل 2‑4، LEDها به دو دسته تقسيم شده و در دو حلقه متحدالمرکز و با شعاعهاي مختلف قرار ميگيرند. در هر لحظه فقط يکي از دو حلقه روشن و ديگري خاموش است. هنگاميکه حلقه داخلي روشن باشد، نور بازتابيده شده از سطح مردمک چشم[1] به دوربين ميرسد و چشم به طور واضح، روشنتر از ساير قسمتهاي چهره است. اما وقتي حلقه خارجي روشن باشد، چنين حالتي براي مردمک چشم رخ نميدهد و چشم تاريک است. به دو حالت متفاوت چشم به ترتيب مردمک روشن[2] و مردمک تيره[3] ميگويند (شکل 2‑5).
شکل 2‑4: سيستم نورپردازي مادون قرمز شامل دو دسته LED به شکل دو حلقه کوچک و بزرگ [6]
منبع نور مادون قرمز |
پرتوي منعکس شده از چشم |
پرتوي تابيده شده به چشم |
چشم |
دوربين |
منبع نور مادون قرمز |
پرتوي منعکس شده از چشم |
پرتوي تابيده شده به چشم |
چشم |
دوربين |
مردمک روشن |
مردمک تيره |
شکل 2‑5: نمايش ايجاد پديده مردمک روشن و مردمک تيره در نورپردازي مادون قرمز
در مرحله آشکارسازي چشم، از خاصيت مردمک روشن و مردمک تيره استفاده شده است. در اين روش ابتدا تفاضل فريم زوج از فريم فرد بدست ميآيد (مطابق شکل 2‑6). سپس تصوير حاصل از تفاضل، دوسطحي شده و مکان چشم تعيين ميگردد.
شکل 2‑6: آشکارسازي چشم بر اساس ويژگي مردمک تيره و روشن: شکلها از سمت راست به ترتيب فريم زوج با تصوير مردمک روشن، فريم فرد با تصوير مردمک تيره و تفاضل فريمهاي زوج و فرد [6]
Zhu و همکارانش [39] روشي مشابه روش فوق براي آشکارسازي چشم استفاده کردهاند. با اين تفاوت که پس از تعيين نقاط چشم از ماشين بردار پشتيبان[4] (SVM) براي افزايش دقت آشکارسازي چشم استفاده شده است. در اين مقاله هسته[5]هاي مختلفي براي SVM انتخاب گرديده و نشان داده شده که هسته گوسي بهترين دقت را دارد. با انتخاب هسته گوسي براي SVM، دقت آشکارسازي چشم بيش از 95% خواهد بود. در [41, 42, 44] نيز مشابه اين روش براي آشکارسازي چشم استفاده شده است.
Zhao و همکارش [45] براي آشکارسازي چشم تنها از يک منبع نور مادون قرمز استفاده کردهاند که در راستاي محور اپتيکي دوربين قرار دارد. با توجه به اين چينش منبع نور، همواره بازتابش مردمک چشم در دوربين وجود دارد و در تصوير چهره، مردمک روشن ديده ميشود. با استفاده از عملگر ريختشناسي[6] بازکردن[7] تصوير و محاسبه تفاضل اين تصوير و تصوير اصلي، نقاط منتخب چشم معين ميشود. اين نقاط منتخب با اعمال يک سطح آستانه بر روي تفاضل دو تصوير و استفاده از تحليل اجزاي همبند قابل استخراج است. براي اطمينان از انتخاب صحيح اين نقاط به عنوان چشم، از ماشين بردار پشتيبان (SVM) و تبديل تقارن تعميميافته[8] (GST) استفاده شده است. با ترکيب نتايج حاصل از خروجي SVM و تبديل GST، نقاط چشم تعيين خواهد شد. در ارزيابي اين روش براي آشکارسازي چشم بدون عينک، TPR 4/99% و FPR صفر و براي آشکارسازي چشم با عينک TPR 3/88% و FPR 14% گزارش شده است. اين در حالي است که در صورت عدم استفاده از تبديل GST، براي آشکارسازي چشم با عينک TPR 1/54% و FPR 3% است.
1-1-2- روشهاي مبتني بر دوسطحي کردن تصوير
يکي از سادهترين روشهاي آشکارسازي چشم، اعمال يک حد آستانه بر روي مقادير پيکسلهاي تصوير چهره براي دو سطحي کردن تصوير و تخمين مکان چشم است. اين روش بر اساس اين فرض عمل ميکند که مردمک چشمها تيرهترين نقاط چهره هستند. مهمترين بخش اين الگوريتم تعيين مقدار حد آستانه ميباشد. اين روش دقت چنداني در آشکارسازي چشم ندارد، بهويژه اينکه در افراد سياهپوست يا در محيطي با نور کم خطاي آن به شدت افزايش مييابد. به همين دليل معمولا پس از دوسطحي کردن تصوير چهره، پردازشهاي ديگري مانند تحليل اجزاي همبند[9] (CCA) [46, 47] يا محاسبه کانتور نواحي آشکارسازي شده [7, 27] انجام ميگيرد تا دقت آشکارسازي چشم افزايش يابد.
1-1-3- روشهاي مبتني بر پروجکشن
يکي ديگر از سادهترين و پرکاربردترين روشهاي آشکارسازي چشم، استفاده از پروجکشن[10] است. پروجکشن به معني محاسبه مجموع مقادير پيکسلها در يک جهت مشخص است. جهت پروجکشن معمولا در راستاي افقي يا عمودي انتخاب ميشود. اين روش ميتواند بر روي تصاوير دوسطحي يا سطح خاکستري اعمال شود. پروجکشن در راستاي افقي و عمودي براي تصوير با ابعاد به ترتيب از روابط (1) و (2) محاسبه ميشود. در اين روابط i مربوط به ستونهاي تصوير و j مربوط به سطرهاي آن است.
مهمترين مسئله در اين روش، فرض يکنواخت بودن نورپردازي و تيرهتر بودن چشمها (مردمک) نسبت به پوست چهره است. بنابراين انتظار ميرود پروجکشن افقي تصوير چهره در محل چشمها داراي مقدار کمينه محلي باشد. اگر نور محيط به گونهاي باشد که تصوير چهره به شکل يکنواخت نورپردازي نشود يا اينکه فرد داراي پوست تيرهاي باشد، آشکارسازي چشم دچار اختلال ميشود. به همين دليل در برخي سيستمها، پردازشهاي بيشتري بر روي نواحي انتخاب شده انجام ميشود تا دقت آشکارسازي چشم افزايش يابد. در [26, 28, 34, 35, 48]، پروجکشن به عنوان روش اصلي براي آشکارسازي چشم ميباشد و در [49] از پروجکشن براي تعيين مکان اوليه چشمها استفاده شده است.
براي افزايش دقت پروجکشن در آشکارسازي چشم، معمولا آشکارسازي با يک يا چند فرض اوليه انجام ميشود. به عنوان مثال فرض بر اين که چشم همواره در نيمه بالايي چهره قرار دارد [28, 30]، باعث ميشود تا پروجکشن نيمه پايين چهره محاسبه نشود و مواردي همچون ريش يا سبيل، باعث کاهش دقت آشکارسازي چشم نگردد. علاوه بر اين، معمولا پس از آشکارسازي چشمها، براي اطمينان از آشکارسازي، روشهايي مثل تحليل اجزاي همبند استفاده ميشود [28].
در برخي سيستمها براي کاهش وابستگي الگوريتم آشکارسازي به نور محيط، به جاي محاسبه پروجکشن از روي تصوير اصلي، ابتدا تصوير چهره لبهيابي گرديده، سپس پروجکشن محاسبه ميشود [30]. گاهي نيز بهجاي پروجکشن تصوير، پروجکشن واريانس تصوير محاسبه ميشود [27]. پروجکشن واريانس نسبت به تغييرات نور محيط حساسيت کمتري دارد. پروجکشن واريانس در راستاي افقي و عمودي به ترتيب از روابط (3) و (4) محاسبه ميشوند. در اين روابط و به ترتيب ميانگين مقادير پيکسلها در ستون i و سطر j از تصوير I هستند.
1-1-4- روشهاي مبتني بر يادگيري
گاه براي افزايش دقت سيستم نظارت چهره در آشکارسازي صحيح چشم، يکي از روشهاي قبلي به عنوان روش پايه استفاده شده و چند نقطه از تصوير چهره را به عنوان نقاط کانديدا انتخاب ميکنند. سپس با استفاده از روشهاي مبتني بر يادگيري مانند شبکههاي عصبي يا ماشين بردار پشتيبان (SVM)، مکان دقيق چشم مشخص ميشود. در سيستمهاي [39, 41, 42, 44, 45] روش اصلي آشکارسازي چشم بر اساس نورپردازي و تصويربرداري در طيف مادون قرمز است، اما پس از انتخاب نقاط کانديدا، از ماشين بردار پشتيبان براي انتخاب نهايي نقاط چشم استفاده شده است. در [50] از تبديل هاف دايروي[11] و بررسي تقارن نقاط براي انتخاب اوليه چند نقطه کانديدا استفاده شده، سپس با استفاده از شبکه عصبي، وجود يا عدم وجود چشم در نقاط کانديدا تعيين ميگردد.
[1] Pupil
[2] Bright Pupil
[3] Dark Pupil
[4] Support Vector Machine (SVM)
[5] Kernel
[6] Morphologic
[7] Opening
[8] Generalized Symmetry Transformation (GST)
[9] Connected Component Analysis (CCA)
[10] Projection
[11] Circle Hough Transform