آشکارسازي چشم

در روش‏هاي کنوني براي استخراج ويژگي‏هاي خستگي و عدم تمرکز حواس راننده از تصوير چهره، ابتدا بايد اجزاي چهره آشکارسازي شود. تقريبا در تمام سيستم‏هاي نظارت چهره راننده از ويژگي‏هاي ناحيه چشم استفاده شده است، بنابراين آشکارسازي چشم اهميت ويژه‏اي دارد. مهمترين روش‏هاي آشکارسازي چشم به سه دسته اصلي قابل تقسيم است:

  • روش‏هاي مبتني بر نورپردازي و تصويربرداري طيف مادون قرمز
  • روش‏هاي مبتني بر دوسطحي کردن تصوير
  • روش‏هاي مبتني بر پروجکشن

1-1-1- روش‏هاي مبتني بر نورپردازي و تصويربرداري در طيف مادون قرمز

يکي از روش‏هاي سريع و نسبتا دقيق در آشکارسازي چشم، استفاده از روش‏هاي مبتني بر نورپردازي و تصويربرداري در طيف مادون قرمز مي‏باشد که در آن از ساختار فيزيولوژي و اپتيکي چشم در طيف مادون قرمز استفاده مي‏شود. اين روش بدون نياز به آشکارسازي چهره، قادر به آشکارسازي چشم است. به همين علت، حجم محاسبات در سيستم‏هايي که از اين نوع روش استفاده مي‏کنند، نسبت به ساير سيستم‏ها کمتر است. البته اين روش بيشتر براي سيستم‏هايي مناسب مي‏باشد که فقط بر اساس پردازش ناحيه چشم خستگي و عدم تمرکز حواس راننده را تشخيص مي‏دهند. مهمترين عيب اين روش اين است که اگر به دليل خطاي رديابي در هنگام خواب‏آلودگي راننده که چشم تقريبا بسته مي‏باشد، مکان چشم گم شود، سيستم قادر به آشکارسازي آن نخواهد بود. چرا که در اين حالت مردمک چشم تقريبا مشخص نيست و آشکارسازي چشم مشکل است. بسياري از سيستم‏هاي نظارت چهره راننده از اين روش براي آشکارسازي چشم استفاده کرده‏اند [6, 20-23, 39-43]. در اکثر اين‏گونه سيستم‏ها، از يک پيکربندي خاص براي سيستم نورپردازي و تصويربرداري طيف مادون قرمز استفاده گرديده است. در اين پيکربندي نورپردازي مادون قرمز توسط دو دسته LED تامين مي‏شود که در اين سيستم نقش بسيار موثري ايفا مي‏کنند. مطابق شکل ‏2‑4، LED‏ها به دو دسته تقسيم شده و در دو حلقه متحدالمرکز و با شعاع‏هاي مختلف قرار مي‏گيرند. در هر لحظه فقط يکي از دو حلقه روشن و ديگري خاموش است. هنگامي‏که حلقه داخلي روشن باشد، نور بازتابيده شده از سطح مردمک چشم[1] به دوربين مي‏رسد و چشم به طور واضح، روشن‏تر از ساير قسمت‏هاي چهره است. اما وقتي حلقه خارجي روشن باشد، چنين حالتي براي مردمک چشم رخ نمي‏دهد و چشم تاريک است. به دو حالت متفاوت چشم به ترتيب مردمک روشن[2] و مردمک تيره[3] مي‏گويند (شکل ‏2‑5).

شکل ‏2‑4: سيستم نورپردازي مادون قرمز شامل دو دسته LED به شکل دو حلقه کوچک و بزرگ [6]

منبع نور مادون قرمز
پرتوي منعکس شده از چشم
پرتوي تابيده شده به چشم
چشم
دوربين
منبع نور مادون قرمز
پرتوي منعکس شده از چشم
پرتوي تابيده شده به چشم
چشم
دوربين
مردمک روشن
مردمک تيره

شکل ‏2‑5: نمايش ايجاد پديده مردمک روشن و مردمک تيره در نورپردازي مادون قرمز

در مرحله آشکارسازي چشم، از خاصيت مردمک روشن و مردمک تيره استفاده شده است. در اين روش ابتدا تفاضل فريم زوج از فريم فرد بدست مي‏آيد (مطابق شکل ‏2‑6). سپس تصوير حاصل از تفاضل، دوسطحي شده و مکان چشم تعيين مي‏گردد.

شکل ‏2‑6: آشکارسازي چشم بر اساس ويژگي مردمک تيره و روشن: شکل‏ها از سمت راست به ترتيب فريم زوج با تصوير مردمک روشن، فريم فرد با تصوير مردمک تيره و تفاضل فريم‏‏هاي زوج و فرد [6]

Zhu و همکارانش [39] روشي مشابه روش فوق براي آشکارسازي چشم استفاده کرده‏اند. با اين تفاوت که پس از تعيين نقاط چشم از ماشين بردار پشتيبان[4] (SVM) براي افزايش دقت آشکارسازي چشم استفاده شده است. در اين مقاله هسته[5]‏هاي مختلفي براي SVM انتخاب گرديده و نشان داده شده که هسته گوسي بهترين دقت را دارد. با انتخاب هسته گوسي براي SVM، دقت آشکارسازي چشم بيش از 95% خواهد بود. در [41, 42, 44] نيز مشابه اين روش براي آشکارسازي چشم استفاده شده است.

Zhao و همکارش [45] براي آشکارسازي چشم تنها از يک منبع نور مادون قرمز استفاده کرده‏اند که در راستاي محور اپتيکي دوربين قرار دارد. با توجه به اين چينش منبع نور، همواره بازتابش مردمک چشم در دوربين وجود دارد و در تصوير چهره، مردمک روشن ديده مي‏شود. با استفاده از عملگر ريخت‏شناسي[6] بازکردن[7] تصوير و محاسبه تفاضل اين تصوير و تصوير اصلي، نقاط منتخب چشم معين مي‏شود. اين نقاط منتخب با اعمال يک سطح آستانه بر روي تفاضل دو تصوير و استفاده از تحليل اجزاي همبند قابل استخراج است. براي اطمينان از انتخاب صحيح اين نقاط به عنوان چشم، از ماشين بردار پشتيبان (SVM) و تبديل تقارن تعميم‏يافته[8] (GST) استفاده شده است. با ترکيب نتايج حاصل از خروجي SVM و تبديل GST، نقاط چشم تعيين خواهد شد. در ارزيابي اين روش براي آشکارسازي چشم بدون عينک، TPR 4/99% و FPR صفر و براي آشکارسازي چشم با عينک TPR 3/88% و FPR 14% گزارش شده است. اين در حالي است که در صورت عدم استفاده از تبديل GST، براي آشکارسازي چشم با عينک TPR 1/54% و FPR 3% است.

1-1-2- روش‏هاي مبتني بر دوسطحي کردن تصوير

يکي از ساده‏ترين روش‏هاي آشکارسازي چشم، اعمال يک حد آستانه بر روي مقادير پيکسل‏هاي تصوير چهره براي دو سطحي کردن تصوير و تخمين مکان چشم است. اين روش بر اساس اين فرض عمل مي‏کند که مردمک چشم‏ها تيره‏ترين نقاط چهره هستند. مهمترين بخش اين الگوريتم تعيين مقدار حد آستانه مي‏باشد. اين روش دقت چنداني در آشکارسازي چشم ندارد، به‏ويژه اينکه در افراد سياه‏پوست يا در محيطي با نور کم خطاي آن به شدت افزايش مي‏يابد. به همين دليل معمولا پس از دوسطحي کردن تصوير چهره، پردازش‏هاي ديگري مانند تحليل اجزاي همبند[9] (CCA) [46, 47] يا محاسبه کانتور نواحي آشکارسازي شده [7, 27] انجام مي‏گيرد تا دقت آشکارسازي چشم افزايش يابد.

1-1-3- روش‏هاي مبتني بر پروجکشن

يکي ديگر از ساده‏ترين و پرکاربردترين روش‏هاي آشکارسازي چشم، استفاده از پروجکشن[10] است. پروجکشن به معني محاسبه مجموع مقادير پيکسل‏ها در يک جهت مشخص است. جهت پروجکشن معمولا در راستاي افقي يا عمودي انتخاب مي‏شود. اين روش مي‏تواند بر روي تصاوير دوسطحي يا سطح خاکستري اعمال شود. پروجکشن در راستاي افقي و عمودي براي تصوير  با ابعاد  به ترتيب از روابط ‏(1) و ‏(2) محاسبه مي‏شود. در اين روابط i مربوط به ستون‏هاي تصوير و j مربوط به سطرهاي آن است.

مهمترين مسئله در اين روش، فرض يکنواخت بودن نورپردازي و تيره‏تر بودن چشم‏ها (مردمک) نسبت به پوست چهره است. بنابراين انتظار مي‏رود پروجکشن افقي تصوير چهره در محل چشم‏ها داراي مقدار کمينه محلي باشد. اگر نور محيط به گونه‏اي باشد که تصوير چهره به شکل يکنواخت نورپردازي نشود يا اينکه فرد داراي پوست تيره‏اي باشد، آشکارسازي چشم دچار اختلال مي‏شود. به همين دليل در برخي سيستم‏ها، پردازش‏هاي بيشتري بر روي نواحي انتخاب شده انجام مي‏شود تا دقت آشکارسازي چشم افزايش يابد. در [26, 28, 34, 35, 48]، پروجکشن به عنوان روش اصلي براي آشکارسازي چشم مي‏باشد و در [49] از پروجکشن براي تعيين مکان اوليه چشم‏ها استفاده شده است.

براي افزايش دقت پروجکشن در آشکارسازي چشم، معمولا آشکارسازي با يک يا چند فرض اوليه انجام مي‏شود. به عنوان مثال فرض بر اين که چشم همواره در نيمه بالايي چهره قرار دارد [28, 30]، باعث مي‏شود تا پروجکشن نيمه پايين چهره محاسبه نشود و مواردي همچون ريش يا سبيل، باعث کاهش دقت آشکارسازي چشم نگردد. علاوه بر اين، معمولا پس از آشکارسازي چشم‏ها، براي اطمينان از آشکارسازي، روش‏هايي مثل تحليل اجزاي همبند استفاده مي‏شود [28].

در برخي سيستم‏ها براي کاهش وابستگي الگوريتم آشکارسازي به نور محيط، به جاي محاسبه پروجکشن از روي تصوير اصلي، ابتدا تصوير چهره لبه‏يابي گرديده، سپس پروجکشن محاسبه مي‏شود [30]. گاهي نيز به‏جاي پروجکشن تصوير، پروجکشن واريانس تصوير محاسبه مي‏شود [27]. پروجکشن واريانس نسبت به تغييرات نور محيط حساسيت کمتري دارد. پروجکشن واريانس در راستاي افقي و عمودي به ترتيب از روابط ‏(3) و ‏(4) محاسبه مي‏شوند. در اين روابط  و  به ترتيب ميانگين مقادير پيکسل‏ها در ستون i و سطر j از تصوير I هستند.

1-1-4- روش‏هاي مبتني بر يادگيري

گاه براي افزايش دقت سيستم نظارت چهره در آشکارسازي صحيح چشم، يکي از روش‏هاي قبلي به عنوان روش پايه استفاده شده و چند نقطه از تصوير چهره را به عنوان نقاط کانديدا انتخاب مي‏کنند. سپس با استفاده از روش‏هاي مبتني بر يادگيري مانند شبکه‏هاي عصبي يا ماشين بردار پشتيبان (SVM)‏، مکان دقيق چشم مشخص مي‏شود. در سيستم‏هاي [39, 41, 42, 44, 45] روش اصلي آشکارسازي چشم بر اساس نورپردازي و تصويربرداري در طيف مادون قرمز است، اما پس از انتخاب نقاط کانديدا، از ماشين بردار پشتيبان براي انتخاب نهايي نقاط چشم استفاده شده است. در [50] از تبديل هاف دايروي[11] و بررسي تقارن نقاط براي انتخاب اوليه چند نقطه کانديدا استفاده شده، سپس با استفاده از شبکه عصبي، وجود يا عدم وجود چشم در نقاط کانديدا تعيين مي‏گردد.

[1] Pupil

[2] Bright Pupil

[3] Dark Pupil

[4] Support Vector Machine (SVM)

[5] Kernel

[6] Morphologic

[7] Opening

[8] Generalized Symmetry Transformation (GST)

[9] Connected Component Analysis (CCA)

[10] Projection

[11] Circle Hough Transform

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *