ماشین بینایی

image-processing-matlab-download-trainجهت دانلود آموزش جامع پردازش تصویر در متلب بر روی تصویر بالا کلیک فرمایید

 
 

بینایی ماشین

تعریف بینایی ماشین

بینایی ماشین، تبدیل داده یک دوربین به یک نمایش جدید یا یک تصمیم است. همه این تبدیلات براي رسیدن به هدف مشخصی انجام می‏شود.

داده‏ي ورودي می‌تواند شامل اطلاعات متنی مانند اینکه ”دوربین در یک ماشین قرار داده شده ”یا این که” تشخیص دهنده‏ي فاصله لیزري یک شیءرا در فاصله یک متري نشان می‌دهد“، باشد.

تصمیم نیز می‌تواند به طور مثال این باشد که ”شخصی در صحنه حضور دارد ” یا این که ” 14 سلول تومور در این اسلاید وجود دارد”. یک نمایش جدید نیز می‌تواند به معنی تبدیل یک تصویر رنگی به سیاه و سفید و یا حذف حر کت دوربین از یک مجموعه تصاویر باشد.

طبیعت معیوب بینایی

  • ظاهر دوبعدي اشیاء می‌تواند شدیداً با نقطه دید تغییر کند.
  • داده‌ها همراه با نویز و اعوجاج می‏باشد.

چشم انسان

چشم انسان تقریباً یک عدسی کروي با قطر 2.5 سانتی متر می‏باشدکه از چندین لایه مختلف که درونیترین آن‏ها شبکیه نام دارد تشکیل شده است. ماهیچه‏هاي اطراف چشم اندازه لنز را تنظیم می‏کنند که این کارچشم را قادر به زوم کردن روي اشیاء می‏کند.

دوربین(Charge Coupled Device) CCD

CCD از جهت عملکرد تقریباً مانند چشم انسان کار می‏کند .نور از طریق یک عدسی وارد دوربین و برروي یک پردهمخصوص تصویر می‏شود که تحت عنوان تراشهCCDشناخته می‏شود.

تعریف پیکسل: تراشهCCDکه تصاویر با استفاده از آن گرفته می‏شوند از تعداد زیادي سلول تشکیل شده که همگی در یک تراشه با الگوي خاصی مرتب شده‏اند و تحت عنوان پیکسل (pixels) شناخته می‏شوند.

گرافیک       خطاي ديد

خطاي چشم انسان و عادت كردن آن به كلمات باعث ميشود تا شما، به راحتي متن صفحه قبل را نيز بخوانيد!! با وجود اينكه پر از غلط املائي است!

گرافیک       خطاي ديد

در طراحي اين تصوير تماما از خطوط صاف و مستقيم استفاده شده است.

گرافیک       خطاي ديد

گرافیک       خطاي ديد

گرافیک       خطاي ديد

گرافیک       خطاي ديد

گرافیک       خطاي ديد

گرافیک       خطاي ديد

چشم انسان قادر است كمتر از يك تريلينيوم درصد از امواج الكترومغناطيسي كه در اصطلاح نور مرئي مي‏ناميم را ببيند.

گرافیک: طیف الکترمغناطیس

گرافیک: دروبینهای دید در شب

دوربينهاي ديد در شب قادرند از انسانها و اشياء در شب فيلم برداري كرده و به ما نشان دهند.

گرافیک: نكاتي در خصوص فيزيولوژي چشم

vاندازه و ضخامت شبكيه به معادل يك تمبر پستي است.

vچشم هشت پا بزرگترين چشم نسبت به جثه است.

vپرندگان هشت برابر بهتر از انسان مي بينند.

vچشم سنجاقك ده برابر بدتر از چشم انسان مي بيند.

vچشم حشرات ده برابر بهتر از چشم انسان حركات را مي‏بيند. يك دويستم ثانيه براي ديدن يك حركت براي آن كافي است.

vهمه چيز در زير آب به رنگ آبي مايل به سبز است زيرا آب طيف قرمز نور را جذب مي‏كند.

vاحتمالا“ سگ‏ها هيچ رنگي را نمي بينند البته اين موضوع هنوز ثابت نشده است.

vيك چشم سالم به طورمعمول می‏تواند ده ميليون رنگ را تشخيص دهد.

vگاوها رنگ‌ها را نمي بينند پس پارچه‏ي قرمز در عصباني كردن گاو وحشي تاثيري ندارد.

v

گرافیک: نكاتي در خصوص فيزيولوژي چشم

vيك نمونه از خطاي ديد : اگر يك عينك وارونه كن بر چشم بگذاريم بعد از يك هفته همه چيز درست ديده مي‏شود ولي اگر عينك را برداريم دوباره همه چيز به صورت وارونه در مي‏آيد.

vنور مهتاب كامل يك صدوشصتم نور خورشيد است.

vجغد مي‏تواند در زير نور يك شمع در فاصله چهارصد متري طعمه اش را شكار كند.

vچشم گربه سانان مانند آينه عمل مي‏كند و كمترين نورها را نيز بازتاب مي‏کند.

vمار زنگي اشعه مادون قرمز را مي‏بيند بنابراين، گرماي حاصل از بدن جانوران اين را به سوي خود جذب مي‏كند.

vخلبانان انگليسي در جنگ جهاني دوم زياد هويج مي خوردند وقتي آلماني‌ها ديدند كه آن‌ها هدف را در شب مي‏بينند فكر كردند كه اين اثر زياد خوردن هويج است در حالي كه انگليسي‌ها رادار را اختراع كرده بودند.

vتصاوير متحرك براي چشم ما حداقل پانزده كادر در ثانيه هستند ولي اين مگس اين تصاوير را به صورت صحنه آهسته مي بيند.

مفهوم گرافيك كامپيوتري

اولين كامپيوترها شامل سطرهاي بسياري از چراغها و كليدها بودند.

سپس دستگاههاي قابل برنامه نويسي جديدي پديد آمد كه ميتوانستند بر روي لوله كاغذ با مكانيزمي شبيه ماشين‌هاي تحرير از راه دور چاپ كنند.

مانيتورهاي CRT اوليه در آغاز تنها خروجي‌هايي براي تصاويري بودند كه تنها حروف اسكي را نمايشمی‏داد.

اولين گرافيك‌هاي كامپيوتري كه بر روي اين خروجي‌ها نمايش داده ميشد دو بعدی بودند.

اصطلاح Real-time اولين بار به تصاويري كه متحرك بودند اطلاق شد.

بكارگيري اصطلاح Real-time براي گرافيك كامپيوتري بدين معناست كه كامپيوتر در حال ارائه كردن يك انيميشن يا رشته‏اي از تصاوير است كه بی‏درنگ به بعضي از ورودي‌ها واكنش نشان مي‏دهد.

مفهوم گرافيك كامپيوتري

اصطلاح سه بعدي (3D): به اين معناست كه يك شئ در حال نمايش، سه بعد قابل اندازه‏گيري دارد طول و عرض و عمق

گرافيك سه بعدي كامپيوتري در حقيقت تصاويري دو بعدي هستند روي يك صفحه تخت كه بعد سوم و يا خطاي ديد در عمق را مهيا ميسازند.

2D + Perspective = 3D

پرسپكتيو تنها براي خلق سيماي سه بعدي كافي است.

مصنوعات سه بعدي: دليل اينكه وقتي شما جلوي يكي از چشمانتان را مي‏پوشانيد دنيا به يكباره تخت نمی‏شود اين است كه هنوز افكت‏هاي سه بعدي زيادي حاظر هستند وقتي كه دو بعدي تماشا ميشوند. اين افكت‏ها (تاثيرات) به اندازه‏اي هستند كه باعث شوند مغز شما به راحتي مسافت و عمق را تشخيص دهد. مسلم ترين چيز اينست كه اشيا نزديك‏تر بزرگتر از اشيا دور نمايان مي‏شوند.

اين افكت پرسپكتيو Foreshortening ناميده ميشود . اين افكت و تغييرات رنگ و تكسچرها و نورها و اختلاف در شدت رنگ همه با هم به ادراك ما يك تصوير سه بعدي را اضافه ميكنند.

مفهوم گرافيك كامپيوتري

مهمترين ابزار خروجي كه مي تواند به مفهوم گرافيك كامپيوتري عينيت ببخشد، صفحه نمايش (Monitor) است كه امروزه با روشهاي متفاوت در اندازه‏ها و كيفيت‏هاي مختلفي توليد می‏شوند.

تعریف پیکسل (Pixel=Picture cell/Element): در معماري سخت‏افزار گرافيك كامپيوتري امروزي (و كارت‌هاي گرافيكي در راس آنها) تصاوير به صورت مجموعه اي از نقاط در نظر گرفته مي شوند. هر نقطه ، رنگ و مشخصات خاص خود را دارد و كوچكترين جز قابل رويت يك تصوير محسوب مي شود. به اين نقاط در اصطلاح پيكسل گفته می‏شود.

تعریف صفحه نمایش (Screen): به مجموعه پيكسل‌هايي كه در هر لحظه از طريق ابزارهايي مانند صفحه نمايش ترسيم مي شود صفحه تصوير گفته می‎‏شود.

صفحه نمايش دو بعدي در نظر گرفته مي شود و معمولاً پيكسل‌هايي كه در اين دو بعد وجود دارند از طريق مختصات آنها مانند يك ماتريس قابل دسترسي می‏باشند.

مفاهیم پایه

qتفكيك پذيري (resolution):

وضوح تصاوير يا تفكيك پذيري به مجموعه پيكسلهاي افقي و عمودي اطلاق مي‏شود كه صفحه نمايش قادر به نمايش آن است

qپيكسل (pixel):

پيكسل كوچكترين عنصر تصويري است كه به صورت نقطه كوچكي روي صفحه نمايش قابل رويت مي‏باشد وبا توجه به تعداد و ميزان تراكم اين نقاط در صفحه نمايش، كيفيت تصاوير به نمايش در آمده متفاوت خواهند بود.

qماتريس كاراكتر:

ماتريس كاراكتر مجموعه اي از نقاط روشن و خاموش در صفحه نمايش مي باشد كه يك كاراكتر را نمايش مي دهند، هر چه تعداد پيكسلهاي موجود در ماتريس كاراكتر بيشتر باشد، وضوح تصاوير و كاراكترها نيز بيشتر خواهد بود.

qمد متني (Text Mode):

در اين مد كوچكترين جز تصوير كاراكتر است . صفحه نمايش به چند سطر و ستون تقسيم مي شود . ابعاد صفحه در اين مد مي تواند 40*25 یا 80*25 باشد.

q

انواع صفحه‏هاي نمايش

qصفحه كريستال مايع (LCD):

از اين نوع سابقاً در كامپيوترهاي كيفي و قابل حمل استفاده مي شده و اكنون به صورت رايج براي تمام كامپيوترها استفاده مي شود. اين صفحه نمايش حجم و وزن كمي دارد. عبور يكسري جريانات خاص باعث نوراني شدن پيكسل‌هاي آن مي شود.

qلامپ اشعه كاتدي (CRT):

اين نوع لامپ تصوير، كيفيت خوبي را ارائه مي‏دهد و حجم و توان مصرفي بالايي دارد. در گذشته از اين نوع مانيتور براي كامپيوترهاي شخصي استفاده مي‏شد. تفاوت عمده تلويزيون با مانيتور در اين است كه تلويزيون داراي تيونر بوده و قادر است كانالهاي مختلف تلويزيوني را از طريق آنتن دريافت كند.

مشخصات كارت‏هاي گرافيكي

مشخصات كارت‏هاي گرافيكي

vMDA: متن را بدون لرزش و با دقت زياد به يكي از زبانهاي سبز، خاكستري و سفيد نمايش مي‏دهد.

vHERCULES: اين كارت رنگي نيست ولي براي كارهاي گرافيكي مي‏توان از آن استفاده نمود.

vCGA: متن و گرافيك را با 4 رنگ توليد مي‏كند. اين كارت مي تواند خروجي خود را علاوه بر مانيتور به تلويزيون هم بدهد. هر چند در اين تعويض 80 ستون در مانيتور به 40 ستون در تلويزيون تبديل مي‏شود .

vEGA: گرافيك و متن را خيلي خوب توليد مي‏كند و چهار حالت گرافيكي قابل نمايش است.

vVGA: اين كارت كليه چهار حالت گرافيكي EGA را توليد مي‏كند و دقت آن براي كارهاي اداري عالي و براي كارهاي چاپي و طراحي خوب است.

اصطلاحات علمی

تفاوت بین پردازش تصویر با بینایی ماشین:

üImage processing

ü

üMachine vision

اصطلاحات علمی

اصطلاحات بینایی کامپیوتر (computer vision)، درک تصویر (imageunderstanding) و آنالیز تصویر (image analysis) اغلب مورد استفاده قرار می‏گیرد که به معنای بینایی ماشین (machine vision) می‏باشد.

سازماندهی سیستم بینایی ماشین

نمونه‏ای از مرحله اندازه‏گیری ویژگی‏ها

اجزای یک سیستم ماشین بینایی

یک و یا چند دوربین دیجیتال یا آنالوگ (سیاه-سفید یا رنگی) با اپتیک مناسب برای گرفتن عکس.

واسطه ای که عکس‌ها را برای پردازش آماده می‏سازد. برای دوربین‌های آنالوگ این واسطه شامل یک دیجیتال کننده عکس است. هنگامی‌که این واسطه یک سخت‌افزار جدا باشد، به آن Frame grabber(کارتی که برای دریافت سیگنال تصویری و فرستادن آن به کامپیوتر استفاده می‏شود) می‏گویند.

یک پردازشگرگاهی یکPC یا پردازنده تعبیه شده (EmbeddedProcessor) مانند DSP

نرم‌افزار  Machine visionاین نرم‌افزار امکاناتی برای توسعه یک برنامه نرم‌افزاری که برای کاربردی مشخص است را فراهم می‏کند.

اجزای یک سیستم ماشین بینایی

سخت‌افزار ورودی / خروجی (مثلاً I/O دیجیتال) یا حلقه‌های ارتباطیمثلا ارتباط شبکه ای یا (RS-232) برای گزارش نتایج.

یک دوربین هوشمند: یک وسیله ساده که همه موارد فوق را داراست.

لنزهایی که بتواند به مقدار مطلوبی روی سنسور تصویر زوم کند.

منابع نوری مناسب و گاهی خیلی مخصوص ( مثلا چراغهای LED، فلورسنت، لامپهای‌هالوژن و . . . )

یک برنامه مشخص که بتواند تصاویر را پردازش کرده و مشخصه‌های مربوط و مناسب را شناسایی کند.

یک سنسور همزمان ساز برای شناسایی اجزا (گاهی یک سنسور نوری و یا یک سنسور مغناطیسی): این سنسور برای راه اندازی سیستم استخراج و پردازش تصویر می‏باشد.

حالت کلی عملکرد دستگاه

سنسور همزمان ساز تعیین می‌کند که چه زمانی یک بخش (که معمولاً روی یک حمل کننده حرکت می‌کند) در موقعیتی قرار گرفته است که باید مورد بررسی واقع شود. این سنسور هنگامیکه از زیر دوربین می‏گذرد و یک پالس نوری برای ثابت نگهداشتن تصویر ایجاد می‌کند، دوربین را برای گرفتن عکس فعال می‏کند. نوری که برای روشن کردن آن بخش به کار می‌رود در واقع برای آن است که مشخصه‌های مطلوب را برجسته و مشخصات نامطلوب (مثل سایه‌ها و یا انعکاس‏ها) را به حداقل برساند. معمولاً پنل‌های LED با اندازه و طراحی مناسب برای این هدف مورد استفاده قرار می‌گیرند. تصویر دوربین یا توسط یک frame grabber  و یا توسط یک حافظه کامپیوتری (که در آن ازframe grabber  استفاده نشده است) گرفته می‏شود.

حالت کلی عملکرد دستگاه

frame grabberیک وسیله دیجیتال کننده است (یا در داخل دوربین هوشمند و یا بطور جداگانه) که خروجی دوربین را به فرمت دیجیتال تبدیل کرده (معمولاً این فرمت از یک آرایه دو بعدی از اعداد تشکیل شده که هر عدد متناظر شدت روشنایی نقطه متناظر در آن تصویر می‏باشد. به این نقاط پیکسل می‌گویند.) و سپس تصویر را به منظور پردازش توسط نرم‌افزارٍ Machine vision  در حافظه کامپیوتر ذخیره می‏کند. به طور معمول نرم‌افزار، اقدامات متفاوتی را برای پردازش تصویر انجام می‏دهد. گاهی در ابتدا تصویر برای کاهش نویز و یا تبدیل سایه‌های خاکستری به ترکیب ساده ای از رنگهای سیاه و سفید دستکاری می‌شود (Binarization)در قدم بعدی نرم‌افزار عمل شمردن، اندازه گیری و شناسایی اجسام، ابعاد، کاستی‌ها و مشخصات دیگر تصویر را انجام می‌دهد.

حالت کلی عملکرد دستگاه

در نهایت با توجه به ضوابط و معیارهای برنامه ریزی شده ممکن است بخشی را بپذیرد و یا رد کند. اگر یک بخش رد شد، نرم‌افزار به یک دستگاه مکانیکی فرمان می‌دهد تا آن بخش را خارج کند و همچنین سیستم خط تولید را قطع کرده و به کارگر هشدار می‌دهد تا مشکلی که باعث ایجاد خطا شده را رفع نماید. اگرچه اکثر Machine vision‌ها بر مبنای دوربین‌های سیاه–سفید بنا نهاده شده اند، استفاده از دوربین‌های رنگی در حال رایج شدن است. همچنین امروزه شاهد شیوع فراوان استفاده از تجهیزات دوربین‌های دیجیتال به جای یک دوربین و یک framegrabberجداگانه در Machine vision هستیم. استفاده از یک دوربین دیجیتال به منظور برقراری ارتباط مستقیم، باعث صرفه جویی در هزینه و نیز سادگی سیستم خواهد شد. دوربین‌های هوشمند که در داخل آنها embeddedprocessorها تعبیه شده اند، در حال تسخیر سهم بالایی از بازار Machine vision‌ها هستند.

حالت کلی عملکرد دستگاه

دوربین‌های هوشمند که در داخل آنها embedded processor‌ها تعبیه شده‏اند، در حال تسخیر سهم بالایی از بازار Machine vision‌ها هستند. استفاده از یک embedded processorو یا یک پردازنده بهینه نیاز ما به framegrabber و یک کامپیوتر خارجی را از بین می‏برد. به همین خاطر این پردازنده‌ها باعث کاهش هزینه، کاهش پیچیدگی سیستم و همچنین اختصاص توان پردازشی مشخص به هر دوربین می‏شود. دوربین‌های هوشمند معمولاً ارزان تر از سیستمهای شامل یک دوربین و یک برد و یک کامپیوتر خارجی هستند. همچنین توان بالای embeddedprocessor و DSPها منجر به بالا رفتن عملکرد و توانایی آنها نسبت به سیستمهای مرسوم ( که بر مبنای PC هستند) شده است.

کاربردهای بینایی ماشین

vتولید صنعتی در مقیاس بزرگ.

vساخت اجزایی که نیاز به زمان تولید مشخصی دارند.

vسیستمهای ایمنی موجود در محیط‌های صنعتی.

vبررسی مواد اولیه تولید (مثلا کنترل کیفیت و بررسی وقوع خطا)

vکنترل موجودی انبار و سیستمهای مدیریتی ( شمارش، بارکد خواندن و ذخیره اطلاعات در سیستمهای دیجیتال)

vکنترل رباتهای تعقیب خطی که برای حمل بار در کارخانه‌های صنعتی استفاده می‌شوند.

vکنترل کیفیت و بهبود محصولات غذایی.

vماشینی کردن اجزای کوچک صنعتی.

v

روش‌های پردازش

vشمارش پیکسل:

شمردن تعداد پیکسل‏های روشن و تاریک.

vتعیین آستانه:

تبدیل یک عکس با قسمت‌های خاکستری به یک عکس سیاه و سفید به این طریق که با قرار دادن آستانه‏ای پیکسل‌های روشن تر از آن را سفید و پیکسل‌های تیره‏تر از آن را سیاه در نظر می‌گیریم.

vبخش‏بندی کردن: (Segmentation)

تبدیل تصویر ورودی به بخش‌های مختلف برای موقعیت یابی و شمارش پیکسل‏ها.

vتشخیص و شناسایی لکه‌ها و دستکاری:

بررسی یک عکس برای یافتن گسسته از بین تمامی‌پیکسل‏ها. (به عنوان مثال یک حفره سیاه رنگ در درون یک جسم خاکستری) این لکه‌ها به عنوان نشان اختصاصی عکس خواهند بود.

v

v

روش‌های پردازش

vتشخیص و شناسایی توسط اجزاء موجود:

استخراج اجزاءی خاص از یک تصویر ورودی مثلا عکس.

vتشخیص وشناسایی الگو به طور مداوم در برابر تغییرات:

به این معنا که موقعیت جسمی‌که ممکن است چرخانده شود یا اندازه اش تغییر کند یا قسمتی از این جسم توسط جسم دیگر پوشانده شود، را به طور دقیق شناسایی کند.

vخواندن بارکد:

شناسایی و تعیین کدهای یک بعدی و دو بعدی اسکن شده توسط ماشین‌ها طراحی شده است.

vتشخیص و شناسایی کاراکتر نوری:

خواندن خودکار یک متن (مثال: یک رشته اعداد پشت سرهم).

v


روش‏های پردازش

vاندازه گیری:

اندازه گیری ابعاد یک جسم (بر حسب میلی متر یا اینچ).

vتشخیص و شناسایی لبه‌ها:

پیدا کردن لبه‌های یک جسم در یک تصویر.

vتشخیص و شناسایی از طریق تطبیق الگو:

پیدا کردن، مطابقت دادن و شمارش اشکال خاص در یک تصویر.

در اکثرموارد یک سیستمMachine vision  به منظور بررسی کامل یک تصویر، از زنجیره مرکبی از این تکنیک‏های پردازش استفاده می‏کند. به عنوان مثال می‏توان به سیستمی‌اشاره کرد که بارکد را می‏خواند و هم سطح جسم را برای خراش احتمالی مورد بررسی قرار می‏دهد و هم ممکن است طول و عرض آن وسیله را اندازه گیری کند.

فرآیند یک سیستم بینایی ماشین

مثال: تشخیص ارقام دست نوشته

مثال: تعیین موقعیت سر

پردازش تصویر: تصویر دیجیتالی

پردازش تصویر: تشکیل تصویر دیجیتالی

نمودار تابع به ازای مقادیر پیوسته و گسسته

پردازش تصویر: تشکیل تصویر دیجیتالی

üبرای یک پیکسل دو نوع همسایگی می‏توان تعریف نمود:

همسایگی چهارگانه

همسایگی هشت‏گانه

پردازش تصویر: تشکیل تصویر دیجیتالی

  • شدت روشنایی دریافت شده توسط حسگر در پیکسل (m,n) از تصویر باید کوانتیزه شود.
  • در بینایی ماشین با دو نوع تصویر سروکار داریم:

تصویر باینری و تصویر خاکستری

نمونه‏ای از کاربردهای بینایی ماشین

بازی مشت زنی

بازی تیس روی میز

video

تصویر رنگی و خاکستری

از دید بینایی ماشین هریک از رنگ‏های قرمز و سبز و آبی یک کانال رنگ نامیده می‏شود. یعنی برای ایجاد تصویر رنگی باید به ازای هر پیکسل مقادیر هریک از کانال‏های قرمز، سبز و آبی را به طور مجزا ذخیره نمود.

در بیشتر مسائل بینایی ماشین تصاویر رنگی را به خاکستری طبق فرمول زیر تبدیل می‏کنند.

 

عملیات نقطه‏ای

عملیات نقطه‏ای از عملیات پیش‏پردازش می‏باشد که تنها بر روی یک پیکسل از تصویر اعمال می‏گردد. با اعمال عملیات نقطه‏ای مقدار جدید یک پیکسل تنها تابعی از مقدار فعلی آن پیکسل خواهد بود.

اگر عملیات نقطه‏ای بر روی دو تصویر اعمال شوند، مقدار جدید پیکسل تابعی از مقادیر پیکسل‏های متناظر در دو تصویر ورودی خواهد بود.

عملیات محلی:
کانولوشن تصویر

عملیات محلی:
هموار‏کردن تصویر (فیلتر میانگین و فیلتر گاوسین)

فیلتر میانگین: 

1/(w*H)

عملیات محلی:
هموار‏کردن تصویر (فیلتر میانگین و فیلتر گاوسین)

فیلتر گاوسین

فرمول فیلتر هموارکننده با استفاده از فیلتر گاوسین

هیستوگرام تصویر

فرمول هیستوگرام

نرمالیزه کردن هیستوگرام

تقطیع (بخش‏بندی) تصویر

vبه طورکلی تقطیع شامل چهار نوع عمل می‏باشد:

لبه یابی

آستانه‏گیری

تفکیک

یافتن نقاط بارز

تقطیع (بخش‏بندی) تصویر:
لبه‏یابی براساس مشتق اول تصویر

تقطیع (بخش‏بندی) تصویر:
فیلترهای لبه‏یابی براساس مشتق اول تصویر

تقطیع (بخش‏بندی) تصویر:
فیلترهای لبه‏یابی براساس مشتق اول تصویر

تقطیع (بخش‏بندی) تصویر:
لبه‏یابی براساس مشتق دوم تصویر

تقطیع (بخش‏بندی) تصویر:
لبه‏یابی براساس مشتق دوم تصویر

تقطیع (بخش‏بندی) تصویر:
لبه‏یاب کنی (canny)

تقطیع (بخش‏بندی) تصویر:
آستانه گیری از تصویر

تقطیع (بخش‏بندی) تصویر:
آستانه گیری از تصویر(تعیین سطح آستانه مبتنی بر شکل هیستوگرام)

تقطیع (بخش‏بندی) تصویر:
آستانه گیری از تصویر(تعیین سطح آستانه مبتنی بر شکل هیستوگرام)

تقطیع (بخش‏بندی) تصویر:
آستانه گیری از تصویر(تعیین سطح آستانه مبتنی بر شکل هیستوگرام)

تقطیع (بخش‏بندی) تصویر:
آستانه گیری از تصویر(آستانه‏گیری سطح آماری)

مهمترین روش‏های تعیین سطح آستانه آماری به سه حالت تقسیم می‏گردد:

بهینه

عمومی

اتسو

تقطیع (بخش‏بندی) تصویر:
آستانه‏گیری سطح آماری: روش آستانه‏گیری بهینه

تقطیع (بخش‏بندی) تصویر:
آستانه‏گیری سطح آماری: روش آستانه‏گیری عمومی

تقطیع (بخش‏بندی) تصویر:
آستانه‏گیری سطح آماری: روش آستانه‏گیری اتسو

با فرض وجود دو کلاس (زمینه و پس زمینه)، روش کلی اتسو مینیمم کردن واریانس داخل کلاسی می‏باشد. یعنی یافتن مقدار مینیمم رابطه زیر:

تقطیع (بخش‏بندی) تصویر:
آستانه‏گیری سطح محلی

تقطیع با روش یادگیری ماشین:
تقطیع تصویر با روش k means

تقطیع با روش یادگیری ماشین:
تقطیع تصویر با روش k means

تقطیع با روش یادگیری ماشین:
تقطیع تصویر با روش k means

تقطیع با روش یادگیری ماشین:
تقطیع تصویر با روش k means

تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین

تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین

تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین

تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین

تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین

تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین

تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین

تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین

تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین

تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین

تقطیع تصویر با استفاده از الگوریتم واترشید

تقطیع تصویر با استفاده از الگوریتم واترشید

تقطیع تصویر با استفاده از الگوریتم واترشید

تقطیع تصویر با استفاده از الگوریتم واترشید

تقطیع مبتنی بر تقسیم و ترکیب

تقطیع مبتنی بر تقسیم و ترکیب

تقطیع مبتنی بر تقسیم و ترکیب

تقطیع مبتنی بر تخمین حرکت

برچسب زنی اجزای متصل

برچسب زنی اجزای متصل

برچسب زنی اجزای متصل

برچسب زنی به روش پیمایش سطحی

برچسب زنی به روش پیمایش عمقی

برچسب زنی دو مرحله‏ای

برچسب زنی اجزای متصل به روش سطحی

برای پیاده‏سازی الگوریتم پیمایش گراف به صورت سطحی از یک صف استفاده می‏کنیم.

ریشه را به صف اضافه کن و flag آن را ست کن

تا زمانی که صف خالی نشده است تکرار کن

گره سرصف را برداشته، در خروجی چاپ کرده و همه فرزندان آن را که flag آنها ست نشده باشد، به انتهای صف اضافه کن

flag همه گره‏های فرزندان اضافه شده به صف را ست کن. ست کردن flag بدین منظور انجام می‏گیرد که هر گره تنها یکبار به صف اضافه شود

برچسب زنی اجزای متصل به روش سطحی

برچسب زنی اجزای متصل به روش عمقی

برای پیاده سازی الگوریتم پیمایش گراف به صورت عمقی از یک پشته استفاده می‏کنیم.

  • ریشه را به پشته اضافه کرده و فلگ آن را ست کن
  • تا زمانی که پشته خالی نشده است، تکرار کن
  • گره بالای پشته را برداشته (Pop)، آن را در خروجی چاپ کرده و همه فرزندان آن را که فلگ آنها ست نشده باشد، به پشته اضافه کن (Push)
  • فلگ همه گره‌های فرزندان اضافه شده به صف را ست کن. ست کردن فلگ بدین منظور انجام می‌گیرد که هر گره تنها یکبار به صف اضافه شود.

برچسب زنی اجزای متصل به روش عمقی

مثال: برچسب زنی اجزای متصل به روش عمقی و سطحی

برچسب زنی اجزای متصل به روش دومرحله‏ای (تکراری)

برچسب زنی به روش تکراری یک روش دو مرحله ای است که در مرحله اول با پیمایش تصویر از بالا به پایین و از چپ به راست به هر پیکسل شی ای، بر اساس شرایط زیر برچسبی را انتساب می‌دهد:

üدر همسایگی 4گانه پیکسلp(i,j) ، اگر پیکسل بالایی p(i-1,j) و پیکسل سمت چپی p(i,j-1) دارای برچسب X  باشند، پیکسل p(i,j) نیز برچسب X خواهد داشت.

üدر همسایگی 4گانه پیکسلp(i,j) ، اگر پیکسل بالاییp(i-1,j) یا پیکسل سمت چپی p(i,j-1)  دارای برچسب X باشند، پیکسل p(i,j) نیز برچسبX خواهد داشت.

üدر همسایگی 4گانه پیکسلp(i,j) ، اگر پیکسل بالایی p(i-1,j) برچسب X و پیکسل سمت چپیp(i,j-1) دارای برچسبY باشند (XوY باهم برابر نیستند)، برچسب پیکسلp(i,j) را برابر X قرار داده و در جدول معادل‌هاX و Yرا وارد می‌کنیم.

üدر همسایگی 4گانه پیکسلp(i,j) ، اگر پیکسل بالاییp(i-1,j) و پیکسل سمت چپی p(i,j-1)  هیچیک دارای برچسب نباشند، به پیکسل p(i,j) برچسب جدیدی برابر Z قرار می‏دهیم.

برچسب زنی اجزای متصل به روش دومرحله‏ای (تکراری)

هنگام انتساب برچسب به پیکسل‌ها معمولا از مقادیر عددی استفاده می‌کنیم. جدول معادل‌ها نیز شامل همه برچسب‌های معادل هم خواهد بود. در مرحله دوم برچسب‌های معادل با هم ادغام شده و برچسب منحصربفردی را برای هریک از اشیا تولید می‏کند. اگرX و Yدو برچسب معادل از جدول معادل‏ها باشند، زمانی کهX<Y باشد همه برچسب‌هایY را برابرX قرار می‌دهیم و در نتیجه به هریک از اجزای متصل برچسب منحصربفردی منتسب می‌شود.

استخراج کانتور تصویر

مثالی از توصیف کانتور لب

مثالی از توصیف کانتور لب

مثالی از توصیف کانتور لب

مثالی از توصیف کانتور لب (فرآیند جداسازی)

مثالی از توصیف کانتور لب (تست آزمایشگاهی )

مثالی از توصیف کانتور لب (تست آزمایشگاهی )

نقاط بارز و ویژگیهای سطح پایین
گوشه یابی در تصویر

معیارهای مهم در آشکارسازی گوشه:

üهمه گوشه‌ها آشکار شوند.

üهیچ گوشه اشتباهی یافت نشود.

üنقاط گوشه پیدا شده باید در موقعیت درستی محل‏بایی شوند.

üآشکاساز گوشه باید در مقابل نویز مقاوم باشد.

نقاط بارز و ویژگیهای سطح پایین
گوشه یابی در تصویر

نقاط بارز و ویژگیهای سطح پایین
گوشه یابی در تصویر

نقاط بارز و ویژگیهای سطح پایین
گوشه یابی در تصویر

نقاط بارز و ویژگیهای سطح پایین
گوشه یابی در تصویر

نقاط بارز و ویژگیهای سطح پایین
تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل‌هاف دایره‏ای

نقاط بارز و ویژگیهای سطح پایین
تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل‌هاف دایره‏ای

نقاط بارز و ویژگیهای سطح پایین
تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل‌هاف دایره‏ای

نقاط بارز و ویژگیهای سطح پایین
تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل‌هاف دایره‏ای

الگوریتم تبدیل‌هاف دایره‏ای:

üیافتن لبه‏ها

üبرای هر نقطه لبه تبدیل‌هاف شروع می‏شود: یک دایره با مرکزیت نقطه لبه با شعاع r رسم می‏شود و در انباره تمام مختصاتی که محیط دایره از آنها عبور می‏کند، افزایش می‏یابند.

üنقاط ماکزیمم در انباره پیدا می‏شود و تبدیل‌هاف تمام می‏شود.

üپارامترهای پیدا شده (r,a,b) مطابق با نقاط ماکزیمم روی تصویر اصلی مشخص می‏شوند.

مثالی از تبدیل‌هاف دایره‏ای

مثالی از تبدیل‌هاف دایره‏ای

نقاط بارز و ویژگیهای سطح پایین
تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل‌هاف خط

نقاط بارز و ویژگیهای سطح پایین
تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل‌هاف خط

نقاط بارز و ویژگیهای سطح پایین
تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل‌هاف خط

نقاط بارز و ویژگیهای سطح پایین
تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل‌هاف خط

مثالی از تبدیل‌هاف خط

مثالی از تبدیل‌هاف خط

عملیات مورفولوژیکی:
 عملگرهای مجموعه ای

عملگر اجتماع

عملگر اشتراک

عملیات مورفولوژیکی:
 عملگرهای مجموعه ای

عملگر تفاضل

عملگر تک عملوندی مکمل

گسترش باینری مورفولوژیکی

سایش باینری مورفولوژیکی

استخراج اسکلت بندی اشیاء

استخراج اسکلت بندی اشیاء

مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی

مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی

مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی

مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی

مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی

مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی

مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی:
بررسی معیار تراکم

 

مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی:
بررسی معیار تراکم

 

استخراج ویژگی

vویژگی‏های شکل

vویژگی‏های مبتنی بر ناحیه

vویژگی‏های مبتنی بر شدت روشنایی

vویژگی‏های مبتنی بر بانک فیلتر گابور

شمای کلی یک سیستم بازیابی تصویر

استخراج ویژگی‏های محتوایی تصاویر براساس رنگ

ویژگی‏های تصویر از لحاظ نحوه توصیف‏گر به سه دسته تقسیم می‏گردد:

üویژگی‏های عمومی‌یا سطح پایین (رنگ و بافت)

üویژگی‏های معنایی

üوِیژگی‏های مختص کاربردهای خاص

استخراج ویژگی‏های محتوایی تصاویر براساس رنگ

انواع فضاهای رنگی در استخراج رنگ:

üRGB

üHSV

üL*a*b*

استخراج ویژگی‏های محتوایی تصاویر براساس رنگ

روش‏های استخراج رنگ:

üممان رنگ

üهیستوگرام رنگ

üهیستوگرام برچسب رنگ

üبردار ارتباط رنگ

üهمبستگی نگاشت رنگ

üرنگ غالب

üبردار وابستگی

 

استخراج ویژگی‏های محتوایی تصاویر براساس رنگ

نمونه‏ای از روش‏های استخراج ویژگی بافت:

üماتریس Co-occurrence

üویژگی‏های Tamura

üماشین اتوماتا و منطق فازی

üویژگی‏های تبدیل موجک

مثالی برای استخراج ویژگی

مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی

در این مثال از دو ویژگی رنگ غالب فازی و رنگ غالب فازی با در نظر گرفتن وابستگی مکانی پیکسل‌ها استفاده شده است و ساختار مبتنی بر اتوماتای سلولی برای استخراج ویژگی بکار رفته است.

تابع عضویت وضعیت قرار گرفتن یک پیکسل در همسایگی 8 از نطر رنگ پیکسل‏های همسایه

مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی

نحوه نگاشت سلول‏های اتوماتا بر پیکسل‏های تصویر

مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی

مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی

مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی

مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی

مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی

مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی

مثال2: تشخیص دست‏نوشته با استفاده از ماشین اتوماتا و منطق فازی

مثال2: تشخیص دست‏نوشته با استفاده از ماشین اتوماتا و منطق فازی

الگوریتم کار:

محاسبه زاویه حرکت دست از روی نقاط پیدا شده

شناسایی حرکت مطلوب توسط سیستم فازی

قرار دادن نام حرکت روی نوار اتوماتا جهت تغییر وضعیت آن

شناسایی وضعیت نهایی اتوماتا و حرف نوشته شده

مثال2: تشخیص دست‏نوشته با استفاده از ماشین اتوماتا و منطق فازی

محاسبه زاویه حرکت دست:

مثال2: تشخیص دست‏نوشته با استفاده از ماشین اتوماتا و منطق فازی

مثال2: تشخیص دست‏نوشته با استفاده از ماشین اتوماتا و منطق فازی

üفرمول یافتن مختصات جدید زاویه حرکت دست:

üیافتن مکان کنونی دست با استفاده از لبه‏یابی:

مثال2: تشخیص دست‏نوشته با استفاده از ماشین اتوماتا و منطق فازی

مدل فازی تشخیص جهت حرکت دست از روی زاویه حرکت به دست آمده

مثال2: تشخیص دست‏نوشته با استفاده از ماشین اتوماتا و منطق فازی

ماشین‌های اتوماتای DFA(Deterministic Finite Automata)

یکDFA به صورت                             تعریف می‌شود، که در آن:

Qیک مجموعه متناهی است که نام State‌های ماشین در آن قرار دارد.

Ʃ یک مجموعه متناهی است که نام Symbol‌های زبان ماشین در آن قرار دارد.

δ تابع انتقال (تغییر وضعیت) ماشین که به صورت  تعریف می‌شود.

q0 عضوی از  می‌باشد که به عنوان State شروع می‌باشد.

F  زیر مجموعه ای از  که به عنوان State (های) نهایی (پذیرش) می‌باشد.

مثال2: تشخیص دست‏نوشته با استفاده از ماشین اتوماتا و منطق فازی

پیام بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

nine + one =