جهت دانلود آموزش جامع پردازش تصویر در متلب بر روی تصویر بالا کلیک فرمایید
بینایی ماشین
تعریف بینایی ماشین
بینایی ماشین، تبدیل داده یک دوربین به یک نمایش جدید یا یک تصمیم است. همه این تبدیلات براي رسیدن به هدف مشخصی انجام میشود.
دادهي ورودي می تواند شامل اطلاعات متنی مانند اینکه ”دوربین در یک ماشین قرار داده شده ”یا این که” تشخیص دهندهي فاصله لیزري یک شیءرا در فاصله یک متري نشان می دهد“، باشد.
تصمیم نیز می تواند به طور مثال این باشد که ”شخصی در صحنه حضور دارد ” یا این که ” 14 سلول تومور در این اسلاید وجود دارد”. یک نمایش جدید نیز می تواند به معنی تبدیل یک تصویر رنگی به سیاه و سفید و یا حذف حر کت دوربین از یک مجموعه تصاویر باشد.
طبیعت معیوب بینایی
- ظاهر دوبعدي اشیاء می تواند شدیداً با نقطه دید تغییر کند.
- داده ها همراه با نویز و اعوجاج میباشد.
چشم انسان
چشم انسان تقریباً یک عدسی کروي با قطر 2.5 سانتی متر میباشدکه از چندین لایه مختلف که درونیترین آنها شبکیه نام دارد تشکیل شده است. ماهیچههاي اطراف چشم اندازه لنز را تنظیم میکنند که این کارچشم را قادر به زوم کردن روي اشیاء میکند.
دوربین(Charge Coupled Device) CCD
CCD از جهت عملکرد تقریباً مانند چشم انسان کار میکند .نور از طریق یک عدسی وارد دوربین و برروي یک پردهمخصوص تصویر میشود که تحت عنوان تراشهCCDشناخته میشود.
تعریف پیکسل: تراشهCCDکه تصاویر با استفاده از آن گرفته میشوند از تعداد زیادي سلول تشکیل شده که همگی در یک تراشه با الگوي خاصی مرتب شدهاند و تحت عنوان پیکسل (pixels) شناخته میشوند.
گرافیک خطاي ديد
خطاي چشم انسان و عادت كردن آن به كلمات باعث ميشود تا شما، به راحتي متن صفحه قبل را نيز بخوانيد!! با وجود اينكه پر از غلط املائي است!
گرافیک خطاي ديد
در طراحي اين تصوير تماما از خطوط صاف و مستقيم استفاده شده است.
گرافیک خطاي ديد
گرافیک خطاي ديد
گرافیک خطاي ديد
گرافیک خطاي ديد
گرافیک خطاي ديد
گرافیک خطاي ديد
چشم انسان قادر است كمتر از يك تريلينيوم درصد از امواج الكترومغناطيسي كه در اصطلاح نور مرئي ميناميم را ببيند.
گرافیک: طیف الکترمغناطیس
گرافیک: دروبینهای دید در شب
دوربينهاي ديد در شب قادرند از انسانها و اشياء در شب فيلم برداري كرده و به ما نشان دهند.
گرافیک: نكاتي در خصوص فيزيولوژي چشم
vاندازه و ضخامت شبكيه به معادل يك تمبر پستي است.
vچشم هشت پا بزرگترين چشم نسبت به جثه است.
vپرندگان هشت برابر بهتر از انسان مي بينند.
vچشم سنجاقك ده برابر بدتر از چشم انسان مي بيند.
vچشم حشرات ده برابر بهتر از چشم انسان حركات را ميبيند. يك دويستم ثانيه براي ديدن يك حركت براي آن كافي است.
vهمه چيز در زير آب به رنگ آبي مايل به سبز است زيرا آب طيف قرمز نور را جذب ميكند.
vاحتمالا“ سگها هيچ رنگي را نمي بينند البته اين موضوع هنوز ثابت نشده است.
vيك چشم سالم به طورمعمول میتواند ده ميليون رنگ را تشخيص دهد.
vگاوها رنگ ها را نمي بينند پس پارچهي قرمز در عصباني كردن گاو وحشي تاثيري ندارد.
v
گرافیک: نكاتي در خصوص فيزيولوژي چشم
vيك نمونه از خطاي ديد : اگر يك عينك وارونه كن بر چشم بگذاريم بعد از يك هفته همه چيز درست ديده ميشود ولي اگر عينك را برداريم دوباره همه چيز به صورت وارونه در ميآيد.
vنور مهتاب كامل يك صدوشصتم نور خورشيد است.
vجغد ميتواند در زير نور يك شمع در فاصله چهارصد متري طعمه اش را شكار كند.
vچشم گربه سانان مانند آينه عمل ميكند و كمترين نورها را نيز بازتاب ميکند.
vمار زنگي اشعه مادون قرمز را ميبيند بنابراين، گرماي حاصل از بدن جانوران اين را به سوي خود جذب ميكند.
vخلبانان انگليسي در جنگ جهاني دوم زياد هويج مي خوردند وقتي آلماني ها ديدند كه آن ها هدف را در شب ميبينند فكر كردند كه اين اثر زياد خوردن هويج است در حالي كه انگليسي ها رادار را اختراع كرده بودند.
vتصاوير متحرك براي چشم ما حداقل پانزده كادر در ثانيه هستند ولي اين مگس اين تصاوير را به صورت صحنه آهسته مي بيند.
مفهوم گرافيك كامپيوتري
اولين كامپيوترها شامل سطرهاي بسياري از چراغها و كليدها بودند.
سپس دستگاههاي قابل برنامه نويسي جديدي پديد آمد كه ميتوانستند بر روي لوله كاغذ با مكانيزمي شبيه ماشين هاي تحرير از راه دور چاپ كنند.
مانيتورهاي CRT اوليه در آغاز تنها خروجي هايي براي تصاويري بودند كه تنها حروف اسكي را نمايشمیداد.
اولين گرافيك هاي كامپيوتري كه بر روي اين خروجي ها نمايش داده ميشد دو بعدی بودند.
اصطلاح Real-time اولين بار به تصاويري كه متحرك بودند اطلاق شد.
بكارگيري اصطلاح Real-time براي گرافيك كامپيوتري بدين معناست كه كامپيوتر در حال ارائه كردن يك انيميشن يا رشتهاي از تصاوير است كه بیدرنگ به بعضي از ورودي ها واكنش نشان ميدهد.
مفهوم گرافيك كامپيوتري
اصطلاح سه بعدي (3D): به اين معناست كه يك شئ در حال نمايش، سه بعد قابل اندازهگيري دارد طول و عرض و عمق
گرافيك سه بعدي كامپيوتري در حقيقت تصاويري دو بعدي هستند روي يك صفحه تخت كه بعد سوم و يا خطاي ديد در عمق را مهيا ميسازند.
2D + Perspective = 3D
پرسپكتيو تنها براي خلق سيماي سه بعدي كافي است.
مصنوعات سه بعدي: دليل اينكه وقتي شما جلوي يكي از چشمانتان را ميپوشانيد دنيا به يكباره تخت نمیشود اين است كه هنوز افكتهاي سه بعدي زيادي حاظر هستند وقتي كه دو بعدي تماشا ميشوند. اين افكتها (تاثيرات) به اندازهاي هستند كه باعث شوند مغز شما به راحتي مسافت و عمق را تشخيص دهد. مسلم ترين چيز اينست كه اشيا نزديكتر بزرگتر از اشيا دور نمايان ميشوند.
اين افكت پرسپكتيو Foreshortening ناميده ميشود . اين افكت و تغييرات رنگ و تكسچرها و نورها و اختلاف در شدت رنگ همه با هم به ادراك ما يك تصوير سه بعدي را اضافه ميكنند.
مفهوم گرافيك كامپيوتري
مهمترين ابزار خروجي كه مي تواند به مفهوم گرافيك كامپيوتري عينيت ببخشد، صفحه نمايش (Monitor) است كه امروزه با روشهاي متفاوت در اندازهها و كيفيتهاي مختلفي توليد میشوند.
تعریف پیکسل (Pixel=Picture cell/Element): در معماري سختافزار گرافيك كامپيوتري امروزي (و كارت هاي گرافيكي در راس آنها) تصاوير به صورت مجموعه اي از نقاط در نظر گرفته مي شوند. هر نقطه ، رنگ و مشخصات خاص خود را دارد و كوچكترين جز قابل رويت يك تصوير محسوب مي شود. به اين نقاط در اصطلاح پيكسل گفته میشود.
تعریف صفحه نمایش (Screen): به مجموعه پيكسل هايي كه در هر لحظه از طريق ابزارهايي مانند صفحه نمايش ترسيم مي شود صفحه تصوير گفته میشود.
صفحه نمايش دو بعدي در نظر گرفته مي شود و معمولاً پيكسل هايي كه در اين دو بعد وجود دارند از طريق مختصات آنها مانند يك ماتريس قابل دسترسي میباشند.
مفاهیم پایه
qتفكيك پذيري (resolution):
وضوح تصاوير يا تفكيك پذيري به مجموعه پيكسلهاي افقي و عمودي اطلاق ميشود كه صفحه نمايش قادر به نمايش آن است
qپيكسل (pixel):
پيكسل كوچكترين عنصر تصويري است كه به صورت نقطه كوچكي روي صفحه نمايش قابل رويت ميباشد وبا توجه به تعداد و ميزان تراكم اين نقاط در صفحه نمايش، كيفيت تصاوير به نمايش در آمده متفاوت خواهند بود.
qماتريس كاراكتر:
ماتريس كاراكتر مجموعه اي از نقاط روشن و خاموش در صفحه نمايش مي باشد كه يك كاراكتر را نمايش مي دهند، هر چه تعداد پيكسلهاي موجود در ماتريس كاراكتر بيشتر باشد، وضوح تصاوير و كاراكترها نيز بيشتر خواهد بود.
qمد متني (Text Mode):
در اين مد كوچكترين جز تصوير كاراكتر است . صفحه نمايش به چند سطر و ستون تقسيم مي شود . ابعاد صفحه در اين مد مي تواند 40*25 یا 80*25 باشد.
q
انواع صفحههاي نمايش
qصفحه كريستال مايع (LCD):
از اين نوع سابقاً در كامپيوترهاي كيفي و قابل حمل استفاده مي شده و اكنون به صورت رايج براي تمام كامپيوترها استفاده مي شود. اين صفحه نمايش حجم و وزن كمي دارد. عبور يكسري جريانات خاص باعث نوراني شدن پيكسل هاي آن مي شود.
qلامپ اشعه كاتدي (CRT):
اين نوع لامپ تصوير، كيفيت خوبي را ارائه ميدهد و حجم و توان مصرفي بالايي دارد. در گذشته از اين نوع مانيتور براي كامپيوترهاي شخصي استفاده ميشد. تفاوت عمده تلويزيون با مانيتور در اين است كه تلويزيون داراي تيونر بوده و قادر است كانالهاي مختلف تلويزيوني را از طريق آنتن دريافت كند.
مشخصات كارتهاي گرافيكي
مشخصات كارتهاي گرافيكي
vMDA: متن را بدون لرزش و با دقت زياد به يكي از زبانهاي سبز، خاكستري و سفيد نمايش ميدهد.
vHERCULES: اين كارت رنگي نيست ولي براي كارهاي گرافيكي ميتوان از آن استفاده نمود.
vCGA: متن و گرافيك را با 4 رنگ توليد ميكند. اين كارت مي تواند خروجي خود را علاوه بر مانيتور به تلويزيون هم بدهد. هر چند در اين تعويض 80 ستون در مانيتور به 40 ستون در تلويزيون تبديل ميشود .
vEGA: گرافيك و متن را خيلي خوب توليد ميكند و چهار حالت گرافيكي قابل نمايش است.
vVGA: اين كارت كليه چهار حالت گرافيكي EGA را توليد ميكند و دقت آن براي كارهاي اداري عالي و براي كارهاي چاپي و طراحي خوب است.
اصطلاحات علمی
تفاوت بین پردازش تصویر با بینایی ماشین:
üImage processing
ü
üMachine vision
اصطلاحات علمی
اصطلاحات بینایی کامپیوتر (computer vision)، درک تصویر (imageunderstanding) و آنالیز تصویر (image analysis) اغلب مورد استفاده قرار میگیرد که به معنای بینایی ماشین (machine vision) میباشد.
سازماندهی سیستم بینایی ماشین
نمونهای از مرحله اندازهگیری ویژگیها
اجزای یک سیستم ماشین بینایی
یک و یا چند دوربین دیجیتال یا آنالوگ (سیاه-سفید یا رنگی) با اپتیک مناسب برای گرفتن عکس.
واسطه ای که عکسها را برای پردازش آماده میسازد. برای دوربینهای آنالوگ این واسطه شامل یک دیجیتال کننده عکس است. هنگامی که این واسطه یک سختافزار جدا باشد، به آن Frame grabber(کارتی که برای دریافت سیگنال تصویری و فرستادن آن به کامپیوتر استفاده میشود) میگویند.
یک پردازشگرگاهی یکPC یا پردازنده تعبیه شده (EmbeddedProcessor) مانند DSP
نرمافزار Machine visionاین نرمافزار امکاناتی برای توسعه یک برنامه نرمافزاری که برای کاربردی مشخص است را فراهم میکند.
اجزای یک سیستم ماشین بینایی
سختافزار ورودی / خروجی (مثلاً I/O دیجیتال) یا حلقههای ارتباطیمثلا ارتباط شبکه ای یا (RS-232) برای گزارش نتایج.
یک دوربین هوشمند: یک وسیله ساده که همه موارد فوق را داراست.
لنزهایی که بتواند به مقدار مطلوبی روی سنسور تصویر زوم کند.
منابع نوری مناسب و گاهی خیلی مخصوص ( مثلا چراغهای LED، فلورسنت، لامپهای هالوژن و . . . )
یک برنامه مشخص که بتواند تصاویر را پردازش کرده و مشخصههای مربوط و مناسب را شناسایی کند.
یک سنسور همزمان ساز برای شناسایی اجزا (گاهی یک سنسور نوری و یا یک سنسور مغناطیسی): این سنسور برای راه اندازی سیستم استخراج و پردازش تصویر میباشد.
حالت کلی عملکرد دستگاه
سنسور همزمان ساز تعیین میکند که چه زمانی یک بخش (که معمولاً روی یک حمل کننده حرکت می کند) در موقعیتی قرار گرفته است که باید مورد بررسی واقع شود. این سنسور هنگامیکه از زیر دوربین میگذرد و یک پالس نوری برای ثابت نگهداشتن تصویر ایجاد میکند، دوربین را برای گرفتن عکس فعال میکند. نوری که برای روشن کردن آن بخش به کار می رود در واقع برای آن است که مشخصههای مطلوب را برجسته و مشخصات نامطلوب (مثل سایهها و یا انعکاسها) را به حداقل برساند. معمولاً پنلهای LED با اندازه و طراحی مناسب برای این هدف مورد استفاده قرار می گیرند. تصویر دوربین یا توسط یک frame grabber و یا توسط یک حافظه کامپیوتری (که در آن ازframe grabber استفاده نشده است) گرفته میشود.
حالت کلی عملکرد دستگاه
frame grabberیک وسیله دیجیتال کننده است (یا در داخل دوربین هوشمند و یا بطور جداگانه) که خروجی دوربین را به فرمت دیجیتال تبدیل کرده (معمولاً این فرمت از یک آرایه دو بعدی از اعداد تشکیل شده که هر عدد متناظر شدت روشنایی نقطه متناظر در آن تصویر میباشد. به این نقاط پیکسل می گویند.) و سپس تصویر را به منظور پردازش توسط نرمافزارٍ Machine vision در حافظه کامپیوتر ذخیره میکند. به طور معمول نرمافزار، اقدامات متفاوتی را برای پردازش تصویر انجام میدهد. گاهی در ابتدا تصویر برای کاهش نویز و یا تبدیل سایههای خاکستری به ترکیب ساده ای از رنگهای سیاه و سفید دستکاری میشود (Binarization)در قدم بعدی نرمافزار عمل شمردن، اندازه گیری و شناسایی اجسام، ابعاد، کاستیها و مشخصات دیگر تصویر را انجام می دهد.
حالت کلی عملکرد دستگاه
در نهایت با توجه به ضوابط و معیارهای برنامه ریزی شده ممکن است بخشی را بپذیرد و یا رد کند. اگر یک بخش رد شد، نرمافزار به یک دستگاه مکانیکی فرمان می دهد تا آن بخش را خارج کند و همچنین سیستم خط تولید را قطع کرده و به کارگر هشدار می دهد تا مشکلی که باعث ایجاد خطا شده را رفع نماید. اگرچه اکثر Machine visionها بر مبنای دوربینهای سیاه–سفید بنا نهاده شده اند، استفاده از دوربینهای رنگی در حال رایج شدن است. همچنین امروزه شاهد شیوع فراوان استفاده از تجهیزات دوربینهای دیجیتال به جای یک دوربین و یک framegrabberجداگانه در Machine vision هستیم. استفاده از یک دوربین دیجیتال به منظور برقراری ارتباط مستقیم، باعث صرفه جویی در هزینه و نیز سادگی سیستم خواهد شد. دوربینهای هوشمند که در داخل آنها embeddedprocessorها تعبیه شده اند، در حال تسخیر سهم بالایی از بازار Machine visionها هستند.
حالت کلی عملکرد دستگاه
دوربینهای هوشمند که در داخل آنها embedded processorها تعبیه شدهاند، در حال تسخیر سهم بالایی از بازار Machine visionها هستند. استفاده از یک embedded processorو یا یک پردازنده بهینه نیاز ما به framegrabber و یک کامپیوتر خارجی را از بین میبرد. به همین خاطر این پردازندهها باعث کاهش هزینه، کاهش پیچیدگی سیستم و همچنین اختصاص توان پردازشی مشخص به هر دوربین میشود. دوربینهای هوشمند معمولاً ارزان تر از سیستمهای شامل یک دوربین و یک برد و یک کامپیوتر خارجی هستند. همچنین توان بالای embeddedprocessor و DSPها منجر به بالا رفتن عملکرد و توانایی آنها نسبت به سیستمهای مرسوم ( که بر مبنای PC هستند) شده است.
کاربردهای بینایی ماشین
vتولید صنعتی در مقیاس بزرگ.
vساخت اجزایی که نیاز به زمان تولید مشخصی دارند.
vسیستمهای ایمنی موجود در محیطهای صنعتی.
vبررسی مواد اولیه تولید (مثلا کنترل کیفیت و بررسی وقوع خطا)
vکنترل موجودی انبار و سیستمهای مدیریتی ( شمارش، بارکد خواندن و ذخیره اطلاعات در سیستمهای دیجیتال)
vکنترل رباتهای تعقیب خطی که برای حمل بار در کارخانههای صنعتی استفاده می شوند.
vکنترل کیفیت و بهبود محصولات غذایی.
vماشینی کردن اجزای کوچک صنعتی.
v
روشهای پردازش
vشمارش پیکسل:
شمردن تعداد پیکسلهای روشن و تاریک.
vتعیین آستانه:
تبدیل یک عکس با قسمتهای خاکستری به یک عکس سیاه و سفید به این طریق که با قرار دادن آستانهای پیکسلهای روشن تر از آن را سفید و پیکسلهای تیرهتر از آن را سیاه در نظر می گیریم.
vبخشبندی کردن: (Segmentation)
تبدیل تصویر ورودی به بخشهای مختلف برای موقعیت یابی و شمارش پیکسلها.
vتشخیص و شناسایی لکهها و دستکاری:
بررسی یک عکس برای یافتن گسسته از بین تمامی پیکسلها. (به عنوان مثال یک حفره سیاه رنگ در درون یک جسم خاکستری) این لکهها به عنوان نشان اختصاصی عکس خواهند بود.
v
v
روشهای پردازش
vتشخیص و شناسایی توسط اجزاء موجود:
استخراج اجزاءی خاص از یک تصویر ورودی مثلا عکس.
vتشخیص وشناسایی الگو به طور مداوم در برابر تغییرات:
به این معنا که موقعیت جسمی که ممکن است چرخانده شود یا اندازه اش تغییر کند یا قسمتی از این جسم توسط جسم دیگر پوشانده شود، را به طور دقیق شناسایی کند.
vخواندن بارکد:
شناسایی و تعیین کدهای یک بعدی و دو بعدی اسکن شده توسط ماشینها طراحی شده است.
vتشخیص و شناسایی کاراکتر نوری:
خواندن خودکار یک متن (مثال: یک رشته اعداد پشت سرهم).
v
روشهای پردازش
vاندازه گیری:
اندازه گیری ابعاد یک جسم (بر حسب میلی متر یا اینچ).
vتشخیص و شناسایی لبه ها:
پیدا کردن لبههای یک جسم در یک تصویر.
vتشخیص و شناسایی از طریق تطبیق الگو:
پیدا کردن، مطابقت دادن و شمارش اشکال خاص در یک تصویر.
در اکثرموارد یک سیستمMachine vision به منظور بررسی کامل یک تصویر، از زنجیره مرکبی از این تکنیکهای پردازش استفاده میکند. به عنوان مثال میتوان به سیستمی اشاره کرد که بارکد را میخواند و هم سطح جسم را برای خراش احتمالی مورد بررسی قرار میدهد و هم ممکن است طول و عرض آن وسیله را اندازه گیری کند.
فرآیند یک سیستم بینایی ماشین
مثال: تشخیص ارقام دست نوشته
مثال: تعیین موقعیت سر
پردازش تصویر: تصویر دیجیتالی
پردازش تصویر: تشکیل تصویر دیجیتالی
نمودار تابع به ازای مقادیر پیوسته و گسسته
پردازش تصویر: تشکیل تصویر دیجیتالی
üبرای یک پیکسل دو نوع همسایگی میتوان تعریف نمود:
همسایگی چهارگانه
همسایگی هشتگانه
پردازش تصویر: تشکیل تصویر دیجیتالی
- شدت روشنایی دریافت شده توسط حسگر در پیکسل (m,n) از تصویر باید کوانتیزه شود.
- در بینایی ماشین با دو نوع تصویر سروکار داریم:
تصویر باینری و تصویر خاکستری
نمونهای از کاربردهای بینایی ماشین
بازی مشت زنی
بازی تیس روی میز
video
تصویر رنگی و خاکستری
از دید بینایی ماشین هریک از رنگهای قرمز و سبز و آبی یک کانال رنگ نامیده میشود. یعنی برای ایجاد تصویر رنگی باید به ازای هر پیکسل مقادیر هریک از کانالهای قرمز، سبز و آبی را به طور مجزا ذخیره نمود.
در بیشتر مسائل بینایی ماشین تصاویر رنگی را به خاکستری طبق فرمول زیر تبدیل میکنند.
عملیات نقطهای
عملیات نقطهای از عملیات پیشپردازش میباشد که تنها بر روی یک پیکسل از تصویر اعمال میگردد. با اعمال عملیات نقطهای مقدار جدید یک پیکسل تنها تابعی از مقدار فعلی آن پیکسل خواهد بود.
اگر عملیات نقطهای بر روی دو تصویر اعمال شوند، مقدار جدید پیکسل تابعی از مقادیر پیکسلهای متناظر در دو تصویر ورودی خواهد بود.
عملیات محلی:
کانولوشن تصویر
عملیات محلی:
هموارکردن تصویر (فیلتر میانگین و فیلتر گاوسین)
فیلتر میانگین:
1/(w*H)
عملیات محلی:
هموارکردن تصویر (فیلتر میانگین و فیلتر گاوسین)
فیلتر گاوسین
فرمول فیلتر هموارکننده با استفاده از فیلتر گاوسین
هیستوگرام تصویر
فرمول هیستوگرام
نرمالیزه کردن هیستوگرام
تقطیع (بخشبندی) تصویر
vبه طورکلی تقطیع شامل چهار نوع عمل میباشد:
لبه یابی
آستانهگیری
تفکیک
یافتن نقاط بارز
تقطیع (بخشبندی) تصویر:
لبهیابی براساس مشتق اول تصویر
تقطیع (بخشبندی) تصویر:
فیلترهای لبهیابی براساس مشتق اول تصویر
تقطیع (بخشبندی) تصویر:
فیلترهای لبهیابی براساس مشتق اول تصویر
تقطیع (بخشبندی) تصویر:
لبهیابی براساس مشتق دوم تصویر
تقطیع (بخشبندی) تصویر:
لبهیابی براساس مشتق دوم تصویر
تقطیع (بخشبندی) تصویر:
لبهیاب کنی (canny)
تقطیع (بخشبندی) تصویر:
آستانه گیری از تصویر
تقطیع (بخشبندی) تصویر:
آستانه گیری از تصویر(تعیین سطح آستانه مبتنی بر شکل هیستوگرام)
تقطیع (بخشبندی) تصویر:
آستانه گیری از تصویر(تعیین سطح آستانه مبتنی بر شکل هیستوگرام)
تقطیع (بخشبندی) تصویر:
آستانه گیری از تصویر(تعیین سطح آستانه مبتنی بر شکل هیستوگرام)
تقطیع (بخشبندی) تصویر:
آستانه گیری از تصویر(آستانهگیری سطح آماری)
مهمترین روشهای تعیین سطح آستانه آماری به سه حالت تقسیم میگردد:
بهینه
عمومی
اتسو
تقطیع (بخشبندی) تصویر:
آستانهگیری سطح آماری: روش آستانهگیری بهینه
تقطیع (بخشبندی) تصویر:
آستانهگیری سطح آماری: روش آستانهگیری عمومی
تقطیع (بخشبندی) تصویر:
آستانهگیری سطح آماری: روش آستانهگیری اتسو
با فرض وجود دو کلاس (زمینه و پس زمینه)، روش کلی اتسو مینیمم کردن واریانس داخل کلاسی میباشد. یعنی یافتن مقدار مینیمم رابطه زیر:
تقطیع (بخشبندی) تصویر:
آستانهگیری سطح محلی
تقطیع با روش یادگیری ماشین:
تقطیع تصویر با روش k means
تقطیع با روش یادگیری ماشین:
تقطیع تصویر با روش k means
تقطیع با روش یادگیری ماشین:
تقطیع تصویر با روش k means
تقطیع با روش یادگیری ماشین:
تقطیع تصویر با روش k means
تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین:
تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع تصویر با استفاده از الگوریتم واترشید
تقطیع تصویر با استفاده از الگوریتم واترشید
تقطیع تصویر با استفاده از الگوریتم واترشید
تقطیع تصویر با استفاده از الگوریتم واترشید
تقطیع مبتنی بر تقسیم و ترکیب
تقطیع مبتنی بر تقسیم و ترکیب
تقطیع مبتنی بر تقسیم و ترکیب
تقطیع مبتنی بر تخمین حرکت
برچسب زنی اجزای متصل
برچسب زنی اجزای متصل
برچسب زنی اجزای متصل
برچسب زنی به روش پیمایش سطحی
برچسب زنی به روش پیمایش عمقی
برچسب زنی دو مرحلهای
برچسب زنی اجزای متصل به روش سطحی
برای پیادهسازی الگوریتم پیمایش گراف به صورت سطحی از یک صف استفاده میکنیم.
ریشه را به صف اضافه کن و flag آن را ست کن
تا زمانی که صف خالی نشده است تکرار کن
گره سرصف را برداشته، در خروجی چاپ کرده و همه فرزندان آن را که flag آنها ست نشده باشد، به انتهای صف اضافه کن
flag همه گرههای فرزندان اضافه شده به صف را ست کن. ست کردن flag بدین منظور انجام میگیرد که هر گره تنها یکبار به صف اضافه شود
برچسب زنی اجزای متصل به روش سطحی
برچسب زنی اجزای متصل به روش عمقی
برای پیاده سازی الگوریتم پیمایش گراف به صورت عمقی از یک پشته استفاده میکنیم.
- ریشه را به پشته اضافه کرده و فلگ آن را ست کن
- تا زمانی که پشته خالی نشده است، تکرار کن
- گره بالای پشته را برداشته (Pop)، آن را در خروجی چاپ کرده و همه فرزندان آن را که فلگ آنها ست نشده باشد، به پشته اضافه کن (Push)
- فلگ همه گره های فرزندان اضافه شده به صف را ست کن. ست کردن فلگ بدین منظور انجام می گیرد که هر گره تنها یکبار به صف اضافه شود.
برچسب زنی اجزای متصل به روش عمقی
مثال: برچسب زنی اجزای متصل به روش عمقی و سطحی
برچسب زنی اجزای متصل به روش دومرحلهای (تکراری)
برچسب زنی به روش تکراری یک روش دو مرحله ای است که در مرحله اول با پیمایش تصویر از بالا به پایین و از چپ به راست به هر پیکسل شی ای، بر اساس شرایط زیر برچسبی را انتساب می دهد:
üدر همسایگی 4گانه پیکسلp(i,j) ، اگر پیکسل بالایی p(i-1,j) و پیکسل سمت چپی p(i,j-1) دارای برچسب X باشند، پیکسل p(i,j) نیز برچسب X خواهد داشت.
üدر همسایگی 4گانه پیکسلp(i,j) ، اگر پیکسل بالاییp(i-1,j) یا پیکسل سمت چپی p(i,j-1) دارای برچسب X باشند، پیکسل p(i,j) نیز برچسبX خواهد داشت.
üدر همسایگی 4گانه پیکسلp(i,j) ، اگر پیکسل بالایی p(i-1,j) برچسب X و پیکسل سمت چپیp(i,j-1) دارای برچسبY باشند (XوY باهم برابر نیستند)، برچسب پیکسلp(i,j) را برابر X قرار داده و در جدول معادل هاX و Yرا وارد می کنیم.
üدر همسایگی 4گانه پیکسلp(i,j) ، اگر پیکسل بالاییp(i-1,j) و پیکسل سمت چپی p(i,j-1) هیچیک دارای برچسب نباشند، به پیکسل p(i,j) برچسب جدیدی برابر Z قرار میدهیم.
برچسب زنی اجزای متصل به روش دومرحلهای (تکراری)
هنگام انتساب برچسب به پیکسل ها معمولا از مقادیر عددی استفاده می کنیم. جدول معادل ها نیز شامل همه برچسب های معادل هم خواهد بود. در مرحله دوم برچسب های معادل با هم ادغام شده و برچسب منحصربفردی را برای هریک از اشیا تولید میکند. اگرX و Yدو برچسب معادل از جدول معادلها باشند، زمانی کهX<Y باشد همه برچسب هایY را برابرX قرار می دهیم و در نتیجه به هریک از اجزای متصل برچسب منحصربفردی منتسب می شود.
استخراج کانتور تصویر
مثالی از توصیف کانتور لب
مثالی از توصیف کانتور لب
مثالی از توصیف کانتور لب
مثالی از توصیف کانتور لب (فرآیند جداسازی)
مثالی از توصیف کانتور لب (تست آزمایشگاهی )
مثالی از توصیف کانتور لب (تست آزمایشگاهی )
نقاط بارز و ویژگیهای سطح پایین
گوشه یابی در تصویر
معیارهای مهم در آشکارسازی گوشه:
üهمه گوشه ها آشکار شوند.
üهیچ گوشه اشتباهی یافت نشود.
üنقاط گوشه پیدا شده باید در موقعیت درستی محلبایی شوند.
üآشکاساز گوشه باید در مقابل نویز مقاوم باشد.
نقاط بارز و ویژگیهای سطح پایین
گوشه یابی در تصویر
نقاط بارز و ویژگیهای سطح پایین
گوشه یابی در تصویر
نقاط بارز و ویژگیهای سطح پایین
گوشه یابی در تصویر
نقاط بارز و ویژگیهای سطح پایین
گوشه یابی در تصویر
نقاط بارز و ویژگیهای سطح پایین
تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل هاف دایرهای
نقاط بارز و ویژگیهای سطح پایین
تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل هاف دایرهای
نقاط بارز و ویژگیهای سطح پایین
تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل هاف دایرهای
نقاط بارز و ویژگیهای سطح پایین
تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل هاف دایرهای
الگوریتم تبدیل هاف دایرهای:
üیافتن لبهها
üبرای هر نقطه لبه تبدیل هاف شروع میشود: یک دایره با مرکزیت نقطه لبه با شعاع r رسم میشود و در انباره تمام مختصاتی که محیط دایره از آنها عبور میکند، افزایش مییابند.
üنقاط ماکزیمم در انباره پیدا میشود و تبدیل هاف تمام میشود.
üپارامترهای پیدا شده (r,a,b) مطابق با نقاط ماکزیمم روی تصویر اصلی مشخص میشوند.
مثالی از تبدیل هاف دایرهای
مثالی از تبدیل هاف دایرهای
نقاط بارز و ویژگیهای سطح پایین
تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل هاف خط
نقاط بارز و ویژگیهای سطح پایین
تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل هاف خط
نقاط بارز و ویژگیهای سطح پایین
تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل هاف خط
نقاط بارز و ویژگیهای سطح پایین
تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل هاف خط
مثالی از تبدیل هاف خط
مثالی از تبدیل هاف خط
عملیات مورفولوژیکی:
عملگرهای مجموعه ای
عملگر اجتماع
عملگر اشتراک
عملیات مورفولوژیکی:
عملگرهای مجموعه ای
عملگر تفاضل
عملگر تک عملوندی مکمل
گسترش باینری مورفولوژیکی
سایش باینری مورفولوژیکی
استخراج اسکلت بندی اشیاء
استخراج اسکلت بندی اشیاء
مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی
مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی
مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی
مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی
مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی
مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی
مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی:
بررسی معیار تراکم
مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی:
بررسی معیار تراکم
استخراج ویژگی
vویژگیهای شکل
vویژگیهای مبتنی بر ناحیه
vویژگیهای مبتنی بر شدت روشنایی
vویژگیهای مبتنی بر بانک فیلتر گابور
شمای کلی یک سیستم بازیابی تصویر
استخراج ویژگیهای محتوایی تصاویر براساس رنگ
ویژگیهای تصویر از لحاظ نحوه توصیفگر به سه دسته تقسیم میگردد:
üویژگیهای عمومی یا سطح پایین (رنگ و بافت)
üویژگیهای معنایی
üوِیژگیهای مختص کاربردهای خاص
استخراج ویژگیهای محتوایی تصاویر براساس رنگ
انواع فضاهای رنگی در استخراج رنگ:
üRGB
üHSV
üL*a*b*
استخراج ویژگیهای محتوایی تصاویر براساس رنگ
روشهای استخراج رنگ:
üممان رنگ
üهیستوگرام رنگ
üهیستوگرام برچسب رنگ
üبردار ارتباط رنگ
üهمبستگی نگاشت رنگ
üرنگ غالب
üبردار وابستگی
استخراج ویژگیهای محتوایی تصاویر براساس رنگ
نمونهای از روشهای استخراج ویژگی بافت:
üماتریس Co-occurrence
üویژگیهای Tamura
üماشین اتوماتا و منطق فازی
üویژگیهای تبدیل موجک
مثالی برای استخراج ویژگی
مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی
در این مثال از دو ویژگی رنگ غالب فازی و رنگ غالب فازی با در نظر گرفتن وابستگی مکانی پیکسل ها استفاده شده است و ساختار مبتنی بر اتوماتای سلولی برای استخراج ویژگی بکار رفته است.
تابع عضویت وضعیت قرار گرفتن یک پیکسل در همسایگی 8 از نطر رنگ پیکسلهای همسایه
مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی
نحوه نگاشت سلولهای اتوماتا بر پیکسلهای تصویر
مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی
مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی
مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی
مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی
مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی
مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی
مثال2: تشخیص دستنوشته با استفاده از ماشین اتوماتا و منطق فازی
مثال2: تشخیص دستنوشته با استفاده از ماشین اتوماتا و منطق فازی
الگوریتم کار:
محاسبه زاویه حرکت دست از روی نقاط پیدا شده
شناسایی حرکت مطلوب توسط سیستم فازی
قرار دادن نام حرکت روی نوار اتوماتا جهت تغییر وضعیت آن
شناسایی وضعیت نهایی اتوماتا و حرف نوشته شده
مثال2: تشخیص دستنوشته با استفاده از ماشین اتوماتا و منطق فازی
محاسبه زاویه حرکت دست:
مثال2: تشخیص دستنوشته با استفاده از ماشین اتوماتا و منطق فازی
مثال2: تشخیص دستنوشته با استفاده از ماشین اتوماتا و منطق فازی
üفرمول یافتن مختصات جدید زاویه حرکت دست:
üیافتن مکان کنونی دست با استفاده از لبهیابی:
مثال2: تشخیص دستنوشته با استفاده از ماشین اتوماتا و منطق فازی
مدل فازی تشخیص جهت حرکت دست از روی زاویه حرکت به دست آمده
مثال2: تشخیص دستنوشته با استفاده از ماشین اتوماتا و منطق فازی
ماشین های اتوماتای DFA(Deterministic Finite Automata)
یکDFA به صورت تعریف می شود، که در آن:
Qیک مجموعه متناهی است که نام State های ماشین در آن قرار دارد.
Ʃ یک مجموعه متناهی است که نام Symbol های زبان ماشین در آن قرار دارد.
δ تابع انتقال (تغییر وضعیت) ماشین که به صورت تعریف می شود.
q0 عضوی از می باشد که به عنوان State شروع می باشد.
F زیر مجموعه ای از که به عنوان State (های) نهایی (پذیرش) می باشد.
مثال2: تشخیص دستنوشته با استفاده از ماشین اتوماتا و منطق فازی