جهت دانلود آموزش جامع پردازش تصویر در متلب بر روی تصویر بالا کلیک فرمایید
بینایی ماشین
تعریف بینایی ماشین
بینایی ماشین، تبدیل داده یک دوربین به یک نمایش جدید یا یک تصمیم است. همه این تبدیلات براي رسیدن به هدف مشخصی انجام میشود.
دادهي ورودي می تواند شامل اطلاعات متنی مانند اینکه ”دوربین در یک ماشین قرار داده شده ”یا این که” تشخیص دهندهي فاصله لیزري یک شیءرا در فاصله یک متري نشان می دهد“، باشد.
تصمیم نیز می تواند به طور مثال این باشد که ”شخصی در صحنه حضور دارد ” یا این که ” 14 سلول تومور در این اسلاید وجود دارد”. یک نمایش جدید نیز می تواند به معنی تبدیل یک تصویر رنگی به سیاه و سفید و یا حذف حر کت دوربین از یک مجموعه تصاویر باشد.
طبیعت معیوب بینایی
ظاهر دوبعدي اشیاء می تواند شدیداً با نقطه دید تغییر کند.
داده ها همراه با نویز و اعوجاج میباشد.
چشم انسان
چشم انسان تقریباً یک عدسی کروي با قطر 2.5 سانتی متر میباشد که از چندین لایه مختلف که درونیترین آنها شبکیه نام دارد تشکیل شده است. ماهیچههاي اطراف چشم اندازه لنز را تنظیم میکنند که این کار چشم را قادر به زوم کردن روي اشیاء میکند.
دوربین (Charge Coupled Device) CCD
CCD از جهت عملکرد تقریباً مانند چشم انسان کار میکند .نور از طریق یک عدسی وارد دوربین و برروي یک پرده مخصوص تصویر میشود که تحت عنوان تراشه CCD شناخته میشود.
تعریف پیکسل: تراشه CCD که تصاویر با استفاده از آن گرفته میشوند از تعداد زیادي سلول تشکیل شده که همگی در یک تراشه با الگوي خاصی مرتب شدهاند و تحت عنوان پیکسل (pixels) شناخته میشوند.
گرافیک خطاي ديد
خطاي چشم انسان و عادت كردن آن به كلمات باعث ميشود تا شما، به راحتي متن صفحه قبل را نيز بخوانيد!! با وجود اينكه پر از غلط املائي است!
گرافیک خطاي ديد
در طراحي اين تصوير تماما از خطوط صاف و مستقيم استفاده شده است.
گرافیک خطاي ديد
گرافیک خطاي ديد
گرافیک خطاي ديد
گرافیک خطاي ديد
گرافیک خطاي ديد
گرافیک خطاي ديد
چشم انسان قادر است كمتر از يك تريلينيوم درصد از امواج الكترومغناطيسي كه در اصطلاح نور مرئي ميناميم را ببيند.
گرافیک: طیف الکترمغناطیس
گرافیک: دروبینهای دید در شب
دوربينهاي ديد در شب قادرند از انسانها و اشياء در شب فيلم برداري كرده و به ما نشان دهند.
گرافیک: نكاتي در خصوص فيزيولوژي چشم
اندازه و ضخامت شبكيه به معادل يك تمبر پستي است.
چشم هشت پا بزرگترين چشم نسبت به جثه است.
پرندگان هشت برابر بهتر از انسان مي بينند.
چشم سنجاقك ده برابر بدتر از چشم انسان مي بيند.
چشم حشرات ده برابر بهتر از چشم انسان حركات را ميبيند. يك دويستم ثانيه براي ديدن يك حركت براي آن كافي است.
همه چيز در زير آب به رنگ آبي مايل به سبز است زيرا آب طيف قرمز نور را جذب ميكند.
احتمالا“ سگها هيچ رنگي را نمي بينند البته اين موضوع هنوز ثابت نشده است.
يك چشم سالم به طورمعمول میتواند ده ميليون رنگ را تشخيص دهد.
گاوها رنگ ها را نمي بينند پس پارچهي قرمز در عصباني كردن گاو وحشي تاثيري ندارد.
گرافیک: نكاتي در خصوص فيزيولوژي چشم
يك نمونه از خطاي ديد : اگر يك عينك وارونه كن بر چشم بگذاريم بعد از يك هفته همه چيز درست ديده ميشود ولي اگر عينك را برداريم دوباره همه چيز به صورت وارونه در ميآيد.
نور مهتاب كامل يك صدوشصتم نور خورشيد است.
جغد ميتواند در زير نور يك شمع در فاصله چهارصد متري طعمه اش را شكار كند.
چشم گربه سانان مانند آينه عمل ميكند و كمترين نورها را نيز بازتاب ميکند.
مار زنگي اشعه مادون قرمز را ميبيند بنابراين، گرماي حاصل از بدن جانوران اين را به سوي خود جذب ميكند.
خلبانان انگليسي در جنگ جهاني دوم زياد هويج مي خوردند وقتي آلماني ها ديدند كه آن ها هدف را در شب ميبينند فكر كردند كه اين اثر زياد خوردن هويج است در حالي كه انگليسي ها رادار را اختراع كرده بودند.
تصاوير متحرك براي چشم ما حداقل پانزده كادر در ثانيه هستند ولي اين مگس اين تصاوير را به صورت صحنه آهسته مي بيند.
مفهوم گرافيك كامپيوتري
اولين كامپيوترها شامل سطرهاي بسياري از چراغها و كليدها بودند.
سپس دستگاههاي قابل برنامه نويسي جديدي پديد آمد كه ميتوانستند بر روي لوله كاغذ با مكانيزمي شبيه ماشين هاي تحرير از راه دور چاپ كنند.
مانيتورهاي CRT اوليه در آغاز تنها خروجي هايي براي تصاويري بودند كه تنها حروف اسكي را نمايش میداد.
اولين گرافيك هاي كامپيوتري كه بر روي اين خروجي ها نمايش داده ميشد دو بعدی بودند.
اصطلاح Real-time اولين بار به تصاويري كه متحرك بودند اطلاق شد.
بكارگيري اصطلاح Real-time براي گرافيك كامپيوتري بدين معناست كه كامپيوتر در حال ارائه كردن يك انيميشن يا رشتهاي از تصاوير است كه بیدرنگ به بعضي از ورودي ها واكنش نشان ميدهد.
مفهوم گرافيك كامپيوتري
اصطلاح سه بعدي (3D): به اين معناست كه يك شئ در حال نمايش، سه بعد قابل اندازهگيري دارد طول و عرض و عمق
گرافيك سه بعدي كامپيوتري در حقيقت تصاويري دو بعدي هستند روي يك صفحه تخت كه بعد سوم و يا خطاي ديد در عمق را مهيا ميسازند.
2D + Perspective = 3D
پرسپكتيو تنها براي خلق سيماي سه بعدي كافي است.
مصنوعات سه بعدي: دليل اينكه وقتي شما جلوي يكي از چشمانتان را ميپوشانيد دنيا به يكباره تخت نمیشود اين است كه هنوز افكتهاي سه بعدي زيادي حاظر هستند وقتي كه دو بعدي تماشا ميشوند. اين افكتها (تاثيرات) به اندازهاي هستند كه باعث شوند مغز شما به راحتي مسافت و عمق را تشخيص دهد. مسلم ترين چيز اينست كه اشيا نزديكتر بزرگتر از اشيا دور نمايان ميشوند.
اين افكت پرسپكتيو Foreshortening ناميده ميشود . اين افكت و تغييرات رنگ و تكسچرها و نورها و اختلاف در شدت رنگ همه با هم به ادراك ما يك تصوير سه بعدي را اضافه ميكنند.
مفهوم گرافيك كامپيوتري
مهمترين ابزار خروجي كه مي تواند به مفهوم گرافيك كامپيوتري عينيت ببخشد، صفحه نمايش (Monitor) است كه امروزه با روشهاي متفاوت در اندازهها و كيفيتهاي مختلفي توليد میشوند.
تعریف پیکسل (Pixel=Picture cell/Element): در معماري سختافزار گرافيك كامپيوتري امروزي (و كارت هاي گرافيكي در راس آنها) تصاوير به صورت مجموعه اي از نقاط در نظر گرفته مي شوند. هر نقطه ، رنگ و مشخصات خاص خود را دارد و كوچكترين جز قابل رويت يك تصوير محسوب مي شود. به اين نقاط در اصطلاح پيكسل گفته میشود.
تعریف صفحه نمایش (Screen): به مجموعه پيكسل هايي كه در هر لحظه از طريق ابزارهايي مانند صفحه نمايش ترسيم مي شود صفحه تصوير گفته میشود.
صفحه نمايش دو بعدي در نظر گرفته مي شود و معمولاً پيكسل هايي كه در اين دو بعد وجود دارند از طريق مختصات آنها مانند يك ماتريس قابل دسترسي میباشند.
مفاهیم پایه
تفكيك پذيري (resolution):
وضوح تصاوير يا تفكيك پذيري به مجموعه پيكسلهاي افقي و عمودي اطلاق ميشود كه صفحه نمايش قادر به نمايش آن است
پيكسل (pixel):
پيكسل كوچكترين عنصر تصويري است كه به صورت نقطه كوچكي روي صفحه نمايش قابل رويت ميباشد وبا توجه به تعداد و ميزان تراكم اين نقاط در صفحه نمايش، كيفيت تصاوير به نمايش در آمده متفاوت خواهند بود.
ماتريس كاراكتر:
ماتريس كاراكتر مجموعه اي از نقاط روشن و خاموش در صفحه نمايش مي باشد كه يك كاراكتر را نمايش مي دهند، هر چه تعداد پيكسلهاي موجود در ماتريس كاراكتر بيشتر باشد، وضوح تصاوير و كاراكترها نيز بيشتر خواهد بود.
مد متني (Text Mode):
در اين مد كوچكترين جز تصوير كاراكتر است . صفحه نمايش به چند سطر و ستون تقسيم مي شود . ابعاد صفحه در اين مد مي تواند 40*25 یا 80*25 باشد.
انواع صفحههاي نمايش
صفحه كريستال مايع (LCD):
از اين نوع سابقاً در كامپيوترهاي كيفي و قابل حمل استفاده مي شده و اكنون به صورت رايج براي تمام كامپيوترها استفاده مي شود. اين صفحه نمايش حجم و وزن كمي دارد. عبور يكسري جريانات خاص باعث نوراني شدن پيكسل هاي آن مي شود.
لامپ اشعه كاتدي (CRT):
اين نوع لامپ تصوير، كيفيت خوبي را ارائه ميدهد و حجم و توان مصرفي بالايي دارد. در گذشته از اين نوع مانيتور براي كامپيوترهاي شخصي استفاده ميشد. تفاوت عمده تلويزيون با مانيتور در اين است كه تلويزيون داراي تيونر بوده و قادر است كانالهاي مختلف تلويزيوني را از طريق آنتن دريافت كند.
مشخصات كارتهاي گرافيكي
مشخصات كارتهاي گرافيكي
MDA: متن را بدون لرزش و با دقت زياد به يكي از زبانهاي سبز، خاكستري و سفيد نمايش ميدهد.
HERCULES: اين كارت رنگي نيست ولي براي كارهاي گرافيكي ميتوان از آن استفاده نمود.
CGA: متن و گرافيك را با 4 رنگ توليد ميكند. اين كارت مي تواند خروجي خود را علاوه بر مانيتور به تلويزيون هم بدهد. هر چند در اين تعويض 80 ستون در مانيتور به 40 ستون در تلويزيون تبديل ميشود .
EGA: گرافيك و متن را خيلي خوب توليد ميكند و چهار حالت گرافيكي قابل نمايش است.
VGA: اين كارت كليه چهار حالت گرافيكي EGA را توليد ميكند و دقت آن براي كارهاي اداري عالي و براي كارهاي چاپي و طراحي خوب است.
اصطلاحات علمی
تفاوت بین پردازش تصویر با بینایی ماشین:
Image processing
Machine vision
اصطلاحات علمی
اصطلاحات بینایی کامپیوتر (computer vision)، درک تصویر (image understanding) و آنالیز تصویر (image analysis) اغلب مورد استفاده قرار میگیرد که به معنای بینایی ماشین (machine vision) میباشد.
سازماندهی سیستم بینایی ماشین
نمونهای از مرحله اندازهگیری ویژگیها
اجزای یک سیستم ماشین بینایی
یک و یا چند دوربین دیجیتال یا آنالوگ (سیاه-سفید یا رنگی) با اپتیک مناسب برای گرفتن عکس.
واسطه ای که عکسها را برای پردازش آماده میسازد. برای دوربینهای آنالوگ این واسطه شامل یک دیجیتال کننده عکس است. هنگامی که این واسطه یک سختافزار جدا باشد، به آن Frame grabber (کارتی که برای دریافت سیگنال تصویری و فرستادن آن به کامپیوتر استفاده میشود) میگویند.
یک پردازشگر گاهی یکPC یا پردازنده تعبیه شده (Embedded Processor ) مانند DSP
نرمافزار Machine visionاین نرمافزار امکاناتی برای توسعه یک برنامه نرمافزاری که برای کاربردی مشخص است را فراهم میکند.
اجزای یک سیستم ماشین بینایی
سختافزار ورودی / خروجی (مثلاً I/O دیجیتال) یا حلقههای ارتباطی مثلا ارتباط شبکه ای یا (RS-232) برای گزارش نتایج.
یک دوربین هوشمند: یک وسیله ساده که همه موارد فوق را داراست.
لنزهایی که بتواند به مقدار مطلوبی روی سنسور تصویر زوم کند.
منابع نوری مناسب و گاهی خیلی مخصوص ( مثلا چراغهای LED، فلورسنت، لامپهای هالوژن و . . . )
یک برنامه مشخص که بتواند تصاویر را پردازش کرده و مشخصههای مربوط و مناسب را شناسایی کند.
یک سنسور همزمان ساز برای شناسایی اجزا (گاهی یک سنسور نوری و یا یک سنسور مغناطیسی): این سنسور برای راه اندازی سیستم استخراج و پردازش تصویر میباشد.
حالت کلی عملکرد دستگاه
سنسور همزمان ساز تعیین میکند که چه زمانی یک بخش (که معمولاً روی یک حمل کننده حرکت می کند) در موقعیتی قرار گرفته است که باید مورد بررسی واقع شود. این سنسور هنگامیکه از زیر دوربین میگذرد و یک پالس نوری برای ثابت نگهداشتن تصویر ایجاد میکند، دوربین را برای گرفتن عکس فعال میکند. نوری که برای روشن کردن آن بخش به کار می رود در واقع برای آن است که مشخصههای مطلوب را برجسته و مشخصات نامطلوب (مثل سایهها و یا انعکاسها) را به حداقل برساند. معمولاً پنلهای LED با اندازه و طراحی مناسب برای این هدف مورد استفاده قرار می گیرند. تصویر دوربین یا توسط یک frame grabber و یا توسط یک حافظه کامپیوتری (که در آن ازframe grabber استفاده نشده است) گرفته میشود.
حالت کلی عملکرد دستگاه
frame grabber یک وسیله دیجیتال کننده است (یا در داخل دوربین هوشمند و یا بطور جداگانه) که خروجی دوربین را به فرمت دیجیتال تبدیل کرده (معمولاً این فرمت از یک آرایه دو بعدی از اعداد تشکیل شده که هر عدد متناظر شدت روشنایی نقطه متناظر در آن تصویر میباشد. به این نقاط پیکسل می گویند.) و سپس تصویر را به منظور پردازش توسط نرمافزارٍ Machine vision در حافظه کامپیوتر ذخیره میکند. به طور معمول نرمافزار، اقدامات متفاوتی را برای پردازش تصویر انجام میدهد. گاهی در ابتدا تصویر برای کاهش نویز و یا تبدیل سایههای خاکستری به ترکیب ساده ای از رنگهای سیاه و سفید دستکاری میشود (Binarization) در قدم بعدی نرمافزار عمل شمردن، اندازه گیری و شناسایی اجسام، ابعاد، کاستیها و مشخصات دیگر تصویر را انجام می دهد.
حالت کلی عملکرد دستگاه
در نهایت با توجه به ضوابط و معیارهای برنامه ریزی شده ممکن است بخشی را بپذیرد و یا رد کند. اگر یک بخش رد شد، نرمافزار به یک دستگاه مکانیکی فرمان می دهد تا آن بخش را خارج کند و همچنین سیستم خط تولید را قطع کرده و به کارگر هشدار می دهد تا مشکلی که باعث ایجاد خطا شده را رفع نماید. اگرچه اکثر Machine visionها بر مبنای دوربینهای سیاه–سفید بنا نهاده شده اند، استفاده از دوربینهای رنگی در حال رایج شدن است. همچنین امروزه شاهد شیوع فراوان استفاده از تجهیزات دوربینهای دیجیتال به جای یک دوربین و یک frame grabber جداگانه در Machine vision هستیم. استفاده از یک دوربین دیجیتال به منظور برقراری ارتباط مستقیم، باعث صرفه جویی در هزینه و نیز سادگی سیستم خواهد شد. دوربینهای هوشمند که در داخل آنها embedded processorها تعبیه شده اند، در حال تسخیر سهم بالایی از بازار Machine visionها هستند.
حالت کلی عملکرد دستگاه
دوربینهای هوشمند که در داخل آنها embedded processorها تعبیه شدهاند، در حال تسخیر سهم بالایی از بازار Machine visionها هستند. استفاده از یک embedded processor و یا یک پردازنده بهینه نیاز ما به frame grabber و یک کامپیوتر خارجی را از بین میبرد. به همین خاطر این پردازندهها باعث کاهش هزینه، کاهش پیچیدگی سیستم و همچنین اختصاص توان پردازشی مشخص به هر دوربین میشود. دوربینهای هوشمند معمولاً ارزان تر از سیستمهای شامل یک دوربین و یک برد و یک کامپیوتر خارجی هستند. همچنین توان بالای embedded processor و DSP ها منجر به بالا رفتن عملکرد و توانایی آنها نسبت به سیستمهای مرسوم ( که بر مبنای PC هستند) شده است.
کاربردهای بینایی ماشین
تولید صنعتی در مقیاس بزرگ.
ساخت اجزایی که نیاز به زمان تولید مشخصی دارند.
سیستمهای ایمنی موجود در محیطهای صنعتی.
بررسی مواد اولیه تولید (مثلا کنترل کیفیت و بررسی وقوع خطا)
کنترل موجودی انبار و سیستمهای مدیریتی ( شمارش، بارکد خواندن و ذخیره اطلاعات در سیستمهای دیجیتال)
کنترل رباتهای تعقیب خطی که برای حمل بار در کارخانههای صنعتی استفاده می شوند.
کنترل کیفیت و بهبود محصولات غذایی.
ماشینی کردن اجزای کوچک صنعتی.
روشهای پردازش
شمارش پیکسل:
شمردن تعداد پیکسلهای روشن و تاریک.
تعیین آستانه:
تبدیل یک عکس با قسمتهای خاکستری به یک عکس سیاه و سفید به این طریق که با قرار دادن آستانهای پیکسلهای روشن تر از آن را سفید و پیکسلهای تیرهتر از آن را سیاه در نظر می گیریم.
بخشبندی کردن: (Segmentation)
تبدیل تصویر ورودی به بخشهای مختلف برای موقعیت یابی و شمارش پیکسلها.
تشخیص و شناسایی لکهها و دستکاری:
بررسی یک عکس برای یافتن گسسته از بین تمامی پیکسلها. (به عنوان مثال یک حفره سیاه رنگ در درون یک جسم خاکستری) این لکهها به عنوان نشان اختصاصی عکس خواهند بود.
روشهای پردازش
تشخیص و شناسایی توسط اجزاء موجود:
استخراج اجزاءی خاص از یک تصویر ورودی مثلا عکس.
تشخیص وشناسایی الگو به طور مداوم در برابر تغییرات:
به این معنا که موقعیت جسمی که ممکن است چرخانده شود یا اندازه اش تغییر کند یا قسمتی از این جسم توسط جسم دیگر پوشانده شود، را به طور دقیق شناسایی کند.
خواندن بارکد:
شناسایی و تعیین کدهای یک بعدی و دو بعدی اسکن شده توسط ماشینها طراحی شده است.
تشخیص و شناسایی کاراکتر نوری:
خواندن خودکار یک متن (مثال: یک رشته اعداد پشت سرهم).
روشهای پردازش
اندازه گیری:
اندازه گیری ابعاد یک جسم (بر حسب میلی متر یا اینچ).
تشخیص و شناسایی لبه ها:
پیدا کردن لبههای یک جسم در یک تصویر.
تشخیص و شناسایی از طریق تطبیق الگو:
پیدا کردن، مطابقت دادن و شمارش اشکال خاص در یک تصویر.
در اکثرموارد یک سیستمMachine vision به منظور بررسی کامل یک تصویر، از زنجیره مرکبی از این تکنیکهای پردازش استفاده میکند. به عنوان مثال میتوان به سیستمی اشاره کرد که بارکد را میخواند و هم سطح جسم را برای خراش احتمالی مورد بررسی قرار میدهد و هم ممکن است طول و عرض آن وسیله را اندازه گیری کند.
فرآیند یک سیستم بینایی ماشین
مثال: تشخیص ارقام دست نوشته
مثال: تعیین موقعیت سر
پردازش تصویر: تصویر دیجیتالی
پردازش تصویر: تشکیل تصویر دیجیتالی
نمودار تابع به ازای مقادیر پیوسته و گسسته
پردازش تصویر: تشکیل تصویر دیجیتالی
برای یک پیکسل دو نوع همسایگی میتوان تعریف نمود:
همسایگی چهارگانه
همسایگی هشتگانه
پردازش تصویر: تشکیل تصویر دیجیتالی
شدت روشنایی دریافت شده توسط حسگر در پیکسل (m,n) از تصویر باید کوانتیزه شود.
در بینایی ماشین با دو نوع تصویر سروکار داریم:
تصویر باینری و تصویر خاکستری
نمونهای از کاربردهای بینایی ماشین
بازی مشت زنی
بازی تیس روی میز
video
تصویر رنگی و خاکستری
از دید بینایی ماشین هریک از رنگهای قرمز و سبز و آبی یک کانال رنگ نامیده میشود. یعنی برای ایجاد تصویر رنگی باید به ازای هر پیکسل مقادیر هریک از کانالهای قرمز، سبز و آبی را به طور مجزا ذخیره نمود.
در بیشتر مسائل بینایی ماشین تصاویر رنگی را به خاکستری طبق فرمول زیر تبدیل میکنند.
عملیات نقطهای
عملیات نقطهای از عملیات پیشپردازش میباشد که تنها بر روی یک پیکسل از تصویر اعمال میگردد. با اعمال عملیات نقطهای مقدار جدید یک پیکسل تنها تابعی از مقدار فعلی آن پیکسل خواهد بود.
اگر عملیات نقطهای بر روی دو تصویر اعمال شوند، مقدار جدید پیکسل تابعی از مقادیر پیکسلهای متناظر در دو تصویر ورودی خواهد بود.
عملیات محلی: کانولوشن تصویر
عملیات محلی: هموارکردن تصویر (فیلتر میانگین و فیلتر گاوسین)
فیلتر میانگین:
1/(w*H)
عملیات محلی: هموارکردن تصویر (فیلتر میانگین و فیلتر گاوسین)
فیلتر گاوسین
فرمول فیلتر هموارکننده با استفاده از فیلتر گاوسین
هیستوگرام تصویر
فرمول هیستوگرام
نرمالیزه کردن هیستوگرام
تقطیع (بخشبندی) تصویر
به طورکلی تقطیع شامل چهار نوع عمل میباشد:
لبه یابی
آستانهگیری
تفکیک
یافتن نقاط بارز
تقطیع (بخشبندی) تصویر: لبهیابی براساس مشتق اول تصویر
تقطیع (بخشبندی) تصویر: فیلترهای لبهیابی براساس مشتق اول تصویر
تقطیع (بخشبندی) تصویر: فیلترهای لبهیابی براساس مشتق اول تصویر
تقطیع (بخشبندی) تصویر: لبهیابی براساس مشتق دوم تصویر
تقطیع (بخشبندی) تصویر: لبهیابی براساس مشتق دوم تصویر
تقطیع (بخشبندی) تصویر: لبهیاب کنی (canny)
تقطیع (بخشبندی) تصویر: آستانه گیری از تصویر
تقطیع (بخشبندی) تصویر: آستانه گیری از تصویر (تعیین سطح آستانه مبتنی بر شکل هیستوگرام)
تقطیع (بخشبندی) تصویر: آستانه گیری از تصویر (تعیین سطح آستانه مبتنی بر شکل هیستوگرام)
تقطیع (بخشبندی) تصویر: آستانه گیری از تصویر (تعیین سطح آستانه مبتنی بر شکل هیستوگرام)
تقطیع (بخشبندی) تصویر: آستانه گیری از تصویر (آستانهگیری سطح آماری)
مهمترین روشهای تعیین سطح آستانه آماری به سه حالت تقسیم میگردد:
بهینه
عمومی
اتسو
تقطیع (بخشبندی) تصویر: آستانهگیری سطح آماری: روش آستانهگیری بهینه
تقطیع (بخشبندی) تصویر: آستانهگیری سطح آماری: روش آستانهگیری عمومی
تقطیع (بخشبندی) تصویر: آستانهگیری سطح آماری: روش آستانهگیری اتسو
با فرض وجود دو کلاس (زمینه و پس زمینه)، روش کلی اتسو مینیمم کردن واریانس داخل کلاسی میباشد. یعنی یافتن مقدار مینیمم رابطه زیر:
تقطیع (بخشبندی) تصویر: آستانهگیری سطح محلی
تقطیع با روش یادگیری ماشین: تقطیع تصویر با روش k means
تقطیع با روش یادگیری ماشین: تقطیع تصویر با روش k means
تقطیع با روش یادگیری ماشین: تقطیع تصویر با روش k means
تقطیع با روش یادگیری ماشین: تقطیع تصویر با روش k means
تقطیع با روش یادگیری ماشین: تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین: تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین: تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین: تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین: تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین: تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین: تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین: تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین: تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع با روش یادگیری ماشین: تقطیع تصویر با استفاده از الگوریتم شیفت میانگین
تقطیع تصویر با استفاده از الگوریتم واترشید
تقطیع تصویر با استفاده از الگوریتم واترشید
تقطیع تصویر با استفاده از الگوریتم واترشید
تقطیع تصویر با استفاده از الگوریتم واترشید
تقطیع مبتنی بر تقسیم و ترکیب
تقطیع مبتنی بر تقسیم و ترکیب
تقطیع مبتنی بر تقسیم و ترکیب
تقطیع مبتنی بر تخمین حرکت
برچسب زنی اجزای متصل
برچسب زنی اجزای متصل
برچسب زنی اجزای متصل
برچسب زنی به روش پیمایش سطحی
برچسب زنی به روش پیمایش عمقی
برچسب زنی دو مرحلهای
برچسب زنی اجزای متصل به روش سطحی
برای پیادهسازی الگوریتم پیمایش گراف به صورت سطحی از یک صف استفاده میکنیم.
ریشه را به صف اضافه کن و flag آن را ست کن
تا زمانی که صف خالی نشده است تکرار کن
گره سرصف را برداشته، در خروجی چاپ کرده و همه فرزندان آن را که flag آنها ست نشده باشد، به انتهای صف اضافه کن
flag همه گرههای فرزندان اضافه شده به صف را ست کن. ست کردن flag بدین منظور انجام میگیرد که هر گره تنها یکبار به صف اضافه شود
برچسب زنی اجزای متصل به روش سطحی
برچسب زنی اجزای متصل به روش عمقی
برای پیاده سازی الگوریتم پیمایش گراف به صورت عمقی از یک پشته استفاده میکنیم.
ریشه را به پشته اضافه کرده و فلگ آن را ست کن
تا زمانی که پشته خالی نشده است، تکرار کن
گره بالای پشته را برداشته (Pop)، آن را در خروجی چاپ کرده و همه فرزندان آن را که فلگ آنها ست نشده باشد، به پشته اضافه کن (Push)
فلگ همه گره های فرزندان اضافه شده به صف را ست کن. ست کردن فلگ بدین منظور انجام می گیرد که هر گره تنها یکبار به صف اضافه شود.
برچسب زنی اجزای متصل به روش عمقی
مثال: برچسب زنی اجزای متصل به روش عمقی و سطحی
برچسب زنی اجزای متصل به روش دومرحلهای (تکراری)
برچسب زنی به روش تکراری یک روش دو مرحله ای است که در مرحله اول با پیمایش تصویر از بالا به پایین و از چپ به راست به هر پیکسل شی ای، بر اساس شرایط زیر برچسبی را انتساب می دهد:
در همسایگی 4گانه پیکسلp(i,j) ، اگر پیکسل بالایی p(i-1,j) و پیکسل سمت چپی p(i,j-1) دارای برچسب X باشند، پیکسل p(i,j) نیز برچسب X خواهد داشت.
در همسایگی 4گانه پیکسلp(i,j) ، اگر پیکسل بالاییp(i-1,j) یا پیکسل سمت چپی p(i,j-1) دارای برچسب X باشند، پیکسل p(i,j) نیز برچسبX خواهد داشت.
در همسایگی 4گانه پیکسلp(i,j) ، اگر پیکسل بالایی p(i-1,j) برچسب X و پیکسل سمت چپیp(i,j-1) دارای برچسبY باشند (X وY باهم برابر نیستند)، برچسب پیکسلp(i,j) را برابر X قرار داده و در جدول معادل هاX و Y را وارد می کنیم.
در همسایگی 4گانه پیکسلp(i,j) ، اگر پیکسل بالاییp(i-1,j) و پیکسل سمت چپی p(i,j-1) هیچیک دارای برچسب نباشند، به پیکسل p(i,j) برچسب جدیدی برابر Z قرار میدهیم.
برچسب زنی اجزای متصل به روش دومرحلهای (تکراری)
هنگام انتساب برچسب به پیکسل ها معمولا از مقادیر عددی استفاده می کنیم. جدول معادل ها نیز شامل همه برچسب های معادل هم خواهد بود. در مرحله دوم برچسب های معادل با هم ادغام شده و برچسب منحصربفردی را برای هریک از اشیا تولید میکند. اگرX و Yدو برچسب معادل از جدول معادلها باشند، زمانی کهX
استخراج کانتور تصویر
مثالی از توصیف کانتور لب
مثالی از توصیف کانتور لب
مثالی از توصیف کانتور لب
مثالی از توصیف کانتور لب (فرآیند جداسازی)
مثالی از توصیف کانتور لب (تست آزمایشگاهی )
مثالی از توصیف کانتور لب (تست آزمایشگاهی )
نقاط بارز و ویژگیهای سطح پایین گوشه یابی در تصویر
معیارهای مهم در آشکارسازی گوشه:
همه گوشه ها آشکار شوند.
هیچ گوشه اشتباهی یافت نشود.
نقاط گوشه پیدا شده باید در موقعیت درستی محلبایی شوند.
آشکاساز گوشه باید در مقابل نویز مقاوم باشد.
نقاط بارز و ویژگیهای سطح پایین گوشه یابی در تصویر
نقاط بارز و ویژگیهای سطح پایین گوشه یابی در تصویر
نقاط بارز و ویژگیهای سطح پایین گوشه یابی در تصویر
نقاط بارز و ویژگیهای سطح پایین گوشه یابی در تصویر
نقاط بارز و ویژگیهای سطح پایین تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل هاف دایرهای
نقاط بارز و ویژگیهای سطح پایین تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل هاف دایرهای
نقاط بارز و ویژگیهای سطح پایین تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل هاف دایرهای
نقاط بارز و ویژگیهای سطح پایین تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل هاف دایرهای
الگوریتم تبدیل هاف دایرهای:
یافتن لبهها
برای هر نقطه لبه تبدیل هاف شروع میشود: یک دایره با مرکزیت نقطه لبه با شعاع r رسم میشود و در انباره تمام مختصاتی که محیط دایره از آنها عبور میکند، افزایش مییابند.
نقاط ماکزیمم در انباره پیدا میشود و تبدیل هاف تمام میشود.
پارامترهای پیدا شده (r,a,b) مطابق با نقاط ماکزیمم روی تصویر اصلی مشخص میشوند.
مثالی از تبدیل هاف دایرهای
مثالی از تبدیل هاف دایرهای
نقاط بارز و ویژگیهای سطح پایین تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل هاف خط
نقاط بارز و ویژگیهای سطح پایین تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل هاف خط
نقاط بارز و ویژگیهای سطح پایین تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل هاف خط
نقاط بارز و ویژگیهای سطح پایین تبدیل ویژگی مقاوم در برابر تغییر مقیاس: تبدیل هاف خط
مثالی از تبدیل هاف خط
مثالی از تبدیل هاف خط
عملیات مورفولوژیکی: عملگرهای مجموعه ای
عملگر اجتماع
عملگر اشتراک
عملیات مورفولوژیکی: عملگرهای مجموعه ای
عملگر تفاضل
عملگر تک عملوندی مکمل
گسترش باینری مورفولوژیکی
سایش باینری مورفولوژیکی
استخراج اسکلت بندی اشیاء
استخراج اسکلت بندی اشیاء
مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی
مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی
مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی
مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی
مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی
مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی
مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی: بررسی معیار تراکم
مثال: تشخيص محل پلاک خودرو از تصاوير پيچيده بر اساس عمليات مورفولوژيکی: بررسی معیار تراکم
استخراج ویژگی
ویژگیهای شکل
ویژگیهای مبتنی بر ناحیه
ویژگیهای مبتنی بر شدت روشنایی
ویژگیهای مبتنی بر بانک فیلتر گابور
شمای کلی یک سیستم بازیابی تصویر
استخراج ویژگیهای محتوایی تصاویر براساس رنگ
ویژگیهای تصویر از لحاظ نحوه توصیفگر به سه دسته تقسیم میگردد:
ویژگیهای عمومی یا سطح پایین (رنگ و بافت)
ویژگیهای معنایی
وِیژگیهای مختص کاربردهای خاص
استخراج ویژگیهای محتوایی تصاویر براساس رنگ
انواع فضاهای رنگی در استخراج رنگ:
RGB
HSV
L*a*b*
استخراج ویژگیهای محتوایی تصاویر براساس رنگ
روشهای استخراج رنگ:
ممان رنگ
هیستوگرام رنگ
هیستوگرام برچسب رنگ
بردار ارتباط رنگ
همبستگی نگاشت رنگ
رنگ غالب
بردار وابستگی
استخراج ویژگیهای محتوایی تصاویر براساس رنگ
نمونهای از روشهای استخراج ویژگی بافت:
ماتریس Co-occurrence
ویژگی های Tamura
ویژگیهای فیلتر گابور
ویژگیهای تبدیل موجک
مثالی برای استخراج ویژگی
مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی
در این مثال از دو ویژگی رنگ غالب فازی و رنگ غالب فازی با در نظر گرفتن وابستگی مکانی پیکسل ها استفاده شده است و ساختار مبتنی بر اتوماتای سلولی برای استخراج ویژگی بکار رفته است.
تابع عضویت وضعیت قرار گرفتن یک پیکسل در همسایگی 8 از نطر رنگ پیکسلهای همسایه
مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی
نحوه نگاشت سلولهای اتوماتا بر پیکسلهای تصویر
مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی
مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی
مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی
مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی
مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی
مثال1: استخراج ویژگی در تصاویر رنگی با استفاده از اتوماتای سلولی فازی
مثال2: تشخیص دستنوشته با استفاده از ماشین اتوماتا و منطق فازی
مثال2: تشخیص دستنوشته با استفاده از ماشین اتوماتا و منطق فازی
الگوریتم کار:
محاسبه زاویه حرکت دست از روی نقاط پیدا شده
شناسایی حرکت مطلوب توسط سیستم فازی
قرار دادن نام حرکت روی نوار اتوماتا جهت تغییر وضعیت آن
شناسایی وضعیت نهایی اتوماتا و حرف نوشته شده
مثال2: تشخیص دستنوشته با استفاده از ماشین اتوماتا و منطق فازی
محاسبه زاویه حرکت دست:
مثال2: تشخیص دستنوشته با استفاده از ماشین اتوماتا و منطق فازی
مثال2: تشخیص دستنوشته با استفاده از ماشین اتوماتا و منطق فازی
فرمول یافتن مختصات جدید زاویه حرکت دست:
یافتن مکان کنونی دست با استفاده از لبهیابی:
مثال2: تشخیص دستنوشته با استفاده از ماشین اتوماتا و منطق فازی
مدل فازی تشخیص جهت حرکت دست از روی زاویه حرکت به دست آمده
مثال2: تشخیص دستنوشته با استفاده از ماشین اتوماتا و منطق فازی
ماشین های اتوماتای DFA(Deterministic Finite Automata)
یکDFA به صورت تعریف می شود، که در آن:
Q یک مجموعه متناهی است که نام State های ماشین در آن قرار دارد.
Ʃ یک مجموعه متناهی است که نام Symbol های زبان ماشین در آن قرار دارد.
δ تابع انتقال (تغییر وضعیت) ماشین که به صورت تعریف می شود.
q0 عضوی از می باشد که به عنوان State شروع می باشد.
F زیر مجموعه ای از که به عنوان State (های) نهایی (پذیرش) می باشد.
مثال2: تشخیص دستنوشته با استفاده از ماشین اتوماتا و منطق فازی
دانلود نسخه کامل
محصولات مرتبط
بر روی هر تصویر کلیک کنید تا توضیحات کامل هر قسمت را مشاهده فرمایید
سلام مقاله خوبیه فقط دانلود کردم و از من پسووردمیخواد
میشه پسوورد رو بزارید ممنون میشم
ممنون از زحمات شما
matlab1.ir