یکی از مشکلات اساسی، که در شناخت اشیا وجود دارد ، این است که شکلها از نظر موقعیت قرارگیری ، چرخش ، بازتاب و غیره در حالتهای مختلفی قرار میگیرند.
• چرخش: اشیا با زاویههای متفاوتی در تصویر ظاهر میشوند، که باعث میشوند نحوه نمایش آن توسط پیکسلها، تفاوت زیادی با حالت عادی داشته باشد. امکان دارد این چرخش باعث آشکارسازی نادرست، یک شکل شود.
• بازتاب: متاسفانه این مشکل هم مانند چرخش، منجر به شناخت نادرست اشیا میشود.
• تغییر ناپذیر بودن مقیاس : مقیاسهای گوناگون از یک شکل باعث مشکل در شناخت شکلها میشود. شکلها هم به دلایل بسیاری امکان دارد در مقیاسها و اندازههای گوناگونی ظاهر شوند، که با اندازه واقعی آنها متفاوت است. این مشکل برای انسان شاید بی اهمیت باشد، اما برای کامپیوتر اینطور نیست.
• ترجمه: مشکل ترجمه زمانی ایجاد میشود که یک شی در مکانهای مختلفی از یک تصویر ظاهر شود ؛ اگرچه این مشکل بظاهر جدی بنظر نمیرسد،اما باید در هنگام ایجاد یک سیستم تشخیص اشیا بدرستی حل شود.
• قیچی شدن ونداشتن مقیاس یکنواخت : این دو نیز از مشکلاتی هستند که در سر راه تشخیص درست اشیا قرار گرفته اند.
• انسداد : رفع این مشکل از رفع مشکلات قبلی که گفتیم سخت تر است.شبکههای عصبی، بسختی شکلهای مسدود را شناسایی میکنند. بخش بندی شی در اینجا مفید است، بدین گونه که هر گاه بخشی از یک شی مسدود شده بود، بقیه بخشهای آن ، اطلاعات بدرد بخور و دست نخورده ای برای شناسایی آن شی به ارایه میدهند.
• اشیا چندگانه :هنگامیکه چند شی در تصویر وجود دارند،این مشکل پدید میآید.یا اینکه هنگامیکه دوشی در تصویر ؛ حس شد، باید تصمیم گرفت که کدامیک شناسایی شود وکدامیک نادیده گرفته شود.
• روشنایی :مشکلی که همیشه در کار با تصویر بوجود میآید،شرایط نوردهی وتغییرات روشنایی است. نور تاثیر زیادی در رنگ دارد و مسلما بر روی شناخت اشیا نیز تاثیر میگذارد. چشم انسان بصورت خودکار میزان روشنایی را تنظیم میکند، کامپیوترها هنوز این قابلیت را ندارند و این موجب به کاهش توانایی سیستمها در شناخت اشیا میشود]68[.