یکی از مشکلات اساسی، که در شناخت اشیا وجود دارد ، این است که شکلها از نظر موقعیت قرارگیری ، چرخش ، بازتاب و غیره در حالت های مختلفی قرار میگیرند.
• چرخش: اشیا با زاویه های متفاوتی در تصویر ظاهر میشوند، که باعث می شوند نحوه نمایش آن توسط پیکسلها، تفاوت زیادی با حالت عادی داشته باشد. امکان دارد این چرخش باعث آشکارسازی نادرست، یک شکل شود.
• بازتاب: متاسفانه این مشکل هم مانند چرخش، منجر به شناخت نادرست اشیا میشود.
• تغییر ناپذیر بودن مقیاس : مقیاس های گوناگون از یک شکل باعث مشکل در شناخت شکلها میشود. شکلها هم به دلایل بسیاری امکان دارد در مقیاس ها و اندازه های گوناگونی ظاهر شوند، که با اندازه واقعی آنها متفاوت است. این مشکل برای انسان شاید بی اهمیت باشد، اما برای کامپیوتر اینطور نیست.
• ترجمه: مشکل ترجمه زمانی ایجاد می شود که یک شی در مکانهای مختلفی از یک تصویر ظاهر شود ؛ اگرچه این مشکل بظاهر جدی بنظر نمی رسد،اما باید در هنگام ایجاد یک سیستم تشخیص اشیا بدرستی حل شود.
• قیچی شدن ونداشتن مقیاس یکنواخت : این دو نیز از مشکلاتی هستند که در سر راه تشخیص درست اشیا قرار گرفته اند.
• انسداد : رفع این مشکل از رفع مشکلات قبلی که گفتیم سخت تر است.شبکه های عصبی، بسختی شکلهای مسدود را شناسایی می کنند. بخش بندی شی در اینجا مفید است، بدین گونه که هر گاه بخشی از یک شی مسدود شده بود، بقیه بخشهای آن ، اطلاعات بدرد بخور و دست نخورده ای برای شناسایی آن شی به ارایه می دهند.
• اشیا چندگانه :هنگامی که چند شی در تصویر وجود دارند،این مشکل پدید می آید.یا اینکه هنگامی که دوشی در تصویر ؛ حس شد، باید تصمیم گرفت که کدامیک شناسایی شود وکدامیک نادیده گرفته شود.
• روشنایی :مشکلی که همیشه در کار با تصویر بوجود می آید،شرایط نوردهی وتغییرات روشنایی است. نور تاثیر زیادی در رنگ دارد و مسلما بر روی شناخت اشیا نیز تاثیر می گذارد. چشم انسان بصورت خودکار میزان روشنایی را تنظیم میکند، کامپیوتر ها هنوز این قابلیت را ندارند و این موجب به کاهش توانایی سیستم ها در شناخت اشیا می شود]68[.