پیاده سازی یک ماژول مربوط به زبان فارسی در گیت و مستند سازی آن

پیاده سازی یک ماژول مربوط به زبان فارسی در گیت و مستند سازی آن

  1. بازشناسی جملات در متون فارسی (که بر اساس نماد ها و قواعد انجام می شود)
  2. بارشناسی اسامی خاص در متون فارسی (که نام افراد، اماکن، اعداد، و … را تشخیص می دهد و نوع آن را نیز تعیین می کند)
  3. برچسب گذاری دستوری متون فارسی (که تعیین می کند یک کلمه در جمله نقش اسم، فعل، صفت و .. را دارد)
  4. برچسب گذاری معنایی متون فارسی (که تعیین می کند یک کلمه در جمله یا عبارت نقش فاعل، مفعول، مفعول مستقیم، مفعول غیر مستقیم، فعل، فعل معلوم، فعل مجهول، صفت، موصوف، و .. را دارد)
  5. تشخیص واحد های زبانی در متون فارسی یا Tokenizer
  6. ریشه یاب کلمات و تشخیص نوع کلمه ساخته شده از آن ریشه در متون فارسی
  7. بازشناسی گروه های لغوی (گروه های اسمی، وصفی، فعلی و … ) در متون فارسی

استفاده از یک وردنت (ساخته شده از پیش یا ساخته شده توسط دانشجو) برای تعیین روابط معنایی کلمات در متون فارسی

 

 

 

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *