پیاده سازی یک ماژول مربوط به زبان فارسی در گیت و مستند سازی آن
- بازشناسی جملات در متون فارسی (که بر اساس نماد ها و قواعد انجام می شود)
- بارشناسی اسامی خاص در متون فارسی (که نام افراد، اماکن، اعداد، و … را تشخیص می دهد و نوع آن را نیز تعیین می کند)
- برچسب گذاری دستوری متون فارسی (که تعیین می کند یک کلمه در جمله نقش اسم، فعل، صفت و .. را دارد)
- برچسب گذاری معنایی متون فارسی (که تعیین می کند یک کلمه در جمله یا عبارت نقش فاعل، مفعول، مفعول مستقیم، مفعول غیر مستقیم، فعل، فعل معلوم، فعل مجهول، صفت، موصوف، و .. را دارد)
- تشخیص واحد های زبانی در متون فارسی یا Tokenizer
- ریشه یاب کلمات و تشخیص نوع کلمه ساخته شده از آن ریشه در متون فارسی
- بازشناسی گروه های لغوی (گروه های اسمی، وصفی، فعلی و … ) در متون فارسی
استفاده از یک وردنت (ساخته شده از پیش یا ساخته شده توسط دانشجو) برای تعیین روابط معنایی کلمات در متون فارسی