پیکره وابستگی نحوی زبان فارسی (نسخه ۱.۱.۱)
ارسال شده توسط admin در تاریخ پنجشنبه, 12/28/1393 - 10:09
کد داده: D3911103a | ثبت در مرجع: 28 اسفند 1393 | تعداد بازدید: 7344

پیکرهٔ وابستگی نحوی زبان فارسی مجموعه‌ای است شامل حدود ۳۰ هزار جملهٔ برچسب‌خورده با اطلاعات نحوی و ساخت‌واژی. این پیکره می‌تواند به عنوان زیرساختی اساسی در پردازش رایانه‌ای زبان فارسی به کار رود. مهم‌ترین دلائل استفاده از دستور وابستگی در این پیکرهٔ نحوی عبارتند از: نتایج رضایت‌بخش در یادگیری خودکار و سازگاری مناسب با طبیعت زبان‌های بی‌ترتیب همچون زبان فارسی. در نسخهٔ جدید پیکرهٔ وابستگی نحوی زبان فارسی (نسخه ۱.۱.۱) تغییراتی چون حذف جملات تکراری، یکسان‌سازی نویسه‌ها، رفع برخی خطاهای برچسب‌زنی و تغییر نسبت داده‌های آموزش، توسعه و آزمون اعمال شده است.

مالکیت معنوی: 
دبیرخانه شورای عالی اطلاع‌رسانی
شرایط استفاده: 

- تنها برای مقاصد علمی و غیرتجاری

اطلاعات ارجاع: 

 

- Mohammad Sadegh Rasooli, Manouchehr Kouhestani, and Amirsaeid Moloodi. (2013). Development of a Persian Syntactic Dependency Treebank. In The 2013 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL HLT), Atlanta, USA.

اطلاعات تکمیلی: 

 

- http://dadegan.ir/catalog/perdt/about - صفحه معرفی پیکره وابستگی نحوی زبان فارسی (ویژگی‌ها، نمونه، مستندات، اعضای پروژه، ابزار)

 

http://search.dadegan.ir - سامانه جستجوی دادگان (جستجوی برخط در پیکره وابستگی نحوی زبان فارسی)