پیکره وابستگی نحوی زبان فارسی (نسخه ۱.۱.۱)
ارسال شده توسط admin در تاریخ چهارشنبه, 12/27/1393 - 13:09
کد داده: D3911103a | ثبت در مرجع: 27 اسفند 1393 | تعداد بازدید: 7111

پیکره وابستگی نحوی زبان فارسی مجموعه‎ای است شامل حدود ۳۰ هزار جمله برچسب‌خورده با اطلاعات نحوی و ساخت‌واژی. این پیکره می‌تواند به عنوان زیرساختی اساسی در پردازش رایانه‌ای زبان فارسی به کار رود. مهم‌ترین دلائل استفاده از دستور وابستگی در این پیکره نحوی عبارتند از: نتایج رضایت‌بخش در یادگیری خودکار و سازگاری مناسب با طبیعت زبان‌های بی‌ترتیب همچون زبان فارسی. در نسخه جدید پیکره وابستگی نحوی زبان فارسی (نسخه ۱.۱.۱) تغییراتی چون حذف جملات تکراری، یکسان‌سازی نویسه‌ها، رفع برخی خطاهای برچسب‌زنی و تغییر نسبت داده‌های آموزش، توسعه و آزمون اعمال شده است.

مالکیت معنوی: 
دبیرخانه شورای عالی اطلاع‌رسانی
شرایط استفاده: 

- تنها برای مقاصد علمی و غیر تجاری

اطلاعات ارجاع: 

 

- Mohammad Sadegh Rasooli, Manouchehr Kouhestani, and Amirsaeid Moloodi. (2013). Development of a Persian Syntactic Dependency Treebank. In The 2013 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL HLT), Atlanta, USA. (دریافت)

سایر مستندات: 

 

- محمدصادق رسولی، منوچهر کوهستانی، و امیرسعید مولودی. (۱۳۹۳). پیکره نحوی زبان فارسی: پژوهشی بر اساس دستور وابستگی. تهران: دبیرخانهٔ شورای عالی اطلاع‌رسانی. (دریافت) ISBN/شابک:9789648846379‮

 

- گروه پژوهشی دادگان. (۱۳۹۱). گزارش پروژه دادگان وابستگی زبان فارسی. تهران: دبیرخانه شورای عالی اطلاع‌رسانی. (دریافت)

 

- Dadegan Research Group. (2012). Persian Dependency Treebank, Version 1.0, Annotation Manual and User Guide. Tehran, I.R. Iran: Supreme Council of Information and Communication Technology. (دریافت)

کاربردها: 
تجزیه نحوی، پردازش زبان طبیعی، زبان‌شناسی رایانشی، زبان‌شناسی پیکره‌ای
اطلاعات تکمیلی: 

 

- http://dadegan.ir/catalog/perdt/about - صفحه معرفی پیکره وابستگی نحوی زبان فارسی (ویژگی‌ها، نمونه، مستندات، اعضای پروژه، ابزار)

 

http://search.dadegan.ir - سامانه جستجوی دادگان (جستجوی برخط در پیکره وابستگی نحوی زبان فارسی)