دادگان درختی فارسی در چارچوب دستور ساخت سازه‌ای هسته‌بنیان
ارسال شده توسط admin در تاریخ سه شنبه, 03/21/1392 - 20:06
کد داده: D3920320a | ثبت در مرجع: 21 خرداد 1392 | تعداد بازدید: 2771

دادگان درختی فارسی در چارچوب دستور ساخت سازه‌ای هسته‌بنیان (HPSG) مجموعه‌ای است شامل بیش از ۱۰۰۰ جمله برچسب‌خورده با اطلاعات نحوی. ازجمله ویژگی‌های دستور ساخت سازه‌ای هسته‌بنیان این است که علاوه بر ارائه توصیف ساختاری سلسله مراتبی سازه‌ها، دانش واژگانی واژه‌ها مورد استفاده قرار می‌گیرد، و روابط بین واژه‌های یک سازه به طور واضح و صریح مشخص می‌گردد.

مالکیت معنوی: 
-
اطلاعات ارجاع: 

 

- Ghayoomi, Masood (2012) "Bootstrapping the Development of an HPSG-​based Treebank for Persian" In Linguistic Issues in Language Technology, 7 (1). CSLI Publications.

سایر مستندات: 

 

- مسعود قیومی. (۱۳۹۲). معرفی دادگان درختی و تجزیه‌گر خودکار فارسی. ارائه شده در هشتمین همایش زبان‌شناسی ایران، تهران، دانشگاه علامه‌طباطبایی.

 

- Ghayoomi, Masood (2012) "From Grammar Rule Extraction to Treebanking: A Bootstrapping Approach" In Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC'12), May 23-25, 2012; Istanbul, Turkey, pp: 1912-1919.

 

- Ghayoomi, Masood (2012) "Word clustering for Persian statistical parsing" In Advances in Natural Language Processing , LNAI 5221 of Springer, eds H. Isahara and K. Kanzaki, Jap­TAL'12: Proceedings of the 8th International Conference on Advances in Natural Language Processing, October 22-24, 2012; Kanazawa, Japan, pp: 126-​137.

 

- Ghayoomi, Masood and Omid Moradiannasab (2012) "The effect of treebank annotation granularity on parsing: A comparative study" In Proceedings of the 11th International Workshop on Treebanks and Linguistic Theories , November 30 - December 1, 2012, Lisbon, Portugal, pp: 109-114.

پژوهش‌های مرتبط: 

 

http://scholar.google.com/scholar?q=related:tVD1R4mpU2gJ:scholar.google.com/&hl=en&as_sdt=0,5

 

- Sarabi, Zahra  and  Morteza Analoui (2012) "A New DOP Model for Phrase-structure Parsing of Persian Sentences" In Proceedings of the 10th Workshop on Asian Language Resources, COLINg 2012, December 8-15, 2012; Mumbai, India, pp. 45-54.

کاربردها: 
تجزیه نحوی، پردازش زبان طبیعی، زبان‌شناسی رایانشی
اطلاعات تکمیلی: 

http://hpsg.fu-berlin.de/~ghayoomi/PTB.html

 

- Dep­PerTree­Bank - تبدیل خودکار دادگان درختی فارسی در چارچوب دستور ساخت سازه‌ای هسته‌بنیان به پیکره وابستگی بر اساس قالب CoNLL 2006 و CoNLL 2009.