پیکره گروه‌های نحوی استاندارد برای تجزیه سطحی جملات فارسی [منتشر نشده]
ارسال شده توسط admin در تاریخ شنبه, 11/24/1394 - 13:51
کد داده: D3941124a | ثبت در مرجع: 24 بهمن 1394 | تعداد بازدید: 3569

پیکرهٔ حاضر شامل تعداد ۸۴۰۰ جملهٔ برگرفته از پیکرهٔ متنی زبان فارسی است که در قالب استاندارد تجزیه نحوی سطحی یا همان فرمت IOB برچسب‌گذاری شده است. گروه‌های برچسب‌خورده در این پیکره به ترتیب فراوانی عبارتند از گروه اسمی، گروه حرف اضافه، گروه فعلی، گروه حرف ربط، گروه قیدی، گروه حرف اضافه پسین (را)، گروه صفتی و گروه لیست. تجزیهٔ سطحی نسبت به تجزیهٔ کامل سریع‌تر است و در پردازش زبان طبیعی کاربردهای بسیاری دارد.

مالکیت معنوی: 
پژوهشگاه توسعه فناوری پیشرفته خواجه نصیرالدین طوسی
شرایط استفاده: 

- این داده به صورت رسمی منتشر نشده است. در صورت انتشار اطلاع‌رسانی خواهد شد.

اطلاعات ارجاع: 

- شادی حسین‌نژاد، طاهره امامی آزادی و یاسر شکفته. (۱۳۹۴). تهیه پیکره گروه‌های نحوی استاندارد برای تجزیه سطحی جملات فارسی. مجموعه مقالات نخستین همایش ملی زبان‌شناسی پیکره‌ای. تهران: نشر نویسه پارسی.

پژوهش‌های مرتبط: 
اطلاعات تکمیلی: 

- پژوهشکده پردازش داده پژوهشگاه توسعه فناوری پیشرفته خواجه نصیرالدین طوسی (http://www.rcdat.com/rcsp)

دریافت: 
غیر فعال