پیکره نور [منتشر نشده]
ارسال شده توسط admin در تاریخ شنبه, 08/11/1392 - 04:24
کد داده: D3920811a | ثبت در مرجع: 11 آبان 1392 | تعداد بازدید: 2801

پیکره نور مجموعه‌ای است عظیم از متون اسلامی که عمدتاً به زبان عربی و فارسی نوشته شده‌اند. متون مربوط به بیش از ۴ هزار کتاب عربی (بیش از یک میلیارد کلمه) و بیش از ۲ هزار کتاب فارسی (بیش از ۶۰۰ میلیون کلمه) و همچنین بالغ بر ۲۰۰ کتاب دوزبانه (عربی-فارسی) توسط مرکز تحقیقات کامپیوتری علوم اسلامی (نور) در این پیکره جمع‌آوری شده است. 

مالکیت معنوی: 
مرکز تحقیقات کامپیوتری علوم اسلامی (نور)
شرایط استفاده: 

این داده به صورت رسمی منتشر نشده است. در صورت انتشار اطلاع‌رسانی خواهد شد.

اطلاعات ارجاع: 

 

Elahimanesh, M. H., Minaei-Bidgoli, B., Gholami, M. J., & Juzi, H. (2012) An Introduction to Noor Corpus and its Language Model. in First International Conference on Persian Language Processing (ICPLP), Semnan, Iran. (دریافت)

پژوهش‌های مرتبط: 

کاربردها: 
مدل‌سازی زبانی، پردازش زبان طبیعی، زبان‌شناسی رایانشی، زبان‌شناسی پیکره‌ای
اطلاعات تکمیلی: 
دریافت: 
غیر فعال