پایگاه داده‌های زبان فارسی [منتشر نشده]
ارسال شده توسط admin در تاریخ شنبه, 10/14/1392 - 22:48
کد داده: D3921014a | ثبت در مرجع: 14 دی 1392 | تعداد بازدید: 4203

پایگاه داده‌های زبان فارسی مجموعه‌ای است از متون مختلف فارسی که بخشی از آن دارای نشانه‌گذاری‌هایی از جمله شناسنامه متن،‌ برچسب‌های دستوری، ‌آوایی، ‌ریشه‌ای و معنایی است. این دادگان که در پژوهشگاه علوم انسانی و مطالعات فرهنگی تهیه شده است مجهز به نرم‌افزارهای اختصاصی جستجو، تقطیع و تحلیل متن است که می‌تواند انواع فهرست‌های واژگانی، ‌بسامدی و آماری را ارائه کند. از جمله متون موجود در پیکره حدود ۴۵۰ اثر داستانی و غیر داستانی نثر، ‌۲۵۰ اثر شعری از شاعران معاصر، بیش از ‌۸۰ عنوان مجله و نشریه علمی ادبی و تخصصی، ‌ نزدیک به ۳۰۰ عنوان نمایشنامه و فیلمنامه، ‌ و ۲۰۰ عنوان ادبیات کودک، چندین عنوان روزنامه و نشریه خبری، برخی از کتاب‌های درسی دانشگاهی و دبیرستانی، ‌برخی از کتاب‌های دبستانی، نامه‌های اداری و بخشنامه‌ها، مجموعه کامل قوانین و مقررات، نشریه‌ها و جزوه‌های پراکنده، ‌پوستر‌ها، دیوارنوشته‌ها است.

مالکیت معنوی: 
پژوهشگاه علوم انسانی و مطالعات فرهنگی
شرایط استفاده: 

این داده به صورت رسمی منتشر نشده است. نسخه برخط نرم‌افزار جستجو در داده موجود است.

اطلاعات ارجاع: 

- مصطفی عاصی. (۱۳۸۴). پایگاه داده‌های زبان فارسی در اینترنت. پژوهشگران، (۲). (دریافت)

 

Assi, S. M. (1997). Farsi linguistic database (FLDB). International Journal of Lexicography10(3), 5.

کاربردها: 
زبان‌شناسی پیکره‌ای
اطلاعات تکمیلی: 
دریافت: 
غیر فعال