واژگان زایای زبان فارسی
ارسال شده توسط کاربر مهمان در تاریخ یکشنبه, 11/08/1391 - 03:03
کد داده: D3911105a | ثبت در مرجع: 08 بهمن 1391 | تعداد بازدید: 5172

واژگان زایای زبان فارسی واژگانی است شامل حدود ۵۵ هزار مدخل که هر مدخل دارای اطلاعات مربوط به صورت نوشتاری واژه در خط فارسی، ساخت واجی، مقولهٔ واژگانی، الگوی تکیه، و بسامد واژه می‌باشد. برای تهیهٔ واژگان زایا، یک پیکره متنی ۱۰ میلیون کلمه‌ای ملاک استخراج واژه‌ها قرار گرفته است. واژگان زایا از حدود ۱۰۰ هزار کلمه با بسامدهای متفاوت تشکیل شده است. بعد از حذف صورت‌های تصریفی از فهرست فوق، حدود ۴۴ هزار واژه به مفهوم علمی آن به دست آمد. در بررسی فهرست واژه‌های حاصل از پیکره متنی معلوم شد که برخی واژه‌های عامیانه و برخی واژه‌های کاملاً علمی در فهرست ۴۴ هزار مدخلی غایب هستند. برای رفع این کاستی فهرست فوق با فرهنگ فارسی امروز (صدری‌افشار، ۱۳۸۱) مقایسه شد و حدود ۱۱ هزار مدخل جدید به فهرست واژه‌ها اضافه شد و واژگان ۵۵ هزار مدخلی به دست آمد.

مالکیت معنوی: 
دبیرخانه شورای عالی اطلاع‌رسانی
شرایط استفاده: 

-

اطلاعات ارجاع: 

 

- محرم اسلامی، مسعود شریفی آتشگاه، صدیقه علیزاده لمجیری، و طاهره زندی. (۱۳۸۳). واژگان زایای زبان فارسی. مجموعه مقالات اولین کارگاه پژوهشی زبان فارسی و رایانه. تهران.

اطلاعات تکمیلی: 
-