فهرست داده‌ها
 

معرفی

فرهنگ‌های ظرفیت منابعی با ارزش برای پردازش زبان طبیعی تلقی می‌شوند. در این فرهنگ‌ها، اطلاعاتی در مورد متمم‌های اجباری و اختیاری واژه‌ها در سطح نحوی و یا معنایی برچسب می‌خورد.

 

فراوانی فعل‌های مرکب در زبان فارسی، نیاز به فرهنگ ظرفیت فعل را در این زبان دوچندان می‌نماید. چراکه شناخت فعل‌های مرکب چه از لحاظ انسانی و چه از لحاظ پردازشی کاری دشوارتر از شناخت فعل‌های ساده است و به همین خاطر فراهم آوردن فهرستی از فعل‌های زبان (که شامل فعل‌های مرکب نیز می‌شود) به همراه ساخت‌های ظرفیتی افعال، کمکی شایان برای کارهای پردازشی محسوب می‌شود. از سوی دیگر، بر اساس نظریه وابستگی، ساخت بنیادین جمله را می‌توان از روی ساخت ظرفیتی فعل جمله به دست آورد و به همین دلیل بر اهمیت دانستن ساخت‌های ظرفیتی فعل در متن‌های زبانی افزوده می‌شود. مسائل مطرح‌شده ما را بر آن داشت که «فرهنگ ظرفیت نحوی افعال زبان فارسی» را که نخستین فرهنگ ظرفیتی زبان فارسی است، تولید و عرضه نماییم.

 

علاوه بر موارد ذکرشده، یکی از اهداف اصلی ما در ایجاد فرهنگ ظرفیت افعال زبان فارسی، استفاده از این فرهنگ به عنوان راهنمایی برای زبان‌شناسان در برچسب‌زنی جملات پیکره وابستگی نحوی زبان فارسی بود. با ایجاد ابزار جستجو در فرهنگ ظرفیت، این هدف در طی برچسب‌زنی پیکرهٔ وابستگی محقق شد.

 

صفحه فرهنگ ظرفیت در مرجع دادگان زبان فارسی را می‌توانید از طریق این پیوند ملاحظه فرمایید. این صفحه شامل فهرستی از پژوهش‌هایی است که در آن‌ها از فرهنگ ظرفیت استفاده شده است.

ویژگی‌ها

 

 • دارای اطلاعات مربوط به انواع متمم‌ها: فاعل (+ فاعل تهی)، مفعول، مفعول دوم، مفعول حرف اضافه‌ای، مسند، تمیز، بند متممی فعل، متمم قیدی، مفعول نشانه اضافه‌ای
 • دارای اطلاعات جزئی در خصوص متمم‌ها؛ برای مثال، متمم قیدی فعل مورد نظر از چه نوعی است (حالت، مکان، مقدار)؟ مفعول حرف اضافه‌ای مورد نظر با چه حرف اضافه‌ای می‌آید (از، به، در ...)؟
 • عرضه شده در دو قالب (فایل متنی/فایل اکسل) با قالب‌بندی بن ماضی، بن مضارع، پیشوند، فعل‌یار، حرف اضافه فعلی، ساخت ظرفیتی

 

 


(نمونۀ اطلاعات موجود در فرهنگ ظرفیت)

سرپرستی پروژه و پژوهش زبان‌شناسی رایانه‌ای

 • محمدصادق رسولی، کارشناسی ارشد هوش مصنوعی، دانشگاه علم و صنعت ایران

پژوهش و آموزش زبان‌شناسی

 • منوچهر کوهستانی، دانشجوی دکتری زبان‌شناسی، دانشگاه تربیت مدرس
 • امیرسعید مولودی، دانشجوی دکتری زبان‌شناسی، دانشگاه تهران

برچسب‌زنی زبان‌شناختی

 • سحر اولی‌پور، کارشناس ارشد زبان‌شناسی، دانشگاه تهران
 • فرزانه بختیاری، دانشجوی کارشناسی ارشد زبان‌شناسی، دانشگاه تهران
 • ندا پورمرتضی خامنه، کارشناس ارشد زبان و ادبیات فارسی، دانشگاه آزاد اسلامی
 • پریناز دادرس، دانشجوی کارشناسی ارشد زبان‌شناسی، دانشگاه تهران
 • سوده رسالت‌پو، کارشناسی ارشد زبان‌شناسی، دانشگاه آزاد اسلامی علوم و تحقیقات
 • مرتضی رضائی، دانشجوی کارشناسی ارشد زبان‌شناسی رایانشی، دانشگاه صنعتی شریف
 • سلیمه زمانی، کارشناس ارشد زبان‌شناسی، دانشگاه آزاد اسلامی علوم و تحقیقات
 • فاطمه شفیعی، کارشناس ارشد زبان‌شناسی، دانشگاه تهران
 • مریم فعال همدانچی، دکترای زبان‌شناسی، دانشگاه دوستی ملل روسیه
 • سعیده قدردوست نخچی، کارشناسی ارشد زبان‌شناسی، دانشگاه تهران
 • مصطفی مهدوی، دانشجوی دکتری زبان‌شناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی
 • آزاده میرزائی، دانشجوی دکتری زبان‌شناسی، دانشگاه علامه طباطبایی

برنامه‌نویسی

 • سید مهدی حسینی، کارشناسی ارشد هوش مصنوعی، دانشگاه علم و صنعت ایران
 • یاسر سوری، دانشجوی کارشناسی ارشد هوش مصنوعی، دانشگاه صنعتی شریف
 • علیرضا نوریان، دانشجوی کارشناسی ارشد هوش مصنوعی، دانشگاه علم و صنعت ایران

 

ابزار

 

این سامانه هم‌اکنون امکان جستجوی برخط در فرهنگ ظرفیت نحوی افعال فارسی و پیکره وابستگی نحوی زبان فارسی را فراهم می‌کند و می‌تواند به عنوان منبعی برای مطالعات زبان‌شناختی و ابزاری برای آموزش زبان فارسی به کار رود. همچنین علاقه‌مندان به استفاده از داده‌های گروه پژوهشی دادگان برای اهداف پردازشی نیز می‌توانند با استفاده از این سامانه درک بهتری از انواع اطلاعات و روابط موجود در داده‌ها داشته باشند.

 

 

 

این برنامه که به زبان برنامه‌نویسی سی‌شارپ نوشته شده است می‌تواند تصریف‌های پیچیده افعال ساده و پیشوندی و همین‌طور فعل‌های مرکب با فاصله دور را شناسایی کند.
در مراحل اولیه تهیه فرهنگ ظرفیت نحوی افعال زبان فارسی، از این ابزار به منظور جستجو و تهیه فهرست گزینه‌های اولیه افعال فرهنگ ظرفیت استفاده شد.