تعداد داده‌ها: ۳۷

مرجع دادگان زبان فارسی (dadegan.ir) با هدف ارائه متمرکز پیکره‌ها و سایر داده‌های زبانی موجود برای زبان فارسی راه‌اندازی شده است. داده‌های عرضه شده در این مرجع تخصصی می‌توانند برای اهداف پردازش رایانه‌ای زبان و مطالعات زبان‌شناختی مورد استفاده قرار بگیرند.

ارسال شده توسط admin در تاریخ سه شنبه, 11/24/1391 - 05:59

خبرنامه

با اشتراک در خبرنامۀ الکترونیکی دادگان، فهرستی از آخرین داده‌های اضافه شده به مرجع دادگان به صورت دوره‌ای به آدرس پست الکترونیکی شما ارسال خواهد شد.

 

1 + 3 =
پاسخ سوال ساده ریاضی را وارد کنید. به طور مثال برای 1+3 وارد کنید 4.
 

امروزه روش‌های آماری و مبتنی بر یادگیری ماشینی کاربرد فراوانی در پردازش زبان طبیعی و ایجاد سامانه‌هایی چون سامانه‌های ترجمه ماشینی، پرسش و پاسخ خودکار، تبدیل رایانه‌ای متن به گفتار و بالعکس، بازیابی اطلاعات و ... پیدا کرده‌اند. یکی از ملزومات استفاده از روش‌های آماری در پردازش زبان طبیعی، دسترسی به داده‌های زبانی شامل پیکره‌های متنی، پیکره‌های درختی، واژگان‌ها، بانک‌های صوتی و ... است و عدم دسترسی مناسب به چنین داده‌هایی مشکلات فراوانی را پیش پای پژوهشگران قرار می‌دهد.

از سوی دیگر بسیاری از زبان‌شناسان در پژوهش‌های خود از پیکره‌های زبانی بهره می‌گیرند و به بررسی ویژگی‌ها و کشف قواعد زبان از طریق اطلاعات موجود در داده‌های زبانی می‌پردازند.

»مرجع دادگان زبان فارسی» به منظور دسترسی هرچه سریع‌تر محققان حوزه پردازش رایانه‌ای زبان و زبان‌شناسی به داده‌های زبانی موجود برای زبان فارسی راه‌اندازی شده است و در نظر دارد با همراهی همه علاقه‌مندان، به مرجعی کارآمد در این زمینه تبدیل شود.

 

داده‌های ثبت شده در مرجع دادگان در «فهرست داده‌ها» نمایش داده می‌شود. صفحه مربوط به هر داده شامل اطلاعات زیر است:

 

  • معرفی (اطلاعات مختصر در خصوص هر داده به منظور آشنایی اولیه کاربران در بخش "معرفی" نمایش داده‌ می‌شود.)
  • اطلاعات ارجاع (مناسب است - و معمولاً از کاربران خواسته می‌شود - که هنگام استفاده از داده در پژوهش به این شکل به داده ارجاع داده شود.)
  • سایر مستندات علمی مربوط به داده ( اگر علاوه بر موارد معرفی شده در بخش اطلاعات ارجاع، مستندات دیگری در خصوص داده وجود داشته باشد در این بخش معرفی می‌شود.)
  • پژوهش‌های مرتبط (محققین با مراجعه به این پژوهش‌ها می‌توانند با کاربردهای مختلف یک داده، مشکلات استفاده از داده و راه‌حل‌های موجود، محصولات به دست آمده از داده، و همچنین تغییر و یا توسعه داده‌ای مشخص آشنا شوند.)
  • اطلاعات تکمیلی (توضیحات تکمیلی در خصوص داده در این قسمت ثبت شده و یا پیوند وبگاه دیگری که حاوی اطلاعات تکمیلی باشد در این بخش ارائه می‌شود.)
  • پیوند دریافت داده (کاربران می‌توانند با مراجعه به این پیوند داده را دانلود نموده و یا به هر شکل دیگری که عرضه شده باشد دریافت نمایند. به منظور رعایت حقوق معنوی صاحبان آثار، هیچ یک از داده‌های معرفی شده به صورت مستقیم در مرجع دادگان زبان فارسی عرضه نخواهد شد، مگر آنکه مالک معنوی اثر خود چنین درخواستی از مرجع دادگان داشته باشد.)
  • نمونه داده (به منظور فراهم نمودن امکان آشنایی با ساختار داده پیش از دریافت آن، در صورت امکان بخشی از داده به عنوان نمونه ارائه می‌شود.)

 

 

 

  • اگر داده زبانی تولید کرده‌اید و می‌خواهید آن را در مرجع دادگان زبان فارسی معرفی کنید،
  • اگر داده‌ای را می‌شناسید که هنوز در مرجع دادگان زبان فارسی معرفی نشده است،
  • اگر هرگونه پیشنهاد و یا سؤالی در خصوص مرجع دادگان زبان فارسی دارید،


با ما تماس بگیرید.