پیکره فارسی تحلیل احساس سِنتی‌پِرس
ارسال شده توسط admin در تاریخ شنبه, 04/27/1394 - 03:51
کد داده: D3940423a | ثبت در مرجع: 27 تیر 1394 | تعداد بازدید: 2848

پیکره سِنتی‌پِرس شامل مجموعه‌ای از جملات فارسی با برچسب‌های حاوی بار معنایی است که در پردازش زبان طبیعی و به طور مشخص در زمینه تحلیل احساس یا عقیده‌کاوی کاربرد دارد. با توجه به ویژگی‌های این پیکره، می‌توان آن را در نوع خود اولین پیکره تحلیل احساس برای زبان فارسی با چنین مشخصاتی به شمار آورد. گفتنی است که دامنه جملات موجود در پیکره مربوط به حوزه کالاهای دیجیتال است. همچنین این پیکره شامل جملاتی، هم به صورت رسمی و هم به صورت نوشتاری عامیانه یا غیررسمی است. پروژه توسعه این پیکره ادامه دارد و پیکره حاضر که تحت عنوان بخش اول کار ارائه شده است مشتمل بر حدود ۱۱۰۰ جملهٔ برچسب‌خورده است.

مالکیت معنوی: 
گروه پردازش زبان طبیعی دانشگاه گیلان
شرایط استفاده: 

استفاده از این پیکره با ذکر منبع و تنها برای اهداف پژوهشی و غیرتجاری بلامانع است.

اطلاعات ارجاع: 

Pedram Hosseini, Ali Ahmadian Ramaki, Hassan Maleki, Mansoureh Anvari, and Seyed Abolghasem Mirroshandel. 2015. Sentipers: A sentiment analysis corpus for Persian. http://dadegan.ir/catalog/sentipers

پدرام حسینی و دیگران. (۱۳۹۳). پیکره‌ی فارسی تحلیل احساس سِنتی پِرس. ارائه‌شده در سومین همایش ملی زبان‌شناسی رایانشی، تهران: دانشگاه صنعتی شریف. (دریافت)
اطلاعات تکمیلی: 

 

- جهت دسترسی به این مجموعه میتوانید درخواست خود را با ذکر مقطع تحصیلی/موقعیت فعلی، دانشگاه/موسسه/شرکت/سازمان مربوطه، و هدف استفاده از مجموعه به آدرس ایمیل pdr.hosseini@gmail.com (پدرام حسینی) ارسال نمایید.

- از تمامی پژوهشگران محترم دعوت می‌شود تا پیشنهادات یا مشکلات مربوط به پیکره را با ما در میان بگذارند تا ان‌شاءالله بتوانیم مجموعه‌ای هرچه بهتر و کاربردی‌تر برای زبان فارسی پدید آوریم.

- گروه پردازش زبان طبیعی دانشگاه گیلان: http://nlp.guilan.ac.ir

دریافت: 
بخش «اطلاعات تکمیلی» را مطالعه بفرمایید.