پیکره موازی انگلیسی-فارسی تهران
ارسال شده توسط کاربر مهمان در تاریخ یکشنبه, 02/15/1392 - 00:05
کد داده: D3920214a | ثبت در مرجع: 15 اردیبهشت 1392 | تعداد بازدید: 2945

پیکره موازی انگلیسی فارسی تهران (TEP) مجموعه‌ای است حاوی بیش از ششصدهزار جمله هم‌ترازشده انگلیسی و فارسی که از زیرنویس ۱۶۰۰ فیلم استخراج شده‌اند. این پیکره در آزمایشگاه پردازش زبان طبیعی دانشگاه تهران تهیه شده است و در ماشین‌های ترجمه و دیگر سیستم‌های پردازش زبان طبیعی کاربرد دارد.

مالکیت معنوی: 
-
شرایط استفاده: 

-

اطلاعات ارجاع: 

 

- Mohammad Taher Pilevar, Heshaam Faili, and Abdol Hamid Pilevar. 2011. TEP: Tehran English-Persian parallel corpus. In Proceedings of the 12th international conference on Computational linguistics and intelligent text processing (CICLing'11), pages 68-79, Tokyo, Japan. (دریافت)

پژوهش‌های مرتبط: 

 

- http://scholar.google.com/scholar?q=related:SpnIij3ObP8J:scholar.google.com/&hl=en&as_sdt=0,5

 

* اگر در پژوهش خود از این داده استفاده کرده‌اید و یا پژوهش دیگری را می‌شناسید که از این داده استفاده نموده باشد، لطفاً اطلاعات مربوط به پژوهش را برای ما ارسال فرمایید تا به این لیست اضافه شود.

کاربردها: 
ترجمه ماشینی، پردازش زبان طبیعی، زبان‌شناسی رایانشی، زبان‌شناسی پیکره‌ای
اطلاعات تکمیلی: