پیکره تطبیقی فارسی-انگلیسی دانشگاه تهران
ارسال شده توسط admin در تاریخ چهارشنبه, 03/01/1392 - 13:41
کد داده: D3920230a | ثبت در مرجع: 01 خرداد 1392 | تعداد بازدید: 3168

پیکره تطبیقی فارسی-انگلیسی دانشگاه تهران (UTPECC) از دو مجموعه اخبار متفاوت از دو مبدأ مجزا یعنی اخبار فارسی خبرگزاری همشهری و اخبار انگلیسی خبرگزاری بی‌بی‌سی ساخته شده است. همچنین برای هم‌ترازی اسناد این دو زبان، علاوه بر تاریخ انتشار اخبار، شباهت محتوای اسناد نیز در نظر گرفته شده است. این پیکره در آزمایشگاه پژوهشی سیستم‌های هوشمند اطلاعات دانشگاه تهران تهیه شده است.

مالکیت معنوی: 
آزمایشگاه سیستم‌های هوشمند اطلاعات دانشگاه تهران
شرایط استفاده: 

- برای استفاده از این مجموعه، با ارسال ایمیل به خانم دکتر آزاده شاکری (سرپرست آزمایشگاه سیستم‌های هوشمند اطلاعات دانشگاه تهران - shakery@ut.ac.ir)، رمز مربوطه را دریافت نمایید.

اطلاعات ارجاع: 

 

- Homa B. Hashemi, Azadeh Shakery, and Heshaam Faili, "Creating a Persian-English Comparable Corpus", in proceedings of Conference on Multilingual and Multimodal Information Access Evaluation (CLEF), Padua, Italy, pp. 27-39, 2010.

سایر مستندات: 

 

- هما برادران هاشمی. (۱۳۸۹). استفاده از پیکره‌های تطبیقی برای بازیابی اطلاعات بین زبانی فارسی-انگلیسی. پایان‌نامه کارشناسی ارشد. دانشگاه تهران.

اطلاعات تکمیلی: 

 

- این مجموعه داده‌ای به عنوان بخشی از پروژه «ایجاد و توسعه پیکره دادگان متنی مرجع در زبان فارسی»، تحت حمایت معاونت علمی و فناوری ریاست جمهوری، ستاد توسعه فناوری اطلاعات و ارتباطات توسعه داده شده است.

 

- آزمایشگاه سیستم‌های هوشمند اطلاعات دانشگاه تهران

 

- صفحهٔ معرفی پیکره تطبیقی در وبگاه دانشکده مهندسی برق و کامپیوتر دانشگاه تهران