فااسپل: ﺩﺍﺩﻩ ﺍﺭﺯﯾﺎﺑﯽ خطایاب‌های املایی
ارسال شده توسط admin در تاریخ دوشنبه, 08/25/1394 - 09:53
کد داده: D3940825a | ثبت در مرجع: 25 آبان 1394 | تعداد بازدید: 1695

«فااسپل» متشکل از دو ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩ ﺑﺮﺍی ﺍﺭﺯﯾﺎﺑﯽ ﺭوﺵ‌های خطایابی املایی است. گروه اول شامل خطاهای معمول است که از دانش‌آموزان مدارس و همچنین خطاهای املایی در هنگام تایپ فارسی جمع‌آوری شده‌اند. این گروه شامل ۵۵۰۰ خطا و کلمهٔ تصحیح‌شده است. گروه دوم شامل ۸۰۰ جفت کلمه با خطای املایی و نوشتار صحیح آن است که از خروجی یک سیستم نویسه‌خوان نوری (OCR) جمع‌آوری شده است.

مالکیت معنوی: 
بهرنگ قاسمی‌زاده
اطلاعات ارجاع: 
لطفاً در صورت استفاده به یکی از مقالات زیر ارجاع دهید:

 

Barari, L., & QasemiZadeh, B. (2005). CloniZER spell checker adaptive language independent spell checker. In AIML 2005 Conference CICC, Cairo, Egypt (pp. 65-71).

 

QasemiZadeh, B., Ilkhani, A., & Ganjeii, A. (2006, June). Adaptive language independent spell checking using intelligent traverse on a tree. In Cybernetics and Intelligent Systems, 2006 IEEE Conference on (pp. 1-6). IEEE.

پژوهش‌های مرتبط: 
اطلاعات تکمیلی: 

http://pars.ie/lr/faspell_dataset

 

QasemiZadeh, Behrang, 2015, FAspell, LINDAT/CLARIN digital library at Institute of Formal and Applied Linguistics, Charles University in Prague, http://hdl.handle.net/11372/LRT-1547.