بانک اطلاعات حروف گسسته دست‌نویس فارسی
ارسال شده توسط admin در تاریخ دوشنبه, 11/09/1391 - 22:28
کد داده: D3911108a | ثبت در مرجع: 09 بهمن 1391 | تعداد بازدید: 2628

به دلیل روند رو به گسترش تولید و استفاده از سیستم‌های مبتنی بر نویسه‌خوانی نوری (OCR)، اهمیت وجود بانک‌های اطلاعات تصاویر نوشتار فارسی بیش از پیش احساس می‌شود. این بانک‌های اطلاعاتی هم به منظور توسعه و آموزش الگوریتم‌های آموزش‌پذیر و هم به منظور ارزیابی سیستم‌های ساخته شده، استفاده می‌شوند. متن دست‌نویس گسسته‌‌‌ همان نوشته‌هایی است که حروف آن جدا از هم و به صورت گسسته نوشته شده‌اند، مثل نام و نام‌خانوادگی که در فرم‌های آزمون ثبت‌نام به صورت هر حرف داخل یک کادر نوشته می‌شوند. بانک اطلاعاتی حروف گسسته دست‌نویس مشتمل بر ۱۰ میلیون و ۲۳۶ هزار و ۴۰ نمونه تصویر است که حجم کل آن حدود ۱۲۰ گیگابایت می‌باشد. تصاویر موجود در این بانک در قالب BMP، با وضوح تصویر ۳۰۰ نقطه در اینچ و به‌صورت خاکستری ۲۵۶ سطحی عرضه شده‌اند.

مالکیت معنوی: 
دبیرخانه شورای عالی اطلاع‌رسانی
شرایط استفاده: 

-

سایر مستندات: 

 

- Khosravi, S.; Razzazi, F.; Rezaei, H.; Sadigh, M.R., "A comprehensive handwritten image corpus of isolated persian/arabic characters for OCR development and evaluation," Signal Processing and Its Applications, 2007. ISSPA 2007. 9th International Symposium on , vol., no., pp.1,4, 12-15 Feb. 2007 (دریافت)

پژوهش‌های مرتبط: 

 

http://scholar.google.com/scholar?q=related:vNSZycB84asJ:scholar.google.com/&hl=en&as_sdt=0,5

 

* اگر در پژوهش خود از این داده استفاده کرده‌اید و یا پژوهش دیگری را می‌شناسید که از این داده استفاده نموده باشد، لطفاً اطلاعات مربوط به پژوهش را برای ما ارسال فرمایید تا به این لیست اضافه شود.