دادگان دایفونی فارسی [منتشر نشده]
ارسال شده توسط admin در تاریخ شنبه, 06/16/1392 - 20:47
کد داده: D3920616a | ثبت در مرجع: 16 شهریور 1392 | تعداد بازدید: 3097

واحد پایه مورد استفاده در دادگان صوتی برای بازسازی رایانه‌ای گفتار باید به گونه‌ای انتخاب شود كه اولاً حجم حافظه معقولی را اشغال كند، یعنی تعداد واحدهای آوایی مطلوب باشد و ثانیاً بتوان گذرهای آوایی را در دادگان پوشش داد. از جمله واحدهایی كه با هدف تأمین این شرایط، تعریف و مورد استفاده قرار می‌گیرد، دایفون است. دایفون عبارت است از نیمه پایدار یك آوا تا نیمه پایدار آوای بعدی. دایفون از دو نیم‌آوای به هم چسبیده تشكیل می‌شود، البته باید درنظر داشت كه این تركیب شامل تركیب سكوت و نیم‌آوا نیز می‌باشد. با این تعریف انواع دایفون‌های زبان فارسی شامل توالی‌های cc، cv، vc، -c، c- ، v- و -v است، كه "-" به معنای سكوت می‌باشد. در دادگان دایفونی فارسی که در پژوهشکده پردازش هوشمند علائم تهیه شده است، تعداد ۹۶۶ دايفون وجود دارد.

مالکیت معنوی: 
پژوهشکده پردازش هوشمند علائم
شرایط استفاده: 

این داده به صورت رسمی منتشر نشده است. در صورت انتشار اطلاع‌رسانی خواهد شد.

اطلاعات ارجاع: 

 

- محرم اسلامی، جواد شیخ‌زادگان، زهرا احمدی‌نیا، و علی بهرامی راد. (۱۳۸۸). مراحل و نحوه تهیه دادگان‌های صوتی هجایی و دایفونی برای سامانه تبدیل متن به گفتار فارسی. دوفصل‌نامه علمی-پژوهشی پردازش علائم و داده‌ها، (۱۲)، ۳–۱۲. (دریافت)

کاربردها: 
پردازش گفتار، پردازش زبان طبیعی، زبان‌شناسی رایانشی
دریافت: 
غیرفعال