مجموعه داده استاندارد وبلاگ‌های ایران
ارسال شده توسط admin در تاریخ سه شنبه, 10/15/1394 - 11:39
کد داده: D3941014a | ثبت در مرجع: 15 دی 1394 | تعداد بازدید: 2575

مجموعه داده استاندارد وبلاگ‌های ایران (irBlogs) جهت ایجاد بستری مناسب برای تحقیق و ارائهٔ الگوریتم در زمینهٔ شبکه‌های اجتماعی ایرانی تولید شده است. این مجموعه شامل متون برگرفته از بیش از ۶۰۰ هزار وبلاگ (نزدیک به ۵ میلیون پست) است و گراف روابط افراد نیز برای آن تهیه شده است. علاوه بر کاربردهای ذکر شده، می‌توان از این مجموعه داده برای اهداف دیگری در حوزه‌های بازیابی اطلاعات، پردازش زبان طبیعی و مطالعهٔ زبان فارسی استفاده کرد.

مالکیت معنوی: 
گروه تحقیقاتی پایگاه داده دانشکده برق و کامپیوتر دانشگاه تهران
شرایط استفاده: 

- این داده رایگان بوده و استفاده از آن برای اهداف غیرتجاری آزاد است.

اطلاعات ارجاع: 

- AleAhmad, A., Zahedi, M., Rahgozar, M., & Moshiri, B. (2016). irBlogs: A standard collection for studying Persian bloggers. Computers in Human Behavior, 57, 195-207.

سایر مستندات: 
- ابوالفضل آل احمد، رضا بدیع، مسعود رهگذر، بهزاد مشیری. مجموعه داده irBlogs جهت تحقیق در شبکه اجتماعی وبلاگ‌های ایرانی. همایش تخصصی بررسی شبکه اجتماعی، تهران، مهرماه 1392.

 

Abolfazl AleAhmad, MohammadSadegh Zahedi, Masoud Rahgozar, Behzad Moshiri. irBlogs: a collection for research on Persian weblogs social network, 2013.