تعداد نشریات | 55 |
تعداد شمارهها | 1,780 |
تعداد مقالات | 14,130 |
تعداد مشاهده مقاله | 29,845,698 |
تعداد دریافت فایل اصل مقاله | 18,760,453 |
مقایسه عملکرد الگوریتمهای پایه یادگیری ماشین در دستهبندی اشعار فارسی به دو گروه تلمیحدار و بدون تلمیح | ||
علم زبان | ||
مقالات آماده انتشار، پذیرفته شده، انتشار آنلاین از تاریخ 18 دی 1400 | ||
نوع مقاله: مقاله پژوهشی | ||
شناسه دیجیتال (DOI): 10.22054/ls.2021.60784.1453 | ||
نویسندگان | ||
پریسا محمدیان کلخوران1؛ محمد بحرانی ![]() ![]() | ||
1گروه زبانشناسی رایانشی، مرکز زبانها و زبانشناسی، دانشگاه صنعتی شریف، تهران، ایران | ||
2گروه رایانه، دانشکده آمار، ریاضی و رایانه، دانشگاه علامه طباطبائی، تهران، ایران | ||
چکیده | ||
هدف این پژوهش آن است که عملکرد چند روش یادگیری ماشین را در دستهبندی اشعار فارسی به دو گروه تلمیحدار و بدون تلمیح، بررسی کند. برای این کار از روشهای نظارتشده بیز ساده، ماشین بردار پشتیبان، درخت تصمیم، جنگل تصادفی، k نزدیکترین همسایه، رگرسیون لجستیک و الگوریتم پرسپترون چندلایه استفاده میشود. پس از جمعآوری دادههای برچسبخورده در قالب دو فایل متنی، هر کدام از ابیات به بردار عددی تبدیل میشوند و پس از ادغام دادهها و تقسیم آنها به دو دسته آموزش و آزمون، الگوریتم مدنظر بر روی دادههای آموزشی پیادهسازی و بر روی دادههای آزمون، آزمایش میگردد تا دقت عملکرد الگوریتم سنجیده شود. خروجی هر الگوریتم، برچسب پیشبینی شده توسط ماشین برای ابیات موردنظر است. شیوه ارزیابی الگوریتمها نیز روش LOOCV میباشد. نتایج ارزیابی نشان میدهد که الگوریتمهای بیز ساده با 76.09%، رگرسیون لجستیک با 76.09%، پرسپترون چند لایه با 75.22% و ماشین بردار پشتیبان با 74.35% نسبت به الگوریتمهای دیگر عملکرد بهتری دارند. در مجموع و با توجه به سایر معیارها از جمله معیار اف-1 و زمان اجرا، میتوان گفت که بهترین عملکرد مربوط به الگوریتم بیز ساده است. | ||
کلیدواژهها | ||
تلمیح؛ شعر فارسی؛ دستهبندی متن؛ یادگیری ماشین؛ پردازش زبان طبیعی | ||
مراجع | ||
| ||
آمار تعداد مشاهده مقاله: 311 |