جستجو در مقالات منتشر شده


1 نتیجه برای استخراج ماشینی کلیدواژه

نصرت ریاحی نیا، فرزانه شادان‌پور، کیوان برنا، غلامعلی منتظر،
دوره 9، شماره 3 - ( 7-1401 )
چکیده

زمینه و هدف: هدف این پژوهش، بررسی نتایج استخراج خودکار کلیدواژه از فهرست مندرجات کتاب‌های الکترونیکی فارسی حوزۀ علوم  با استفاده از مدل‌سازی موضوعی ال. دی. اِی.،  سنجش شباهت‌ کلیدواژه‌های خروجی با کلیدواژه‌های استاندارد و ارزیابی کاربران از کلیدواژه‌های استخراج‌شده به‌صورت ماشینی است.
روش پژوهش: این پژوهش کاربردی، از نوع پژوهش‌های متن‌کاوی و به جنبۀ روش‌های مورداستفاده در آن پژوهش آمیخته است. از مدل‌سازی موضوعی ال. دی. اِی.  برای  استخراج کلیدواژه از فهرست‌های مندرجات کتاب‌ها استفاده‌شده‌ و نتایج کاربرد مدل با دو روش سنجش کسینوس شباهت و پژوهش کیفی توسط کاربران مورد ارزیابی قرار گرفته است.
یافته‌ها: فهرست‌های مندرجات مورد بررسی با میانگین پیراسته  ۲۶۰.۰۲ کلمه از متون با طول متوسط  محسوب می‌شوند و  حدود ۲۰ درصد از کلمات  آن‌ها را  ایست‌واژه‌ها تشکیل داده‌اند. میان کلیدواژه‌های استاندارد سرعنوانی و کلیدواژه‌های خروجی مدل ال. دی. اِی.  کسینوس شباهت، ۰.۰۹۳۲، بسیار پایین به دست آمد. توافق کامل کاربران نشان داد کلیدواژه‌های خروجی  مدل موضوعی ال. دی. اِی.  حوزه موضوعی کل پیکره را نشان می‌دهند، اما ازنظر کاربران به ترتیب کلیدواژه‌های سرعنوانی استاندارد، کلیدواژه‌های مستخرج از مدل در زیرحوزه‌های موضوعی و کلیدواژه‌های مستخرج از مدل با کل پیکره در توصیف موضوعات هر تک مدرک موفق‌اند.  
نتیجه‌گیری: کلیدواژه‌های به‌دست‌آمده از مدل موضوعی ال. دی. اِی.  را می‌توان در مجموعه‌های ناشناخته به‌منظور استخراج محتوای موضوعی ناآشکار کل مجموعه به کار برد، اما برای ربط دقیق  موضوع به  مدرک در پیکره‌های بزرگ با موضوعات  ناهمگن و متنوع، نمی‌توان از این روش استفاده کرد. این روش در رویه‌های رسمی توصیف موضوعی تک‌تک مدارک به‌صورت مستقل می‌تواند به‌عنوان یک سیستم پیشنهاددهنده کلیدواژه به نیروی انسانی نمایه‌ساز به کار گرفته  شود.
 


صفحه 1 از 1     

کلیه حقوق این وب سایت متعلق به تعامل انسان و اطلاعات می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2024 CC BY-NC 4.0 | Human Information Interaction

Designed & Developed by : Yektaweb