<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Human Information Interaction</title>
<title_fa>تعامل انسان و اطلاعات</title_fa>
<short_title>Human Information Interaction</short_title>
<subject>Literature &amp; Humanities</subject>
<web_url>http://hii.khu.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2423-7418</journal_id_issn>
<journal_id_issn_online>2423-7418</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>doi</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid></journal_id_sid>
<journal_id_nlai></journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1401</year>
	<month>7</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2022</year>
	<month>10</month>
	<day>1</day>
</pubdate>
<volume>9</volume>
<number>3</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>استخراج ماشینی کلیدواژه با مدل‌سازی موضوعی ال. دی. اِی.: شباهت‌سنجی با کلیدواژه‌های استاندارد و ارزیابی کاربران</title_fa>
	<title>Automatic keyword extraction using Latent Dirichlet Allocation topic modeling: Similarity with golden standard and users' evaluation</title>
	<subject_fa>تخصصي</subject_fa>
	<subject>Special</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;span style=&quot;font-size:16px;&quot;&gt;&lt;span style=&quot;font-family:nasimYW;&quot;&gt;&lt;span style=&quot;line-height:150%&quot;&gt;&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;b&gt;&lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;line-height:150%&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;&lt;span style=&quot;background-color:#dddddd;&quot;&gt;زمینه و هدف:&lt;/span&gt; &lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;line-height:150%&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;هدف این پژوهش، بررسی نتایج استخراج خودکار کلیدواژه از فهرست مندرجات کتاب&#8204;های الکترونیکی فارسی حوزۀ علوم&amp;nbsp; با استفاده از مدل&#8204;سازی موضوعی ال. دی. اِی.،&amp;nbsp; سنجش شباهت&#8204; کلیدواژه&#8204;های خروجی با کلیدواژه&#8204;های استاندارد و ارزیابی کاربران از کلیدواژه&#8204;های استخراج&#8204;شده به&#8204;صورت ماشینی است.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;b&gt;&lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;line-height:150%&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;&lt;span style=&quot;background-color:#dddddd;&quot;&gt;روش پژوهش&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;line-height:150%&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;&lt;span style=&quot;background-color:#dddddd;&quot;&gt;:&lt;/span&gt; این پژوهش کاربردی، از نوع پژوهش&#8204;های متن&#8204;کاوی و به جنبۀ روش&#8204;های مورداستفاده در آن پژوهش آمیخته است. از مدل&#8204;سازی موضوعی ال. دی. اِی.&amp;nbsp; برای&amp;nbsp; استخراج کلیدواژه از فهرست&#8204;های مندرجات کتاب&#8204;ها استفاده&#8204;شده&#8204; و نتایج کاربرد مدل با دو روش سنجش کسینوس شباهت و پژوهش کیفی توسط کاربران مورد ارزیابی قرار گرفته است.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;b&gt;&lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;line-height:150%&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;&lt;span style=&quot;background-color:#dddddd;&quot;&gt;یافته&#8204;ها:&lt;/span&gt; &lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;line-height:150%&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;فهرست&#8204;های مندرجات مورد بررسی با میانگین پیراسته&amp;nbsp; &lt;span lang=&quot;FA&quot;&gt;&lt;span style=&quot;line-height:150%&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;۲۶۰.۰۲&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;line-height:150%&quot;&gt;&lt;span style=&quot;color:black&quot;&gt; کلمه از متون با طول متوسط&amp;nbsp; محسوب می&#8204;شوند و&amp;nbsp; حدود &lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span lang=&quot;FA&quot;&gt;&lt;span style=&quot;line-height:150%&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;۲۰&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;line-height:150%&quot;&gt;&lt;span style=&quot;color:black&quot;&gt; درصد از کلمات&amp;nbsp; آن&#8204;ها را&amp;nbsp; ایست&#8204;واژه&#8204;ها تشکیل داده&#8204;اند. میان کلیدواژه&#8204;های استاندارد سرعنوانی و کلیدواژه&#8204;های خروجی مدل ال. دی. اِی.&amp;nbsp; کسینوس شباهت، &lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span lang=&quot;FA&quot;&gt;&lt;span style=&quot;line-height:150%&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;۰.۰۹۳۲&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;line-height:150%&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;، بسیار پایین به دست آمد. توافق کامل کاربران نشان داد کلیدواژه&#8204;های خروجی&amp;nbsp; مدل موضوعی ال. دی. اِی.&amp;nbsp; حوزه موضوعی کل پیکره را نشان می&#8204;دهند، اما ازنظر کاربران به ترتیب کلیدواژه&#8204;های سرعنوانی استاندارد، کلیدواژه&#8204;های مستخرج از مدل در زیرحوزه&#8204;های موضوعی و کلیدواژه&#8204;های مستخرج از مدل با کل پیکره در توصیف موضوعات هر تک مدرک موفق&#8204;اند. &lt;b&gt;&amp;nbsp;&lt;/b&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;b&gt;&lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;line-height:150%&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;&lt;span style=&quot;background-color:#dddddd;&quot;&gt;نتیجه&#8204;گیری&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span lang=&quot;AR-SA&quot;&gt;&lt;span style=&quot;line-height:150%&quot;&gt;&lt;span style=&quot;color:black&quot;&gt;&lt;span style=&quot;background-color:#dddddd;&quot;&gt;:&lt;/span&gt; کلیدواژه&#8204;های به&#8204;دست&#8204;آمده از مدل موضوعی ال. دی. اِی.&amp;nbsp; را می&#8204;توان در مجموعه&#8204;های ناشناخته به&#8204;منظور استخراج محتوای موضوعی ناآشکار کل مجموعه به کار برد، اما برای ربط دقیق&amp;nbsp; موضوع به&amp;nbsp; مدرک در پیکره&#8204;های بزرگ با موضوعات&amp;nbsp; ناهمگن و متنوع، نمی&#8204;توان از این روش استفاده کرد. این روش در رویه&#8204;های رسمی توصیف موضوعی تک&#8204;تک مدارک به&#8204;صورت مستقل می&#8204;تواند به&#8204;عنوان یک سیستم پیشنهاددهنده کلیدواژه به نیروی انسانی نمایه&#8204;ساز به کار گرفته&amp;nbsp; شود.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&amp;nbsp;&lt;span lang=&quot;FA&quot;&gt;&lt;span style=&quot;line-height:150%&quot;&gt;&lt;span style=&quot;font-family:&amp;quot;Arial&amp;quot;,sans-serif&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;</abstract_fa>
	<abstract>&lt;span style=&quot;font-size:13pt&quot;&gt;&lt;span style=&quot;text-autospace:none&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;span style=&quot;font-style:italic&quot;&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;font-style:normal&quot;&gt;Purpose: &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;font-style:normal&quot;&gt;This study investigates the automatic keyword extraction from the table of contents of Persian e-books in the field of science using LDA topic modeling, evaluating their similarity with the golden standard, and users&amp;#39; viewpoints of the model keywords.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;font-size:13pt&quot;&gt;&lt;span style=&quot;text-autospace:none&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;span style=&quot;font-style:italic&quot;&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;font-style:normal&quot;&gt;Methodology: &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;font-style:normal&quot;&gt;This is mixed text-mining research in which LDA topic modeling is used to extract keywords from the table of contents of scientific e-books. The evaluation of the used approach has been done by two methods of cosine similarity computing and qualitative evaluation by users.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;font-size:13pt&quot;&gt;&lt;span style=&quot;text-autospace:none&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;span style=&quot;font-style:italic&quot;&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;font-style:normal&quot;&gt;Findings: &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;font-style:normal&quot;&gt;Table of contents are medium-length texts with a trimmed mean of 260.02 words, about 20% of which are stop-words. The cosine similarity between the golden standard keywords and the output keywords is 0.0932 thus very low. The full agreement of users showed that the extracted keywords with the LDA topic model represent the subject field of the whole corpus, but the golden standard keywords, the keywords extracted using the LDA topic model in sub-domains of the corpus, and the keywords extracted from the whole corpus were respectively successful in subject describing of each document. &lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;RTL&quot; style=&quot;font-size:10.0pt&quot; lang=&quot;AR-SA&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;span style=&quot;font-size:13pt&quot;&gt;&lt;span style=&quot;text-autospace:none&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;&lt;span style=&quot;font-style:italic&quot;&gt;&lt;b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;font-style:normal&quot;&gt;Conclusion: &lt;/span&gt;&lt;/span&gt;&lt;/b&gt;&lt;span style=&quot;font-size:10.0pt&quot;&gt;&lt;span style=&quot;font-style:normal&quot;&gt;The keywords extracted using the LDA topic model can be used in unspecified and unknown collections to extract hidden thematic content of the whole collection, but not to accurately relate each topic to each document in large and heterogeneous themes. In collections of texts in one subject field, such as mathematics or physics, etc., with less diversity and more uniformity in terms of the words used in them, more coherent and relevant keywords are obtained, but in these cases, the control of the relevance of keywords to each document is required. In formal subject analysis procedures and processes of individual documents, this approach can be used as a keyword suggestion system for indexing and analytical workforce.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&amp;nbsp;</abstract>
	<keyword_fa>استخراج ماشینی کلیدواژه, مدل‌سازی موضوعی, ال. دی. اِی., شباهت‌سنجی, ارزیابی کاربر</keyword_fa>
	<keyword>Keyword extraction, Topic modeling, Latent Dirichlet Allocation (LDA), Similarity evaluation, Users' evalua-tion.</keyword>
	<start_page>1</start_page>
	<end_page>22</end_page>
	<web_url>http://hii.khu.ac.ir/browse.php?a_code=A-10-663-1&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Nosrat</first_name>
	<middle_name></middle_name>
	<last_name>RiahiNia</last_name>
	<suffix></suffix>
	<first_name_fa>نصرت</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>ریاحی نیا</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>sara_purriahi@yahoo.com</email>
	<code>10031947532846005137</code>
	<orcid>10031947532846005137</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Kharazmi University</affiliation>
	<affiliation_fa>دانشگاه خوارزمی ، دانشکده روانشناسی و علوم تربیتی، گروه علم اطلاعات و دانش شناسی</affiliation_fa>
	 </author>


	<author>
	<first_name>Farzaneh</first_name>
	<middle_name></middle_name>
	<last_name>Shadanpour</last_name>
	<suffix></suffix>
	<first_name_fa>فرزانه</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>شادان‌پور</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>fshadanpoor@gmail.com</email>
	<code>10031947532846005138</code>
	<orcid>10031947532846005138</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Kharazmi University</affiliation>
	<affiliation_fa>دانشگاه خوارزمی</affiliation_fa>
	 </author>


	<author>
	<first_name>Keyvan</first_name>
	<middle_name></middle_name>
	<last_name>Borna</last_name>
	<suffix></suffix>
	<first_name_fa>کیوان</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>برنا</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>borna@khu.ac.ir</email>
	<code>10031947532846005139</code>
	<orcid>10031947532846005139</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Kharazmi University</affiliation>
	<affiliation_fa>دانشگاه خوارزمی</affiliation_fa>
	 </author>


	<author>
	<first_name>Gholam Ali</first_name>
	<middle_name></middle_name>
	<last_name>Montazer</last_name>
	<suffix></suffix>
	<first_name_fa>غلامعلی</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>منتظر</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>montazer@modares.ac.ir</email>
	<code>10031947532846005140</code>
	<orcid>10031947532846005140</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Tarbiat Modares University</affiliation>
	<affiliation_fa>دانشگاه تربیت مدرس</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
