دانلود مقاله ترجمه شده خوشه بندی اسناد علمی با استفاده از مدل‌سازی موضوعی


چطور این مقاله مهندسی کامپیوتر و IT را دانلود کنم؟

فایل انگلیسی این مقاله با شناسه 2005928 رایگان است. ترجمه چکیده این مقاله مهندسی کامپیوتر و IT در همین صفحه قابل مشاهده است. شما می توانید پس از بررسی این دو مورد نسبت به خرید و دانلود مقاله ترجمه شده اقدام نمایید

قیمت :
1,160,000 ریال
شناسه محصول :
2005928
سال انتشار:
2014
حجم فایل انگلیسی :
721 Kb
حجم فایل فارسی :
1 مگا بایت
نوع فایل های ضمیمه :
Pdf+Word
کلمه عبور همه فایلها :
www.daneshgahi.com

عنوان فارسي

خوشه بندی اسناد علمی با استفاده از مدل‌سازی موضوعی

عنوان انگليسي

Clustering scientific documents with topic modeling

نویسنده/ناشر/نام مجله

Scientometrics

این مقاله چند صفحه است؟

این مقاله ترجمه شده مهندسی کامپیوتر و IT شامل 20 صفحه انگلیسی به صورت پی دی اف و 26 صفحه متن فارسی به صورت ورد تایپ شده است

چکیده فارسی

چکیده

مدلسازی موضوعی یک نوع مدل آماری برای کشف "موضوعات" پنهان است، مدلسازی موضوعی در مجموعه ای از اسناد از طریق یادگیری ماشین صورت می گیرد. در حال حاضر، تخصیص پنهان دیریکله (LDA) یک رویکرد مدلسازی بسیاری متداول و معروف است. در این مقاله، روش هایی را، از جمله LDA و بسط آن را، برای تجزیه مجموعه ای از انتشارات علمی به درون چند خوشه بررسی می کنیم. برای ارزیابی این نتایج، مجموعه ای از اسناد را تولید می کنیم که شامل مقالات دانشگاهی در چندین زمینه متفاوت هستند و بررسی می کنیم که آیا مواردی که در یک زمینه هستند با همدیگر در یک خوشه قرار می گیرند یا نه. کاربردهای بالقوه علم سنجی مانند قابلیت های تحلیل متن را نیز کشف می‌ کنیم.

1-مقدمه

با افزایش استفاده از پایگاه داده های ساخت‌ یافته متنی، رویکرد ما در راستای سنجش علم، بیشتر و بیشتر به روش های کمی اتکا می کند. اغلب با اشاره به عنوان "کتاب سنجی" (Borgman and Furner 2002)، مطالعات از ابزارهای روش شناختی متفاوتی برای استخراج اطلاعات از پایگاه داده ها، و در راستای تلاش برای کشف ساختارهای اساسی درون مجموعه داده استفاده می کنند...

مدلسازی موضوعی تحلیل متن تخصیص پنهان دیریکله :کلمات کلیدی

چکیده انگلیسی

Abstract

Topic modeling is a type of statistical model for discovering the latent “topics” that occur in a collection of documents through machine learning. Currently, latent Dirichlet allocation (LDA) is a popular and common modeling approach. In this paper, we investigate methods, including LDA and its extensions, for separating a set of scientific publications into several clusters. To evaluate the results, we generate a collection of documents that contain academic papers from several different fields and see whether papers in the same field will be clustered together. We explore potential scientometric applications of such text analysis capabilities

Keywords: Topic modeling Text analysis Atent dirichlet allocation
کتابخانه الکترونیک
دانلود مقالات ترجمه شده
جستجوی مقالات
با انتخاب رشته مورد نظر خود می توانید مقالات ترجمه شده آن رو به صورت موضوع بندی شده مشاهده نمایید