چطور این مقاله مهندسی کامپیوتر و IT را دانلود کنم؟
فایل انگلیسی این مقاله با شناسه 2008251 رایگان است. ترجمه چکیده این مقاله مهندسی کامپیوتر و IT در همین صفحه قابل مشاهده است. شما می توانید پس از بررسی این دو مورد نسبت به خرید و دانلود مقاله ترجمه شده اقدام نمایید
حجم فایل فارسی :
2 مگا بایت
نوع فایل های ضمیمه :
Pdf+Word
کلمه عبور همه فایلها :
www.daneshgahi.com
عنوان فارسي
یک روش نیمه نظارت شده و مبتنی بر معیار های افزونگی و ارتباط، به منظور گزینش ویژگی
عنوان انگليسي
Semisupervised Feature Selection Based on Relevance and Redundancy Criteria
نویسنده/ناشر/نام مجله
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS
این مقاله چند صفحه است؟
این مقاله ترجمه شده مهندسی کامپیوتر و IT شامل 12 صفحه انگلیسی به صورت پی دی اف و 27 صفحه متن فارسی به صورت ورد تایپ شده است
چکیده
در مسئله ی انتخاب یا گزینش ویژگی به دنبال آن هستیم تا بتوانیم ویژگیهای موجود و مرتبط بهم در یک دسته بندی را پیدا کرده، با این هدف که بتوان کارائی دستهبندی را بهبود داده و ویژگیهای تکراری در دسته بندی را حذف نموده و در نهایت بتوان هزینههای محاسباتی را کاهش داد. چگونگی ایجاد یک توازن در بین این دو فاکتور را میتوان یک چالش دانست، مخصوصا در شرایطی که به دست آوردن برچسبهای قطعی برای این ویژگی ها هزینه بر باشد. در این مقاله قصد داریم از روش یادگیری نیمه نظارت شده برای حل این مسئله استفاده نماییم و همچنین به ارائهی یک معیار افزونگی-حداقلی و ارتباط-حداکثری که مبتنی بر ضریب همبستگی پوآسن (RRPC) میباشد بپردازیم. در این روش جدید از یک تکنیک جستجوی افزایشی برای گزینش زیر مجموعهای از ویژگیهای بهینه استفاده میشود. ویژگیهای انتخابی جدید از ارتباطی قوی با برچسب ها برخوردار میباشند (البته در مد نظارت شده) و همچنین جلوی افزونگی زیر مجموعه ویژگیهای انتخابیِ تحت محدودیتهای نظارت نشده گرفته میشود. مطالعاتی مقایسه ای را بر روی دادههای باینری و دادههای چند دستهای که از مجموعه دادهای بنچ مارک به دست آمد انجام دادیم. نتایج نشان میدهد که روش پیشنهادی RRPC میتواند به توازن مطلوبی در بین خصیصههای ارتباط و افزونگی در تکنیک گزینش ویژگی نیمه نظارت شده دست پیدا کند. همچنین به مقایسهی تکنیک RRPC با معیارهای کلاسیکی گزینش ویژگی نظارت شده (مانند mRMr و مقیاس فیشر)، معیارهای گزینش ویژگی نیمه نظارت شده (مانند امتیاز لاپلاس) و معیارهای گزینش ویژگی نیمه نظارت شده (مانند حساسیت محلی و sSelect) میپردازیم. نتایجِ حاصل از آزمایش ها نشان از بهرهوری روش پیشنهادی ما دارد.
1-مقدمه
گزینش ویژگی را میتوان یکی از روشهای رایج برای کاهش بعد در بسیاری از اپلیکیشن ها [1,3] دانست. در این تکنیک هدف این است تا بتوان ویژگیهایی معنادار را انتخاب کرده، هزینههای محاسباتی را کاهش داده و همچنین در فضای ذخیرهسازی صرفه جویی نمود. با توجه به مسئلهی معضل بعد، گزینش ویژگی [4] را میتوان یکی از مباحث داغ تحقیقاتی در حیطهی داده کاوی [5,7]، تشخیص الگو [8,9]، و بینایی ماشین [10] دانست. به طور کلی گزینش ویژگی را میتوان به دستهی گزینش ویژگی نظارت شده [12,13]، گزینش ویژگی نظارت نشده [14,16] تقسیم کرد…
گزینش ویژگی یادگیری ماشین ارتباط حداکثری
:کلمات کلیدی
Abstract
Feature selection aims to gain relevant features for improved classification performance and remove redundant features for reduced computational cost. How to balance these two factors is a problem especially when the categorical labels are costly to obtain. In this paper, we address this problem using semisupervised learning method and propose a max-relevance and min-redundancy criterion based on Pearson’s correlation (RRPC) coefficient. This new method uses the incremental search technique to select optimal feature subsets. The new selected features have strong relevance to the labels in supervised manner, and avoid redundancy to the selected feature subsets under unsupervised constraints. Comparative studies are performed on binary data and multicategory data from benchmark data sets. The results show that the RRPC can achieve a good balance between relevance and redundancy in semisupervised feature selection. We also compare the RRPC with classic supervised feature selection criteria (such as mRMR and Fisher score), unsupervised feature selection criteria (such as Laplacian score), and semisupervised feature selection criteria(such as sSelect and locality sensitive). Experimental results demonstrate the effectiveness of our method.
Keywords:
Feature selection machine learning max-relevance
سایر منابع مهندسی کامپیوتر و IT-نرم افزار در زمینه گزینش ویژگی