چطور این مقاله مهندسی کامپیوتر و IT را دانلود کنم؟
فایل انگلیسی این مقاله با شناسه 2008236 رایگان است. ترجمه چکیده این مقاله مهندسی کامپیوتر و IT در همین صفحه قابل مشاهده است. شما می توانید پس از بررسی این دو مورد نسبت به خرید و دانلود مقاله ترجمه شده اقدام نمایید
حجم فایل انگلیسی :
159 Kb
حجم فایل فارسی :
817 کیلو بایت
نوع فایل های ضمیمه :
Pdf+Word
کلمه عبور همه فایلها :
www.daneshgahi.com
عنوان فارسي
گزینش کارآمد ویژگی با استفاده از تحلیل افزونگی و ارتباط بین ویژگی ها
عنوان انگليسي
Efficient Feature Selection via Analysis of Relevance and Redundancy
نویسنده/ناشر/نام مجله
Journal of Machine Learning Research
این مقاله چند صفحه است؟
این مقاله ترجمه شده مهندسی کامپیوتر و IT شامل 20 صفحه انگلیسی به صورت پی دی اف و 32 صفحه متن فارسی به صورت ورد تایپ شده است
چکیده
در مسئلهی گزینش ویژگی به دنبال کاهش تعداد ویژگیهای موجود در اپلیکیشن های متعددی هستیم که دادههای مربوط به این اپلیکیشن ها با صد ها و یا حتی هزاران ویژگی سرو کار دارند. روشهای فعلی که برای گزینش ویژگی ارائه شده است غالباً بر روی پیدا کردن ویژگیهای به هم مرتبط متمرکز شدهاند. در این مقاله نشان خواهیم داد که ارتباط ویژگی ها را نمیتوان یک شرط کافی برای گزینش کارآمد ویژگی ها وآنهم در دادههایی با تعداد ابعاد بالا دانست. در همین راستا، مفهوم "افزونگی ویژگی" را معرفی میکنیم تا بتوان تحلیلهایی را بر روی افزونگی ویژگی ها در مسئلهی گزینش ویژگی انجام داد. چارچوب جدیدی را معرفی خواهیم نمود که میتواند تحلیل افزونگی و تحلیل ارتباط بین ویژگی ها را به صورت مجزا از هم انجام دهد. به توسعهی یک روش مبتنی بر همبستگی برای تحلیل افزونگی و ارتباط خواهیم پرداخت و مطالعاتی تجربی را بر روی بهرهوری و اثر بخشی آن در مقایسه با روشهای دیگر انجام میدهیم.
1-مقدمه
در روشهای کلاسیکی یادگیری نظارت شده، با یک مجموعهی آموزشی از بردارهای ویژگی با طول ثابت و برچسب دار (نمونهها) روبرو هستیم. یک نمونه را میتوان به عنوان تخصیص مقادیر f = ( f1, ..., fN) به یک مجموعه از ویژگی ها F = (F1, ...,FN) و تخصیص یکی از کلاس ممکن lc1, ...,c به برچسب کلاس تعریف نمود. هدف این است که بتوان به دستهبندیای دست پیدا کنیم که بتواند به شکلی صحیح به پیشبینی برچسبهای نمونههای جدید بپردازد. یادگیری یک دسته بند میتواند به وسیلهی مقادیر ویژگیهای آن مشخص شود…
یادگیری نظارت شده گزینش ویژگی
:کلمات کلیدی
Abstract
Feature selection is applied to reduce the number of features in many applications where data has hundreds or thousands of features. Existing feature selection methods mainly focus on finding relevant features. In this paper, we show that feature relevance alone is insufficient for efficient feature selection of high-dimensional data. We define feature redundancy and propose to perform explicit redundancy analysis in feature selection. A new framework is introduced that decouples relevance analysis and redundancy analysis. We develop a correlation-based method for relevance and redundancy analysis, and conduct an empirical study of its efficiency and effectiveness comparing with representative methods.
Keywords:
supervised learning feature selection relevance
سایر منابع مهندسی کامپیوتر و IT-نرم افزار در زمینه گزینش ویژگی