چطور این مقاله مهندسی کامپیوتر و IT را دانلود کنم؟
فایل انگلیسی این مقاله با شناسه 2006025 رایگان است. ترجمه چکیده این مقاله مهندسی کامپیوتر و IT در همین صفحه قابل مشاهده است. شما می توانید پس از بررسی این دو مورد نسبت به خرید و دانلود مقاله ترجمه شده اقدام نمایید
حجم فایل انگلیسی :
386 Kb
حجم فایل فارسی :
425 کیلو بایت
نوع فایل های ضمیمه :
Pdf+Word
کلمه عبور همه فایلها :
www.daneshgahi.com
عنوان فارسي
یادگیری ماشینی مربوط به پایگاههای داده نامتوازن: نرم افزاری در تشخیص پزشکی
عنوان انگليسي
Machine Learning for Imbalanced Datasets: Application in Medical Diagnostic
نویسنده/ناشر/نام مجله
Application in Medical Diagnostic
این مقاله چند صفحه است؟
این مقاله ترجمه شده مهندسی کامپیوتر و IT شامل 8 صفحه انگلیسی به صورت پی دی اف و 14 صفحه متن فارسی به صورت ورد تایپ شده است
چکیده
در این مقاله ما قاعده جدید الگوریتم قیاسی را برای یادگیری ماشینی در تشخیص طبی ارائه می کنیم. دیتابیس های طبی، مانند بسیاری از دیتابیس های جهان واقعی، توزیع نامتوازن طبقاتی را نشان می دهند. هر چند این تنها مشکل در این نوع از دیتابیس ها که باید حل شود، نیست، همچنین ما باید به مشکلات دیگری در کنار درستی طبقه بندی ضعیف ناشی از توزیع طبقاتی، توجه کنیم. بنابراین هدف ما استراتژی متفاوتی بر اساس حداکثرسازی صحت طبقه بندی، گروه اقلیت است که برعکس با نمونه گیری مورد استفاده معمول و تکنیک های ارزشی است. نتایج تجربی ما با استفاده از یک مجموعه داده اصلی، برای تشخیص بیماری های قلبی عروقی و دیتابیس های عمومی سه گانه اجراشد. آزمایشات با استفاده از گروه بندی استاندارد (Naïve Bayes، C4.5 و k-Nearest Neighbor) طبقه بندی اورژانسی (شبکه های عصبی و ماشین های مسیر پشتیبانی) و دیگر دسته بندی های استفاده شده برای دیتابیس های نامتوازن (Ripper و Random Forest جنگلی تصادفی و شکاف دهنده) انجام شدند. در تمامی آزمایش ها، الگوریتم ما نتایج قابل رقابتی را از نظر درستی و منطقه زیر منحنی ROC، نشان دادند. اما از نظر قابلیت درک و اعتبار بر دیگرطبقه بندی ها غلبه کردند.
1-مقدمه
بسیاری از دیتابیس های دنیای واقعی یک توزیع دسته بندی نامتوازن را نشان می دهند، جاییکه انبوه دسته بندی هایی با دیتای نرمال و دسته بندی حداقلی با دیتایی مهم و ناهنجار، وجود دارد. Fraud دریافت، ورود بی اجازه شبکه و تشخیص های طبی، نمونه هایی از این نوع دیتابیس ها هستند. هرچند که، برخلاف دیگر نرم افزارهای یادگیری ماشینی، مشکل تشخیص طبی، یکباره پایان نمی یابد...
یادگیری ماشینی دیتابیس های نامتوازن تشخیص های طبی درستی اعتبار و قابلیت درک
:کلمات کلیدی
Abstract
In this paper, we present a new rule induction algorithm for machine learning in medical diagnosis. Medical datasets, as many other real–world datasets, exhibit an imbalanced class distribution. However, this is not the only problem to solve for this kind of datasets, we must also consider other problems besides the poor classification accuracy caused by the classes distribution. Therefore, we propose a different strategy based on the maximization of the classification accuracy of the minority class as opposed to the usually used sampling and cost techniques. Our experimental results were conducted using an original dataset for cardiovascular diseases diagnostic and three public datasets. The experiments are performed using standard classifiers (Naïve Bayes, C4.5 and k–Nearest Neighbor), emergent classifiers (Neural Networks and Support Vector Machines) and other classifiers used for imbalanced datasets (Ripper and Random Forest). In all the tests, our algorithm showed competitive results in terms of accuracy and area under the ROC curve, but overcomes the other classifiers in terms of comprehensibility and validity
Keywords:
machine learning imbalanced datasets medical diagnosis accuracy validity and comprehensibility
سایر منابع مهندسی کامپیوتر و IT-نرم افزار در زمینه یادگیری ماشین