چطور این مقاله مهندسی کامپیوتر و IT را دانلود کنم؟
فایل انگلیسی این مقاله با شناسه 2000373 رایگان است. ترجمه چکیده این مقاله مهندسی کامپیوتر و IT در همین صفحه قابل مشاهده است. شما می توانید پس از بررسی این دو مورد نسبت به خرید و دانلود مقاله ترجمه شده اقدام نمایید
حجم فایل انگلیسی :
208 Kb
حجم فایل فارسی :
343 کیلو بایت
نوع فایل های ضمیمه :
word+pdf
کلمه عبور همه فایلها :
www.daneshgahi.com
عنوان فارسي
یک مقایسه تحقیقاتی از تکنیک های یادگیری ماشین نظارت شده برای فیلتر ایمیل اسپم
عنوان انگليسي
A Comparative Study of Supervised Machine Learning Techniques for Spam E-Mail Filtering
نویسنده/ناشر/نام مجله
Fourth International Conference on Computational Intelligence and Communication Networks
این مقاله چند صفحه است؟
این مقاله ترجمه شده مهندسی کامپیوتر و IT شامل 7 صفحه انگلیسی به صورت پی دی اف و 16 صفحه متن فارسی به صورت ورد تایپ شده است
چکیده
یک مشکل بزرگ برای هرکاربر ایمیل، ایمیل ناخواسته (اسپم) است. اخیرا، ایمیل های اسپم به گونه ای خاص نوشته و تولید می شود که توسط فیلتر های ضداسپم تشخصی داده نشود، درنتیجه فیلتر ایمیل های اسپم بسیار دشوار شده است. این مقاله، معیارهای کارآیی دسته های خاصی از تکینیک های یادگیری ماشین با نظارت را از جمله، الگوریتم های بیز، الگوریتم های تنبل، الگوریتم های درختی، شبکه های عصبی و ماشین بردارپشتیبانی، برای دسته بندی مجموعه ایمیل های اسپم که توسط پایگاه یادگیری ماشین UCI جمع آوری شده، بررسی و مقایسه می نماییم. هدف این مقاله، درنظر گرفتن محتوی ایمیل ها، یادگیری یک پایگاه محدود در دسترس و طراحی یک مدل دسته بندی است که قادر باشد اسپم بودن ایمیل را پیش بینی نماید.
کلمات کلیدی : دسته بندی، الگوریتم های یادگیری ماشین، ایمیل اسپم، فیلتر کردن
1-مقدمه
یکی از مشکلات بزرگ برای هر دسته از کاربران ایمیل و اینترنت، دریافت ایمیل اسپم است. شرکت ها و اشخاص از طریق ایمیل، تبلیغاتی از محصولات، اخبار زیان بار نامطلوب و محتوی و پیشنهادات جعلی وغیره ارسال می کنند. این ایمیل های اسپم، کاربران ایمیل را اذیت کرده و وقت باارزش آنها را تلف می کند. برای کاربران غیرجدی و بدون تکنولوژی، از آنجا که این ایمیل ها، آنها را گمراه می کنند، مشکلات بزرگی ایجاد می نمایند. ایمیل های اسپم منجر به مصرف غیرضروی پهنای باند و مسدود کردن سرورهای ایمیل می شود.
بمنظور معرفی مشکل ایمیل اسپم، یک تحقیق قابل توجه درمورد تکنیک های نرم افزاری ضداسپم انجام گرفته و توسط کاربران استفاده می شود. تکنیک های فیلتر اسپم شامل روش های دستی و خودکار هستند. در روش های دستی، لیستی از ارسال کنندگان اسپم، لیستی از ارسال کنندگان واقعی، و لیستی از کلمات انتخاب شده در محتوی ایمیل یا تیتر آن برای درنظرگرفتن در فیلتر اسپم وارد می شود. در سال های اخیر، تکنیک یادگیری ماشین، یک تکنیک بهتر در مقایسه با روش های دستی برای تشخیص و دسته بندی خودکار ایمیل های اسپم استفاده می شود.
در برنامه نویسی معمول، کامپیوتر داده و برنامه را به عنوان ورودی گرفته و یک خروجی مرتبط را ارائه می کند. در مقابل در یادگیری ماشین، کامپیوتر، داده و خروجی را به عنوان ورودی گرفته و برنامه را به عنوان نتیجه ارائه می دهد. به بیان ساده، این الگوریتم ها، تطبیق یافته و به کامپیوتر امکان یادگیری از مشاهدات داده شده را می دهد. این الگوریتم ها، دانش مفید را به طور خودکار از داده استخراج می کنند [1,4,19].
در یادگیری ماشین با نظارت یا استنتاجی، این الگوریتم ها از داده های آموزشی که شامل هردو ورودی ها و خروجی ها (نتایج) هستند یادگرفته و یک مدل ساخته می شود. این مدل برای نمونه های جدید دسته بندی آزمایش می شوند. در حالت دسته بندی دودویی، خروجی به دو کلاس تعلق دارد. در سالهای اخیر، فیلتر اسپم، یکی از شاخه های تحقیقاتی مهم شده است. محققان از روش های مختلفی برای تحلیل پردازش ایمیل ها از جمله، اطلاعات سرتیتر، اطلاعات فرستنده و محتوی استفاده کرده اند. در طول زمان، تعدادی تکنیک های یادگیری ماشین، در مطالعات تحقیقاتی برای دسته بندی داده های ایمیل اسپم مورد استفاده قرار گرفته اند [15] که در دامنه عمومی نگهداری می شوند. با وجود توسعه قابل توجه، الگوریتم های ضداسپم، تکنیک های فیلتر اسپم، مشکلات زیادی را پیش رو دارند. ارسال کنندگان اسپم یا اسپمرها، از روش های جدیدی برای آماده کردن ایمیل های اسپم که تشخیص آنها توسط ابزار ضداسپم دشوار است، استفاده می کنند. در بخش بعدی، الگوریتم های یادگیری ماشین، که برای دسته بندی ایمیل اسپم مبتنی بر محتوی آنها استفاده می شوند، بررسی می گردند.
دسته بندی الگوریتم های یادگیری ماشین ایمیل اسپم فیلتر کردن
:کلمات کلیدی
سایر منابع مهندسی کامپیوتر و IT-فناوری اطلاعات در زمینه فیلتر ایمیل هرزنامه