دانلود مقاله ترجمه شده یک مقایسه تحقیقاتی از تکنیک های یادگیری ماشین نظارت شده برای فیلتر ایمیل اسپم


چطور این مقاله مهندسی کامپیوتر و IT را دانلود کنم؟

فایل انگلیسی این مقاله با شناسه 2000373 رایگان است. ترجمه چکیده این مقاله مهندسی کامپیوتر و IT در همین صفحه قابل مشاهده است. شما می توانید پس از بررسی این دو مورد نسبت به خرید و دانلود مقاله ترجمه شده اقدام نمایید

قیمت :
830,000 ریال
شناسه محصول :
2000373
سال انتشار:
2012
حجم فایل انگلیسی :
208 Kb
حجم فایل فارسی :
343 کیلو بایت
نوع فایل های ضمیمه :
word+pdf
کلمه عبور همه فایلها :
www.daneshgahi.com

عنوان فارسي

یک مقایسه تحقیقاتی از تکنیک های یادگیری ماشین نظارت شده برای فیلتر ایمیل اسپم

عنوان انگليسي

A Comparative Study of Supervised Machine Learning Techniques for Spam E-Mail Filtering

نویسنده/ناشر/نام مجله

Fourth International Conference on Computational Intelligence and Communication Networks

این مقاله چند صفحه است؟

این مقاله ترجمه شده مهندسی کامپیوتر و IT شامل 7 صفحه انگلیسی به صورت پی دی اف و 16 صفحه متن فارسی به صورت ورد تایپ شده است

چکیده فارسی

چکیده

یک مشکل بزرگ برای هرکاربر ایمیل، ایمیل ناخواسته (اسپم) است. اخیرا، ایمیل های اسپم به گونه ای خاص نوشته و تولید می شود که توسط فیلتر های ضداسپم تشخصی داده نشود، درنتیجه فیلتر ایمیل های اسپم بسیار دشوار شده است. این مقاله، معیارهای کارآیی دسته های خاصی از تکینیک های یادگیری ماشین با نظارت را از جمله، الگوریتم های بیز، الگوریتم های تنبل، الگوریتم های درختی، شبکه های عصبی و ماشین بردارپشتیبانی، برای دسته بندی مجموعه ایمیل های اسپم که توسط پایگاه یادگیری ماشین UCI جمع آوری شده، بررسی و مقایسه می نماییم. هدف این مقاله، درنظر گرفتن محتوی ایمیل ها، یادگیری یک پایگاه محدود در دسترس و طراحی یک مدل دسته بندی است که قادر باشد اسپم بودن ایمیل را پیش بینی نماید.

کلمات کلیدی : دسته بندی، الگوریتم های یادگیری ماشین، ایمیل اسپم، فیلتر کردن

1-مقدمه

یکی از مشکلات بزرگ برای هر دسته از کاربران ایمیل و اینترنت، دریافت ایمیل اسپم است. شرکت ها و اشخاص از طریق ایمیل، تبلیغاتی از محصولات، اخبار زیان بار نامطلوب و محتوی و پیشنهادات جعلی وغیره ارسال می کنند. این ایمیل های اسپم، کاربران ایمیل را اذیت کرده و وقت باارزش آنها را تلف می کند. برای کاربران غیرجدی و بدون تکنولوژی، از آنجا که این ایمیل ها، آنها را گمراه می کنند، مشکلات بزرگی ایجاد می نمایند. ایمیل های اسپم منجر به مصرف غیرضروی پهنای باند و مسدود کردن سرورهای ایمیل می شود.

بمنظور معرفی مشکل ایمیل اسپم، یک تحقیق قابل توجه درمورد تکنیک های نرم افزاری ضداسپم انجام گرفته و توسط کاربران استفاده می شود. تکنیک های فیلتر اسپم شامل روش های دستی و خودکار هستند. در روش های دستی، لیستی از ارسال کنندگان اسپم، لیستی از ارسال کنندگان واقعی، و لیستی از کلمات انتخاب شده در محتوی ایمیل یا تیتر آن برای درنظرگرفتن در فیلتر اسپم وارد می شود. در سال های اخیر، تکنیک یادگیری ماشین، یک تکنیک بهتر در مقایسه با روش های دستی برای تشخیص و دسته بندی خودکار ایمیل های اسپم استفاده می شود.

در برنامه نویسی معمول، کامپیوتر داده و برنامه را به عنوان ورودی گرفته و یک خروجی مرتبط را ارائه می کند. در مقابل در یادگیری ماشین، کامپیوتر، داده و خروجی را به عنوان ورودی گرفته و برنامه را به عنوان نتیجه ارائه می دهد. به بیان ساده، این الگوریتم ها، تطبیق یافته و به کامپیوتر امکان یادگیری از مشاهدات داده شده را می دهد. این الگوریتم ها، دانش مفید را به طور خودکار از داده استخراج می کنند [1,4,19].

در یادگیری ماشین با نظارت یا استنتاجی، این الگوریتم ها از داده های آموزشی که شامل هردو ورودی ها و خروجی ها (نتایج) هستند یادگرفته و یک مدل ساخته می شود. این مدل برای نمونه های جدید دسته بندی آزمایش می شوند. در حالت دسته بندی دودویی، خروجی به دو کلاس تعلق دارد. در سالهای اخیر، فیلتر اسپم، یکی از شاخه های تحقیقاتی مهم شده است. محققان از روش های مختلفی برای تحلیل پردازش ایمیل ها از جمله، اطلاعات سرتیتر، اطلاعات فرستنده و محتوی استفاده کرده اند. در طول زمان، تعدادی تکنیک های یادگیری ماشین، در مطالعات تحقیقاتی برای دسته بندی داده های ایمیل اسپم مورد استفاده قرار گرفته اند [15] که در دامنه عمومی نگهداری می شوند. با وجود توسعه قابل توجه، الگوریتم های ضداسپم، تکنیک های فیلتر اسپم، مشکلات زیادی را پیش رو دارند. ارسال کنندگان اسپم یا اسپمرها، از روش های جدیدی برای آماده کردن ایمیل های اسپم که تشخیص آنها توسط ابزار ضداسپم دشوار است، استفاده می کنند. در بخش بعدی، الگوریتم های یادگیری ماشین، که برای دسته بندی ایمیل اسپم مبتنی بر محتوی آنها استفاده می شوند، بررسی می گردند.

دسته بندی الگوریتم های یادگیری ماشین ایمیل اسپم فیلتر کردن :کلمات کلیدی

چکیده انگلیسی


Abstract

Unsolicited e-mail (Spam) has become a major issue for each e-mail user. In recent days it is very difficult to filter spam emails as these emails are written or generated in a very special way so that anti-spam filters cannot detect such emails. This Paper compares and discusses performance measures of certain categories of supervised machine learning techniques such as Bayes algorithms, lazy algorithms, tree algorithms, neural network, and support vector machines for classifying a spam e-mail corpus maintained by UCI Machine Learning Repository. The objective of this study is to consider the content of the emails, learn a finite dataset available and to develop a classification model that will able to predict whether an e-mail is spam or not

Keywords: Classification Machine Learning Algorithms Spam- Email Filtering
Skip Navigation Linksصفحه اصلی > دپارتمان ها > دپارتمان فنی و مهندسی > مهندسی کامپیوتر و IT > مقاله های مهندسی کامپیوتر و IT و ترجمه فارسی آنها > یک مقایسه تحقیقاتی از تکنیک های یادگیری ماشین نظارت شده برای فیلتر ایمیل اسپم
کتابخانه الکترونیک
دانلود مقالات ترجمه شده
جستجوی مقالات
با انتخاب رشته مورد نظر خود می توانید مقالات ترجمه شده آن رو به صورت موضوع بندی شده مشاهده نمایید