دانلود روشی سريع برای کاوش قوانين انجمنی (association rules) درمجموعه داده های حجيم
عنوان فارسي
:
روشی سريع برای کاوش قوانين انجمنی (association rules) درمجموعه داده های حجيم
چکیده
روشی سريع برای کاوش قوانين انجمنی (association rules) درمجموعه داده های حجيم
قوانين انجمنی یکی از قوانین مهم و کاربردی در زمینه داده کاوی بوده و به کشف الگوهای پنهان میان داده ها کمک می کند. با افزایش حجم داده ها یافتن الگوهای موجود میان داده ها دشوار می شود. در این تحقیق آماده کامپیوتر روشی سریع برای کاوش قوانين انجمنی ارائه شده است. تحقیق آماده قوانين انجمنی در قالب فایل word و به صورت رایگان قابل دانلود است.
با توجه به کاربرد روزافزون بانکهای اطلاعاتی حجیم و انبارههای بزرگ تراکنش،اخیرا توجه بسیاری از محققان به سمت تولید روش های کارآمد جهت استخراج قوانین انجمنی معطوف گشته است.اغلب روشهای موجود در مرحله اول کار خود کلیه اقلام پر تکرار(ساده و ترکیبی)را از بین تمام اقلام موجود در داده ها جستجو می کند که این امر نیازمند به خواندن مکرر کل داده ها از دیسک است.اکثر روشهایی که جدیدا پیشنهاد شده اند سعی بر این دارند تا لااقل میزان رخداد و درجه پشتیبانی بعضی از اقلام را بتوان مستقیما و بدون پیمایش داده ها محاسبه کرد . اما به این مسئله کمتر توجه شده که چگونه به روش بهینه ای برای شمارش دفعات رخداد اقلام در مواقعی که راهی جزء شمارش وجود ندارد دست یابیم .
در این مقاله را ه حلی کارا برای این مسئله ارائه شده است . در روش پیشنهادی ما ، داده ها تنها یک بار از دیسک خوانده می شوند و بعد از آن به یک ساختار رمز شده و خلاصه تبدیل می گردند به طوری که اولا قابل نگهداری در حافظه می باشند و ثانیا با توجه به ساختار خاصی که دارند ، عملیات شمارش به سریعترین نحوه ممکن انجام می گردد و زمان شمارش دفعات تکرار اقلام در هر مرحله کمتر از مرحله قبل می شود . پس از ارائه الگوریتم ، کارائی آن را با استفاده از دو مجموعه از داده های ساختگی و واقعی ارزیابی کرده و با چند روش کارا که تا کنون ارائه شده اند.
مقایسه می کنیم .فهرست مطالب تحقیق روشی سريع برای کاوش قوانين انجمنی به شرح زیر است
مقدمه
تحقیقات مرتبط
الگوريتم FP-Growth
توزین بار به روش شماره گره
هزینه ی کاوش درخت تراکنش ها
روش شمارش گره
نتایج شبیه سازی
سر بار روش شمارش گره
الگوريتم پيشنهادی FastARM
مقدار مناسب k
نتايج عملی مقايسه الگوريتم ها
آزمايش : داده های توليد شده تصادفی
آزمايش : مجموعه داده های واقعی
نتيجه گيري
Keywords:
قوانين انجمنی
سایر منابع مهندسی کامپیوتر و IT-نرم افزار در زمینه داده کاوی