چطور این مقاله مهندسی کامپیوتر و IT را دانلود کنم؟
فایل انگلیسی این مقاله با شناسه 2008503 رایگان است. ترجمه چکیده این مقاله مهندسی کامپیوتر و IT در همین صفحه قابل مشاهده است. شما می توانید پس از بررسی این دو مورد نسبت به خرید و دانلود مقاله ترجمه شده اقدام نمایید
حجم فایل فارسی :
488 کیلو بایت
نوع فایل های ضمیمه :
Pdf+Word
کلمه عبور همه فایلها :
www.daneshgahi.com
عنوان فارسي
مدل کارایی برنامه های تکراری مپ ردیوس برای انفجار ابر هیبریدی
عنوان انگليسي
Performance Model of MapReduce Iterative Applications for Hybrid Cloud Bursting
نویسنده/ناشر/نام مجله
IEEE Transactions on Parallel and Distributed Systems
این مقاله چند صفحه است؟
این مقاله ترجمه شده مهندسی کامپیوتر و IT شامل 14 صفحه انگلیسی به صورت پی دی اف و 52 صفحه متن فارسی به صورت ورد تایپ شده است
چکیده
انفجار ابر هیبریدی (اجاره منابع موقتی ابری خارج از سیستم، جهت افزایش ظرفیت کلی ابر در زمان اوج بکار گیری سیستم) می تواند یک راه مقرون به صرفه برای حل مشکل افزایش پیچیدگی تحلیل کلان داده ها، به ویژه برای کاربردهای تکراری به شمار رود. با این وجود، توان عملیاتی پایین و تاخیر زیاد در اتصال شبکه بین منابع داخلی و خارجی سیستم («اتصال ضعیف») موجب می شوند تا مقیاس پذیری این رویکرد دشوار باشد. در حالی که چندین تکنیک «همجواری داده» برای انفجار کلان داده ها در ابرهای هیبریدی مطرح شده، اما تخمین میزان اثربخشی این رویکردها بسیار دشوار است. از طرفی دیگر، ارائه چنین تخمین هایی برای کاربران بسیار حیاتی است، زیرا دسترسی به این تخمین ها به آنها کمک می کند تا بررسی کنند که آیا هزینههای مربوط به استفاده از منابع خارجی سیستم، افزایش سرعت زمان اجرای برنامه ها را توجیه می کنند یا خیر. برای این منظور، در این مقاله یک مدل و روش کارایی برای تخمین زمان اجرای برنامه های مپ ردیوس تکراری در سناریوی انفجار ابر هیبریدی ارائه شده است. در این رویکرد ایده اصلی معطوف بر سربار ناشی از اتصال ضعیف در گرانولاریتی، هم برای فاز «نگاشت» و هم فاز «کاهش» می باشد. همان طور که آزمایشات انجام شده بر روی چندین کاربرد مپ ردیوس تکراری در دنیای واقعی نشان می دهند، کاهش این سربار می تواند موجب دقت بالا در تخمین شود. این آزمایشات بر روی مجموعه های کلان داده ای استانداردی انجام شده است که طیف گسترده ای از الگوهای دادهای را شامل می شوند. تخمین های بدست آمده نه تنها در مقایسه با نتایج تجربی واقعی دقیق می باشند، بلکه همچنین نسبت به سایر رویکردهای نوین بررسی شده جهت پیاده سازی مپ ردیوس دقت بالاتری ارائه می کنند. این برتری حداکثر به میزان ۱ واحد نمایی است.
1-مقدمه
یکی از مهم ترین دسته مسائلی که بر روی ابرهای خصوصی اجرا می شوند مسائل مربوط به «تجزیه و تحلیل کلان داده ها» است. با انفجار اندازه داده ها (پیش بینی می شود این انفجار تا سال ۲۰۲۰ به اندازه زتابایت باشد [۱]) و همچنین بسیار پیچیده شدن برنامه ها، ابرهای خصوصی تلاش می کنند تا معیار و حوزه مورد نیاز برای حل این مشکلات را فراهم کنند: اغلب موارد ظرفیت کافی برای انجام تجزیه و تحلیل مطلوب کافی نیست و یا دستیابی به نتایج مطلوب در مدت زمان معین دشوار می باشد...
ابر هیبریدی تجزیه تحلیل کلان داده کاربردهای تکراری
:کلمات کلیدی
Abstract
Hybrid cloud bursting (i.e., leasing temporary off-premise cloud resources to boost the overall capacity during peak utilization) can be a cost-effective way to deal with the increasing complexity of big data analytics, especially for iterative applications. However, the low throughput, high latency network link between the on-premise and off premise resources (“weak link”) makes it difficult to maintain scalability. While there are several data locality techniques dedicated for big data bursting on hybrid clouds, their effectiveness is difficult to estimate in advance. On the other hand, such estimations are critical for users, because they aid in the decision of whether the extra pay-as-you-go cost incurred by using the off-premise resources justifies the runtime speed-up. To this end, the current paper contributes with a performance model and methodology to estimate the runtime of iterative MapReduce applications in a hybrid cloud bursting scenario. A key idea of the proposal is to focus on the overhead incurred by the weak link at fine granularity, both for the map and reduce phase. This enables high estimation accuracy, as demonstrated by extensive experiments at scale using a mix of real-life iterative MapReduce applications from standard big data benchmarking suites that cover a broad spectrum of data patterns. Not only are the produced estimations accurate in absolute terms compared with the actual experimental results, but they are also up to an order of magnitude more accurate than applying state-of-art estimation approaches originally designed for single-site MapReduce deployments.
Keywords:
Hybrid Cloud Big Data Analytics Iterative Applications
سایر منابع مهندسی کامپیوتر و IT در زمینه ابر هیبریدی