چطور این مقاله مهندسی کامپیوتر و IT را دانلود کنم؟
فایل انگلیسی این مقاله با شناسه 2007869 رایگان است. ترجمه چکیده این مقاله مهندسی کامپیوتر و IT در همین صفحه قابل مشاهده است. شما می توانید پس از بررسی این دو مورد نسبت به خرید و دانلود مقاله ترجمه شده اقدام نمایید
حجم فایل فارسی :
799 کیلو بایت
نوع فایل های ضمیمه :
Pdf+Word
کلمه عبور همه فایلها :
www.daneshgahi.com
عنوان فارسي
یک روش یادگیری تخاصمی عمیق و چند مرحله ای، برای باز شناسی شخص بر مبنای ویدئو
عنوان انگليسي
Few-Shot Deep Adversarial Learning for Video-Based Person Re-Identification
نویسنده/ناشر/نام مجله
IEEE TRANSACTIONS ON IMAGE PROCESSING
این مقاله چند صفحه است؟
این مقاله ترجمه شده مهندسی کامپیوتر و IT شامل 13 صفحه انگلیسی به صورت پی دی اف و 26 صفحه متن فارسی به صورت ورد تایپ شده است
چکیده
بازشناسی شخص (re-ID) بر مبنای ویدئو را می توان به عنوان فرآیند تطبیق تصویر یک فرد از طریق دیدهای مختلف دوربین که به وسیله ی تصاویر ویدئویی ناهم راستا گرفته شده است، در نظر گرفت. روش هایی که برای اینکار وجود دارند، از سیگنال های نظارتی برای بهینه سازی فضای پیش روی دوربین استفاده نموده که تحت این شرایط، فاصله ی بین ویدئوها بیشینه سازی/کمینه سازی می شود. البته این کار باعث شده تا برچسب گذاری افراد در سطح دید های ویدئو بسیار زیاد شده و باعث شده تا نتوان آنها را به خوبی بر روی دوربین های شبکه بندی شده ی بزرگ مقیاس بندی کرد. همچنین خاطر نشان شده است که یادگیری نمایش های مختلف ویدئویی و آن هم به وسیله ی عدم تغییر دید دوربین را نمی توان انجام داد چرا که ویژگی های تصویر، هر کدام دارای توزیع های مختلف مختص به خود می باشند. بنابراین تطبیق ویدئوها برای باز شناسی افراد، نیاز به مدل هایی انعطاف پذیر برای بدست آوردن پویایی های موجود در مشاهدات ویدئویی و یادگیری دیدهای ثابت از طریق دسترسی به نمونه های آموزشی برچسب دار و محدود دارد. در این مقاله قصد داریم یک روش مبتنی بر یادگیری عمیق چند مرحله ای را برای باز شناسی یک فرد بر مبنای ویدئو ارائه دهیم و بتوانیم به یادگیری دیدهای قابل قیاسی از این فرد که متمایز هستند بپردازیم. روش پیشنهادی را بر روی شبکه های عصبی باز رخداد گر متغیر (VRNN) توسعه داده ایم و آنرا به منظور ایجاد متغیر های پنهان با وابستگی های موقت که بسیار متمایز بوده ولی در تطبیق تصاویر فرد از نظر دید ثابت می باشد، مورد یادگیری قرار داده ایم. آزمایش های وسیعی را بر روی سه مجموعه ی داده ای بنچ مارک انجام داده ایم و به صورت تجربی به اثبات قابلیت روش پیشنهادی مان در ایجاد ویژگی های موقتی و با یک دید ثابت و کارائی بالایی که به وسیله ی آن بدست آمده است خواهیم پرداخت.
1-مقدمه
یکی از وظایف مهمی که در سامانه های نظارت تصویری صورت می گیرد این بوده که باید بتوان تصاویر افراد را به صورت خودکار بر روی دید های مختلف از دوربین های مجزا تطبیق داد که این فرآیند را باز شناسی فرد (re-ID) گویند. این روش در حوزه ی نظارت ویدئویی، چند رسانه ای و سیستم های امنیتی مورد توجه گسترده ای قرار گرفته است چرا که در این روش به دنبال جستجوی افراد مد نظر و آن هم از طریق دنباله های ویدئویی زیاد هستیم. بسیاری از روش های موجود، بر روی تطبیق تصاویر ثابتی که دارای یک ظاهر بصری فضایی ( شکل، بافت و رنگ ) می باشند متمرکز می باشند....
باز شناسی فرد بر مبنای ویدئو شبکه های عصبی باز رخدادگر متغیر یادگیری تخاصمی
:کلمات کلیدی
Abstract
Video-based person re-identification (re-ID) refers to matching people across camera views from arbitrary unaligned video footages. Existing methods rely on supervision signals to optimise a projected space under which the distances between inter/intra-videos are maximised/minimised. However, this demands exhaustively labelling people across camera views, rendering them unable to be scaled in large networked cam-eras. Also, it is noticed that learning effective video representations with view invariance is not explicitly addressed for which features exhibit different distributions otherwise. Thus, matching videos for person re-ID demands flexible models to capture the dynamics in time-series observations and learn view-invariant representations with access to limited labeled training samples. In this paper, we propose a novel few-shot deep learning approach to video-based person re-ID, to learn comparable representations that are discriminative and view-invariant. The proposed method is developed on the variational recurrent neural networks (VRNNs) and trained adversarially to produce latent variables with temporal dependencies that are highly discriminative yet view-invariant in matching persons. Through extensive experiments conducted on three benchmark datasets, we empirically show the capability of our method in creating view-invariant temporal features and state-of-the-art performance achieved by our method.
Keywords:
Video-based person re-identification variational recurrent neural networks adversarial learning
سایر منابع مهندسی کامپیوتر و IT-نرم افزار در زمینه شبکه عصبی