دانلود مقاله ترجمه شده یک روش یادگیری تخاصمی عمیق و چند مرحله ای، برای باز شناسی شخص بر مبنای ویدئو


چطور این مقاله مهندسی کامپیوتر و IT را دانلود کنم؟

فایل انگلیسی این مقاله با شناسه 2007869 رایگان است. ترجمه چکیده این مقاله مهندسی کامپیوتر و IT در همین صفحه قابل مشاهده است. شما می توانید پس از بررسی این دو مورد نسبت به خرید و دانلود مقاله ترجمه شده اقدام نمایید

قیمت :
1,270,000 ریال
شناسه محصول :
2007869
سال انتشار:
2019
حجم فایل انگلیسی :
2 Mb
حجم فایل فارسی :
799 کیلو بایت
نوع فایل های ضمیمه :
Pdf+Word
کلمه عبور همه فایلها :
www.daneshgahi.com

عنوان فارسي

یک روش یادگیری تخاصمی عمیق و چند مرحله ای، برای باز شناسی شخص بر مبنای ویدئو

عنوان انگليسي

Few-Shot Deep Adversarial Learning for Video-Based Person Re-Identification

نویسنده/ناشر/نام مجله

IEEE TRANSACTIONS ON IMAGE PROCESSING

این مقاله چند صفحه است؟

این مقاله ترجمه شده مهندسی کامپیوتر و IT شامل 13 صفحه انگلیسی به صورت پی دی اف و 26 صفحه متن فارسی به صورت ورد تایپ شده است

چکیده فارسی

چکیده

بازشناسی شخص (re-ID) بر مبنای ویدئو را می توان به عنوان فرآیند تطبیق تصویر یک فرد از طریق دیدهای مختلف دوربین که به وسیله ی تصاویر ویدئویی ناهم راستا گرفته شده است، در نظر گرفت. روش هایی که برای اینکار وجود دارند، از سیگنال های نظارتی برای بهینه سازی فضای پیش روی دوربین استفاده نموده که تحت این شرایط، فاصله ی بین ویدئوها بیشینه سازی/کمینه سازی می شود. البته این کار باعث شده تا برچسب گذاری افراد در سطح دید های ویدئو بسیار زیاد شده و باعث شده تا نتوان آنها را به خوبی بر روی دوربین های شبکه بندی شده ی بزرگ مقیاس بندی کرد. همچنین خاطر نشان شده است که  یادگیری نمایش های مختلف ویدئویی و آن هم به وسیله ی عدم تغییر دید دوربین را نمی توان انجام داد  چرا که ویژگی های تصویر،  هر کدام دارای توزیع های مختلف مختص به خود می باشند. بنابراین تطبیق ویدئوها برای باز شناسی افراد، نیاز به مدل هایی انعطاف پذیر برای بدست آوردن پویایی های موجود در مشاهدات ویدئویی و یادگیری دیدهای ثابت از طریق دسترسی به نمونه های آموزشی برچسب دار و محدود دارد. در این مقاله قصد داریم یک روش مبتنی بر یادگیری عمیق چند مرحله ای را برای باز شناسی یک فرد بر مبنای ویدئو ارائه دهیم و بتوانیم به یادگیری دیدهای قابل قیاسی از این فرد که متمایز  هستند بپردازیم. روش پیشنهادی را بر روی شبکه های عصبی باز رخداد گر متغیر (VRNN) توسعه داده ایم و آنرا به منظور ایجاد متغیر های پنهان با وابستگی های موقت که بسیار متمایز بوده ولی در تطبیق تصاویر فرد از نظر دید ثابت می باشد، مورد یادگیری قرار داده ایم.  آزمایش های وسیعی را بر روی سه مجموعه ی داده ای بنچ مارک انجام داده ایم و به صورت تجربی به اثبات قابلیت روش پیشنهادی مان در ایجاد ویژگی های موقتی و با یک دید ثابت و کارائی بالایی که به وسیله ی آن بدست آمده است خواهیم پرداخت.

1-مقدمه

یکی از وظایف مهمی که در سامانه های نظارت تصویری صورت می گیرد این بوده که باید بتوان تصاویر افراد را به صورت خودکار بر روی دید های مختلف از دوربین های مجزا تطبیق داد که این فرآیند را باز شناسی فرد (re-ID) گویند. این روش در حوزه ی نظارت ویدئویی، چند رسانه ای و سیستم های امنیتی مورد توجه گسترده ای قرار گرفته است چرا که در این روش به دنبال جستجوی افراد مد نظر و آن هم از طریق دنباله های ویدئویی زیاد هستیم. بسیاری از روش های موجود، بر روی تطبیق تصاویر ثابتی که  دارای یک ظاهر بصری فضایی ( شکل، بافت و رنگ ) می باشند متمرکز می باشند....

 

باز شناسی فرد بر مبنای ویدئو شبکه های عصبی باز رخدادگر متغیر یادگیری تخاصمی :کلمات کلیدی

چکیده انگلیسی

Abstract

Video-based  person  re-identification  (re-ID)  refers to matching people across camera views from arbitrary unaligned video   footages. Existing  methods   rely on   supervision   signals to  optimise   a projected space   under   which   the distances between  inter/intra-videos  are  maximised/minimised.  However, this demands exhaustively labelling people across camera views, rendering  them  unable  to  be  scaled  in  large  networked cam-eras. Also, it is noticed that learning effective video   representations  with  view  invariance  is  not  explicitly  addressed  for which  features  exhibit  different distributions  otherwise.  Thus, matching  videos  for  person  re-ID  demands  flexible  models  to capture   the  dynamics   in time-series  observations   and   learn view-invariant   representations   with   access   to   limited   labeled training  samples.  In  this  paper,  we  propose  a  novel  few-shot deep  learning  approach  to  video-based  person  re-ID,  to  learn comparable  representations  that  are  discriminative  and  view-invariant.  The  proposed  method  is  developed  on  the  variational recurrent  neural  networks  (VRNNs)  and  trained  adversarially to produce latent variables with temporal dependencies that are highly  discriminative  yet  view-invariant  in  matching  persons. Through  extensive  experiments  conducted  on  three  benchmark datasets,  we  empirically  show  the  capability  of  our  method  in creating  view-invariant  temporal  features  and  state-of-the-art performance  achieved  by our  method.

Keywords: Video-based person re-identification variational recurrent neural networks adversarial learning
Skip Navigation Linksصفحه اصلی > دپارتمان ها > دپارتمان فنی و مهندسی > مهندسی کامپیوتر و IT > مقاله های مهندسی کامپیوتر و IT و ترجمه فارسی آنها > یک روش یادگیری تخاصمی عمیق و چند مرحله ای، برای باز شناسی شخص بر مبنای ویدئو
کتابخانه الکترونیک
دانلود مقالات ترجمه شده
جستجوی مقالات
با انتخاب رشته مورد نظر خود می توانید مقالات ترجمه شده آن رو به صورت موضوع بندی شده مشاهده نمایید