Skip Navigation Links

عنوان ترجمه شده مقاله: آموزش ترکیبی الگوهای نمایشی تک تصویری و تصویر روبرو به منظور شناسایی افراد

در این تحقیق، ما به دنبال ایجاد ارتباط بین این دو دسته از روش ها می باشیم و یک چارچوب آموزش مشترک را برای یکپارچه سازی SIR و CIR با استفاده از شبکه های عصبی پیچیده (CNN) پیشنهاد می کنیم
Abstract

Person re-identification has been usually solved as either the matching of single-image representation (SIR) or the classification of cross-image representation (CIR). In this work, we exploit the connection between these two categories of methods, and propose a joint learning framework to unify SIR and CIR using convolutional neural network (CNN). Specifically, our deep architecture contains one shared sub-network together with two sub-networks that extract the SIRs of given images and the CIRs of given image pairs, respectively. The SIR sub-network is required to be computed once for each image (in both the probe and gallery sets), and the depth of the CIR sub-network is required to be minimal to reduce computational burden. Therefore, the two types of representation can be jointly optimized for pursuing better matching accuracy with moderate computational cost. Furthermore, the representations learned with pairwise comparison and triplet comparison objectives can be combined to improve matching performance. Experiments on the CUHK03, CUHK01 and VIPeR datasets show that the proposed method can achieve favorable accuracy while compared with state-of-the-arts

چکیده

شناسایی افراد معمولاً یا به صورت انطباق الگوی تک تصویری (SIR) و یا دسته بندی الگوی تصویر روبرو (CIR) صورت می گیرد. در این تحقیق، ما به دنبال ایجاد ارتباط بین این دو دسته از روش ها می باشیم و یک چارچوب آموزش مشترک را برای یکپارچه سازی SIR و CIR با استفاده از شبکه های عصبی پیچیده (CNN) پیشنهاد می کنیم. در حالت خاص، ساختار عمیق مورد نظر شامل یک زیر شبکه مشترک با دو زیر شبکه دیگر است که SIR ها را از یک سری تصاویر مشخص و CIR ها را از جفت تصاویر داده شده استخراج می کند. زیر شبکه SIR می بایست هر بار برای هر یک از تصاویر (هم در مجموعه‌های پروب و هم گالری) محاسبه شود و عمق زیر شبکه CIR نیز می بایست به حداقل برسد تا حجم بار محاسباتی کاهش پیدا کند. بنابراین، دو نوع الگوی نمایشی را می توان به صورت مشترک به منظور کسب بهترین دقت انطباق با صرف کمترین بار محاسباتی، بهینه سازی نمود. علاوه بر این، الگوهای نمایشی که با استفاده از اهداف مقایسه دوتایی سه تایی آموزش دیده اند (منظور در شبکه عصبی آموزش داده شده اند) را می توان برای بهبود عملکرد انطباق با هم ترکیب نمود. آزمایش های صورت گرفته روی مجموعه داده های CUHK03 ، CUHK01 و VIPeR نشان می دهد که روش پیشنهادی قادر است دقت بالایی را در مقایسه با سایر الگوهای جدید ارائه شده از خود به نمایش بگذارد.

1-مقدمه

شناسایی افراد در واقع انطباق دو تصویر از اشخاص در حال پیاده روی از دو منظر متفاوت است. این مفهوم در سال های اخیر به خاطر کاربردهای گسترده ای که در تجسس های ویدئویی دارد، توجه بسیاری را به خود جلب کرده و تحقیقات قابل توجهی در مورد آن صورت گرفته است. اما این مسئله، همچنان به عنوان یک چالش شناخته شده و مطالعات بیشتری را می طلبد، که دلیل آن تغییرات زیاد شدت نور، ژست ها، منظرها و پیش زمینه تصاویر افراد پیاده می باشد.

شناسایی افراد را می توان بر اساس دو دسته از روش ها انجام داد: 1) روش های سنجش فاصله و یا شباهت بر اساس الگوی تک تصویری که در واقع الگویی را از یک تصویر مشخص نتیجه می دهد [13, 14, 16, 28, 20, 17, 26, 7] و (2) دسته بندی مربوط به الگوهای تصویر روبرو که الگویی بر اساس یک جفت تصویر است [19, 1, 24]. در دسته اول، الگوی نمایش تک تصویری (SIR) ابتدا با استفاده از روش های دستی و یا با کمک روش های شبکه عصبی پیچیده (CNN) به دست می آید و سپس سنجش فاصله به همراه یک مقدار آستانه برای پیش‌بینی اینکه آیا دو تصویر فرد پیاده با هم انطباق دارند یا خیر، به کار می رود. در دسته روش های دوم، پس از تهیه الگوی نمایشی تصویر روبرو (CIR)، شناسایی فرد مورد نظر را می توان به عنوان یک الگوی دسته بندی باینری ترتیبی در نظر گرفت...


گروه ترجمه تخصصی البرز اقدام به ترجمه مقاله " مهندسی فناوری اطلاعات " با موضوع " آموزش ترکیبی الگوهای نمایشی تک تصویری و تصویر روبرو به منظور شناسایی افراد " نموده است که شما کاربر گرامی می توانید پس از دانلود رایگان مقاله انگلیسی و مطالعه ترجمه چکیده و بخشی از مقدمه مقاله، ترجمه کامل مقاله را خریداری نمایید.
عنوان ترجمه فارسی
آموزش ترکیبی الگوهای نمایشی تک تصویری و تصویر روبرو به منظور شناسایی افراد
نویسنده/ناشر/نام مجله :
CVPR
سال انتشار
2016
کد محصول
1010344
تعداد صفحات انگليسی
9
تعداد صفحات فارسی
28
قیمت بر حسب ریال
240000
نوع فایل های ضمیمه
Pdf+Word
حجم فایل
1 مگا بایت
تصویر پیش فرض


این مقاله ترجمه شده را با دوستان خود به اشتراک بگذارید
سایر مقالات ترجمه شده مهندسی فناوری اطلاعات , مهندسی كامپيوتر را مشاهده کنید.
کاربر گرامی، بلافاصله پس از خرید مقاله ترجمه شده مقاله ترجمه شده و با یک کلیک می توانید مقاله ترجمه شده خود را دانلود نمایید. مقاله ترجمه شده خوداقدام نمایید.
جهت خرید لینک دانلود ترجمه فارسی کلیک کنید
جستجوی پیشرفته مقالات ترجمه شده
برای کسب اطلاعات بیشتر، راهنمای فرایند خرید و دانلود محتوی را ببینید
هزینه این مقاله ترجمه شده 240000 ریال بوده که در مقایسه با هزینه ترجمه مجدد آن بسیار ناچیز است.
اگر امکان دانلود از لینک دانلود مستقیم به هر دلیل برای شما میسر نبود، کد دانلودی که از طریق ایمیل و پیامک برای شما ارسال می شود را در کادر زیر وارد نمایید


این مقاله ترجمه شده مهندسی فناوری اطلاعات در زمینه کلمات کلیدی زیر است:








Image Processing
single-image representation
cross-image representation
neural network

تاریخ انتشار در سایت: 2017-04-29
جستجوی پیشرفته مقالات ترجمه شده
نظرتان در مورد این مقاله ترجمه شده چیست؟